前言:我們精心挑選了數篇優質統計論文文章,供您閱讀參考。期待這些文章能為您帶來啟發,助您在寫作的道路上更上一層樓。
統計學論文2000字(一):影響民族院校統計學專業回歸分析成績因素的研究論文
摘要:學習成績是評價學生素質的重要方面,也是教師檢驗教學能力、反思教學成果的重要標準。利用大連民族大學統計學專業本科生有關數據(專業基礎課成績、平時成績和回歸分析期末成績),建立多元線性回歸模型,對影響回歸分析期末成績的因素進行深入研究,其結果對今后的教學方法改進和教學質量提高具有十分重要的指導意義。
關鍵詞:多元線性回歸;專業基礎課成績;平時成績;期末成績
為了實現教學目標,提高教學質量,有效提高學生學習成績是很有必要的。我們知道專業基礎課成績必定影響專業課成績,而且平時成績也會影響專業課成績,這兩類成績與專業課成績基本上是呈正相關的,但它們之間的關系密切程度有多大?它們之間又存在怎樣的內在聯系呢?就這些問題,本文主要選取了2016級統計專業50名學生的四門專業基礎課成績以及回歸分析的平時成績和期末成績,運用SPSS統計軟件進行分析研究,尋求回歸分析期末成績影響因素的變化規律,擬合出關系式,從而為強化學生的后續學習和提高老師的教學質量提供了有利依據。
一、數據選取
回歸分析是統計專業必修課,也是統計學中的一個非常重要的分支,它在自然科學、管理科學和社會、經濟等領域應用十分廣泛。因此研究影響統計學專業回歸分析成績的相關性是十分重要的。
選取了統計專業50名學生的專業基礎課成績(包括數學分析、高等代數、解析幾何和概率論)、回歸分析的平時成績和期末成績,結合多元線性回歸的基礎理論知識[1-2],建立多元回歸方程,進行深入研究,可以直觀、高效、科學地分析各種因素對回歸分析期末成績造成的影響。
二、建立多元線性回歸模型1及數據分析
運用SPSS統計軟件對回歸分析期末成績的影響因素進行研究,可以得到準確、科學合理的數據結果,全面分析評價學生考試成績,對教師以后的教學工作和學生的學習會有較大幫助。自變量x1表示數學分析成績,x2表示高等代數成績,x3表示解析幾何成績,x4表示概率論成績,x5表示平時成績;因變量y1表示回歸分析期末成績,根據經驗可知因變量y1和自變量xi,i=1,2,3,4,5之間大致成線性關系,可建立線性回歸模型:
(1)
線性回歸模型通常滿足以下幾個基本假設,
1.隨機誤差項具有零均值和等方差,即
(2)
這個假定通常稱為高斯-馬爾柯夫條件。
2.正態分布假定條件
由多元正態分布的性質和上述假定可知,隨機變量y1服從n維正態分布。
從表1描述性統計表中可看到各變量的平均值1=79.68,2=74.66,3=77.22,4=78.10,5=81.04,1=75.48;xi的標準差分別為10.847,11.531,8.929,9.018,9.221,y1的標準差為8.141;有效樣本量n=50。
回歸分析期末成績y1的多元回歸模型1為:
y1=-5.254+0.221x1-0.4x2+0.154x3
+0.334x4+0.347x5
從表2中可以看到各變量的|t|值,在給定顯著水平?琢=0.05的情況下,通過t分布表可以查出,自由度為44的臨界值t?琢/2(44)=2.015,由于高等代數x2的|t|值為0.651小于t?琢/2(44),因此x2對y1的影響不顯著,其他自變量對y1都是線性顯著的。下面利用后退法[3]剔除自變量x2。
三、后退法建立多元線性回歸模型2及數據分析
從模型1中剔除了x2變量,多元回歸模型2為:
y1=-5.459+0.204x1+0.149x3+0.377x4+0.293x5(5)
在表4中,F統計量為90.326,在給定顯著水平?琢=0.05的情況下,查F分布表可得,自由度為p=4和n-p-1=45的臨界值F0.05(4,45)=2.579,所以F>F0.05(4,45),在表5中,所有自變量的|t|值都大于t?琢/2(45)=2.014,因此,多元回歸模型2的線性關系是顯著的。
四、結束語
通過對上述模型進行分析,即各個自變量對因變量的邊際影響,可以得到以下結論:在保持其他條件不變的情況下,當數學分析成績提高一分,則回歸分析成績可提高0.242分[4-5];同理,當解析幾何成績、概率論成績和平時成績每提高一分,則回歸分析成績分別提高0.149分、0.377分和0.293分。
通過對學生專業基礎課成績、平時成績與回歸分析期末成績之間相關關系的研究,一方面有利于教師把控回歸分析教學課堂,提高教師意識,注重專業基礎課教學的重要性,同時,當學生平時成績不好時,隨時調整教學進度提高學生平時學習能力;另一方面使學生認識到,為了更好地掌握回歸分析知識,應加強專業基礎課的學習,提高平時學習的積極性。因此,通過對回歸分析期末成績影響因素的研究能有效的解決教師教學和學生學習中的許多問題。
統計學畢業論文范文模板(二):大數據背景下統計學專業“數據挖掘”課程的教學探討論文
摘要:互聯網技術、物聯網技術、云計算技術的蓬勃發展,造就了一個嶄新的大數據時代,這些變化對統計學專業人才培養模式的變革起到了助推器的作用,而數據挖掘作為拓展和提升大數據分析方法與思路的應用型課程,被廣泛納入統計學本科專業人才培養方案。本文基于數據挖掘課程的特點,結合實際教學經驗,對統計學本科專業開設數據挖掘課程進行教學探討,以期達到更好的教學效果。
關鍵詞:統計學專業;數據挖掘;大數據;教學
一、引言
通常人們總結大數據有“4V”的特點:Volume(體量大),Variety(多樣性),Velocity(速度快)和Value(價值密度低)。從這樣大量、多樣化的數據中挖掘和發現內在的價值,是這個時代帶給我們的機遇與挑戰,同時對數據分析技術的要求也相應提高。傳統教學模式并不能適應和滿足學生了解數據處理和分析最新技術與方法的迫切需要。對于常常和數據打交道的統計學專業的學生來說,更是如此。
二、課程教學探討
針對統計學本科專業的學生而言,“數據挖掘”課程一般在他們三年級或者四年級所開設,他們在前期已經學習完統計學、應用回歸分析、多元統計分析、時間序列分析等課程,所以在“數據挖掘”課程的教學內容選擇上要有所取舍,同時把握好難度。不能把“數據挖掘”課程涵蓋了的所有內容不加選擇地要求學生全部掌握,對學生來說是不太現實的,需要為統計學專業本科生“個性化定制”教學內容。
(1)“數據挖掘”課程的教學應該偏重于應用,更注重培養學生解決問題的能力。因此,教學目標應該是:使學生樹立數據挖掘的思維體系,掌握數據挖掘的基本方法,提高學生的實際動手能力,為在大數據時代,進一步學習各種數據處理和定量分析工具打下必要的基礎。按照這個目標,教學內容應以數據挖掘技術的基本原理講解為主,讓學生了解和掌握各種技術和方法的來龍去脈、功能及優缺點;以算法講解為輔,由于有R語言、python等軟件,學生了解典型的算法,能用軟件把算法實現,對軟件的計算結果熟練解讀,對各種算法的改進和深入研究則不作要求,有興趣的同學可以自行課下探討。
(2)對于已經學過的內容不再詳細講解,而是側重介紹它們在數據挖掘中的功能及綜合應用。在新知識的講解過程中,注意和已學過知識的融匯貫通,既復習鞏固了原來學過的知識,同時也無形中降低了新知識的難度。比如,在數據挖掘模型評估中,把混淆矩陣、ROC曲線、誤差平方和等知識點就能和之前學過的內容有機聯系起來。
(3)結合現實數據,讓學生由“被動接收”式的學習變為“主動探究”型的學習。在講解每種方法和技術之后,增加一個或幾個案例,以加強學生對知識的理解。除了充分利用已有的國內外數據資源,還可以鼓勵學生去搜集自己感興趣的或者國家及社會大眾關注的問題進行研究,提升學生學習的成就感。
(4)充分考慮前述提到的三點,課程內容計劃安排見表1。
(5)課程的考核方式既要一定的理論性,又不能失掉實踐應用性,所以需要結合平時課堂表現、平時實驗項目完成情況和期末考試來綜合評定成績。采取期末閉卷理論考試占50%,平時實驗項目完成占40%,課堂表現占10%,這樣可以全方位的評價學生的表現。
三、教學效果評估
經過幾輪的教學實踐后,取得了如下的教學效果:
(1)學生對課程的興趣度在提升,課下也會不停地去思考數據挖掘有關的方法和技巧,發現問題后會一起交流與討論。
(2)在大學生創新創業項目或者數據分析的有關競賽中,選用數據挖掘方法的人數也越來越多,部分同學的成果還能在期刊上正式發表,有的同學還能在競賽中取得優秀的成績。
(3)統計學專業本科生畢業論文的選題中利用數據挖掘有關方法來完成的論文越來越多,論文的完成質量也在不斷提高。
(4)本科畢業生的就業崗位中從事數據挖掘工作的人數有所提高,說明滿足企業需求技能的人數在增加。繼續深造的畢業生選擇數據挖掘研究方向的人數也在逐漸增多,表明學生的學習興趣得以激發。
教學實踐結果表明,通過數據挖掘課程的學習,可以讓學生在掌握理論知識的基礎上,進一步提升分析問題和解決實際問題的能力。
1刊登論文學科分布情況
通過對《新疆農業科學》刊登論文學科分布的分析,可客觀反映我區與農業相關的學科現狀和發展趨勢,對于了解不同學科發展狀況,促進知識創新、技術創新有重要意義。據統計,2012年《新疆農業科學》論文刊登數量前6個學科分別是:林學與園藝、作物栽培與育種、草業與環境、畜牧獸醫、植物保護、生命科學,共296篇,占總總數的81.76%,其中排名第一的林學與園藝,占論文總數21.56%,表明在我區農業研究領域中,這些學科領域的科研工作較為活躍,科技產出較多,論文數量有明顯增加,被引頻次也有所增長[1]。上述學科相對發展較快,屬于優勢學科,見圖6。
2通訊作者構成情況分析
對通訊作者的構成進行統計和分析表明,2012年《新疆農業科學》的論文中具有正高級職稱的通訊作者達263人,占作者總數的72.65%,具有副高級職稱的通訊作者83人,占作者總數22.92%,合計:95.57%。年齡構成分析表明,年齡在40~50歲的通訊作者有196人,占作者總數的54.14%,年齡在50~60歲的通訊作者113人,占作者總數的31.21%,年齡在40~60歲的通訊作者309人,占作者總數的85.35%;博士生導師119人,占作者總數的32.87%,碩士生導師153人,占作者總數的42.26%,具有碩導和博導身份的通訊作者占作者總數的75.13%。表明《新疆農業科學》的通訊作者主要是高級職稱、高學歷的高層次研究人員,均為項目主持人、學科帶頭人,相應撰寫的論文學術水平和質量較高,對《新疆農業科學》載文質量的穩定和提高辦刊質量與水平起到了關鍵作用,見圖7。
3年度基金項目資助論文數量的統計與分析
對2012年《新疆農業科學》科技論文來源統計分析:國家級項目論文225篇,占全年總數的62.15%,省部級項目論文114篇,占全年總數31.49%,地廳級項目論文23篇,占全年論文總數的6.35%。2012年度國家級、省部級以上的基金總數為339篇,占總刊登論文數的93.64%,表明《新疆農業科學》超過90%的論文來源于國家級、省部級以上基金項目。其中國家級項目近幾年均保持了高百分比。上述統計分析還表明,《新疆農業科學》的基金資助論文數量呈高比例態勢,在科技領域投入不斷增長的社會大背景下,新疆農業科研機構和高等院校承擔的國家、省部級項目的數量在穩步上升,農業科技領域的競爭實力正在逐步增強,農業科研的國際交流、合作研究和技術引進工作穩步發展??傮w來說,《新疆農業科學》目前已經形成了以撐、公益性行業專項)和自治區級(科技攻關、自治區基金、成果轉化、重大專項)項目產出論文為主,地州級、高?;?、研究機構基金等為輔的多層次的資助體系論文。
4結語
(1)企業統計具有信息主導作用。
(2)具有咨詢和監督功能。
運用現代統計技術對企業經營運行狀況進行監測,通過可靠的經濟信息數據庫中的統計信息與其他信息資源,多層次、深層次地展開企業經濟活動的專題與綜合分析,在宏觀信息、市場信息、企業微觀信息基礎上做出預測、置信估計,為企業決策提供依據。同時,通過準確的數據信息,及時、全面地對企業生產經營活動進行定量檢查,對出現的偏差和問題及時反應、描述,提供監測、預警、中止信號,并提出咨詢意見。
2企業統計中存在問題
(1)服務主體錯位。我國的企業統計起源于五十年代的計劃經濟時期,企業統計是官方統計的基層報表單位,以一套報表制度形成自上而下布置、自下而上層層上報的政府統計模式,盡管在計劃經濟時期企業統計也有過多次變革,但服務的對象始終是政府。進入市場經濟,隨著政企分開,企業逐漸成為獨立的統計實體,經濟行為已不再是聽命于政府的指令,已經具備了獨立性和主體利益追逐性,但是企業的統計工作從總體上看仍然沒有突破“統計=報表”的傳統模式。相應地,企業統計的職能也沒有從報告型統計轉變為經營管理型統計,企業統計的主要任務是為上級主管部門提供各種報表,即所謂“吃企業飯,干上級事”,缺乏對企業經營進行深入分析的主動性,從而對企業經營沒有直接貢獻,所以往往被看作是政府部門的附屬機構,是企業中效益最差的管理部門。隨著社會經濟和企業的持續發展就要求企業統計盡快建立適合本企業的統計行為方式,其服務對象主要包括企業決策者、管理者、投資人、債權人和政府。政府由原來的主要服務對象變為次要服務對象,因此,企業統計的目的要由為政府統計服務改變為企業實現最佳經濟效益提供信息服務。
(2)指標體系不完整。與統計報表相適應,企業統計指標體系一般只局限于企業的產值、產量、成本消耗等生產性指標,而與企業管理與決策需求相適應的指標甚少,反映企業外部環境和競爭者的統計指標更少,從而造成企業統計的現有指標體系與管理、決策需求相脫節。
(3)工作內容單調、手段落后。由于企業統計人員均是事后統計,較少進行事前分析和預測;多簡單的數據說明,少深入的系統分析。多數統計數據只是經過簡單加工的初級信息產品,很少有技術含量高、信息含量大的深加工統計產品提供給企業管理者,以幫助其進行決策。所以,企業統計部門不被企業領導所重視,其人員、設備配置相對于其他部門較落后。
(4)缺乏高素質的統計人才。由于企業統計在現有的統計工作體制與模式下沒有為企業管理提供服務,對企業經營沒有直接貢獻,所以企業統計部門不被企業領導所重視,統計人員在企業中的地位低下,能力較強的人員從自身發展的角度出發,都不愿意在統計崗位工作,造成統計人才的短缺。而從統計業務來看,企業統計又是一個專業性很強的工作,統計功能發揮得如何,很大程度上取決于統計人員的專業素質。因此,企業統計本可以在數據分析方面發揮作用,但由于統計人員的業務素質低,無法為企業決策提供高質量、深層次的數據信息。
3對策與建議
3.1部門重組,建立企業信息中心
當今快捷地進行企業信息化運作,已成為企業適應市場環境變化、增強競爭力的關鍵所在。
由于企業統計和企業信息化的功能有許多相同之處,主要是對信息的搜集、整理、分析和應用。不同之處在于,企業信息系統更多地應用了高新技術的支持;企業統計更關注指標體系和分析方法的應用。企業統計和企業信息系統在許多方面可以互補,如果將兩者的功能相結合,相應地,將企業統計部門與企業信息管理部門相融合,建立企業信息中心,應該是一種合理的選擇。
企業信息系統的建設應與企業統計的應用相結合,前者是信息管理的設施,后者提供信息資料。這樣,既滿足了企業信息系統的信息需求,又為企業統計信息功能的順利實現提供了先進的載體和平臺。同時解決了長期困擾企業統計的不被領導重視、地位低下、工作條件落后、硬件配置不足等問題。
3.2服務手段改進,與先進的企業管理方法相結合
信息技術的飛速發展改變了人們的價值觀和投入產出方式,催生了新的管理理念和管理方法,企業要想在激烈競爭的市場中立于不敗之地,就必須在“以客戶為中心,以市場為導向,以效益為目標”的管理理念指引下,用數據庫、網絡及管理應用軟件相結合的信息技術全面提升企業管理水平。由于統計技術與管理方法的天然聯系,企業統計在先進的管理方法中不僅有用武之地,而且其功能得到了新的拓展。
質量管理是企業管理的生命線,質量管理的發展在經歷了質量檢驗管理階段、全面質量管理階段、標準質量管理階段。在質量管理的發展過程中,統計技術的作用愈來愈明顯,應用也愈來愈廣泛。對統計技術在全面質量管理中的作用,費根堡博士曾說:“在全面質量管理活動中,無論何時、何地都會用到統計方法。統計方法所表達的觀點,對全面質量管理的整個領域都有深刻的影響”。在全面質量管理、ISO9000標準質量管理以及6σ管理等先進質量管理方法中,統計技術的運用都起著至關重要的作用,而且應用越來越廣泛。
3.3服務拓展,為企業其他部門提供咨詢服務
企業的采購、生產、銷售以及人力資源管理等職能部門在經營運作過程中,都會有大量的數據記錄,而這些部門的工作人員對數據的處理能力遠不如專業的統計人員,他們一般只采用簡單的方法描述統計數據,難以看到數據中隱含的規律性。所以統計人員可以為企業其他部門提供數據處理咨詢或培訓服務。
如果我國企業能夠盡快學習并引進先進的企業管理方法,用嚴謹的統計數據分析方法提升企業管理水平與決策的高效性、準確性,那么企業領導者會發現,統計技術是企業管理與決策中不可少的工具。這時企業領導會主動地重視企業統計,自然會由“要我重視”轉變為“我要重視”,因為企業統計的職能已不再僅僅是“吃企業飯,干上級事”。隨著企業信息化水平的不斷發展與完善,過去從企業報表那里摘抄而來的統計報表現在可以通過信息轉化功能自動實現,統計人員能夠擺脫煩瑣的事務性工作,有更多的時間和精力運用統計專業技術對統計數據進行高層次的分析,甚至成為項目團隊的主要成員,主要研究企業生產經營狀況,為不斷企業提升管理與決策水平服務。
3.4統計人員提高業務是企業統計新模式的運作保證