數(shù)據(jù)科學(xué)下“多元統(tǒng)計分析”課程改革

時間:2022-07-07 16:30:56

導(dǎo)語:數(shù)據(jù)科學(xué)下“多元統(tǒng)計分析”課程改革一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)科學(xué)下“多元統(tǒng)計分析”課程改革

摘要:文章面向大數(shù)據(jù)時代統(tǒng)計學(xué)科發(fā)展的趨勢,探討了在數(shù)據(jù)科學(xué)視角下“多元統(tǒng)計分析”課程教學(xué)改革舉措,提出與數(shù)據(jù)科學(xué)相互借鑒、相互滲透的頂層設(shè)計思路,以及融合統(tǒng)計模型與機器學(xué)習(xí)算法的教學(xué)內(nèi)容組織,從而培養(yǎng)具有數(shù)據(jù)科學(xué)視野的復(fù)合型統(tǒng)計分析人才。

關(guān)鍵詞:多元統(tǒng)計分析;數(shù)據(jù)科學(xué);頂層設(shè)計;教學(xué)改革

“多元統(tǒng)計分析”課程具有較強的理論性及廣泛的應(yīng)用性,如何教好這門課,讓學(xué)生了解多元統(tǒng)計的思想、掌握現(xiàn)代多元統(tǒng)計的方法,并在大數(shù)據(jù)、人工智能蓬勃發(fā)展的新時代熟練應(yīng)用多元統(tǒng)計知識,是一個值得任課教師深思的課題。近年來,多位教師從教學(xué)理念、時代背景、目標導(dǎo)向等角度進行了有益的探討。例如,以O(shè)BE理念為指導(dǎo),從教學(xué)目標、教學(xué)設(shè)計與教學(xué)考核評價等方面改進“多元統(tǒng)計分析”課程教學(xué)[1]。瞄準計算機技術(shù)的發(fā)展,便于從課堂講授內(nèi)容、案例教學(xué)、編程實踐訓(xùn)練、模型評價與優(yōu)化等多個環(huán)節(jié)進行“多元統(tǒng)計分析”課程教學(xué)內(nèi)容與教學(xué)方法的改革與實踐[2]。針對“多元統(tǒng)計分析”課程實驗教學(xué)的不足,淡化理論教學(xué),注重案例教學(xué)并利用前沿的統(tǒng)計軟件輔助“多元統(tǒng)計分析”課程的教學(xué)改革[3]。為突出實驗教學(xué)的重要性,將實踐教學(xué)融入理論教學(xué),通過實驗課程驗證理論,通過綜合性實驗深化理論教學(xué),運用設(shè)計性實驗強化理論和實踐的結(jié)合[4]。在課程資源建設(shè)方面,有研究提出以學(xué)生“學(xué)”為中心,以學(xué)習(xí)成果為導(dǎo)向,設(shè)計以學(xué)生為中心的課程教學(xué)方法,構(gòu)建以學(xué)生為中心的課程學(xué)習(xí)資源和案例教學(xué)策略[5]。這些教學(xué)改革實踐為本文工作提供了有益的參考。隨著大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)以及人工智能等信息技術(shù)的迅猛發(fā)展,人類社會進入了“第四次工業(yè)革命”的新時代,筆者從事“多元統(tǒng)計分析”課程教學(xué)工作多年,深切感受到“多元統(tǒng)計分析”課程應(yīng)擁抱新時代,與數(shù)據(jù)科學(xué)相互借鑒、相互滲透融合,并在教學(xué)理念、教學(xué)內(nèi)容、教學(xué)手段上進行改革創(chuàng)新。

一、“多元統(tǒng)計分析”課程教學(xué)改革頂層設(shè)計思路

在數(shù)據(jù)科學(xué)迅猛發(fā)展的新時代,統(tǒng)計數(shù)據(jù)分析面臨以下新問題。(1)數(shù)據(jù)規(guī)模。傳統(tǒng)上,統(tǒng)計分析主要處理中小規(guī)模、中低維度的離線數(shù)據(jù)集,大數(shù)據(jù)處理主要面向大規(guī)模、高維度的數(shù)據(jù)集,且多為機器或程序自動生成的動態(tài)數(shù)據(jù)。(2)處理原則及方式。傳統(tǒng)上,統(tǒng)計分析依賴于先驗假設(shè),傾向于建立精準的統(tǒng)計模型,并強調(diào)統(tǒng)計模型的合理性和擬合度。大數(shù)據(jù)處理則強調(diào)對流數(shù)據(jù)的實時處理,以及擴展性好、復(fù)雜度低的快速近似模型及算法,更看重模型的泛化能力和應(yīng)用效果。另外,對高維數(shù)據(jù),一般還需要進行特征工程及降維等預(yù)處理。國內(nèi)“多元統(tǒng)計分析”課程比較注重教授數(shù)理統(tǒng)計的基礎(chǔ)知識,突出統(tǒng)計建模的科學(xué)性和可解釋性,然而,傳統(tǒng)的統(tǒng)計理論與方法難以應(yīng)對當(dāng)今對海量數(shù)據(jù)的實時處理和可擴展需求。筆者提出“以時代發(fā)展為導(dǎo)向、以學(xué)生為本、以融合創(chuàng)新為抓手”的教學(xué)理念,以期對“多元統(tǒng)計分析”課程教學(xué)改革進行頂層設(shè)計。

(一)順應(yīng)時代需求

樹立“以時代發(fā)展為導(dǎo)向、以學(xué)生為本、以融合創(chuàng)新為抓手”的教學(xué)理念,在課程介紹的時候引入大數(shù)據(jù)、數(shù)據(jù)科學(xué)、機器學(xué)習(xí)等概念,讓學(xué)生一窺數(shù)據(jù)科學(xué)前沿及統(tǒng)計分析的定位。例如,在當(dāng)今信息化時代,大多數(shù)學(xué)生對于統(tǒng)計學(xué)習(xí)、機器學(xué)習(xí)、人工智能等數(shù)據(jù)科學(xué)中相關(guān)部分知識特別感興趣,可以因勢利導(dǎo)地在教學(xué)過程中講解多元統(tǒng)計方法與這些熱點技術(shù)之間的聯(lián)系與區(qū)別,讓學(xué)生認識到人工智能是計算機科學(xué)的一個子領(lǐng)域,統(tǒng)計學(xué)習(xí)和機器學(xué)習(xí)都是人工智能的實現(xiàn)方法。

(二)引導(dǎo)學(xué)生主導(dǎo)學(xué)習(xí)

進一步豐富課程考核體系和評價標準,并鼓勵學(xué)生積極主動地融入課堂,允許學(xué)生自由組成3~5人的小組,并以小組答辯的形式完成課程實驗報告;引導(dǎo)學(xué)生參與教學(xué)內(nèi)容相關(guān)的課外活動,進一步鍛煉學(xué)生的學(xué)習(xí)、思考、動手、協(xié)作和表達能力。這些都將對學(xué)生就業(yè)和進一步專業(yè)學(xué)習(xí)深造帶來正向影響。

二、融合統(tǒng)計模型與機器學(xué)習(xí)算法的教學(xué)內(nèi)容組織

在“多元統(tǒng)計分析”課程教學(xué)改革中,許多研究人員提出了要加強統(tǒng)計方法應(yīng)用的教學(xué),強調(diào)要“學(xué)以致用”,并引入統(tǒng)計軟件,以及編程語言等內(nèi)容[3-4],但仍局限于這些統(tǒng)計軟件或編程技術(shù)在傳統(tǒng)多元統(tǒng)計模型與方法中的使用。筆者基于“以時代發(fā)展為導(dǎo)向”的理念,補充了機器學(xué)習(xí)相關(guān)模型與算法,讓學(xué)生得以對某類問題的解決方法一窺全貌。例如,筆者在講授“判別分析”單元時,會指出“判別分析”要解決的問題在信號分析課程中一般稱為“模式識別”問題,在數(shù)據(jù)挖掘課程中一般稱為“分類”問題,而在機器學(xué)習(xí)課程中一般稱為“有監(jiān)督學(xué)習(xí)”問題。針對不同的學(xué)科領(lǐng)域一般采用的處理方法有參數(shù)辨識方法、決策樹方法、神經(jīng)網(wǎng)絡(luò)方法、貝葉斯網(wǎng)絡(luò)方法、K近鄰方法、支持向量機以及集成學(xué)習(xí)方法等。當(dāng)然,限于學(xué)時,只能簡單介紹一下這些方法的背景、特點、適用性、應(yīng)用案例及性能以及可擴展性等。與此同時,推薦相關(guān)的課外學(xué)習(xí)資料,鼓勵學(xué)有余力或感興趣的學(xué)生課后深入探索。又比如,在講授“系統(tǒng)聚類法”單元的時候,會指出“系統(tǒng)聚類法”是數(shù)據(jù)挖掘課程里“聚類”方法或者機器學(xué)習(xí)課程里“無監(jiān)督學(xué)習(xí)”的其中一種,其他常用的聚類方法還有:K均值方法(基于劃分的聚類方法之一)、密度相連方法(基于密度的聚類方法之一),而系統(tǒng)聚類法本身則是基于層次的聚類方法之一。通過補充數(shù)據(jù)科學(xué)相關(guān)課程的相關(guān)知識點,力圖為學(xué)生勾畫一幅多元統(tǒng)計分析經(jīng)典方法及其相關(guān)方法的全景圖,總結(jié)數(shù)據(jù)科學(xué)過程和最重要的機器學(xué)習(xí)算法,讓學(xué)生可以全面了解數(shù)據(jù)科學(xué)應(yīng)用過程以及數(shù)據(jù)科學(xué)的技術(shù)進展,并能針對具體問題選擇正確的模型和方法。

三、豐富完善課程實驗和課程考核體系

針對“多元統(tǒng)計分析”課程教學(xué)改革,許多學(xué)者雖討論了如何強化實踐教學(xué)環(huán)節(jié)、強調(diào)了案例教學(xué)[2-3,5]、引入數(shù)據(jù)科學(xué)方面的競賽題目,完善教學(xué)考核評價體系等舉措[1-2],但較少涉及學(xué)生團隊精神及協(xié)作能力的培養(yǎng),學(xué)生的實踐也并未真正地走出課堂。本文基于“以生為本”的理念,在實踐環(huán)節(jié)的設(shè)計和實施上充分考慮辯證思維、創(chuàng)新能力以及團隊協(xié)作的鍛煉,讓學(xué)生體驗主動學(xué)習(xí)的樂趣和效果。

(一)設(shè)計小組實驗

大量實踐表明,小組合作學(xué)習(xí)更能突出學(xué)生的主體地位,培養(yǎng)其主動參與的意識,在激發(fā)學(xué)生求知欲的同時,又為學(xué)生提供了一個較為輕松、自主的學(xué)習(xí)環(huán)境,提高了他們創(chuàng)造思維的能力。在“多元統(tǒng)計分析”課程作業(yè)設(shè)計中,首先,可有意識地弱化傳統(tǒng)的理論推導(dǎo)和計算題,補充一些來自實際應(yīng)用的、數(shù)據(jù)量比較大的數(shù)據(jù)分析題。這些題通常需要教師進行缺失值、離群點甚至標簽錯誤之類的預(yù)處理。其次,針對一些探索性數(shù)據(jù)分析及必要的特征工程,在確定合適的模型及算法后再進行大量的模型驗證和模型測試。最后,進行可視化工作,把模型結(jié)果和結(jié)論一目了然地展現(xiàn)出來。學(xué)生可以按興趣匹配度和知識互補性自由組隊并進行分工,但每隊限制在3~5人。

(二)鼓勵學(xué)生參與學(xué)科競賽

近年來,國內(nèi)涌現(xiàn)了大量優(yōu)秀的數(shù)學(xué)建模、數(shù)據(jù)分析、大數(shù)據(jù)和智能計算競賽平臺,如中國工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會主辦的全國大學(xué)生數(shù)學(xué)建模競賽、中國計算機學(xué)會主辦的大數(shù)據(jù)與智能計算競賽、全國統(tǒng)計教學(xué)會主辦的全國大學(xué)生統(tǒng)計建模大賽、阿里巴巴集團主辦的天池大數(shù)據(jù)競賽等。很多競賽題目均來自企業(yè)界的實際問題。這些競賽活動對學(xué)生了解企業(yè)需求與實際應(yīng)用、增強業(yè)務(wù)理解與建模等綜合能力的提高有極大地幫助。經(jīng)過課堂小組實驗鍛煉,學(xué)生對這些競賽的內(nèi)容及形式不再陌生。

(三)引導(dǎo)學(xué)生投身“雙創(chuàng)”

我國正處于經(jīng)濟轉(zhuǎn)型關(guān)鍵時期,以創(chuàng)新謀發(fā)展是必由之路。政府也號召“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”,從早期的大學(xué)生挑戰(zhàn)杯,到現(xiàn)在的互聯(lián)網(wǎng)+大學(xué)生創(chuàng)新創(chuàng)業(yè)大賽,旨在深化高等教育綜合改革,激發(fā)大學(xué)生的創(chuàng)造力,培養(yǎng)造就“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”的主力軍;推動賽事成果轉(zhuǎn)化,促進“互聯(lián)網(wǎng)+”新業(yè)態(tài)形成,服務(wù)經(jīng)濟提質(zhì)增效升級;以創(chuàng)新引領(lǐng)創(chuàng)業(yè)、創(chuàng)業(yè)帶動就業(yè),推動高校畢業(yè)生更高質(zhì)量創(chuàng)業(yè)就業(yè)。筆者因勢利導(dǎo),引導(dǎo)學(xué)生利用所學(xué)的多元統(tǒng)計分析知識,結(jié)合國民經(jīng)濟特定行業(yè)特定領(lǐng)域的統(tǒng)計數(shù)據(jù)進行建模,以此為基礎(chǔ)申報“雙創(chuàng)”課題,投身到“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”的時代洪流當(dāng)中。

四、結(jié)論

在大數(shù)據(jù)、人工智能時代,統(tǒng)計學(xué)科需要主動擁抱變化,與數(shù)據(jù)科學(xué)進行融合,并在教學(xué)內(nèi)容、教學(xué)手段等方面進行相應(yīng)的改革,從而培養(yǎng)具有數(shù)據(jù)科學(xué)視野的復(fù)合型統(tǒng)計分析人才。經(jīng)過近幾年的實踐,學(xué)生在學(xué)科視野、知識面、專業(yè)技能、動手能力方面有了較大地提升,更踴躍地參加各種相關(guān)競賽活動和課外實踐活動,逐漸成長為社會亟須的畢業(yè)生。

作者:鄭國慶 夏強 夏英俊 單位:華南農(nóng)業(yè)大學(xué)