教育數(shù)據(jù)挖掘研究與思考

時(shí)間:2022-03-06 11:02:02

導(dǎo)語:教育數(shù)據(jù)挖掘研究與思考一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

教育數(shù)據(jù)挖掘研究與思考

[摘要]對國內(nèi)外教育數(shù)據(jù)挖掘的發(fā)展與應(yīng)用進(jìn)行深入分析,結(jié)合國內(nèi)教育環(huán)境對數(shù)據(jù)挖掘在教育領(lǐng)域應(yīng)用過程中遇到的問題進(jìn)行探討,指出目前存在的不足,就如何在當(dāng)前教育體制改革的背景下,結(jié)合國內(nèi)高校的辦學(xué)特色和實(shí)際狀況,推動與促進(jìn)教育數(shù)據(jù)挖掘的發(fā)展提出了一些建議。

[關(guān)鍵詞]教育數(shù)據(jù);數(shù)據(jù)挖掘;現(xiàn)代教育技術(shù)

大數(shù)據(jù)時(shí)代的來臨,推動了數(shù)據(jù)挖掘技術(shù)的高速發(fā)展,也使得該技術(shù)進(jìn)入了各個(gè)領(lǐng)域[1]?,F(xiàn)代教育技術(shù)的蓬勃興起,催生了數(shù)據(jù)挖掘向著高校等教育領(lǐng)域的延伸,高校教育資源異常龐大和復(fù)雜,如何從這些海量的教育大數(shù)據(jù)中探索教育變量之間的相關(guān)關(guān)系,發(fā)現(xiàn)并診斷現(xiàn)存問題,預(yù)測發(fā)展趨勢,是一個(gè)非常迫切的問題。通過教育數(shù)據(jù)的挖掘與分析,與傳統(tǒng)教育業(yè)務(wù)相融合,可持續(xù)推動高校教育系統(tǒng)的智慧化改革、教學(xué)模式改革,對促進(jìn)實(shí)現(xiàn)真正個(gè)性化學(xué)習(xí)、教育評價(jià)體系重構(gòu)、科學(xué)研究范式轉(zhuǎn)型都具有非常重要的意義。本文對數(shù)據(jù)挖掘技術(shù)在教育領(lǐng)域的發(fā)展與應(yīng)用進(jìn)行研究,基于教育數(shù)據(jù)的特征分析,探討教育數(shù)據(jù)挖掘的關(guān)鍵環(huán)節(jié)與重點(diǎn),就如何整合教育資源、推動教育數(shù)據(jù)挖掘在教育領(lǐng)域的發(fā)展和應(yīng)用提出一些建議。

1國內(nèi)外發(fā)展?fàn)顩r

隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,將該技術(shù)應(yīng)用于教育領(lǐng)域,對海量的教育資源進(jìn)行分析和處理是一個(gè)新興的正日益受到關(guān)注的研究領(lǐng)域。從早期基于調(diào)查問卷的統(tǒng)計(jì)分析到目前基于在線學(xué)習(xí)平臺的信息處理,教育數(shù)據(jù)挖掘技術(shù)日趨多樣化[2]。自2008年首屆教育數(shù)據(jù)挖掘國際學(xué)術(shù)會議召開以來,歐美等教育發(fā)達(dá)國家部分高校分別實(shí)施了教育數(shù)據(jù)挖掘相關(guān)計(jì)劃,而2012年美國教育部的《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》藍(lán)皮書則標(biāo)志著該研究方向已受到廣大教育學(xué)者的關(guān)注[3]。國內(nèi)在教育數(shù)據(jù)挖掘方向的研究尚處于起步階段,加之受到現(xiàn)代教育技術(shù)發(fā)展和教育數(shù)據(jù)采集等因素的影響,直至2004年,隨著網(wǎng)絡(luò)教育、在線課程等的興起,數(shù)據(jù)挖掘技術(shù)才引起國內(nèi)學(xué)者的關(guān)注,目前國內(nèi)研究主要集中于理論研究和方法描述以及分析論證等描述性階段。例如,利用SPSS中關(guān)聯(lián)規(guī)則的Apriori算法來分析錄取結(jié)果與考生類別、地區(qū)等級之間的關(guān)系,為教育資源的統(tǒng)籌安排提供決策支持[4]。運(yùn)用聚類方法對某一課程的多個(gè)模塊成績重新分類,再運(yùn)用關(guān)聯(lián)規(guī)則算法找到院系類別、各題所得分與總分三者之間的聯(lián)系,最后利用聚類的結(jié)果和挖掘到的關(guān)聯(lián)規(guī)則得出有助于教學(xué)的結(jié)論[5]。在指導(dǎo)就業(yè)方面,利用Weka平臺,對決策樹分類方法進(jìn)行改進(jìn),應(yīng)用于分析市場上就業(yè)單位的類別、歸屬地等特征,以及與學(xué)生的性別、專業(yè)、學(xué)歷等之間的關(guān)系,從而為指導(dǎo)就業(yè)提供輔助信息[6]。總體來說,國內(nèi)教育數(shù)據(jù)挖掘的研究還處于起步階段,多集中于對個(gè)別教育環(huán)節(jié)的技術(shù)研究,缺乏對教育系統(tǒng)資源的整體統(tǒng)籌與規(guī)劃。

2國內(nèi)教育數(shù)據(jù)挖掘的主要問題

教育數(shù)據(jù)挖掘結(jié)合了教育學(xué)、現(xiàn)代教育技術(shù)、計(jì)算機(jī)信息處理技術(shù)、數(shù)據(jù)挖掘等多個(gè)學(xué)科,是隨著教育教學(xué)改革和信息技術(shù)的發(fā)展而產(chǎn)生的新領(lǐng)域,一方面教育數(shù)據(jù)資源的外延在不斷擴(kuò)大,包括大量非結(jié)構(gòu)化、異構(gòu)的數(shù)據(jù)使得教育數(shù)據(jù)的復(fù)雜性在不斷增加,另一方面教育信息化的發(fā)展給教育機(jī)構(gòu)的管理體制和運(yùn)行機(jī)制也帶來巨大挑戰(zhàn),教育人員不僅需要轉(zhuǎn)變觀念,還需要為教育信息化提供強(qiáng)有力的技術(shù)和管理支持,這對教育數(shù)據(jù)挖掘的技術(shù)和方法提出了更高的要求,結(jié)合國內(nèi)教育數(shù)據(jù)挖掘的發(fā)展?fàn)顩r,其發(fā)展與應(yīng)用還存在著不少問題和矛盾,主要表現(xiàn)在以下幾個(gè)方面。2.1教育數(shù)據(jù)資源缺乏整合。高校教育數(shù)據(jù)資源龐雜而繁多,既包括存儲在教育管理系統(tǒng)數(shù)據(jù)庫中的結(jié)構(gòu)化數(shù)據(jù),也包括課件、成績、課程、畢業(yè)設(shè)計(jì)、學(xué)科競賽、評價(jià)、試題、大綱等傳統(tǒng)數(shù)據(jù)資源,涉及基礎(chǔ)、狀態(tài)、資源和行為等多個(gè)層次,具有多格式、多語義、多噪聲和數(shù)據(jù)缺失等特征。隨著信息技術(shù)和現(xiàn)代教育技術(shù)的不斷發(fā)展,以慕課、微課、反轉(zhuǎn)課堂、在線學(xué)習(xí)、網(wǎng)絡(luò)課程等為代表的新興教學(xué)方式代表了未來高校教育教學(xué)改革的方向,也是教育數(shù)據(jù)挖掘最能體現(xiàn)出價(jià)值的方面,但目前國內(nèi)高校教育中仍以傳統(tǒng)的課堂教育為主,在這樣的背景下需要將傳統(tǒng)的教育信息與現(xiàn)代教育技術(shù)下的教育數(shù)據(jù)結(jié)合與整合,以奠定教育數(shù)據(jù)挖掘的基礎(chǔ)資源,但目前缺乏對基礎(chǔ)數(shù)據(jù)資源的整合,影響數(shù)據(jù)挖掘技術(shù)在教育領(lǐng)域的應(yīng)用與推廣。2.2基礎(chǔ)設(shè)施薄弱。隨著現(xiàn)代教育技術(shù)和教學(xué)方法的發(fā)展和改革,教育數(shù)據(jù)不僅包括傳統(tǒng)的試卷、成績單、教材等基于紙質(zhì)的數(shù)據(jù),也包括微課、慕課、網(wǎng)上評教、實(shí)踐創(chuàng)新、過程考核等電子的非結(jié)構(gòu)化的數(shù)據(jù),如Word、PDF、網(wǎng)頁文本、圖像、視頻和地理空間數(shù)據(jù)等非結(jié)構(gòu)化信息資源等,而現(xiàn)代化的教育數(shù)據(jù)挖掘的本質(zhì)是一種教育信息化技術(shù),是伴隨著信息技術(shù)的發(fā)展而發(fā)展的,特別是教育大數(shù)據(jù)的爆炸式增長對計(jì)算機(jī)存儲能力、數(shù)據(jù)采集分析和兼容性都提出了更高的要求。但與之不對應(yīng)的是國內(nèi)教育數(shù)據(jù)挖掘的基礎(chǔ)設(shè)施薄弱,相關(guān)技術(shù)有待提高,缺乏必要的數(shù)據(jù)應(yīng)用的基礎(chǔ)設(shè)施建設(shè),區(qū)域間技術(shù)資源分布不均。在系統(tǒng)的選擇方面缺乏統(tǒng)一規(guī)劃,因此數(shù)據(jù)兼容性矛盾較突出。數(shù)據(jù)資源繁雜多樣,即便是電子數(shù)據(jù)如教務(wù)管理、學(xué)生信息、在線教育平臺等數(shù)據(jù),其數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)格式也存在不統(tǒng)一的問題,給進(jìn)一步的研究工作帶來不便。2.3重理論研究,輕實(shí)用推廣。目前國內(nèi)對于教育數(shù)據(jù)挖掘的研究多集中于理論、算法和技術(shù)本身,與教育實(shí)際結(jié)合不多,例如利用數(shù)據(jù)挖掘技術(shù)對線上教學(xué)方式的隱含影響因素進(jìn)行挖掘與分析,得到教育各關(guān)鍵要素之間的關(guān)聯(lián),力圖構(gòu)建網(wǎng)絡(luò)教學(xué)評價(jià)的相關(guān)流程,為教學(xué)管理和決策提供有效支持[7]。利用離群點(diǎn)檢測技術(shù)從海量動態(tài)教育數(shù)據(jù)中定位異常數(shù)據(jù),識別不符合一般特征規(guī)律的行為路徑,為學(xué)習(xí)者的個(gè)性化指導(dǎo)和教育決策提供有價(jià)值的信息[8]?;谟稍诰€評測系統(tǒng)所采集到的學(xué)習(xí)者信息,通過分析其數(shù)據(jù)結(jié)構(gòu)構(gòu)造學(xué)習(xí)者特征,再在此基礎(chǔ)上對學(xué)習(xí)者進(jìn)行聚類分析,從而分析出學(xué)習(xí)者的特征信息[9]。這些成果具有一定的代表性,均是利用數(shù)據(jù)挖掘技術(shù)對某一方面的教育資源進(jìn)行統(tǒng)計(jì)分析,但其成果沒有與具體教育應(yīng)用相結(jié)合,而基于頂層設(shè)計(jì)、面向整個(gè)教育數(shù)據(jù)的分析框架更是鮮有涉及。盡管目前許多高校的教務(wù)、科研、教學(xué)、師資等教育信息均已實(shí)現(xiàn)了計(jì)算機(jī)自動化管理,但類似的系統(tǒng)只是實(shí)現(xiàn)了把紙面的表單遷移到了計(jì)算機(jī)系統(tǒng)中,并具備了簡單的增刪、查詢和統(tǒng)計(jì)功能,也就是事務(wù)處理功能,而更高級的管理決策功能仍依賴于人工經(jīng)驗(yàn)。因此從數(shù)據(jù)挖掘的角度分析,還遠(yuǎn)未達(dá)到多角度、全方位的數(shù)據(jù)自動化分析以及深度數(shù)據(jù)挖掘,從而為教育及教學(xué)管理提供輔助決策的目的。

3促進(jìn)教育數(shù)據(jù)挖掘的建議

3.1制定規(guī)范與標(biāo)準(zhǔn)。教育數(shù)據(jù)挖掘的基礎(chǔ)是數(shù)據(jù),而教育數(shù)據(jù)復(fù)雜而龐大,應(yīng)通過對這些多源異構(gòu)數(shù)據(jù)的特征進(jìn)行對比、分析和預(yù)處理,研究各類教育數(shù)據(jù)的特征,構(gòu)建面向教育規(guī)范的特征數(shù)據(jù)模型和邏輯處理模型,使其統(tǒng)一到一個(gè)度量框架體系中,為其后的數(shù)據(jù)分析與處理奠定基礎(chǔ)。對于當(dāng)前已經(jīng)建設(shè)起來的信息化教學(xué)環(huán)境課,如課程中心、特色教學(xué)資源庫、智慧教學(xué)環(huán)境、雨課堂和各類課堂互動系統(tǒng)等,盡管在各自的教育領(lǐng)域都發(fā)揮著一定作用,但都是獨(dú)立運(yùn)行的系統(tǒng),各系統(tǒng)之間數(shù)據(jù)并沒有聯(lián)系,導(dǎo)致數(shù)據(jù)鴻溝與信息孤島問題依然存在,因此必須對現(xiàn)有的平臺進(jìn)行統(tǒng)一,制定標(biāo)準(zhǔn),加速與促進(jìn)各類教育數(shù)據(jù)的融合。3.2強(qiáng)化頂層設(shè)計(jì)。隨著現(xiàn)代教育技術(shù)與教育教學(xué)理念的發(fā)展與變革,教育數(shù)據(jù)挖掘已成為高等院校順應(yīng)信息時(shí)展的趨勢之一,因此應(yīng)該對其從頂層進(jìn)行設(shè)計(jì),統(tǒng)籌規(guī)劃,將教育數(shù)據(jù)挖掘定位在新的高度,克服破解高校數(shù)據(jù)挖掘發(fā)展的瓶頸。例如,優(yōu)化組織結(jié)構(gòu),組建現(xiàn)代教育中心或數(shù)據(jù)中心等信息管理機(jī)構(gòu),將信息化建設(shè)與教育數(shù)據(jù)挖掘提高到重要位置;制定教育數(shù)據(jù)管理標(biāo)準(zhǔn),制定數(shù)據(jù)采集、分析、安全管理等方面的標(biāo)準(zhǔn)規(guī)范,形成統(tǒng)一完善的高等院校教育大數(shù)據(jù)規(guī)范體系;加快數(shù)字化校園建設(shè)進(jìn)程,將課堂互動系統(tǒng)建設(shè)與一卡通系統(tǒng)、教務(wù)系統(tǒng)、網(wǎng)絡(luò)學(xué)習(xí)平臺、考試系統(tǒng)、圖書館資源等有機(jī)融合起來[10]。3.3特色化發(fā)展。盡管教育數(shù)據(jù)挖掘所用到的原理與技術(shù)基本相同,但不同學(xué)校有不同的歷史和現(xiàn)實(shí)條件,其在高等教育體系中所發(fā)揮的功能、承擔(dān)的任務(wù)以及范圍、作用也各不相同,學(xué)校自身的特色、區(qū)域、規(guī)模、層次、學(xué)科等也有很大差異。從國際角度而言,國內(nèi)外高校更是存在著很大差異。因此,一方面國內(nèi)高校在教育數(shù)據(jù)挖掘的研究方面需要緊跟國際方向,積極參與國際交流與合作研究,以保持對國際主流與前沿方向的跟蹤;另一方面,要基于國內(nèi)高校教育環(huán)境的實(shí)際狀況,不盲目跟風(fēng)、機(jī)械照搬,立足中國獨(dú)特的教育數(shù)據(jù)研究背景和實(shí)踐經(jīng)驗(yàn),形成中國特色的教育數(shù)據(jù)挖掘?qū)W術(shù)概念和分析框架,推動中國教育數(shù)據(jù)挖掘研究的范式轉(zhuǎn)型與良性發(fā)展。

4結(jié)語

信息時(shí)代的發(fā)展,促進(jìn)了高?,F(xiàn)代教育理念及技術(shù)的發(fā)展,也導(dǎo)致了教育數(shù)據(jù)的爆炸式增長。如何將數(shù)據(jù)挖掘技術(shù)引入教育領(lǐng)域,促進(jìn)高校管理與教育發(fā)展是值得深入研究的課題。本文分析了國內(nèi)高校教育數(shù)據(jù)挖掘技術(shù)發(fā)展過程中的不足與問題,就如何結(jié)合技術(shù)優(yōu)勢與教育實(shí)際狀況提出了相應(yīng)建議。

[參考文獻(xiàn)]

[1]王曉妮,韓建剛.?dāng)?shù)據(jù)挖掘在教育大數(shù)據(jù)中的應(yīng)用研究[J].無線互聯(lián)科技,2018(18):135-137.

[2]肖巍,倪傳斌,李銳.國外基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究:回顧與展望[J].中國遠(yuǎn)程教育,2018(2):70-78.

[3]雷曉鋒,楊明.教育數(shù)據(jù)挖掘的研究進(jìn)展與趨勢[J].北京航空航天大學(xué)學(xué)報(bào)(社會科學(xué)版),2018(4):108-114.

[4]于寶華.基于數(shù)據(jù)挖掘的高考數(shù)據(jù)分析[D].天津:天津大學(xué),2009.

[5]柳玉巧.聚類分析和關(guān)聯(lián)規(guī)則技術(shù)在成績分析中的研究及應(yīng)用[D].武漢:華中師范大學(xué),2014.

[6]孫中祥.?dāng)?shù)據(jù)挖掘技術(shù)在大學(xué)生就業(yè)指導(dǎo)中的應(yīng)用研究[D].重慶:重慶師范大學(xué),2013.

[7]張鸰.?dāng)?shù)據(jù)挖掘技術(shù)在線上教學(xué)評價(jià)中的應(yīng)用[J].電腦知識與技術(shù),2018(29):6-8.

[8]陳世超,楊現(xiàn)民,潘青青,等.離群點(diǎn)檢測技術(shù)在教育教學(xué)中的應(yīng)用[J].現(xiàn)代教育技術(shù),2018(6):101-107.

[9]石振強(qiáng).基于教育數(shù)據(jù)挖掘的學(xué)習(xí)者聚類分析與研究[J].電腦知識與技術(shù),2018(6):154-156.

[10]黎生,馮鳥東.基于課堂互動系統(tǒng)的教育大數(shù)據(jù)挖掘與學(xué)習(xí)分析研究[J].教育信息技術(shù),2018(Z2):57-60.

作者:張志剛 單位:西安財(cái)經(jīng)大學(xué)信息學(xué)院