教育數(shù)據(jù)挖掘和信息技術(shù)教學(xué)診斷探索

時(shí)間:2022-03-04 03:59:31

導(dǎo)語:教育數(shù)據(jù)挖掘和信息技術(shù)教學(xué)診斷探索一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

教育數(shù)據(jù)挖掘和信息技術(shù)教學(xué)診斷探索

摘要:近年來,隨著信息化技術(shù)發(fā)展和信息化教學(xué)改革的深入,大量非結(jié)構(gòu)化教育數(shù)據(jù)給常規(guī)教學(xué)診斷方法帶來挑戰(zhàn)。教育數(shù)據(jù)挖掘技術(shù)隨著“大數(shù)據(jù)”時(shí)代的到來日益成為學(xué)者研究熱點(diǎn)。本研究首先闡述數(shù)據(jù)挖掘應(yīng)用于信息化教學(xué)的一般流程,隨后從數(shù)據(jù)預(yù)處理、教育數(shù)據(jù)挖掘和模型評(píng)估三個(gè)方面展開分析,探索教育數(shù)據(jù)挖掘技術(shù)應(yīng)用于信息化教學(xué)數(shù)據(jù)中,實(shí)施教學(xué)診斷的途徑。研究表明,教育數(shù)據(jù)挖掘技術(shù)的引入,可以解決對(duì)于多樣性數(shù)據(jù)建模分析的痛點(diǎn),進(jìn)而反哺信息化教學(xué),提升教學(xué)質(zhì)量。

關(guān)鍵詞:教育數(shù)據(jù)挖掘;信息化教學(xué);教學(xué)診斷

一、引言

“互聯(lián)網(wǎng)+”時(shí)代的到來給傳統(tǒng)的教育教學(xué)帶來了巨大的變革,在教育創(chuàng)新的大背景下,教育理念、教學(xué)技術(shù)、教學(xué)方法不斷發(fā)展。2018年4月,教育部出臺(tái)《教育信息化2.0行動(dòng)計(jì)劃》,進(jìn)一步明確了教育信息化在教育新時(shí)展中的重要地位。利用信息化手段開展教學(xué)改革,日益成為高校教育教學(xué)改革的研究熱點(diǎn)。信息化教學(xué)要求教師學(xué)習(xí)研究先進(jìn)教學(xué)理念,輔助以適合的信息化技術(shù)手段,結(jié)合典型的工作情境開展教學(xué)活動(dòng)。其中,信息化教學(xué)的一個(gè)典型特征就是現(xiàn)代教育技術(shù)手段的運(yùn)用。教師在課堂上需要根據(jù)教學(xué)設(shè)計(jì)的安排,合理地調(diào)用盡可能豐富的教學(xué)媒體、信息化資源,構(gòu)建良好的學(xué)習(xí)環(huán)境,有時(shí)候也可以利用微彈幕、問卷星等方式進(jìn)行實(shí)時(shí)互動(dòng),以達(dá)到充分調(diào)動(dòng)學(xué)生的學(xué)習(xí)主動(dòng)性的目的,使得學(xué)生真正成為知識(shí)信息的主動(dòng)建構(gòu)者,達(dá)到良好的教學(xué)效果。由于信息化技術(shù)手段的介入,教師可以在有數(shù)據(jù)相佐證的情況下,全程跟蹤學(xué)生的學(xué)習(xí)情況。教師課前可以基于網(wǎng)絡(luò)平臺(tái)統(tǒng)計(jì)學(xué)生預(yù)習(xí)工作的完成情況,課中可以實(shí)時(shí)得到學(xué)生的問卷結(jié)果、測驗(yàn)數(shù)據(jù),課后也可以及時(shí)接收學(xué)生反饋。由于傳統(tǒng)的教學(xué)診斷方法往往只能給出教學(xué)環(huán)節(jié)中的單個(gè)節(jié)點(diǎn)信息,忽視了不同環(huán)節(jié)之間的相關(guān)性,教學(xué)質(zhì)量分析結(jié)果的體現(xiàn)形式也只局限于比例分布、平均差、方差等信息。上述傳統(tǒng)方法的特性顯然不能滿足信息化教學(xué)改革對(duì)于全過程、多樣性教育數(shù)據(jù)的分析要求。因此,開展一種可以能夠與信息化教學(xué)相匹配甚至利用教育學(xué)、計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)等多學(xué)科融合理論進(jìn)行教學(xué)質(zhì)量評(píng)估、教學(xué)方法診斷的方法研究,具有較強(qiáng)的實(shí)際意義和現(xiàn)實(shí)價(jià)值。

二、基于信息化技術(shù)數(shù)據(jù)的教育挖掘方法

教育數(shù)據(jù)挖掘包含的研究內(nèi)容可大致分為預(yù)測和描述兩類。其中,預(yù)測主要傾向于通過已有數(shù)據(jù)的分析,揭示其規(guī)律,預(yù)測未知的數(shù)據(jù)。而描述更強(qiáng)調(diào)在分析數(shù)據(jù)的過程中發(fā)現(xiàn)新的模式和結(jié)構(gòu)。本研究關(guān)注在信息化教學(xué)中引入EDM的途徑和方法。因此,從這個(gè)角度出發(fā),將一個(gè)典型的信息化教學(xué)中EDM工作籠統(tǒng)分為數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘和效果評(píng)估三個(gè)階段。其中的信息化課堂并非特指真實(shí)的課堂教學(xué),而是包括課前、課中和課后的開放式教學(xué)環(huán)境。它不僅是信息化數(shù)據(jù)的來源,也是EDM介入后最終需要改進(jìn)的目標(biāo)對(duì)象。從教育的角度來看,這是一個(gè)從教育環(huán)境(信息化課堂)產(chǎn)生的數(shù)據(jù)中發(fā)現(xiàn)知識(shí),再利用這些知識(shí)改善教育環(huán)境的循環(huán)過程(見下圖)。1.數(shù)據(jù)收集及預(yù)處理。數(shù)據(jù)是教育數(shù)據(jù)挖掘研究的基礎(chǔ)。具體到信息化教學(xué)的數(shù)據(jù)收集,是指在開放式課堂過程中充分利用網(wǎng)絡(luò)教學(xué)平臺(tái)、信息化手段和資源庫資源,收集的整個(gè)教育教學(xué)過程中靜態(tài)和動(dòng)態(tài)的所有數(shù)據(jù)。理論上可以在不影響教師和學(xué)生活動(dòng)的情況下,連續(xù)記錄整個(gè)教學(xué)活動(dòng)的所有數(shù)據(jù),如課前預(yù)習(xí)、教學(xué)資料、課堂實(shí)時(shí)互動(dòng)甚至學(xué)生在每個(gè)知識(shí)點(diǎn)上停留的時(shí)間等。收集到數(shù)據(jù)之后,由于數(shù)據(jù)挖掘算法需要處理的數(shù)據(jù)通常是符合固定標(biāo)準(zhǔn)或者規(guī)范的數(shù)據(jù)。我們收集到原始數(shù)據(jù)包含諸如問卷調(diào)查、網(wǎng)絡(luò)統(tǒng)計(jì)、平臺(tái)在線測試等多個(gè)來源。其中有可能包含有噪聲(如學(xué)生隨意評(píng)分)、缺失(如沒有學(xué)生數(shù)據(jù))和不一致(如數(shù)據(jù)分項(xiàng)和總項(xiàng)前后矛盾)等無效數(shù)據(jù)。如果直接基于原始數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,那么最終得到的結(jié)果質(zhì)量將大打折扣。此時(shí),就需要對(duì)于原始數(shù)據(jù)進(jìn)行預(yù)處理,以達(dá)到消除數(shù)據(jù)中存在的噪聲,合并及歸類不同數(shù)據(jù)源數(shù)據(jù),進(jìn)行數(shù)據(jù)壓縮提升挖掘效率等目的。常用的數(shù)據(jù)預(yù)處理一般包括數(shù)據(jù)清理、數(shù)據(jù)集成和數(shù)據(jù)融合、數(shù)據(jù)變換和數(shù)據(jù)規(guī)約等步驟。由于新型教育數(shù)據(jù)的多樣化、大量化、非結(jié)構(gòu)化等特征,大大加劇了預(yù)處理的復(fù)雜度。因此,通常來說,數(shù)據(jù)收集和預(yù)處理環(huán)節(jié)往往是EDM研究中工作量最多的。2.教育數(shù)據(jù)挖掘。數(shù)據(jù)經(jīng)過預(yù)處理之后,已有的結(jié)果變量和真實(shí)值將會(huì)被完全標(biāo)注。下一步就需要選擇合適的數(shù)據(jù)挖掘算法進(jìn)行挖掘分析。信息化教學(xué)數(shù)據(jù)的教育挖掘一般用于在數(shù)據(jù)中建立預(yù)測模型。其常用的數(shù)據(jù)挖掘方法包括分類、聚類、回歸、關(guān)聯(lián)規(guī)則挖掘、文本挖掘、馬爾可夫模型、序列模式挖掘以及推薦算法等等。在上述方法中,根據(jù)訓(xùn)練數(shù)據(jù)是否擁有標(biāo)記信息,學(xué)習(xí)任務(wù)可大致劃分為“監(jiān)督學(xué)習(xí)”和無監(jiān)督學(xué)習(xí)。無監(jiān)督學(xué)習(xí)用于未知情況下,特定的組織或模式。監(jiān)督學(xué)習(xí)是使用一個(gè)已知的結(jié)果的記錄,研究該組數(shù)據(jù)的背后規(guī)律行為。其中,分類和回歸是監(jiān)督學(xué)習(xí)的代表,而聚類則是無監(jiān)督學(xué)習(xí)的代表。數(shù)據(jù)挖掘開始,通常假設(shè)樣本空間中全體樣本服從一個(gè)未知的分布,所有前期獲得的樣本數(shù)據(jù)都是獨(dú)立地從這個(gè)分布采樣獲得的,及“獨(dú)立同分布”。一旦一個(gè)模型表現(xiàn)良好,分析師可以將之遷移到新的數(shù)據(jù)集上去,用于預(yù)測新的數(shù)據(jù)集會(huì)產(chǎn)生的結(jié)果。3.模型評(píng)估及知識(shí)生成。在預(yù)測模型訓(xùn)練的時(shí)候,不論是采樣諸如決策樹和回歸樹算法,還是各種關(guān)聯(lián)規(guī)則、貝葉斯模型等手段。為了考量模型的正確性和泛化能力,往往需要對(duì)于模型進(jìn)行評(píng)估。具體的做法是將原有的實(shí)驗(yàn)數(shù)據(jù)分為訓(xùn)練集、驗(yàn)證集和測試集三個(gè)部分。其中,訓(xùn)練集用于模型訓(xùn)練;驗(yàn)證集用于模型的優(yōu)化選擇;測試集則用于對(duì)于模型的實(shí)際效果進(jìn)行評(píng)估。劃分方法可以使用“留出法”(直接將數(shù)據(jù)集劃分為兩個(gè)互斥的集合)、“交叉驗(yàn)證法”(數(shù)據(jù)集劃分為k個(gè)數(shù)據(jù)子集,子集多次交叉)、“自助法”(從原始數(shù)據(jù)集中隨機(jī)不刪除選取樣本)等。其中,自助法在數(shù)據(jù)集較小,難以有效劃分訓(xùn)練/測試集時(shí)很有用。在得到不同部分的數(shù)據(jù)集之后,通常采用模型的準(zhǔn)確率、召回率、精度、FScore以及AUC等指標(biāo)對(duì)于模型進(jìn)行性能衡量,選取最優(yōu)的模型以及模型參數(shù)作為學(xué)習(xí)到的知識(shí),繼而反饋到信息化教學(xué)過程中。4.教學(xué)診斷應(yīng)用實(shí)例。在信息化教學(xué)診斷研究中,最終目的是找到影響教學(xué)效果的關(guān)鍵因素,并預(yù)測學(xué)習(xí)效果。以常州信息職業(yè)技術(shù)學(xué)院《虛擬儀器應(yīng)用技術(shù)》課程的“機(jī)器視覺物品分類檢測”項(xiàng)目為例,本次課的目標(biāo)主要是讓學(xué)生理解視覺系統(tǒng)的硬件選型依據(jù),掌握基于顏色和圖案紋理的視覺圖像檢測分類處理算法流程。教學(xué)設(shè)計(jì)環(huán)節(jié)運(yùn)用課程團(tuán)隊(duì)提出的“三角環(huán)式課堂模型”開展教學(xué)。對(duì)應(yīng)模型中的“概念探索、應(yīng)用分析、展示成果”三步驟分別設(shè)計(jì)課前、課中和課后拓展任務(wù),分層、逐級(jí)實(shí)現(xiàn)技能提升和崗位對(duì)接。采用的信息化手段包括課程教學(xué)平臺(tái)(課程資源,課程測試),微視頻(真實(shí)案例展示)、硬件仿真軟件和交互式圖像處理軟件等。為了達(dá)到信息化教學(xué)診斷的目的,確定本次數(shù)據(jù)與處理的目標(biāo)主要是清楚除噪聲,統(tǒng)計(jì)每個(gè)學(xué)生在開放教學(xué)環(huán)境中的課前平臺(tái)使用頻次及時(shí)間、測試成績以及錯(cuò)誤部分統(tǒng)計(jì),從中確定分類器的特征。分別統(tǒng)計(jì)得出學(xué)生網(wǎng)絡(luò)平臺(tái)使用時(shí)間、課程測試及格情況和主要錯(cuò)誤失分點(diǎn)作為特征集,用于接下來的預(yù)測模型。數(shù)據(jù)挖掘階段,我們利用SPSS統(tǒng)計(jì)軟件工具包創(chuàng)建提純現(xiàn)有特征和特征空間縮減。選取樸素貝葉斯分類法開展模型訓(xùn)練。最終的對(duì)比結(jié)果表明,該分類器在特異度指標(biāo)以及敏感度指標(biāo)上都好于其他常用分類器效果。因此,在得到該分類器模型時(shí),我們將之反饋到信息化教學(xué)中用于預(yù)測某位學(xué)生課程中存在的問題以及最后不合格的可能性。如果預(yù)測的數(shù)值大于設(shè)定的警示閾值,那么教師就可以及時(shí)的為該學(xué)生提供幫助。

通過信息化教學(xué)改革嘗試,學(xué)生反映這種上課方式充滿新鮮感,同時(shí)試點(diǎn)班相較傳統(tǒng)班的應(yīng)用技術(shù)水平有了較大的提升。課程結(jié)束后,組織學(xué)生參加由美國NI公司組織的CLAD(虛擬儀器助理開發(fā)工程師)認(rèn)證考試,2018年試點(diǎn)班學(xué)生的通過率為60%,高于NI公布的2017年全國高校的CLAD平均通過率24%。以上成果進(jìn)一步證實(shí)了EDM引入信息化教學(xué)改革的有效性。

參考文獻(xiàn):

[1]王珠珠.教育信息化2.0:核心要義與實(shí)施建議[J].中國遠(yuǎn)程教育,2018

[2]張一春.信息化教學(xué)設(shè)計(jì)精彩紛呈[M].北京:高等教育出版社,2018

[3]GarcíaE,RomeroC,VenturaS,etal.Acollaborativeeducationalassociationruleminingtool[J].Internet&HigherEducation,2011

[4]牛杰,李晴,戴艷.以翻轉(zhuǎn)課堂優(yōu)化高職工科教學(xué)設(shè)計(jì)[J].職業(yè)技術(shù)教育,2015

[5]陳雯雯,夏一超.教育數(shù)據(jù)挖掘:大數(shù)據(jù)時(shí)代的教育變革[J].中國教育信息化,2017

[6]周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016

作者:戴艷 牛杰 單位:常州信息職業(yè)技術(shù)學(xué)院電子工程學(xué)院