數(shù)據(jù)挖掘機(jī)械學(xué)習(xí)算法探討

時(shí)間:2022-08-10 04:15:52

導(dǎo)語(yǔ):數(shù)據(jù)挖掘機(jī)械學(xué)習(xí)算法探討一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘機(jī)械學(xué)習(xí)算法探討

摘要:隨著我國(guó)經(jīng)濟(jì)技術(shù)的不斷發(fā)展,信息技術(shù)水平也在不斷的提升,計(jì)算機(jī)技術(shù)的廣泛應(yīng)用,對(duì)社會(huì)的各個(gè)領(lǐng)域都有著影響。信息系統(tǒng)在現(xiàn)在社會(huì)中也有著廣泛的應(yīng)用,在傳統(tǒng)的數(shù)據(jù)分析以及統(tǒng)計(jì)技術(shù)的基礎(chǔ)上有了一定的創(chuàng)新,現(xiàn)在社會(huì)在不斷的進(jìn)步,對(duì)大規(guī)模數(shù)據(jù)的研究力度應(yīng)該加強(qiáng),不斷的挖掘出一些有用的知識(shí),然后使挖掘技術(shù)不斷的完善。機(jī)械學(xué)習(xí)算法有利于解決數(shù)據(jù)挖掘問(wèn)題。機(jī)械學(xué)習(xí)可以進(jìn)行自我完善,在這個(gè)過(guò)程中,計(jì)算機(jī)會(huì)逐漸的積累經(jīng)驗(yàn),從而提高自身的性能,機(jī)械學(xué)習(xí)的能力雖然沒(méi)有人類大腦學(xué)習(xí)能力強(qiáng),但是隨著不斷的創(chuàng)新,使計(jì)算機(jī)具備了從大量數(shù)據(jù)中提取特征、發(fā)現(xiàn)隱含規(guī)律的能力。也正是因?yàn)檫@樣,數(shù)據(jù)挖掘中的機(jī)械學(xué)習(xí)算法也被廣泛的運(yùn)用。

關(guān)鍵詞:數(shù)據(jù)挖掘;機(jī)械學(xué)習(xí);學(xué)習(xí)算法;應(yīng)用探討

信息管理技術(shù)在各大企業(yè)中數(shù)據(jù)管理技術(shù)也被廣泛利用,數(shù)據(jù)管理技術(shù)的廣泛運(yùn)用有利于企業(yè)內(nèi)部職能部門之間的溝通聯(lián)絡(luò)。但是在使用的過(guò)程中還是有些不足之處,數(shù)據(jù)信息越來(lái)越多,這就會(huì)使數(shù)據(jù)分析具有一定的復(fù)雜性。

1完善GA-BP神經(jīng)網(wǎng)絡(luò)模型

本文就在傳統(tǒng)的遺傳算法的基礎(chǔ)上提出了一種新的改進(jìn)型遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型。這種神經(jīng)網(wǎng)絡(luò)模型對(duì)傳統(tǒng)的這種神經(jīng)網(wǎng)絡(luò)模型在遺傳算法的染色體結(jié)構(gòu)和遺傳算子兩個(gè)方面進(jìn)行了相關(guān)的優(yōu)化,然后在進(jìn)行BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)改進(jìn)的時(shí)候,采用了自適應(yīng)交叉和變異概率,下面就對(duì)改進(jìn)的過(guò)程進(jìn)行了簡(jiǎn)要的分析說(shuō)明。(1)設(shè)計(jì)染色體結(jié)構(gòu)。控制基因和參數(shù)基因是上文所描述的新型染色體基因結(jié)構(gòu)的兩個(gè)表現(xiàn)形式,這種神經(jīng)網(wǎng)絡(luò)模型對(duì)傳統(tǒng)的遺傳算法的染色體結(jié)構(gòu)和遺傳算子進(jìn)行了優(yōu)化,從而對(duì)對(duì)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)進(jìn)行改進(jìn)??刂苹?qū)P神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)的改進(jìn)主要是對(duì)BP神經(jīng)網(wǎng)絡(luò)的隱含層節(jié)點(diǎn)數(shù)優(yōu)化。另一種結(jié)構(gòu)參數(shù)基因?qū)P神經(jīng)網(wǎng)絡(luò)的連接權(quán)值和閾值進(jìn)行優(yōu)化[2]。(2)對(duì)適應(yīng)度函數(shù)進(jìn)行設(shè)計(jì),具體過(guò)程如下:在上述函數(shù)中,訓(xùn)練樣本個(gè)數(shù)用n表示;訓(xùn)練數(shù)據(jù)的均方根誤差用∫rmse表示,誤差一般在0~1之間。(3)選擇算子。從提出的被改進(jìn)的遺傳算法上來(lái)看,在進(jìn)行型遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法在實(shí)現(xiàn)算子選取改進(jìn)以常規(guī)適應(yīng)值比例算法的時(shí)候經(jīng)常采用最優(yōu)個(gè)體保留方法,這樣做會(huì)引發(fā)局部最小值等問(wèn)題。(4)交叉、變異算子。采用單點(diǎn)交叉和基本變異算子是上文中提出的控制基因是改進(jìn)型遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法的上層所采用的。下層參數(shù)基因所采用的是整體算數(shù)交叉和非一致變異算子。(5)自適應(yīng)交叉、變異概率。上文中提出的改進(jìn)型遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法的方式,在進(jìn)行優(yōu)化的時(shí)候可以對(duì)設(shè)計(jì)自適應(yīng)交叉、變異概率,以此對(duì)遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò)神經(jīng)算法的機(jī)構(gòu)和初始權(quán)重進(jìn)行平衡優(yōu)化。對(duì)設(shè)計(jì)分析的簡(jiǎn)要過(guò)如下,自適應(yīng)交叉概率可以表示為∫avr表示種群的平均適應(yīng)值,∫min表示種群的最小適應(yīng)值,k1,k2通常在1.0上。上文中提出的改進(jìn)型遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法的過(guò)程的主要幾個(gè)步驟可以分為以下幾點(diǎn):(1)對(duì)相關(guān)的數(shù)據(jù)進(jìn)行及時(shí)的統(tǒng)一優(yōu)化處理。訓(xùn)練樣本數(shù)據(jù)和測(cè)試樣本數(shù)據(jù)是數(shù)據(jù)優(yōu)化處理之后可分為的種類。(2)在對(duì)改進(jìn)型遺傳算法模型的基本參數(shù)進(jìn)行設(shè)計(jì)的時(shí)候,可以用G來(lái)表示最大化代數(shù),在設(shè)定的時(shí)候要考慮隱含層節(jié)點(diǎn)數(shù)對(duì)種群的規(guī)模N的有關(guān)規(guī)定。(3)在對(duì)種群上層個(gè)體進(jìn)行優(yōu)化的時(shí)候采用采用二進(jìn)制編碼,種群下層種群個(gè)體進(jìn)行優(yōu)化采用實(shí)數(shù)編碼。(4)在確定BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)的時(shí)候,可以采用對(duì)種群各個(gè)個(gè)體解碼的形式進(jìn)行。(5)對(duì)種群中適很好的個(gè)體,采用遺傳操作的形式。(6)獲得新的子群,可以對(duì)種群中的遺傳個(gè)體使用自適應(yīng)概率進(jìn)行交叉、變異操作。(7)對(duì)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)隱含層節(jié)點(diǎn)、權(quán)值以及閾值等結(jié)構(gòu)參數(shù)進(jìn)行優(yōu)化改進(jìn),進(jìn)行不斷的創(chuàng)新的過(guò)程就是對(duì)上下層的子群個(gè)體解碼的優(yōu)化。(8)進(jìn)行(5)循環(huán)的要求有兩個(gè),就是在迭代步數(shù)達(dá)到了設(shè)定的最大值執(zhí)行(5)循環(huán),在最大個(gè)體適應(yīng)度值滿足要求的時(shí)候,也要進(jìn)行(5)循環(huán)過(guò)程。(9)在確定最佳的BP神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)、閾值和連接權(quán)值等參數(shù)的時(shí)候,采用對(duì)適應(yīng)值最佳的個(gè)體進(jìn)行解碼的形式。

2機(jī)械學(xué)習(xí)算法實(shí)例

下面就舉出有關(guān)的例子對(duì)上文所提出的優(yōu)化過(guò)程進(jìn)行簡(jiǎn)要分析,下文所采用的實(shí)例是煤礦空壓機(jī)的故障診斷系統(tǒng),然后對(duì)改進(jìn)型遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行有效的探索研究。(1)首先應(yīng)該做好相應(yīng)的準(zhǔn)備工作,閱讀相關(guān)的空壓機(jī)的說(shuō)明書,例如使用說(shuō)明書和故障說(shuō)明書等。在使用空壓機(jī)的時(shí)候,還應(yīng)該對(duì)使用過(guò)程中的經(jīng)驗(yàn)進(jìn)行積累,在使用結(jié)束后再對(duì)相關(guān)經(jīng)驗(yàn)進(jìn)行分析總結(jié),空壓機(jī)的故障類型以及故障是怎么來(lái)的,在進(jìn)行數(shù)據(jù)整理的時(shí)候都要進(jìn)行分析研究,及時(shí)的發(fā)現(xiàn)問(wèn)題所在。煤礦空壓機(jī)的故障診斷系統(tǒng)就是本文所采用的實(shí)例。通過(guò)相應(yīng)的實(shí)驗(yàn)數(shù)據(jù)分析,煤礦空壓機(jī)呈現(xiàn)出5種工作狀態(tài),用符號(hào)Y1-Y5表示,以此作為神經(jīng)網(wǎng)絡(luò)故障診斷模型的輸出。Y1-Y5所表示的內(nèi)容如下:Y1表示煤礦空壓機(jī)正常的工作狀態(tài);Y2表示煤礦空壓機(jī)冷卻水系統(tǒng)出現(xiàn)故障的工作狀態(tài);Y3表示煤礦空壓機(jī)潤(rùn)滑體統(tǒng)出現(xiàn)故障的工作狀態(tài);Y4表示煤礦空壓機(jī)軸承出現(xiàn)故障的工作狀態(tài);Y5表示煤礦空壓機(jī)電路系統(tǒng)出現(xiàn)故障的工作狀態(tài)。如果出現(xiàn)以上故障,根據(jù)相關(guān)的經(jīng)驗(yàn)以及故障的了解,故障的表現(xiàn)形式可以分為10種,用符號(hào)X1-X10表示,即為神經(jīng)網(wǎng)絡(luò)故障診斷模型的輸入。X1-X10分別表示:X1表示煤礦空壓機(jī)排氣量過(guò)低;X2表示空壓機(jī)排氣壓力不足;X3表示空壓機(jī)排氣溫度超限;X4表示空壓機(jī)冷卻水溫度超限;X5表示空壓機(jī)冷卻水壓力不足;X6表示空壓機(jī)主機(jī)轉(zhuǎn)速低限;X7表示空壓機(jī)振動(dòng)超限;X8表示空壓機(jī)潤(rùn)滑系統(tǒng)油溫超限;X9表示空壓機(jī)潤(rùn)滑油壓力不足;X10表示軸承溫度超限。(2)空壓機(jī)經(jīng)過(guò)數(shù)據(jù)挖掘之后的故障診斷分析。通過(guò)對(duì)空壓機(jī)可能出現(xiàn)的故障進(jìn)行分析,為了看出新的神經(jīng)網(wǎng)絡(luò)的良好的性能,采用傳統(tǒng)的遺傳神經(jīng)網(wǎng)絡(luò)算法建立了煤礦空壓機(jī)故障針對(duì)系統(tǒng),在進(jìn)行網(wǎng)絡(luò)訓(xùn)練的時(shí)候應(yīng)該采用相同的訓(xùn)練數(shù)據(jù)樣本,在測(cè)試的時(shí)候也應(yīng)該采用相同的測(cè)試數(shù)據(jù)樣本。通過(guò)相應(yīng)的實(shí)驗(yàn)可以看出,在經(jīng)過(guò)569次迭代后改進(jìn)型GA-BP神經(jīng)網(wǎng)絡(luò)算法就使得誤差達(dá)到了設(shè)定范圍內(nèi),但是如果采用傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)算法就沒(méi)有那么好的效果,只有在進(jìn)行2779次迭代才使得誤差滿足要求。由此可以看出,優(yōu)化改進(jìn)后的BP神經(jīng)網(wǎng)絡(luò)算法在各個(gè)方面上都有很好的效果,特別是網(wǎng)絡(luò)的訓(xùn)練速度、收斂速度和收斂精度方面。改進(jìn)型GA-BP神經(jīng)網(wǎng)絡(luò)算法在個(gè)方面都有比傳統(tǒng)的算法要好。為了能夠更加明顯的看出效果,下面采用100組數(shù)據(jù)進(jìn)行研究分析。從測(cè)試的結(jié)果可以看出,87.5%是傳統(tǒng)的P神經(jīng)網(wǎng)絡(luò)的診斷正確率,診斷時(shí)間為564s,輸出值存在一定的不穩(wěn)定性,而上文中所提到的優(yōu)化改進(jìn)后的GA-BP神經(jīng)網(wǎng)絡(luò)的診斷正確率為98.2%,診斷時(shí)間為246s,輸出值相對(duì)穩(wěn)定,從這數(shù)據(jù)可以看出,改進(jìn)后的效果明顯比傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)算法要好的多。改進(jìn)后的BP神經(jīng)網(wǎng)絡(luò)算法的錯(cuò)誤率比較低,檢測(cè)的準(zhǔn)確率和速度都有提高,工作性能也有所提高。

3結(jié)語(yǔ)

在社會(huì)的不斷發(fā)展進(jìn)步的過(guò)程中,數(shù)據(jù)挖掘技術(shù)也在不斷的創(chuàng)新,在社會(huì)中的運(yùn)用也越來(lái)越廣泛,發(fā)展速度也越來(lái)越快。本文就在傳統(tǒng)的遺傳算法的基礎(chǔ)上提出了一種新的改進(jìn)型遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型。這種神經(jīng)網(wǎng)絡(luò)模型對(duì)傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型在遺傳算法的染色體結(jié)構(gòu)和遺傳算子兩個(gè)方面進(jìn)行了相關(guān)的優(yōu)化,然后在進(jìn)行BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)改進(jìn)的時(shí)候,采用了自適應(yīng)交叉和變異概率,這樣有利于各種數(shù)據(jù)的處理。

作者:馮琬婷 單位:遼寧省大連市遼寧師范大學(xué)

參考文獻(xiàn)

[1]李運(yùn).機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用[D].北京郵電大學(xué),2015.

[2]胡秀.基于Web的數(shù)據(jù)挖掘技術(shù)研究[J].軟件導(dǎo)刊,2015(1):149-150.