數(shù)據(jù)挖掘疾病預(yù)測研究

時間:2022-01-30 09:20:02

導(dǎo)語:數(shù)據(jù)挖掘疾病預(yù)測研究一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘疾病預(yù)測研究

【摘要】隨著計算機(jī)和數(shù)據(jù)挖掘分析日益劇增,在醫(yī)學(xué)預(yù)測方面已經(jīng)取得了很好的結(jié)果,具有非凡的意義,深度學(xué)習(xí)最近幾年已經(jīng)有個初步的結(jié)果,并且用到了醫(yī)學(xué)領(lǐng)域。那么工作分為,數(shù)據(jù)歸一,基于DBN的數(shù)據(jù)構(gòu)建,設(shè)計DBN模型,以及實現(xiàn)預(yù)測。設(shè)計模型,包括數(shù)據(jù)預(yù)測模塊,預(yù)測結(jié)果以及展示結(jié)果。將數(shù)據(jù)進(jìn)行分析處理,預(yù)分析,以及初步的測試,得到結(jié)果。

【關(guān)鍵詞】大數(shù)據(jù);疾病預(yù)測;醫(yī)學(xué)信息系統(tǒng);數(shù)據(jù)挖掘,DBN算法的基本原理

1引言

近年來非典病毒在我國泛濫,出現(xiàn)這一問題有很大的社會因素。那就是危機(jī)意識。非典毫無疑問是一場公共衛(wèi)生危機(jī),這場危機(jī)之所以能夠爆發(fā)并造成嚴(yán)重影響,除了病毒的新發(fā)性之外,危機(jī)意識的淡薄以及由此導(dǎo)致的社會預(yù)警系統(tǒng)的缺乏和應(yīng)有的防治措施的不力,這是一個決不可忽視的社會因素。再來說影響非典發(fā)病的因素。最主要的是疫苗因素,如今生產(chǎn)疫苗的工廠多,所以就造成了疫苗品種多,價格差異大,這樣就不能保證社會的總體免疫力良好,就給了病毒傳播的機(jī)會。其次是對藥品的濫用,長期過量使用氯霉素,鏈霉素,慶大霉素及皮質(zhì)激素等藥物,因其破壞白細(xì)胞和淋巴細(xì)胞,而抗體均是由B淋巴細(xì)胞產(chǎn)生,因此大大影響了免疫效果,是人對非典抵抗下降加快病毒的擴(kuò)散。疾病預(yù)測是疾病預(yù)防,準(zhǔn)確的預(yù)測人群以及個體的疾病發(fā)展趨勢成為人們預(yù)測防范疾病是一個重要的手段,預(yù)測分為定性預(yù)測和定量預(yù)測,定性預(yù)測可以直觀的判斷預(yù)測主要是依靠經(jīng)驗以及直觀判斷能力,不用或者用少量的計算,定性的預(yù)測能充分發(fā)揮人的主觀作用,考慮無法定量的因素,靈活省時省事,但缺乏數(shù)據(jù)的精確描述,而定量的預(yù)測,可以運用數(shù)學(xué)統(tǒng)計的方法對未來發(fā)展趨勢,增減速度以及可能達(dá)到發(fā)展的數(shù)量的說明。利用并構(gòu)建DBN模型,設(shè)計實現(xiàn)疾病預(yù)測行為定性預(yù)測方面,建立模型進(jìn)行預(yù)測的相關(guān)算法,利用波爾茲曼機(jī)以及BP網(wǎng)絡(luò),采用貪婪逐層學(xué)習(xí)的方法對于疾病預(yù)測風(fēng)險評估,利用模糊算法,回歸算法,支持向量機(jī),預(yù)測年際變化。利用BP神經(jīng)網(wǎng)絡(luò)預(yù)測每年疾病數(shù)目。由于疾病信息大,噪聲大,數(shù)據(jù)不完全以及隨機(jī)模糊性,疾病的風(fēng)險預(yù)測顯得極其重要。本文采用了深度學(xué)習(xí)深度信念網(wǎng)絡(luò)的模型方法,來提高疾病的預(yù)測的準(zhǔn)確性,采集疾病病人的體檢數(shù)據(jù),對數(shù)據(jù)進(jìn)行分析處理,歸一化,建立計算處理的基礎(chǔ)表示數(shù)據(jù)庫,對于數(shù)據(jù)進(jìn)行分析,論文預(yù)測構(gòu)建。分為預(yù)處理,疾病建立,開發(fā)DBN系統(tǒng)以及參考測試結(jié)果。

2學(xué)習(xí)方法

當(dāng)前幾種疾病的預(yù)測方法,先已有的包含,回歸預(yù)測,時間序列預(yù)測,灰度預(yù)測,以及人工神經(jīng)網(wǎng)絡(luò)等方法。但是此幾種方法各有缺陷,而深度學(xué)習(xí)的方法是基于數(shù)據(jù)特征進(jìn)行學(xué)習(xí),論文提出的DBN模型不僅可以學(xué)習(xí)特征還能自適應(yīng),也可以避免BP的局部極小的情況。2.1BP神經(jīng)網(wǎng)絡(luò)。BP網(wǎng)絡(luò)是通過逆向傳輸,通過梯度下降得到一個較好的效果,BP網(wǎng)絡(luò)也稱為梯度下降網(wǎng)絡(luò),通過誤差平方和最小,BP的神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),輸入輸出隱層,信息正向傳輸,誤差率反向傳播的過程,雙向并行進(jìn)行。輸入層接收信息,輸出層輸出處理之后的結(jié)果,中間主要是通過數(shù)據(jù)轉(zhuǎn)換,信息變換,通過數(shù)據(jù)處理得到想要的答案。誤差則通過輸出層,按照誤差梯度下降的方法修正各個權(quán)值,向隱層以及輸入層傳播,去調(diào)節(jié)權(quán)值去達(dá)到誤差最小。最常見的就是一個三層的網(wǎng)絡(luò)機(jī)構(gòu),如圖1所示。此種網(wǎng)絡(luò)有很強(qiáng)的映射能力,非線性性能完備。那么在BP網(wǎng)絡(luò)中,隱層足夠的情況下,能夠?qū)崿F(xiàn)任意非線性函數(shù)的逼近,但是BP存在他自身的局限性,譬如:梯度消失,局部最優(yōu),學(xué)習(xí)速度慢,無法控制隱層個數(shù)等等問題。2.2DBN學(xué)習(xí)預(yù)測疾病。DBN算法是數(shù)據(jù)挖掘技術(shù)中常用的一種分類和預(yù)測方法。深度信念機(jī),是由多個波爾茲曼機(jī)組成的神經(jīng)網(wǎng)絡(luò),存在一個n層的網(wǎng)絡(luò)模型,針對隱層以及可視層實現(xiàn)聯(lián)合概率分布。進(jìn)行預(yù)學(xué)習(xí)以及整個DBN的模型學(xué)習(xí)訓(xùn)練,是對一個受限波爾茲曼機(jī)單獨進(jìn)行訓(xùn)練,之后疊加一層,作為下一層輸入,再通過反向?qū)W習(xí)算法進(jìn)行調(diào)節(jié),圖2所示。此模型的好處在于,首先對于數(shù)據(jù)特征進(jìn)行一次學(xué)習(xí),然后通過自學(xué)的方式再將結(jié)果輸出,作為下一層的輸入進(jìn)行訓(xùn)練學(xué)習(xí)。一步一步層層學(xué)習(xí)和訓(xùn)練,作為深度學(xué)習(xí)的過程,對于特征分析可得到更好的結(jié)果。深度信念網(wǎng)絡(luò)實現(xiàn)了從上向下的學(xué)習(xí)結(jié)構(gòu),自生成的結(jié)構(gòu),處理模糊信息加以傳播,從而減少傳播的誤差。在此網(wǎng)絡(luò)用于各個網(wǎng)絡(luò)過程,實現(xiàn)了較好的結(jié)果。

3預(yù)測模型建立

基于DBN的模型,首先數(shù)據(jù)采集,采集心血疾病的各項體征,將數(shù)據(jù)分為測試和預(yù)測兩份。(1)數(shù)據(jù)采集,采集醫(yī)學(xué)數(shù)據(jù)以及劃分?jǐn)?shù)據(jù)分析。(2)構(gòu)造DBN的模型,采用疾病分析方法的網(wǎng)絡(luò)構(gòu)架,包括輸入點,隱層點和輸出點的設(shè)計。(3)構(gòu)造模型,以及利用訓(xùn)練數(shù)據(jù),對其加速訓(xùn)練,以及設(shè)計最好的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行分析,得到誤差函數(shù)。設(shè)計權(quán)值矩陣以及共軛梯度。(4)測試,將數(shù)據(jù)輸入模型進(jìn)行測試。(5)分析結(jié)果。

4結(jié)論

本文基于DBN算法建立流程,通過驗證實驗結(jié)果準(zhǔn)備率,相比與BP的網(wǎng)絡(luò)進(jìn)行對比,DBN準(zhǔn)確率高于深度學(xué)習(xí)的準(zhǔn)確率。通過建立數(shù)據(jù),以及樣本的歸一化,實現(xiàn)確定各個層數(shù)的隱層以及輸出,對數(shù)據(jù)進(jìn)行學(xué)習(xí),數(shù)據(jù)處理完成模型建立完畢。

參考文獻(xiàn)

[1]譚慭莘,田考聰.數(shù)學(xué)模型在人群疾病預(yù)測研究中的應(yīng)用[J].中國醫(yī)院統(tǒng)計,2005,12(1):83~85.

[2]袁鶯楹,董建成.基于數(shù)學(xué)模型的疾病預(yù)測方法比較研究[J].軟件導(dǎo)刊,2009(5):108~110.

[3]涂德華,張理義,陶鳳燕.軍人心理疾病預(yù)測量表的信度及效度檢驗[J].江蘇大學(xué)學(xué)報(醫(yī)學(xué)版),2009,19(2):168~172.

[4]余凱,賈磊,陳雨強(qiáng),徐偉.深度學(xué)習(xí)的昨天、今天和明天[J].計算機(jī)研究與發(fā)展,2013,09:1799~1804.

[5]由清圳.基于深度學(xué)習(xí)的視頻人臉識別方法[D].哈爾濱:哈爾濱工業(yè)大學(xué),2013.

[6]王山海,景新幸,楊海燕.基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的孤立詞語音識別的研究[J].計算機(jī)應(yīng)用研究,2015,8.

作者:高驍智 單位:陜西延安中學(xué)