糖尿病犯者醫(yī)療管理研究

時間:2022-11-15 09:16:38

導(dǎo)語:糖尿病犯者醫(yī)療管理研究一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

糖尿病犯者醫(yī)療管理研究

近十年來,我們面臨快速增長糖尿病患者人數(shù),患者人群也成為了公共健康最為沉重的負(fù)擔(dān)之一。2000年,所有年齡層的糖尿病患病率達(dá)2.8%,預(yù)計到2030年該數(shù)據(jù)將達(dá)到4.4%[1]。2000年,因糖尿病導(dǎo)致的全球過量死亡率預(yù)計達(dá)到290萬人,相當(dāng)于全年死亡人數(shù)的5.2%[2]。伴隨著不同的并發(fā)癥,糖尿病對個人生活質(zhì)量以及醫(yī)療資源的使用造成了相當(dāng)大的影響。預(yù)先血糖控制可以減緩或防止糖尿病并發(fā)癥的發(fā)生。一般來說,糖尿病患者的保健質(zhì)量通過血紅蛋白A1C來評估。

1資料與方法

1.1分類算法及效果評估。為比較屬性選擇的效果,需要利用三種分類算法測試屬集:一個以樣例為基礎(chǔ)的學(xué)習(xí)法KNN,一個決策樹學(xué)習(xí)法C4.5,還有一個概率學(xué)學(xué)習(xí)法樸素貝葉斯分類法(NaïveBayesclassifier)。KNN是以樣例為基礎(chǔ)學(xué)習(xí)法的一個例子,列舉一個新的例子,KNN算法給最相似的一個或多個樣例分配類別。根據(jù)樣例間的差距計算相似度。本研究中,我們使用的分類精度和受試者工作特征曲線下的區(qū)域(藥時曲線下面積)評估分析模型的效果[3]。分類精度的研究原則,是使用最為普遍的原則。藥時曲線下面積有著重要的數(shù)據(jù)特性。一個模型的藥時曲線相當(dāng)于概率,無論該模型中隨機(jī)選取正樣例的級別是否高于隨機(jī)所選負(fù)樣例[4]。一般而言,面積越大,模型越好。1.2數(shù)據(jù)描述。本研究使用的臨床數(shù)據(jù)庫來自于臺灣中部的一家醫(yī)學(xué)院附屬醫(yī)院,該院擁有110名醫(yī)生、600個床位,以及每年60000件的門診服務(wù)和10000件的住院服務(wù)。該數(shù)據(jù)集中有1498個樣例。本研究收集的特征包括連續(xù)數(shù)據(jù),如年齡、發(fā)病期、身體質(zhì)量指數(shù)(BMI);分類數(shù)據(jù),如性別、受教育程度、家庭病史、定期鍛煉、日常飲酒、吸煙、自我護(hù)理、共病、血糖檢測使用情況、治療情況。ICD-9診斷碼,共病分為五類:腎臟并發(fā)癥、眼部并發(fā)癥、神經(jīng)系統(tǒng)并發(fā)癥、血管并發(fā)癥以及足部并發(fā)癥。治療方法分為三類,包括飲食控制、口服液以及胰島素注射。決策屬性A1C分為兩個級別:認(rèn)為A1C<9.0%是做到了良好的血糖控制;認(rèn)為A1C≥9.0%是血糖控制非常不理想[5]。

2研究結(jié)果分析

實驗中使用的血糖控制數(shù)據(jù)。通過使用信息增益、增益率、對稱不確定性以及ReliefF評級算法的整套數(shù)據(jù)確定特征評級。數(shù)據(jù)集里使用三個連續(xù)特征,十個分類特征。四種特征評級方法提供不同的級別,明顯地生產(chǎn)不同的分類效果。血糖控制前五個重要特征是年齡、治療方式、自我護(hù)理條件、受教育程度以及定期鍛煉。C4.5分類法,KNN(k=1),樸素貝葉斯用于測試分類盒藥時曲線下面積。我們使用十倍的交叉效度分析作為標(biāo)準(zhǔn),預(yù)測帶有固定數(shù)據(jù)樣本的學(xué)習(xí)法分類法的準(zhǔn)確性和藥時曲線下面積。通過使用四種特征評級方法比較C4.5的分類準(zhǔn)確性,使用五個和六個特征的ReliefF評級算法獲得最佳的分類準(zhǔn)確性為73.56%。KNN分類法中,使用四個特征的ReliefF評級算法獲得的最佳分類準(zhǔn)確性為73.56%。NB分類法中,使用五個特征的IG、GR、SU算法獲得的最佳分類準(zhǔn)確性為74.10%。與C4.5和KNN分類法相比,NB獲得的準(zhǔn)確性比C4.5和KNN模型更好。通過使用四種特征評級方式比較C4.5的藥時曲線下面積,采用七種特征的ReliefF的評級算法獲得最大的面積為6199。KNN分類法中,使用五個特征的ReliefF評級算法獲得的最大藥時曲線下面積為6251。NB分類法中,使用五個特征的IG、GR、SU算法獲得的最大藥時曲線下面積為6553。與C4.5和KNN分類法的藥時曲線下面積相比,NB獲得的準(zhǔn)確性比C4.5和KNN模型更好。本研究意在探究血糖控制特征的評級,以及使用不同的分級法探究四種特性評級方法的效果。我們提出四種特征評級方法的一個對照,生成特性評級列表。結(jié)果顯示,特征選擇有利于改善常見學(xué)習(xí)法算法。研究表明,任何學(xué)習(xí)分類法都不能完美地處理所有情況。研究表明NB分類法和藥時曲線下面積要比C4.5和KNN分類法和藥時曲線下面積有更高的優(yōu)越性。C4.5和KNN、ReliefF評級算法可以獲得最佳的準(zhǔn)確性和最大藥時曲線下面積;NB、IG、GR、SU則獲得同樣的準(zhǔn)確性和藥時曲線下面積。

本論文得出的結(jié)論對特征評級方法以及學(xué)習(xí)法算法有著重要的影響。其他特征選擇方式以及分類法模型能有益于將來的研究提高準(zhǔn)確性和藥時曲線下面積。

作者:翁景德 唐維萍 許哲毓 單位:1.仰恩大學(xué) 2.華廈學(xué)院