醫(yī)院信息管理數(shù)據(jù)挖掘論文

時(shí)間:2022-03-26 04:38:59

導(dǎo)語:醫(yī)院信息管理數(shù)據(jù)挖掘論文一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

醫(yī)院信息管理數(shù)據(jù)挖掘論文

1數(shù)據(jù)挖掘及其關(guān)鍵技術(shù)

數(shù)據(jù)挖掘技術(shù)是當(dāng)前數(shù)據(jù)分析和處理領(lǐng)域一項(xiàng)十分重要的技術(shù),具體而言數(shù)據(jù)挖掘技術(shù)可以看成是信息技術(shù)不斷發(fā)展和演進(jìn)的結(jié)果,是在人們對于數(shù)據(jù)庫技術(shù)不斷發(fā)展和創(chuàng)新的基礎(chǔ)上發(fā)展而來的。在初期階段,商業(yè)數(shù)據(jù)往往只是簡單的進(jìn)行存儲,然后有了對相關(guān)數(shù)據(jù)的查詢功能,再繼續(xù)發(fā)展為對相關(guān)數(shù)據(jù)的即時(shí)遍歷。數(shù)據(jù)挖掘技術(shù)使得數(shù)據(jù)查詢已經(jīng)不僅僅局限于數(shù)據(jù)本身,同時(shí)還可以通過相關(guān)的算法和技術(shù)發(fā)現(xiàn)數(shù)據(jù)之間潛在的關(guān)聯(lián)性,從而在很大程度上增加了數(shù)據(jù)利用的深度和層次。隨著當(dāng)前大數(shù)據(jù)時(shí)代的到來以及高性能計(jì)算機(jī)和數(shù)據(jù)挖掘算法的成熟,數(shù)據(jù)挖掘技術(shù)開始在商業(yè)領(lǐng)域進(jìn)行應(yīng)用,并且取得了快速的發(fā)展。在目前的醫(yī)院信息管理系統(tǒng)中已經(jīng)積累了大量的數(shù)據(jù)信息,因此如何實(shí)現(xiàn)對這一部分信息的深層次數(shù)據(jù)挖掘是至關(guān)重要的,這也將直接決定著醫(yī)院將來的發(fā)展和命運(yùn)。在醫(yī)院信息管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)可以在更深層次上對醫(yī)院的管理數(shù)據(jù)進(jìn)行分析,從而可以為醫(yī)院從業(yè)人員的相關(guān)決策、管理以及研究提供更加有力的技術(shù)支持。因此數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息管理系統(tǒng)中的應(yīng)用具有十分重要的意義。在目前的數(shù)據(jù)挖掘技術(shù)中,其關(guān)鍵技術(shù)是數(shù)據(jù)的預(yù)處理。當(dāng)需要進(jìn)行分析的數(shù)據(jù)庫包含大量的噪聲或者存在數(shù)據(jù)不一致性時(shí),數(shù)據(jù)預(yù)處理就顯得更加有必要。根據(jù)對相關(guān)數(shù)據(jù)挖掘過程的統(tǒng)計(jì)顯示,超過一半的時(shí)間用于進(jìn)行數(shù)據(jù)預(yù)處理,而真正用于數(shù)據(jù)信息挖掘的時(shí)間則僅占到10%左右。目前的數(shù)據(jù)預(yù)處理技術(shù)主要分析對數(shù)據(jù)的清洗、集成、轉(zhuǎn)換以及消減等。另一關(guān)鍵技術(shù)是匿名化以及轉(zhuǎn)換技術(shù),這主要是由于在目前的醫(yī)院信息管理中涉及到病人的隱私問題,因此在進(jìn)行數(shù)據(jù)處理的同時(shí)需要對患者的相關(guān)記錄進(jìn)行匿名化處理,以更好的保護(hù)患者的個(gè)人隱私。

2基于數(shù)據(jù)挖掘技術(shù)的醫(yī)院信息管理系統(tǒng)

2.1基于數(shù)據(jù)挖掘技術(shù)的醫(yī)院信息管理系統(tǒng)

關(guān)聯(lián)規(guī)則是目前進(jìn)行數(shù)據(jù)挖掘的重要手段,在醫(yī)院信息管理系統(tǒng)中引入關(guān)聯(lián)規(guī)則可以進(jìn)一步發(fā)現(xiàn)數(shù)據(jù)之間的相互關(guān)聯(lián),并且在對病人的相關(guān)數(shù)據(jù)的分析和進(jìn)一步挖掘過程中,嘗試分析患者年齡與醫(yī)療費(fèi)用之間潛在的關(guān)聯(lián),并且進(jìn)一步通過這種關(guān)聯(lián)關(guān)系加強(qiáng)對醫(yī)院資源的合理優(yōu)化配置,實(shí)現(xiàn)對不同年齡段患者的醫(yī)療費(fèi)用的有效控制,進(jìn)而實(shí)現(xiàn)醫(yī)院效益的最大化。具體而言,將關(guān)聯(lián)數(shù)據(jù)集合記為D{=t1,t2,...tn},tk={i1,i2,im..ip},tk為數(shù)據(jù)庫中的事務(wù),im為數(shù)據(jù)庫中的項(xiàng)。在數(shù)據(jù)集合D中,其包含的集X的項(xiàng)數(shù)為集的支持?jǐn)?shù),將其記為σx,支持度為suppor(tX),則有suppor(tX)=σx/|D|×100%。假設(shè)X和Y為數(shù)據(jù)庫集合D中的項(xiàng)集,則有:假如XY,則有X項(xiàng)的支持度大于Y項(xiàng)的支持度,同時(shí)假如X是非頻繁項(xiàng),則此時(shí)Y項(xiàng)也是非頻繁;則假如Y項(xiàng)是頻繁的,則X項(xiàng)也是頻繁的。在數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則中有兩個(gè)至關(guān)重要的概念,即支持度與置信度。通常而言,支持度只要用于衡量采用的關(guān)聯(lián)規(guī)則的可信度,而置信度則用于表示在生成數(shù)據(jù)集中關(guān)聯(lián)規(guī)則的統(tǒng)計(jì)角色。在實(shí)際的應(yīng)用過程中,假如support(XY)大于支持集,并且置信度大于最小置信度,此時(shí)XY可以稱之為強(qiáng)規(guī)則,否則將其稱之為弱規(guī)則。在數(shù)據(jù)挖掘的過程中,尋找強(qiáng)規(guī)則是整個(gè)數(shù)據(jù)挖掘過程的關(guān)鍵。在強(qiáng)規(guī)則XY所對應(yīng)的項(xiàng)集中,必定存在著頻集?;陉P(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘模型如圖1所示,其中主要包括數(shù)據(jù)集D、關(guān)聯(lián)規(guī)則搜索算法、數(shù)據(jù)挖掘結(jié)果R以及用戶與數(shù)據(jù)挖掘之間的交互,對相關(guān)的數(shù)據(jù)挖掘結(jié)果信息結(jié)果進(jìn)行合理的評價(jià)。在實(shí)際的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘過程中還需要考慮到以下兩個(gè)方面的問題:其一,盡量減少I/O操作的次數(shù),這主要是由于數(shù)據(jù)挖掘過程中的數(shù)據(jù)量是非常大的,因此頻繁的進(jìn)行I/O操作將會對數(shù)據(jù)挖掘的效率產(chǎn)生很大的影響,其根本的方法就是減少對于數(shù)據(jù)庫集的掃描頻率和次數(shù);其二,避免候選集中項(xiàng)的數(shù)量過大,這主要是由于過多的項(xiàng)數(shù)將會使得存儲空間被大量占用,從而對數(shù)據(jù)挖掘的效率產(chǎn)生影響。

2.2基于數(shù)據(jù)挖掘技術(shù)的醫(yī)院信息管理系統(tǒng)的實(shí)現(xiàn)

數(shù)據(jù)準(zhǔn)備階段。在研究過程中采用某醫(yī)院信息管理系統(tǒng)中的口腔潰瘍數(shù)據(jù)進(jìn)行挖掘分析,其中數(shù)據(jù)準(zhǔn)備階段主要包括集成、清洗以及轉(zhuǎn)換三個(gè)階段。具體而言,數(shù)據(jù)集成主要是將不同的患者數(shù)據(jù)表格及其費(fèi)用數(shù)據(jù)整合到一起,并且對這些原始數(shù)據(jù)進(jìn)行集成,將其集成到統(tǒng)一的數(shù)據(jù)表格中,其中主要包含患者的性別、年齡以及編號等信息。數(shù)據(jù)清洗指的是對原始數(shù)據(jù)進(jìn)行進(jìn)一步的處理,其目的是去除原始數(shù)據(jù)中的噪聲以及不相關(guān)信息、補(bǔ)充遺漏數(shù)據(jù)、去除白噪聲等,并且根據(jù)實(shí)際情況完成對原始數(shù)據(jù)的轉(zhuǎn)換。同時(shí),由于醫(yī)院信息數(shù)據(jù)存在著其特殊性,醫(yī)院的數(shù)據(jù)往往產(chǎn)生于不同的場所,因此其產(chǎn)生的過程較為復(fù)雜,這就極易導(dǎo)致數(shù)據(jù)產(chǎn)生的過程中出現(xiàn)遺失或者出現(xiàn)數(shù)據(jù)錯(cuò)誤的情況,因此數(shù)據(jù)清洗階段對于醫(yī)院數(shù)據(jù)挖掘工作是至關(guān)重要的,同時(shí)為了更好的保證數(shù)據(jù)清洗階段的準(zhǔn)確性可以實(shí)行專業(yè)醫(yī)護(hù)人員監(jiān)督的模式,此種模式可以有效的降低數(shù)據(jù)清洗過程中的差錯(cuò)。數(shù)據(jù)轉(zhuǎn)換是針對數(shù)據(jù)的不同特征對數(shù)據(jù)進(jìn)行有效的轉(zhuǎn)換,其中主要的手段包括對數(shù)據(jù)的規(guī)格化處理、數(shù)據(jù)信息歸納、旋轉(zhuǎn)等。結(jié)合實(shí)際的醫(yī)院信息管理系統(tǒng)數(shù)據(jù)挖掘案例,可以對年齡數(shù)據(jù)信息進(jìn)分段編號處理,以更好的提高數(shù)據(jù)挖掘的效率。同時(shí),在數(shù)據(jù)轉(zhuǎn)換的過程中還可以將一些沒有意義的數(shù)據(jù)進(jìn)行刪減,以更好的保證數(shù)據(jù)挖掘的效率,同時(shí)還可以降低數(shù)據(jù)挖掘的誤差。

3結(jié)束語

現(xiàn)代化醫(yī)療事業(yè)發(fā)展關(guān)系到國計(jì)民生,在我國的社會主義發(fā)展過程中占到舉足輕重的位置。而信息化程度的提升對于推動(dòng)現(xiàn)代化醫(yī)療事業(yè)發(fā)展具有十分重要的意義,基于數(shù)據(jù)挖掘的醫(yī)院信息管理系統(tǒng)能夠有效的提升醫(yī)院資源配置水平、提升醫(yī)院效益。

作者:沈旴亮單位:南京醫(yī)科大學(xué)附屬南京婦幼保健院