人工智能與檢驗醫(yī)學輔助診療現(xiàn)狀

時間:2022-11-11 09:59:51

導語:人工智能與檢驗醫(yī)學輔助診療現(xiàn)狀一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

人工智能與檢驗醫(yī)學輔助診療現(xiàn)狀

摘要:隨著互聯(lián)網(wǎng)、大數(shù)據(jù)及云計算等新興技術(shù)的快速發(fā)展,人工智能(AI)已被廣泛應用于影像和病理臨床輔助診療。檢驗醫(yī)學作為現(xiàn)代醫(yī)學的重要支撐,與AI的融合勢在必行。該文重點介紹了檢驗大數(shù)據(jù)如何與AI結(jié)合以構(gòu)建檢驗AI,并展望了檢驗AI在疾病診斷、預測及風險評估等臨床輔助診療領(lǐng)域的應用前景。

關(guān)鍵詞:人工智能;檢驗醫(yī)學;檢驗人工智能系統(tǒng);臨床輔助診療

人工智能(AI)是研究、開發(fā)用于模擬、延伸和擴展人類智能的一門新興的科學技術(shù)[1]。AI自誕生以來,經(jīng)過不斷的演進與發(fā)展,在越來越多領(lǐng)域得以重視和應用。目前,AI技術(shù)已廣泛應用于醫(yī)療領(lǐng)域,出現(xiàn)了影像AI[2]、手術(shù)機器人[3]、藥物研發(fā)AI[4]等諸多應用場景。檢驗醫(yī)學作為臨床輔助診療體系中不可或缺的部分,貫穿患者入院、出院、藥物治療等過程,影響著患者的醫(yī)療服務質(zhì)量[5-6]。檢驗醫(yī)學具有高度自動化、數(shù)據(jù)化及數(shù)據(jù)庫存儲等特點為檢驗AI的應用與研發(fā)創(chuàng)造了有利條件[7-8]。為此,本文結(jié)合AI在當下臨床輔助診療中的應用現(xiàn)狀,重點闡述檢驗醫(yī)學如何與AI融合構(gòu)建檢驗AI,并展望檢驗AI在輔助臨床診療中的應用前景。

1AI與臨床輔助診療

隨著深度學習技術(shù)在目標檢測、圖像分類及圖像分割等領(lǐng)域取得突破性的進展,影像AI和病理AI已成為新的醫(yī)學研究熱點[9]。目前,影像AI和病理AI已成功應用于疾病的篩查、預測及診斷等領(lǐng)域。比如,ZHANG等[2]構(gòu)建了一個包括新型冠狀病毒肺炎(COVID-19)、常見肺炎及正常對照人群的大規(guī)模CT數(shù)據(jù)集,并基于CT圖像開發(fā)了COVID-19AI診斷系統(tǒng),用于幫助準確診斷COVID-19。TERAMOTO等[10]使用深卷積神經(jīng)網(wǎng)絡(luò)開發(fā)了微觀圖像中的肺癌細胞病理自動分類模型,使約71%的肺癌細胞得到正確分類,且分類正確的圖像具有典型的細胞形態(tài)和排列。然而,影像和病理診斷具有局限性。一方面,病理切片后診斷周期較長、費用較高,影像學檢查相對迅速但費用也相對較高。另一方面,病理和影像檢查結(jié)果僅僅是一些特定疾病的部分參考指標,無法反映患者疾病的整體情況。相較于影像和病理檢查,實驗室檢驗具有顯著優(yōu)勢。首先,實驗室檢驗方法簡單、快速且成本低,醫(yī)生通過分析患者的檢驗數(shù)據(jù)即可實現(xiàn)良好的診療效果,可提高臨床醫(yī)生的診療效率并減輕患者的醫(yī)療負擔。此外,血常規(guī)、血生化、尿液或糞便等檢驗結(jié)果可直接反映疾病的生理及病理變化過程。臨床上常用的檢驗數(shù)據(jù)具有足夠的有效性和穩(wěn)定性,已經(jīng)過大規(guī)模的臨床實踐和評估,并廣泛用于診斷、排查、分類或監(jiān)測各種疾病,可以為臨床醫(yī)生疾病診療提供一個更為全面的指導建議[11]。目前,檢驗數(shù)據(jù)的真實診斷效能通常被低估,主要是由于個體化檢驗數(shù)據(jù)復雜多變,不同的異常檢驗結(jié)果對應的臨床意義不同,聯(lián)合意義則更多、更廣。臨床醫(yī)生面對眾多異常檢驗結(jié)果時,由于受限于人腦的推理和計算能力,即使是經(jīng)驗豐富的醫(yī)學專家也經(jīng)常忽略眾多結(jié)果之間隱藏的關(guān)鍵信息和重要趨勢,不可避免地造成疾病的漏診與誤診。因此,使用AI方法集成和分析檢驗數(shù)據(jù)為提高檢驗數(shù)據(jù)的診斷價值提供了巨大的應用前景[12]。

2基于檢驗數(shù)據(jù)的檢驗AI

2.1檢驗AI構(gòu)建的基本條件

目前,構(gòu)建檢驗AI的基本條件已經(jīng)基本具備。首先可從醫(yī)院檢驗信息系統(tǒng)(LIS系統(tǒng))中獲得大量檢驗數(shù)據(jù)。LIS已成為當今醫(yī)院管理信息(HIS)系統(tǒng)的重要組成部分,該系統(tǒng)存儲了海量的檢驗數(shù)據(jù)[13],能夠為檢驗AI的構(gòu)建提供大數(shù)據(jù)支持。其次,機器學習(ML)算法層出不窮。比如,極端梯度提升(XGBoost)作為當前比較流行的集成學習算法,在提升樹模型中,具有非常強的擴展性和靈活性,能夠集成多個樹模型來建立一個更強的學習模型[14]。包括XGBoost在內(nèi)的ML算法是一種通過自動分析數(shù)據(jù)以獲得特征規(guī)律,并利用這些規(guī)律對未知數(shù)據(jù)進行預測的算法,是實現(xiàn)AI的基本方法[15]。對于給定的任務,ML算法可以從數(shù)據(jù)中學習,篩選大量變量并尋找可靠的組合預測結(jié)果,所以其對數(shù)量龐大或復雜的數(shù)據(jù)進行挖掘分析具有絕對優(yōu)勢。由此,使用ML算法對LIS中存儲的數(shù)千萬患者信息進行挖掘、訓練、建模是完全可行的。這種方法不僅解決了傳統(tǒng)統(tǒng)計模型參數(shù)限制的問題,還能減少人工誤差,提高篩選效率,更重要的是有助于發(fā)現(xiàn)數(shù)據(jù)間的潛在關(guān)聯(lián)及隱藏價值。最后,算力為檢驗AI提供了基本的計算能力支撐。算力的核心在于AI芯片。由于原有的CPU和傳統(tǒng)計算架構(gòu)已無法支撐ML算法并行計算能力的要求,AI芯片的出現(xiàn)使得AI高強度、大數(shù)據(jù)的處理需求得以滿足。目前,針對AI領(lǐng)域運算特征,AI芯片已成功應用于圖像識別、語音識別、聲紋檢測、視頻檢索及自動駕駛等任務。在做智能處理任務時,AI芯片能夠使計算機以大規(guī)模、低成本、高通量、自動化等方式運行[16]。這些均為檢驗AI的實現(xiàn)和應用提供了強大的硬件平臺。

2.2檢驗AI的構(gòu)建過程

檢驗數(shù)據(jù)只有與AI深度融合形成檢驗AI,才能充分挖掘檢驗指標與疾病之間隱藏的聯(lián)系與規(guī)律,為臨床提供更有意義的診療信息,體現(xiàn)檢驗醫(yī)學的價值。檢驗AI的構(gòu)建(圖1)主要包括以下步驟(1)數(shù)據(jù)收集和預處理:檢驗數(shù)據(jù)來源廣泛,由于各數(shù)據(jù)庫(LIS、HIS系統(tǒng))之間缺乏有效協(xié)調(diào)機制,聯(lián)系和溝通不同,采集和存儲標準不一,影響了檢驗數(shù)據(jù)的應用[17]。因此,檢驗數(shù)據(jù)在用于建模前需要經(jīng)過預處理(包括結(jié)構(gòu)化、標準化、歸一化等)轉(zhuǎn)變成ML算法能夠識別和學習的數(shù)據(jù)格式。模式識別作為AI技術(shù)的重要分支,能夠?qū)⒍鄠€標準來源數(shù)據(jù)分類并結(jié)構(gòu)化,節(jié)省大量的人力物力,解決了不同數(shù)據(jù)庫的互聯(lián)互通[18]。(2)檢驗知識圖譜篩選:臨床醫(yī)生在疾病診斷過程中,一些疾病診斷結(jié)果可能不依賴于異常檢驗結(jié)果而直接通過B超、放射或病理等輔助檢查結(jié)果得出。由于檢驗AI是基于檢驗數(shù)據(jù)的AI模型,如果一些疾病診斷結(jié)果不能通過相應的異常檢驗結(jié)果推理得出,不僅增加了檢驗AI數(shù)據(jù)處理的難度,而且會降低模型預測疾病的準確率。通過人工鑒別異常檢驗結(jié)果是否與疾病診斷結(jié)果相關(guān),往往會出現(xiàn)其復雜程度超越了臨床醫(yī)生知識范疇的情況。因此,通過檢驗知識圖譜從醫(yī)學專業(yè)角度將檢驗數(shù)據(jù)與診斷數(shù)據(jù)相關(guān)聯(lián),排除了一些缺乏知識關(guān)聯(lián)的數(shù)據(jù)信息,提高了輸入數(shù)據(jù)的質(zhì)量,同時也增強了模型學習的能力[19]。(3)特征選擇與建模:在開發(fā)檢驗AI時,特征變量的選擇非常重要,直接影響模型在臨床研究中的表現(xiàn)。從特征自身角度選擇利用的原理為重要的特征應該是攜帶信息較多,也就是特征值差異較大的變量。從輸入特征和輸出特征相關(guān)性角度選擇主要是利用一些模型算法本身的特點,構(gòu)造不同特征與目標特征之間的相關(guān)重要程度,若重要性低的特征變量(如低于某閾值)則可以拋棄。建模方法主要包括監(jiān)督學習和無監(jiān)督學習[20]。監(jiān)督學習是使用有診斷結(jié)果標注的檢驗數(shù)據(jù)訓練開發(fā)模型,之后,所得模型用于預測或診斷新數(shù)據(jù)集的結(jié)果變量。無監(jiān)督學習則僅使用無診斷結(jié)果標注的輸入數(shù)據(jù)來建模。(4)模型評估:模型的性能可以使用同一來源(內(nèi)部驗證)或獨立來源(外部驗證)數(shù)據(jù)進行評估。交叉驗證方法是一種準確的內(nèi)部驗證方法[21]。交叉驗證的最簡單形式是將數(shù)據(jù)集劃分為訓練集(用于開發(fā)模型)和測試集(用于評估模型的性能)。訓練集和測試集之間沒有最佳劃分,例如研究人員習慣將80%的研究人群分配給訓練集,其余20%分配給測試集。然而,這種方法可能會使結(jié)果產(chǎn)生偏差,使得模型不具有普適性。n倍交叉驗證是一種替代方法,在這種方法中,數(shù)據(jù)集被劃分成n個大小相等的分區(qū),執(zhí)行多輪交叉驗證(即每輪使用不同的分區(qū)作為測試集),平均結(jié)果用于估計模型的性能。模型的外部驗證即用非建模數(shù)據(jù)集測試模型的性能,提高其推廣性以支持模型的普適性。(5)臨床驗證:為了證實檢驗AI具有很高的臨床應用價值,即可以有效輔助臨床醫(yī)生進行臨床決策,需要將檢驗AI診療性能與醫(yī)學專家進行比較。(6)模型應用:為了將檢驗AI運用到臨床實踐中,需要基于互聯(lián)網(wǎng)技術(shù)開發(fā)相應的應用程序以方便臨床醫(yī)生使用,使得檢驗AI可以在真實場景運行以獲得疾病的預測值等。

3檢驗AI在輔助診療中的應用前景

3.1疾病診斷

快速而準確的診斷對于指導患者的診療活動至關(guān)重要,檢驗AI基于檢驗數(shù)據(jù)可輔助臨床醫(yī)生進行疾病診斷。比如,GUNCAR等[22]使用了隨機森林ML算法并基于實驗室血液檢測結(jié)果,建立了兩種模型用于血液疾病診斷,一種預測模型(SBA-HEM168)使用所有可用的血液測試參數(shù);另一種預測模型(SBA-HEM061)僅使用一組簡化的血液測試參數(shù)。兩種模型在診斷血液疾病上都具有良好的診斷性能,在預測患者5種最可能的疾病時,預測準確率分別為0.88和0.86;僅考慮患者最可能的疾病時,預測準確率為0.59和0.57[22]。此外,臨床試驗表明兩種預測模型的準確性與血液學專家相當[23]。本課題組采用了730113例合格參與者的89116949個檢驗數(shù)據(jù)和10423581個實驗診斷數(shù)據(jù),構(gòu)建了基于知識和數(shù)據(jù)雙驅(qū)動的多功能智慧檢驗平臺[23](即檢驗AI),能夠自動識別并綜合分析2071種檢驗指標,完成對包括呼吸系統(tǒng)及血液系統(tǒng)等在內(nèi)的10種器官系統(tǒng)疾病和441種具體疾病診斷的多元關(guān)系推理,且所有推理過程具備良好的可解釋性。

3.2疾病預測

檢驗AI可深度挖掘常規(guī)檢驗指標隱藏的信息,能更好地預測疾病。目前,腫瘤的預測僅限于幾種特定的標志物。PATRíCIO等[24]開發(fā)了基于常規(guī)檢驗指標的乳腺癌預測模型,研究人員運用了邏輯回歸、隨機森林和支持向量機3種不同的ML算法以不同數(shù)量的變量(包括葡萄糖、抵抗素、年齡、體質(zhì)量指數(shù)、胰島素抵抗指數(shù)、瘦素、胰島素、脂聯(lián)素、單核細胞趨化蛋白-1)作為預測因子構(gòu)建了乳腺癌預測模型。該研究發(fā)現(xiàn),支持向量機預測模型僅使用葡萄糖、抵抗素、年齡和體質(zhì)量指數(shù)作為決定因素即可預測女性乳腺癌的存在。同時,該預測模型在測試集上實現(xiàn)了高靈敏度(82%、88%)和高特異度(84%、90%)的預測[24]。該研究充分證實基于檢驗AI,一些常規(guī)檢測參數(shù)完全可以替代一些腫瘤標志物成為新的癌癥早期篩查工具[24]。SOMNAY等[25]使用術(shù)前血清鈣、磷、甲狀旁腺激素、維生素D和肌酐水平作為原發(fā)性甲狀旁腺功能亢進的潛在預測因子構(gòu)建了ML模型,在所測試的ML模型中,貝葉斯網(wǎng)絡(luò)模型被證明是最準確的,對95%的原發(fā)性甲狀旁腺功能亢進患者進行了正確分類[曲線下面積(AUC)=0.99],值得注意的是,從模型中省略預測因子甲狀旁腺激素并沒有明顯降低其準確性。該研究表明即使在患者出現(xiàn)輕微疾病病理變化的情況下,ML模型仍可準確預測出原發(fā)性甲狀旁腺功能亢進癥[25]。

3.3疾病風險評估

檢驗AI可以根據(jù)檢驗數(shù)據(jù)對患者疾病進行風險評估,為臨床醫(yī)生改進治療策略做出預警。對于COVID-19,快速準確地識別和評估疾病的嚴重程度至關(guān)重要。MA等[26]收集了COVID-19患者入院臨床數(shù)據(jù),包括癥狀、合并癥、人口統(tǒng)計學、生命體征、CT掃描結(jié)果及檢驗數(shù)據(jù),應用多元邏輯回歸方法確定具有統(tǒng)計學意義的臨床特征,研究人員最終使用了乳酸脫氫酶、C反應蛋白和年齡作為死亡預測因素構(gòu)建了多元邏輯回歸模型,用于識別CO-VID-19入院患者的嚴重程度并評估其死亡風險。該模型預測292例患者病死率的效能(AUC=0.9521)優(yōu)于肺炎CURB-65評分模型(AUC=0.8501)和XGBoost模型(AUC=0.4530)。由數(shù)十個臨床癥狀和檢驗數(shù)據(jù)(如靜脈曲張程度、纖維蛋白原水平和紅斑等)作為患者出血風險的潛在決定因素所構(gòu)建的ML模型能夠預測肝功能受損兒童食管靜脈曲張出血的風險,該模型能夠準確地預測約85%兒童患者食管靜脈曲張破裂出血情況,使高危兒童患者能夠優(yōu)先進行緊急肝移植,該研究結(jié)果已通過在線應用程序(ht-tp://hrs2c2.com),在獨立患者隊列中得到了驗證[27]。

3.4疾病治療與預后檢驗AI可根據(jù)檢驗數(shù)據(jù)評

估患者的疾病治療及預后情況。比如,鑒于華法林的復雜特性,LIU等[28]使用了兩個經(jīng)典的檢驗數(shù)據(jù)即丙氨酸氨基轉(zhuǎn)移酶及血清肌酐,結(jié)合患者的華法林使用劑量、性別、年齡和體質(zhì)量等數(shù)據(jù)構(gòu)建了ML分類模型,用于預測華法林的治療是否充分。研究人員使用了377例住院患者的臨床數(shù)據(jù),比較了7種不同ML分類模型的性能,最終C4.5決策樹和隨機森林得分最高,并發(fā)現(xiàn)相較于臨床醫(yī)生的主觀決定,ML模型更能準確預測華法林治療的充分性[28]。盡管急性腎損傷通常是可逆的,但一些患者發(fā)生腎功能恢復不全、慢性腎病,甚至腎功能衰竭的風險增加[29-30]。急性腎損傷患者住院治療后,對慢性腎病的預測可使患者獲得早期干預,并可能改善疾病預后,且可避免不必要的醫(yī)療資源使用。JAMES等[31]使用了常規(guī)檢驗數(shù)據(jù)(包括基線血清肌氨酸值、蛋白尿、急性腎損傷嚴重程度指標及出院血清肌氨酸值)開發(fā)了一個多變量風險分層模型,該模型能夠識別急性腎損傷住院后可能患有慢性腎病的高風險患者。該模型有助于患者向門診醫(yī)療過渡期間,臨床醫(yī)生做出合理的預后評估、隨訪指導和護理建議。

3.5亞健康的預測

生理生化指標量化檢測是亞健康檢測方法中較為客觀的檢測方法,可最大可能避免人為因素影響,利于亞健康的準確預測。目前,針對亞健康人群的亞健康實驗室檢測參考值很難界定。處于亞健康狀態(tài)的人雖然有諸多自覺不適癥狀,實驗室檢驗可能僅僅有某些指標的變化。如何在正常值范圍內(nèi)劃分出健康人群和亞健康人群一直是研究的難點。檢驗AI的出現(xiàn)為亞健康的預測及診斷指明了方向。以預定時間內(nèi)收集的亞健康患者與疾病人群的檢驗數(shù)據(jù)為預測因素,構(gòu)建區(qū)分健康人群和亞健康人群的亞健康分類器,可實現(xiàn)亞健康的快速甄別。該分類器類似于健康狀態(tài)軌跡,可提示機體是否處于亞健康狀態(tài),以及亞健康人群是否有疾病發(fā)生的可能[32]。比如,王嬙等[33]將采集到的出入境人員臨床檢驗指標等數(shù)據(jù)錄入計算機,基于極限學習機和支持向量機方法建立預測模型并自動分析錄入的信息,從而預測該個體發(fā)生亞健康的趨勢及可能性。

4檢驗AI的局限性和挑戰(zhàn)

檢驗AI在臨床實際應用中,還存在一些局限性和挑戰(zhàn)。首先,由于疾病診斷的復雜性,僅依靠檢驗AI提供的疾病預測或診斷存在局限性[34],臨床醫(yī)生仍需結(jié)合其他輔助檢查(如影像、病理及超聲等)結(jié)果對患者疾病進行綜合判斷。其次,數(shù)據(jù)質(zhì)量問題是檢驗AI面臨的主要挑戰(zhàn)。檢驗AI的疾病預測是基于檢驗大數(shù)據(jù),由于檢驗大數(shù)據(jù)的采集標準不一,導致檢驗數(shù)據(jù)缺乏質(zhì)量保證,影響了檢驗AI模型預測疾病的準確性,進而限制了檢驗AI的臨床實際應用[35]。最后,受限于不同醫(yī)院檢驗科對檢驗數(shù)據(jù)的定義、檢測標準及檢測系統(tǒng)不同,導致不同醫(yī)院之間檢驗數(shù)據(jù)難以互通互用,而依據(jù)單中心檢驗數(shù)據(jù)構(gòu)建的檢驗AI缺乏普適性,其預測結(jié)果在不同醫(yī)院之間存在偏差。

5結(jié)語

檢驗醫(yī)學是臨床輔助診療的重要支撐。隨著AI與醫(yī)學領(lǐng)域的深度融合,檢驗醫(yī)學與AI的結(jié)合作為一種新的醫(yī)療模式正在快速發(fā)展。檢驗AI通過對檢驗大數(shù)據(jù)的分析,可為臨床醫(yī)生提供及時準確的輔助診斷信息,這將徹底改變傳統(tǒng)檢驗醫(yī)學的傳統(tǒng)運用模式,推動檢驗醫(yī)學的智能化發(fā)展。

作者:井杰 綜述 黃曉春 單位:中國人民解放軍海軍軍醫(yī)大學第一附屬醫(yī)院檢驗科