關(guān)于對(duì)診斷一致性Kappa系統(tǒng)的探討
時(shí)間:2022-03-18 07:49:00
導(dǎo)語(yǔ):關(guān)于對(duì)診斷一致性Kappa系統(tǒng)的探討一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
【關(guān)鍵詞】診斷試驗(yàn);,,一致性檢驗(yàn);,,kappa系數(shù),,,
摘要:對(duì)診斷一致性的簡(jiǎn)單Kappa系數(shù)、加權(quán)Kappa系數(shù)以及總Kappa系數(shù)進(jìn)行了分析和說(shuō)明,由于Kappa系數(shù)僅適用于行數(shù)和列數(shù)相等的方表,針對(duì)Kappa檢驗(yàn)的這一局限性,給出了行數(shù)和列數(shù)不一致時(shí)使用SPSS軟件實(shí)現(xiàn)Kappa檢驗(yàn)的方法。
關(guān)鍵詞:診斷試驗(yàn);一致性檢驗(yàn);Kappa系數(shù)
在診斷試驗(yàn)中,研究者希望考察不同的診斷方法在診斷結(jié)果上是否具有一致性。診斷試驗(yàn)的一致性檢驗(yàn)經(jīng)常用于下列兩種情況[1]:一種是評(píng)價(jià)新的診斷試驗(yàn)方法與金標(biāo)準(zhǔn)的一致性;另一種是評(píng)價(jià)兩種診斷試驗(yàn)方法對(duì)同一個(gè)樣本(化驗(yàn)對(duì)象)的化驗(yàn)結(jié)果的一致性、兩個(gè)醫(yī)務(wù)工作者對(duì)同一組病人的診斷結(jié)論的一致性、同一醫(yī)務(wù)工作者對(duì)同一組病人前后進(jìn)行兩次觀察作出診斷的一致性等。1960年Cohen等提出用Kappa值作為評(píng)價(jià)判斷的一致性程度的指標(biāo)。實(shí)踐證明,它是一個(gè)描述診斷的一致性較為理想的指標(biāo),因此在臨床試驗(yàn)中得到廣泛的應(yīng)用。
本研究分別給出三種Kappa系數(shù),即簡(jiǎn)單Kappa系數(shù),加權(quán)Kappa系數(shù)和總Kappa系數(shù)及標(biāo)準(zhǔn)誤和檢驗(yàn)統(tǒng)計(jì)量的計(jì)算公式,并針對(duì)Kappa系數(shù)僅適用于行數(shù)和列數(shù)相等的方表的問(wèn)題,給出了用SPSS軟件實(shí)現(xiàn)對(duì)行列數(shù)不等資料的Kappa檢驗(yàn)方法。
1簡(jiǎn)單Kappa系數(shù)的計(jì)算公式[1]
K=P0-Pe[]1-Pe(1)
其中P0=∑ipii,稱為觀測(cè)一致率,Pe=∑ipi.p・i,稱為期望一致率,即兩次檢驗(yàn)結(jié)果由于偶然機(jī)會(huì)所造成的一致率,其中pi.=Ri[]N,p・i=Ci[]N,Ri,Ci分別為第i個(gè)格點(diǎn)所對(duì)的行合計(jì)和列合計(jì),N為總例數(shù)。當(dāng)兩個(gè)診斷完全一致時(shí),P0=1,此時(shí)Kappa值為1。當(dāng)觀測(cè)一致率大于期望一致率時(shí),Kappa值為正數(shù),且Kappa值越大,說(shuō)明一致性越好。當(dāng)觀察一致率小于期望一致率時(shí),Kappa值為負(fù)數(shù),這種情況一般來(lái)說(shuō)比較少見(jiàn)。根據(jù)邊緣概率的計(jì)算,Kappa值的范圍值應(yīng)在-1~1之間。Kappa≥075兩者一致性較好;0.75>Kappa≥0.4兩者一致性一般;Kappa<0.4兩者一致性較差。
Kappa系數(shù)標(biāo)準(zhǔn)誤的計(jì)算公式為:
S=Pe+P2e-∑ipi.p・i(pi.+p・i)[](1-Pe)N(2)
其95%的置信區(qū)間為:
(k-1.96S,k+1.96S)(3)
由于Kappa值是一個(gè)樣本統(tǒng)計(jì)量,作是否有統(tǒng)計(jì)學(xué)意義的假設(shè)檢驗(yàn)時(shí),應(yīng)選用統(tǒng)計(jì)量:
U=Kappa[]S(4)
2加權(quán)的Kappa系數(shù)[2]
加權(quán)的Kappa系數(shù)是簡(jiǎn)單Kappa系數(shù)的推廣,是用加權(quán)的方法對(duì)兩個(gè)評(píng)價(jià)結(jié)果進(jìn)行量化。對(duì)于四格表來(lái)說(shuō),簡(jiǎn)單Kappa系數(shù)與加權(quán)的Kappa系數(shù)是相等的,對(duì)于一般的行列表,加權(quán)的Kappa系數(shù)的計(jì)算公式為:
Kw=P0(w)-Pe(w)[]1-Pe(w)(5)
P0(w)=∑i∑jwijpij
Pe(w)=∑i∑jwijpi.p・j
其中0≤wij=wji<1,i≠j,wij=1。
加權(quán)Kappa系數(shù)的標(biāo)準(zhǔn)誤計(jì)算公式為:
Skw=∑i∑jpi.p・j[wij-(i.+・j)]2-P2e(w)[](1-Pe(w))2N(6)
95%的置信區(qū)間為:
(kw-1.96Skw,kw+1.96Skw)(7)
假設(shè)檢驗(yàn)的統(tǒng)計(jì)量為U=kW[]Skw(8)
Kappa的權(quán)系數(shù)一般使用CicchettiAllison和FleissCohen兩種權(quán)值類型[2],CicchettiAllison的計(jì)算公式為:
wij=1-|Ci-Cj|[]Ck-Ci(9)
FleissCohen的計(jì)算公式為:
wij=1-(Ci-Cj)2[](Ck-Ci)2(10)
其中,Ci表示第i列的評(píng)價(jià)分值,k表示列數(shù)。如果是數(shù)值型變量,評(píng)價(jià)分值Cij就是第i行第j列對(duì)應(yīng)的具體數(shù)值;如果是分類變量,可按照相應(yīng)級(jí)別進(jìn)行賦值。由于wij=1,而當(dāng)i≠j時(shí),0≤wij<1,所以由Kappa系數(shù)的計(jì)算公式可知加權(quán)的Kappa系數(shù)大于簡(jiǎn)單Kappa系數(shù)。
3總Kappa系數(shù)
假設(shè)列聯(lián)表為多向列聯(lián)表(我們不妨設(shè)有q個(gè)方向),且每個(gè)變量有兩個(gè)水平,即為2×2×…×2列聯(lián)表,令ki表示第i個(gè)變量的Kappa系數(shù),Ski表示第i個(gè)Kappa系數(shù)的標(biāo)準(zhǔn)誤,則總Kappa系數(shù)的計(jì)算公式為:
K總=∑q[]i=1ki[]Ski/∑q[]i=11[]Ski(11)
若要檢驗(yàn)各變量Kappa系數(shù)是否都相等,可采用自由度為q-1的χ2檢驗(yàn),計(jì)算公式為:
χ2=∑q[]i=1(ki-k總)2[]Ski(12)
(11)、(12)兩個(gè)公式均適用于加權(quán)的Kappa系數(shù)。
4行列數(shù)不等時(shí)Kappa系數(shù)的計(jì)算
Kappa系數(shù)的計(jì)算適用于兩個(gè)評(píng)價(jià)人分級(jí)水平數(shù)相同的情況,即數(shù)據(jù)格式為行數(shù)和列數(shù)相等的方表。而在實(shí)際操作中,經(jīng)常會(huì)出現(xiàn)分級(jí)水平數(shù)不一致,即行列數(shù)不等的情況。我們來(lái)看一個(gè)實(shí)例:兩名醫(yī)生按照某項(xiàng)指標(biāo)的1~4個(gè)等級(jí)來(lái)評(píng)價(jià)8個(gè)病人。一個(gè)醫(yī)生用全部4個(gè)等級(jí)進(jìn)行評(píng)價(jià),而另一醫(yī)生只有3個(gè)等級(jí)進(jìn)行評(píng)價(jià)。此時(shí),對(duì)于兩個(gè)醫(yī)生來(lái)說(shuō),他們?cè)u(píng)價(jià)的級(jí)別范圍不同。數(shù)據(jù)見(jiàn)表1。
表1甲乙兩醫(yī)生對(duì)病人的評(píng)價(jià)(略)
下面我們使用SPPS軟件獲得Kappa值及檢驗(yàn)結(jié)果。SPSS110或更低的版本在這種情況下均無(wú)獲得Kappa統(tǒng)計(jì)量。SPSS115以上的版本可以計(jì)算出Kappa值。首先進(jìn)入數(shù)據(jù)編輯器并給甲醫(yī)生添加額外的觀測(cè)值0001。數(shù)據(jù)錄入見(jiàn)圖1。選擇Analyze→DescriptiveStatistics→Crosstabs,將變量甲,乙分別放入對(duì)應(yīng)的行列框內(nèi),選擇Statistics按鈕,得到如下對(duì)話框(圖2),選擇Kappa復(fù)選框,按continue即可輸出Kappa值、標(biāo)準(zhǔn)誤和P值。
相應(yīng)的結(jié)果為:
Kappa=0.810,P=0.001,S=0.176。
5討論
在診斷試驗(yàn)的研究中,數(shù)據(jù)資料多為雙向有序的列聯(lián)表資料,即兩個(gè)變量都是有序變量,而且屬性相同。屬性相同分為三種情況,一種情況是屬性、分級(jí)水平數(shù)和分級(jí)水平都完全相同。如甲醫(yī)生和乙醫(yī)生都把病人的檢查結(jié)果分為1、2、3、4四個(gè)等級(jí)。此時(shí)可直接作Kappa檢驗(yàn)。當(dāng)這兩個(gè)變量都只有2個(gè)水平時(shí),就成為配對(duì)設(shè)計(jì)的四格表資料,可使用配對(duì)χ2檢驗(yàn),即McNemar檢驗(yàn)。第二種是屬性相同的分級(jí)水平數(shù)相同,但分級(jí)水平不全相同。如甲醫(yī)生和乙醫(yī)生都把病人的檢查結(jié)果分為四個(gè)等級(jí),但甲醫(yī)生的分級(jí)為1、2、3、4,而乙醫(yī)生的分級(jí)為2、3、4、5。在這種情況下,由于列聯(lián)表的行數(shù)和列數(shù)仍然是一致的,即列聯(lián)表仍為方表,所以也可計(jì)算出相應(yīng)的Kappa統(tǒng)計(jì)量。第三種是屬性相同,但分級(jí)水平數(shù)和分級(jí)水平不全相同。這種情況就是我們所說(shuō)的列聯(lián)表的行列數(shù)不一致。由于收集上來(lái)的數(shù)據(jù)不能輕易刪除掉,所以我們考慮添加行或列使聯(lián)表成為方表。如行數(shù)為n,例數(shù)為n-1,則我們只需要添加第n列,在第n行第n列的格點(diǎn)中添加權(quán)值0001,而第n行的其它格點(diǎn)均設(shè)為0,就可以命名其成為方表,并計(jì)算Kappa統(tǒng)計(jì)量了。由于權(quán)值系數(shù)很小,所以不會(huì)影響Kappa值的計(jì)算結(jié)果。
另一方面,如果兩個(gè)變量中有一個(gè)變量是金標(biāo)準(zhǔn),那么我們不但能分析出檢驗(yàn)結(jié)果的一致性,還可以計(jì)算出敏感度、特異度、誤診率和漏診率等指標(biāo)。如果有不同的診斷分界點(diǎn),還可以繪制出ROC曲線。
診斷試驗(yàn)的評(píng)價(jià)[3]在醫(yī)學(xué)研究中具有十分重要的意義,目前大多數(shù)文獻(xiàn)都使用Kappa統(tǒng)計(jì)量來(lái)檢驗(yàn)結(jié)果的一致性。所以本研究主要是對(duì)Kappa系數(shù)作一個(gè)探討和分析。診斷試驗(yàn)評(píng)價(jià)的統(tǒng)計(jì)學(xué)方法還會(huì)隨著更多問(wèn)題的提出和解決而不斷得到發(fā)展、修正和擴(kuò)展。
參考文獻(xiàn)
1馬斌榮,主編醫(yī)學(xué)科研中的統(tǒng)計(jì)方法北京:科學(xué)出版,2005,3
2SAS91軟件說(shuō)明書(英文版)
3宇傳華譯診斷醫(yī)學(xué)統(tǒng)計(jì)學(xué)北京:人民衛(wèi)生出版社,2005,3