醫(yī)學(xué)科技論文常見統(tǒng)計學(xué)問題分析

時間:2022-05-29 08:28:53

導(dǎo)語:醫(yī)學(xué)科技論文常見統(tǒng)計學(xué)問題分析一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

醫(yī)學(xué)科技論文常見統(tǒng)計學(xué)問題分析

摘要:針對醫(yī)學(xué)科技論文常見統(tǒng)計學(xué)問題以及稿件退修和編輯加工過程中遇到的共性的統(tǒng)計學(xué)問題進行分析,并提出可能避免統(tǒng)計學(xué)方面錯誤的方法及建議,便于科研人員撰寫論文時學(xué)習(xí)借鑒,也為醫(yī)學(xué)期刊編輯處理類似稿件提供參考。

關(guān)鍵詞:統(tǒng)計學(xué);醫(yī)學(xué);科研;論文;問題

醫(yī)學(xué)統(tǒng)計學(xué)是現(xiàn)代醫(yī)學(xué)研究的重要方法和技術(shù)手段,是醫(yī)學(xué)科研論文中不可或缺的部分,其應(yīng)用水平直接影響科研成果的質(zhì)量[1]。醫(yī)學(xué)科研人員在撰寫論文時若未能仔細鉆研流行病學(xué)和衛(wèi)生統(tǒng)計學(xué)等專業(yè)知識,或未咨詢專業(yè)統(tǒng)計學(xué)研究人員,盲目套用統(tǒng)計學(xué)方法,往往會造成應(yīng)用統(tǒng)計學(xué)方法及處理數(shù)據(jù)時出現(xiàn)錯誤,如變量選擇和納入、模型選擇、結(jié)果描述等錯用情況發(fā)生。在醫(yī)學(xué)研究設(shè)計、數(shù)據(jù)收集、數(shù)據(jù)整理、結(jié)果解釋和表達等環(huán)節(jié)均有可能存在統(tǒng)計學(xué)應(yīng)用不當(dāng)?shù)膯栴}[2‐5]。就已發(fā)表的醫(yī)學(xué)科技論文來看,研究設(shè)計環(huán)節(jié)中存在的問題在審稿時比較容易被識別,且大部分存在科研設(shè)計缺陷的論文在審稿階段已濾除,而運用統(tǒng)計學(xué)方法分析資料,應(yīng)用統(tǒng)計學(xué)軟件實現(xiàn)數(shù)據(jù)管理和分析,正確解釋和表達統(tǒng)計分析結(jié)果等問題則往往比較隱蔽,這部分問題在進入編輯修稿階段才顯現(xiàn)。編輯修稿階段是論文出版前的最后質(zhì)量控制環(huán)節(jié),編輯對論文統(tǒng)計學(xué)問題的審核把關(guān)起著至關(guān)重要的作用,因此,需要期刊編輯具有過硬的專業(yè)知識、嚴謹?shù)闹螌W(xué)態(tài)度及高度的責(zé)任心處理遺留錯誤,特別是有些疑難問題往往需要專業(yè)統(tǒng)計學(xué)人員介入進行判斷。已有調(diào)查顯示,1990年—2003年發(fā)表在NEnglJMed、JAMA和Lancet三大頂尖醫(yī)學(xué)雜志上且引用次數(shù)超過1000次的文獻中,有近1/3的文獻存在統(tǒng)計學(xué)問題[6‐7]??梢娊y(tǒng)計學(xué)誤用、錯用問題在醫(yī)學(xué)期刊中相對較多。因此,對于醫(yī)學(xué)期刊社而言,強調(diào)在論文審稿階段邀請統(tǒng)計專業(yè)審稿專家進行統(tǒng)計方面把關(guān)十分重要?,F(xiàn)就醫(yī)學(xué)論文中常見的統(tǒng)計學(xué)問題及可能的避免方法分析如下,以饗同道共勉。

1描述性分析時存在的統(tǒng)計學(xué)問題

定量資料中的連續(xù)性資料一般采用集中趨勢加離散趨勢形式描述,例如均數(shù)±標準差(x±s)及中位數(shù)(四分位數(shù)間距)。目前,絕大部分文獻統(tǒng)計描述都以均數(shù)±標準差形式進行,研究者往往未檢驗所研究指標數(shù)據(jù)的正態(tài)性,而理所應(yīng)當(dāng)?shù)貙?shù)據(jù)以正態(tài)方式進行呈現(xiàn),忽略了非正態(tài)分布數(shù)據(jù)應(yīng)當(dāng)采用中位數(shù)(四分位數(shù)間距)的形式來描述比較妥當(dāng),這樣的錯誤使用可能會讓讀者對數(shù)據(jù)總體分布造成錯誤判斷。此外,某些研究中研究者會采用均數(shù)±標準誤進行統(tǒng)計描述。一方面,可能是因為研究者對標準誤和標準差的具體含義辨識不準確,樣本標準差是用來描述正態(tài)分布數(shù)據(jù)離散程度的統(tǒng)計量,是將方差開平方即得到的標準差;而樣本標準誤是指樣本均數(shù)的標準差,是一個統(tǒng)計推斷的指標,用于將統(tǒng)計量推斷到總體參數(shù)。另一方面,由于樣本標準誤一般比標準差小,出于使研究結(jié)果看上去更具優(yōu)勢考慮,研究者會使用標準誤代替標準差。

2統(tǒng)計分析方法不滿足假設(shè)條件

2.1不滿足參數(shù)檢驗的數(shù)據(jù)采用了參數(shù)檢驗方法

2.1.1不滿足正態(tài)性在進行兩組或多組定量資料參數(shù)檢驗時,相比于獨立性和方差齊性,數(shù)據(jù)正態(tài)性往往容易被忽視。首先需注意,獨立樣本t檢驗或方差分析對正態(tài)分布的要求有一定耐性。如果原數(shù)據(jù)或經(jīng)變換后數(shù)據(jù)不是嚴重地偏離正態(tài)分布,且樣本量比較大,仍可以采用參數(shù)檢驗方法。但如果原數(shù)據(jù)或經(jīng)變換后數(shù)據(jù)偏態(tài)嚴重,且樣本量不大,不建議使用參數(shù)檢驗方法,推薦采用非參數(shù)檢驗對數(shù)據(jù)進行統(tǒng)計分析。但當(dāng)樣本量很大時(如>200),即使呈兩點分布或指數(shù)分布,其樣本t統(tǒng)計量也近似服從正態(tài)分布[8]。在這種情況下,選用參數(shù)檢驗或非參數(shù)檢驗均可。2.1.2重復(fù)測量數(shù)據(jù)對于重復(fù)測量數(shù)據(jù)的分析方法,大部分科研工作者首先想到的是重復(fù)測量方差分析[9],其具有結(jié)果呈現(xiàn)形式簡單、易于解釋的優(yōu)點,但其前提條件相對較多且通常不易滿足。比如需要平衡數(shù)據(jù),這就要求所有觀測不能有缺失值,否則相應(yīng)的觀測對象需要被刪除。此外,重復(fù)測量方差分析還要求相應(yīng)變量之間的等相關(guān)性以及資料的球形對稱性(可以理解為復(fù)雜情況下的方差齊性),若這些條件不滿足,參數(shù)檢驗的方法將不再適用,只能采用邊際多層模型或線性混合模型等進行分析。

2.2不滿足卡方檢驗條件的數(shù)據(jù)采用了卡方檢驗

兩獨立樣本四格表資料的卡方檢驗要求總例數(shù)n≥40且理論頻數(shù)T≥5[10]。若n≥40,且T為1~<5,采用連續(xù)校正的卡方或Fisher精確概率法進行檢驗;若n<40或T<1,則采用Fisher精確概率法進行檢驗。配對四格表資料卡方檢驗要求不一致對子b+c≥40,否則采用校正卡方檢驗。R×C表資料卡方檢驗中要求不宜有1/5以上的格子T<5,不宜有格子T<1,否則需采用Fisher精確概率法進行統(tǒng)計分析。

2.3不滿足線性回歸條件的數(shù)據(jù)采用了線性回歸分析

線性回歸模型的前提條件包括線性、獨立性、正態(tài)性和方差齊性。其中,線性是指因變量的總體平均值與自變量呈線性關(guān)系??梢酝ㄟ^繪制散點圖判斷回歸關(guān)系是否成立[11]。獨立性是指任意2條記錄互相獨立。正態(tài)性是指模型的誤差項需服從正態(tài)分布(等價于當(dāng)自變量X為定值時因變量Y也呈正態(tài)分布),而在樣本量較大時可以忽略正態(tài)性要求。方差齊性是指在自變量X的取值范圍內(nèi),不論X取什么值,Y都具有相同的方差,等價于殘差的方差齊性。需要注意的是,線性、正態(tài)性和方差齊性通常通過繪制散點圖或正態(tài)概率圖等即可快速判斷,但獨立性往往容易被研究人員忽視,即納入分析的研究對象不應(yīng)有多條記錄,如果有部分研究對象有多條記錄,則應(yīng)只保留一條記錄,否則不能采用線性回歸模型進行分析,只能改用混合效應(yīng)模型進行分析。同時,還需注意,如果是多因素回歸分析,則上述線性、正態(tài)性和方差齊性的條件應(yīng)在各變量和因變量之間均得以滿足。

3結(jié)果闡釋時存在的問題

3.1受制于P值,未按常用界值對數(shù)據(jù)進行劃分

在進行多元回歸分析之前,比較可取的是先進行單因素回歸分析。如某單因素為連續(xù)型變量,且已知其為結(jié)局變量的危險因素可能性較大,若將其直接納入模型進行單因素回歸分析,則可能發(fā)現(xiàn)其回歸系數(shù)β無統(tǒng)計學(xué)意義(P>0.05),這時某些研究者可能會采用將連續(xù)型變量分類的方式以獲得較好結(jié)果,可能為得到較小的P值而未采用常用的有意義界值進行劃分,如在研究血壓對某種慢性病的影響時,未按照臨床定義的高血壓界定值對血壓值進行分類,而是以在數(shù)據(jù)分析時獲得最小P值為目標取最佳截斷值進行分析,這種方法會使結(jié)果產(chǎn)生較大偏倚。因此,在實際運用時應(yīng)盡量按照臨床上常用分類標準對連續(xù)型變量進行分類。

3.2對沒有統(tǒng)計學(xué)意義的結(jié)果進行過分闡釋

醫(yī)學(xué)研究中常常會獲得P>0.05的結(jié)果,此時若以α=0.05為檢驗水準則表示結(jié)果不能拒絕H0假設(shè),但也不能下結(jié)論說H0成立[12]。如研究某因素與阿爾茲海默病間的關(guān)系時,通過多因素回歸分析發(fā)現(xiàn)回歸系數(shù)的P>0.05,此時可以認為這個回歸結(jié)果不具有統(tǒng)計學(xué)意義,但在結(jié)果討論中不能以此下結(jié)論認為該因素與阿爾茲海默病無關(guān),甚至以此來推翻之前的研究結(jié)論。因為在假設(shè)檢驗中,利用反證法思想是以假設(shè)H0成立來進行推導(dǎo),若能推導(dǎo)出原假設(shè)不成立的結(jié)果,則可以推翻原假設(shè)而證明H1成立,但如果推導(dǎo)出H0成立,則并不能做出任何判斷,只能說明以目前結(jié)果尚不能拒絕H0,而后應(yīng)該思考是否是因為實驗樣本量不夠或是統(tǒng)計效能不夠,以在將來進行進一步探究。

3.3有統(tǒng)計學(xué)意義的結(jié)果不一定有實際臨床意義

臨床實踐中,兩組或多組差異有統(tǒng)計學(xué)意義不一定說明差異具有臨床意義,判斷是否具有實際臨床意義需要結(jié)合研究背景和相關(guān)臨床專業(yè)知識[13]。最經(jīng)典的例子是研究某種降壓藥的降壓效果。臨床上一般認為要使血壓降低10mmHg(1mmHg=0.133kPa)以上才能認為具有臨床意義,而如果研究樣本量較大,即使試驗組和對照組間血壓相差不到10mmHg,也非常有可能得到P<0.05的結(jié)果,從而得出該藥具有好的臨床應(yīng)用價值這一不正確結(jié)論。再如,臨床研究較重視病人生活質(zhì)量評價,尤其對心理狀況進行評價時一般采用相關(guān)量表進行測評,對量表測評結(jié)果進行統(tǒng)計學(xué)分析時得出有統(tǒng)計學(xué)意義(P<0.05),在分析時直接推斷出某干預(yù)方法比另一種方法更有效,而未考慮研究對象干預(yù)前水平,可能造成研究結(jié)論科學(xué)性不足。因此,在進行相關(guān)療效評價時,不能僅依據(jù)結(jié)果是否有統(tǒng)計學(xué)意義,生物學(xué)意義才是最重要的。

3.4在不直接進行比較的情況下判斷兩組治療效果

優(yōu)劣干預(yù)在試驗條件或試驗組中產(chǎn)生了顯著效果,而相應(yīng)的效果在對照條件或?qū)φ战M中不顯著,研究人員有時會提出試驗組效果比對照組效果要好[14]。這種錯誤推斷很常見。如觀察A藥和B藥的治療效果,采用自身前后配對設(shè)計,得到的結(jié)果是A藥治療前后配對t檢驗差異有統(tǒng)計學(xué)意義(P<0.05),而B藥治療前后差異沒有統(tǒng)計學(xué)意義(P>0.05)。此時,只能下“A藥在其受試者中觀察到顯著藥效,而B藥在其受試者中未觀察到顯著藥效”的結(jié)論,但不能就此認為A藥治療效果優(yōu)于B藥。要了解兩組治療效果的差異,需要按非配對t檢驗對兩組進行直接比較。另外,還有一種情況,即在進行多組均值或率的比較時,如果已知A組效應(yīng)優(yōu)于B組(P<0.05),而B組效應(yīng)和C組效應(yīng)差異無統(tǒng)計學(xué)意義(P>0.05),此時不能按照數(shù)學(xué)邏輯進行推導(dǎo),得出“A組效應(yīng)同樣優(yōu)于C組”的錯誤結(jié)論。正確做法應(yīng)當(dāng)是將A組和C組直接進行比較。

4可能避免統(tǒng)計學(xué)錯誤的方法及建議

4.1根據(jù)研究目的選擇適宜的統(tǒng)計分析方法

統(tǒng)計學(xué)方法的運用需要考慮其前提條件[15‐16]。若在實際應(yīng)用過程中忽視了這些條件,所得出的結(jié)果往往可能也是錯誤的。所以在應(yīng)用模型及檢驗方法時需要特別注意其應(yīng)用條件。參數(shù)檢驗及大部分模型多要求正態(tài)性及獨立性[17]。在應(yīng)用前需對數(shù)據(jù)進行正態(tài)性檢驗,若不滿足正態(tài)性,可以考慮通過對數(shù)轉(zhuǎn)換、平方根轉(zhuǎn)換及平方根反正弦變換等方法使數(shù)據(jù)轉(zhuǎn)換成正態(tài)以滿足應(yīng)用條件。若無法轉(zhuǎn)換為正態(tài)性數(shù)據(jù)則可采用秩轉(zhuǎn)換的非參數(shù)檢驗方法。而在卡方檢驗中,若不滿足適用條件可考慮采用合適的合并方法[18]。

4.2切勿過分受制于P值P值是最常用的統(tǒng)計指標

[19‐20],科研設(shè)計通常會利用P值得出結(jié)論,但若過分關(guān)注P值,依據(jù)P值處理數(shù)據(jù)或進行相關(guān)結(jié)果解釋,有時會得出不恰當(dāng)或錯誤結(jié)論。P值小于既定檢驗水準不等同于該項結(jié)果就具有臨床或者實際意義。同理,P值大于檢驗水準也并不能說明該項結(jié)果無效。在實際數(shù)據(jù)分析及結(jié)果解釋時應(yīng)客觀分析而不是受制于P值,目前,越來越多地提倡用效應(yīng)值加95%置信區(qū)間來表達結(jié)果[20],這樣既能進行結(jié)果比較,也可以觀察到是否具有臨床實際指導(dǎo)意義。

4.3科學(xué)地解釋統(tǒng)計結(jié)果

不同研究設(shè)計類型要求的統(tǒng)計方法不同,結(jié)果解釋存在一定差異,這是一個在實際工作中常被忽略但卻至關(guān)重要的問題。首先,需正確理解假設(shè)檢驗結(jié)果。“差異有統(tǒng)計學(xué)意義”并不意味著在醫(yī)學(xué)專業(yè)上就是“重要”的。相關(guān)系數(shù)的假設(shè)檢驗只能說明相關(guān)關(guān)系是否有統(tǒng)計學(xué)意義,既不能說明相關(guān)關(guān)系是否密切,也不能說明相關(guān)關(guān)系是否具有醫(yī)學(xué)專業(yè)上的某種意義。其次,需正確解釋不同研究類型數(shù)據(jù)分析結(jié)果。觀察性研究本身已經(jīng)決定了研究結(jié)論的局限性;實驗性研究能夠較好地控制各種混雜因素,對于嚴謹設(shè)計的實驗性研究,結(jié)論通常較為可靠,但要注意臨床試驗對象是人時,存在諸多心理(如安慰劑效應(yīng)和霍桑效應(yīng))以及倫理問題的局限,下結(jié)論時需特別謹慎。最后,需正確解釋不同單位數(shù)據(jù)分析結(jié)果。對于研究對象基于學(xué)校、單位或地區(qū)等水平的匯總數(shù)據(jù)所進行的分析,如果在個人水平上下結(jié)論,就需特別嚴謹,注意因果推論時的邏輯性和正確性。

5小結(jié)

隨著醫(yī)學(xué)科研的快速發(fā)展,不論是科研設(shè)計本身的合理精確性,還是學(xué)術(shù)論文表達的嚴謹性,都需要建立在高度嚴謹?shù)闹螌W(xué)態(tài)度及淵博學(xué)識的理論基礎(chǔ)上。醫(yī)學(xué)期刊編輯在論文統(tǒng)計學(xué)問題把關(guān)中起著舉足輕重的作用,編輯在退修稿件時應(yīng)對統(tǒng)計學(xué)描述和統(tǒng)計學(xué)分析中可能存在的問題進行全面審核,必要時協(xié)助作者查找錯誤,提出中肯修改建議,如統(tǒng)計學(xué)描述是否完整、描述是否和實際一致、統(tǒng)計方法是否恰當(dāng)、統(tǒng)計結(jié)果的解釋和表達是否準確規(guī)范等[21]。統(tǒng)計學(xué)作為一門應(yīng)用科學(xué),在實踐應(yīng)用中不能脫離醫(yī)學(xué)背景,必須緊密結(jié)合醫(yī)學(xué)專業(yè)的實際問題分析判斷,學(xué)習(xí)醫(yī)學(xué)統(tǒng)計學(xué)的最終目的是應(yīng)用統(tǒng)計思維和統(tǒng)計方法分析和解釋醫(yī)學(xué)中的實際問題,是以方法學(xué)的角色介入醫(yī)學(xué)研究領(lǐng)域,也是為醫(yī)學(xué)科研發(fā)展保駕護航的工具。醫(yī)學(xué)統(tǒng)計學(xué)中的每個數(shù)據(jù)都有其特定的專業(yè)含義,而不是抽象的機械數(shù)據(jù),計算機軟件并不能識別數(shù)據(jù)的真正含義,無法確定數(shù)據(jù)是否準確可靠,即使數(shù)據(jù)符合統(tǒng)計運算規(guī)則,也要辨識是否有臨床實際意義,這就需要研究者根據(jù)研究目的,結(jié)合臨床研究受眾實際情況,正確地分析、表達研究結(jié)果,科學(xué)合理地推導(dǎo)結(jié)論,通過統(tǒng)計思維的培養(yǎng),提高醫(yī)學(xué)研究水平,以保證研究結(jié)果的真實性與科學(xué)性。

作者:王雅潔 李亞琴 單位:山西醫(yī)學(xué)期刊社 山西醫(yī)科大學(xué)第一醫(yī)院