混合效應(yīng)線性模型與單因素方差分析在重復(fù)測(cè)量數(shù)據(jù)中的應(yīng)用比較

時(shí)間:2022-03-18 08:02:00

導(dǎo)語(yǔ):混合效應(yīng)線性模型與單因素方差分析在重復(fù)測(cè)量數(shù)據(jù)中的應(yīng)用比較一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

混合效應(yīng)線性模型與單因素方差分析在重復(fù)測(cè)量數(shù)據(jù)中的應(yīng)用比較

【關(guān)鍵詞】重復(fù)測(cè)量;混合效應(yīng)線性模型;單因素方差分析;

摘要:目的:通過(guò)混合效應(yīng)線性模型與單因素方差分析在重復(fù)測(cè)量資料中的應(yīng)用比較,旨在說(shuō)明兩方法在處理重復(fù)測(cè)量資料時(shí)的應(yīng)用特點(diǎn)。方法:用混合效應(yīng)線性模型和單因素方差分析處理重復(fù)測(cè)量資料并比較。結(jié)果:混合效應(yīng)線性模型和單因素方差分析都是處理重復(fù)測(cè)量資料的重要統(tǒng)計(jì)方法,前者在選擇協(xié)方差結(jié)構(gòu)下可對(duì)重復(fù)測(cè)量資料的固定效應(yīng)和隨機(jī)效應(yīng)參數(shù)及協(xié)方差矩陣進(jìn)行參數(shù)估計(jì)和統(tǒng)計(jì)檢驗(yàn),后者可對(duì)重復(fù)測(cè)量資料的固定效應(yīng)做出統(tǒng)計(jì)推斷。結(jié)論:混合效應(yīng)線性模型是處理重復(fù)測(cè)量資料的有力方法,它對(duì)資料的協(xié)方差結(jié)構(gòu)要求寬松,且結(jié)論可靠;單因素方差分析對(duì)資料的協(xié)方差結(jié)構(gòu)有嚴(yán)格的限定。

關(guān)鍵詞:重復(fù)測(cè)量;混合效應(yīng)線性模型;單因素方差分析;

統(tǒng)計(jì)方法特點(diǎn)重復(fù)測(cè)量數(shù)據(jù)(repeatedmeasuresdata)是醫(yī)學(xué)領(lǐng)域中常見(jiàn)的一種數(shù)據(jù)資料。所謂重復(fù)測(cè)量是指對(duì)同一個(gè)觀察對(duì)象在不同時(shí)間點(diǎn)上進(jìn)行的多次測(cè)量[1]。由于重復(fù)測(cè)量資料是對(duì)同一受試對(duì)象的某一觀察指標(biāo)進(jìn)行的重復(fù)觀察所得的數(shù)據(jù),同一受試者的觀察數(shù)據(jù)間可能存在相關(guān)性,一些傳統(tǒng)的統(tǒng)計(jì)學(xué)方法如t檢驗(yàn)等就不能充分揭示這一內(nèi)在特點(diǎn),有時(shí)甚至?xí)?dǎo)致錯(cuò)誤的結(jié)論。

對(duì)重復(fù)測(cè)量資料的分析方法大致可分為兩類,即單變量統(tǒng)計(jì)分析方法和多變量統(tǒng)計(jì)分析方法[2]。本研究通過(guò)選用多變量統(tǒng)計(jì)分析方法中的混合線性效應(yīng)模型對(duì)一例題的分析,并與單因素方差分析進(jìn)行比較,來(lái)說(shuō)明兩種方法在處理重復(fù)測(cè)量資料中的應(yīng)用特點(diǎn)。

1方法簡(jiǎn)介

簡(jiǎn)單說(shuō),混合效應(yīng)線性模型就是所擬和的模型中既包含固定效應(yīng)又包含隨機(jī)效應(yīng),特別是個(gè)體內(nèi)的數(shù)據(jù)結(jié)構(gòu)的選擇將對(duì)各因素的評(píng)價(jià)產(chǎn)生直接影響[3]。

混合效應(yīng)線性模型是一般線性模型的擴(kuò)展,其表達(dá)式為:

Y=Xβ+Zγ+ε(1)

X為已知設(shè)計(jì)矩陣,β為固定效應(yīng)參數(shù)構(gòu)成的未知向量,ε是未知的隨機(jī)誤差向量,其元素不必為同獨(dú)立分布了。在式(1)中Y,γ都是正態(tài)隨機(jī)向量,其均值為0,方差陣分別為G與R,二者之間不相關(guān),因此Y的方差表達(dá)式為:

V=ZGZ+R(2)

當(dāng)R=σ2I,Z=0時(shí),混合線性模型退化為一般線性模型。對(duì)G和R必須選擇其協(xié)方差結(jié)構(gòu),常用的結(jié)構(gòu)有無(wú)結(jié)構(gòu)(一般為協(xié)方差)、自回歸(常用一階)、復(fù)合對(duì)稱(共同協(xié)方差加一對(duì)角元)等[4]。選擇協(xié)方差矩陣的方法是在相同的結(jié)構(gòu)模型下,選擇幾個(gè)不同結(jié)構(gòu)的協(xié)方差矩陣,從中選取似然比統(tǒng)計(jì)量(-2LogLikelihood)、Akaikes信息量標(biāo)準(zhǔn)(AkaikesInformationCriterion,AIC)及SchwartsBayesian標(biāo)準(zhǔn)(SchwartsBayesianCriterion,BIC)較小的一個(gè),當(dāng)這些統(tǒng)計(jì)量較接近時(shí),則選取含參數(shù)個(gè)數(shù)最少的一個(gè)。通常以AIC為主要判斷指標(biāo)。

2實(shí)例分析

下面用一實(shí)例比較兩種方法對(duì)處理重復(fù)測(cè)量資料時(shí)的特點(diǎn):某藥有新舊兩種劑型,為了比較這兩種劑型的代謝情況,對(duì)16例病人服藥后分別在0、4、8、12小時(shí)測(cè)得血藥濃度(表1),問(wèn)該藥新舊劑型的血藥濃度隨時(shí)間變化的趨勢(shì)是否一致。表1四個(gè)時(shí)間點(diǎn)某藥新舊劑型血藥濃度1用SAS軟件的MIXED過(guò)程對(duì)固定效應(yīng)和隨機(jī)效應(yīng)參數(shù)β、γ及協(xié)方差矩陣G、R進(jìn)行估計(jì)和統(tǒng)計(jì)檢驗(yàn)。在本例中因變量為血藥濃度,藥物劑型、測(cè)量時(shí)間為固定效應(yīng),受試者為隨機(jī)效應(yīng),同時(shí)選擇合適的協(xié)方差結(jié)構(gòu)以便在控制隨機(jī)誤差的基礎(chǔ)上分析處理因素(藥物劑型)對(duì)反應(yīng)變量(血藥濃度)的關(guān)系。本例指定為常用的無(wú)結(jié)構(gòu)協(xié)方差(UN)和復(fù)合對(duì)稱性協(xié)方差(CS)。

模型擬合情況見(jiàn)表2。表2模型配合統(tǒng)計(jì)量由表2可見(jiàn),在UN結(jié)構(gòu)下協(xié)方差配合的似然比統(tǒng)計(jì)量-2LogLikelihood=398.0(表2),對(duì)無(wú)效模型的似然比檢驗(yàn),χ2=134.43,ν=9,P<0.0001,說(shuō)明模型擬合效果顯著,模型較好地?cái)M和了資料。在CS結(jié)構(gòu)下,似然比統(tǒng)計(jì)量-2LogLikelihood=506.4,AIC、AICC、BIC三個(gè)值都是UN模型小于CS模型,故本例選用UN結(jié)構(gòu)作模型擬合。

在UN結(jié)構(gòu)下的固定效應(yīng)參數(shù)估計(jì)值及假設(shè)檢驗(yàn)結(jié)果見(jiàn)表3、4。

由表4可知,在UN結(jié)構(gòu)下,不同處理組之間的差別無(wú)統(tǒng)計(jì)學(xué)意義(P=0.07551),不同測(cè)量時(shí)間點(diǎn)的血藥濃度及處理組×?xí)r間點(diǎn)的交互作用的差別有統(tǒng)計(jì)學(xué)意義(P<0.0001),且這種交互作用主要體現(xiàn)在新劑型組。

22應(yīng)用SAS軟件的GLM過(guò)程,對(duì)表1的資料處理結(jié)果見(jiàn)表5。由表5可見(jiàn),各處理組間時(shí)間因素間無(wú)差別,服從精確F分布,本例F處理組=0.09,P=0.77可見(jiàn)其處理組主效應(yīng)與時(shí)間因素?zé)o關(guān)。

主效應(yīng)F時(shí)間點(diǎn)受協(xié)方差矩陣類型分布影響,球形檢驗(yàn)的近似χ2=27.0284,ν=5,對(duì)應(yīng)P=0.0001,不符合球形假定,故須對(duì)分子分母的自由度進(jìn)行校正,用H-F=0.8469作為校正因子,得:

分子的校正自由度為:

ν1=(p-1)=0.8469(4-1)=0.8469×3=2.54073

分母的校正自由度為:

ν2=(p-1)(∑mg=1(ng-1))=0.8469×3(14)=35.569836

查表得F0.05(3,36)=2.87<74.97,P<0.0001,可認(rèn)為不同時(shí)間點(diǎn)的血藥濃度是不同的。

交互效應(yīng)F處理組*F時(shí)間點(diǎn)也涉及時(shí)間點(diǎn)這一重復(fù)測(cè)量因子,故也要對(duì)其分子分母的自由度進(jìn)行校正:

分子的校正自由度為:

ν1=(m-1)(p-1)=0.8469(2-1)(3-1)=1.69382

分母自由度校正同上,ν236

F0.05(2,36)=3.26<46.90,P<0.0001,可認(rèn)為不同組在不同時(shí)間點(diǎn)的血藥濃度是不同的。表3固定效應(yīng)的參數(shù)估計(jì)與比較表5單因素方差分析結(jié)果

3討論

由兩種方法對(duì)同一資料的處理可見(jiàn),兩種方法的結(jié)論一致,但混合效應(yīng)線性模型既考慮了觀察對(duì)象在不同觀察時(shí)點(diǎn)間的內(nèi)在聯(lián)系,又考慮了觀察值間的內(nèi)部相關(guān)性,結(jié)論更為可靠。

單因素方差分析和混合效應(yīng)線性模型都可用來(lái)處理重復(fù)測(cè)量資料,單因素方差分析是應(yīng)用最小二乘法進(jìn)行配合的一般線性模型,此模型對(duì)協(xié)方差矩陣有著極端的假定,如果協(xié)方差陣的球形性得不到滿足,就必須進(jìn)行多元方差分析或?qū)統(tǒng)計(jì)量進(jìn)行校正,獲得校正概率;混合效應(yīng)線性模型是基于似然函數(shù)法的原理,它對(duì)協(xié)方差矩陣的要求比單因素方差分析寬松,它允許資料存在某種相關(guān)性及協(xié)方差矩陣的多樣性,無(wú)須對(duì)自由度進(jìn)行校正,能較好的適合重復(fù)資料的特點(diǎn)。

單因素方差分析很難估計(jì)參數(shù),混合效應(yīng)線性模型可以在所選擇的協(xié)方差結(jié)構(gòu)下,估計(jì)固定效應(yīng)及隨機(jī)效應(yīng)參數(shù),還可以估計(jì)隨機(jī)參數(shù)及隨機(jī)誤差的協(xié)方差陣G和R,所以應(yīng)用范圍廣,即使常規(guī)分析模型,亦可作為其特例來(lái)應(yīng)用[6]。

在配合混合效應(yīng)線性模型時(shí)要根據(jù)研究目的和資料特點(diǎn)選擇一種模型,然后在此模型下選擇合適的協(xié)方差結(jié)構(gòu),只有選擇合適的協(xié)方差結(jié)構(gòu)對(duì)固定效應(yīng)參數(shù)的估計(jì)和推論才有意義。

參考文獻(xiàn)

1余松林,主編.重復(fù)測(cè)量資料分析方法與SAS程序第一版北京:科學(xué)出版社,2004,1.

2陳長(zhǎng)生,徐勇勇,曹秀堂.醫(yī)學(xué)研究中重復(fù)測(cè)量數(shù)據(jù)的統(tǒng)計(jì)分析方法.中國(guó)衛(wèi)生統(tǒng)計(jì),1996,13(6):55.

3胡良平如何比較重復(fù)測(cè)量結(jié)果中華預(yù)防醫(yī)學(xué)雜志,2003,37(4):294

4周天樞,洪榮濤,陳崇幗,等.用混合線性效應(yīng)模型處理復(fù)合測(cè)量數(shù)據(jù)的方法分析腦血管病死亡率中國(guó)衛(wèi)生統(tǒng)計(jì),2001,10(5):287.

5方積乾,主編醫(yī)學(xué)統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn)第二版上海:上??茖W(xué)技術(shù)出版社,2002,401.

6周天樞,洪榮濤,陳崇幗,等.用混合線性效應(yīng)模型處理復(fù)合測(cè)量數(shù)據(jù)的方法分析腦血管病死亡率中國(guó)衛(wèi)生統(tǒng)計(jì),2001,10(5):288.