回歸分析在概率圖紙法中的運(yùn)用

時(shí)間:2022-03-18 08:03:00

導(dǎo)語(yǔ):回歸分析在概率圖紙法中的運(yùn)用一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

回歸分析在概率圖紙法中的運(yùn)用

【關(guān)鍵詞】線性回歸;概率圖紙;Excel軟件;概率分布;

摘要:概率圖紙法在隨機(jī)變量分布的檢驗(yàn)中有快捷簡(jiǎn)便的優(yōu)點(diǎn),但精確度不高。結(jié)合回歸分析理論,利用Excel軟件能克服這些缺點(diǎn)。

關(guān)鍵詞:線性回歸;概率圖紙;Excel軟件;概率分布;

分布參數(shù)一般在進(jìn)行參數(shù)假設(shè)檢驗(yàn)之前,需要對(duì)母體的分布類型進(jìn)行推斷。概率圖紙法是一種常用的檢驗(yàn)方法,目前常用的有正態(tài)、對(duì)數(shù)正態(tài)、二項(xiàng)分布、指數(shù)分布和威布爾分布概率圖紙等。概率圖紙法使用簡(jiǎn)單,但準(zhǔn)確性不高。運(yùn)用回歸分析的方法,結(jié)合概率圖紙能對(duì)母體的分析類型和參數(shù)作出較為準(zhǔn)確的推斷。本研究用線性回歸理論在正態(tài)概率圖紙法的運(yùn)用中說(shuō)明這種方法的過(guò)程。

1正態(tài)概率圖紙的構(gòu)造原理及使用

11構(gòu)造原理

設(shè)母體ξ的分布函數(shù)F(x)服從正態(tài)分布N(μ,θ)

F(x)=12π〖JF(Z〗x-∞e-(t-u)22σ2dt〖JF)〗=12π〖JF(Z〗t-uσ-∞e-z22dt〖JF)〗

=Φ(x-uσ)=Φ(z)

Z(x)服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),函數(shù)Z(x)=x-uσ(I)是x的線性函數(shù),在(x,z(x))直角坐標(biāo)平面上是一條直線。

正態(tài)概率圖紙上,橫軸的刻度表示x,縱軸上先刻出z的刻度(均勻),然后根據(jù)標(biāo)準(zhǔn)正態(tài)分布N(0,1)表查出對(duì)應(yīng)的分布函數(shù)值Φ(z),刻在z的位置上,然后把z的刻度去掉,留下x與F(x)(即Φ(z))的刻度,就構(gòu)成一張正態(tài)概率圖紙。

12使用方法

若假設(shè)的分布類型正確,則母體中抽得子樣數(shù)據(jù)在該種分布的概率圖紙上繪制的點(diǎn)基本在一條直線上,否則研究的隨機(jī)變量就不服從假設(shè)的分布類型。這種方法不僅可以檢驗(yàn)分布類型還可以進(jìn)行參數(shù)估計(jì),但都采用目測(cè),精確度不高。

2線性回歸理論在概率圖紙法中的運(yùn)用

利用線性回歸理論,結(jié)合Excel軟件不僅可計(jì)算z與x間的線性相關(guān)程度,還可算出隨機(jī)變量x的分布參數(shù)的點(diǎn)估計(jì)什和區(qū)間估計(jì)。

21實(shí)例運(yùn)用

檢驗(yàn)?zāi)承吞?hào)玻璃紙的橫向延伸率是否服從正態(tài)分布,測(cè)得數(shù)據(jù)如下[1]:

右端點(diǎn)X36.538.540.542.544.546.548.550.5累計(jì)頻率%715263544567387概率F(X)0.070.150.260.350.440.560.730.87右端點(diǎn)X52.554.556.558.560.562.564.5累計(jì)頻率%929597979999100概率F(X)0.920.950.970.970.990.990.995步驟如下:

①把上表確立的點(diǎn)(x,F(x))標(biāo)在正態(tài)概率圖紙上。觀察點(diǎn)的分布大概在一條直線附近,估計(jì)變量的分布服從正態(tài)分布。以下計(jì)算在Excel軟件中進(jìn)行。

②編輯函數(shù)NORMINV(F(X),0,1)計(jì)算出每一個(gè)F(X)(即Φ(z)對(duì)應(yīng)的Z值),將正態(tài)概率圖紙上的點(diǎn)坐標(biāo)轉(zhuǎn)為(X,Z)。X36.538.540.542.544.546.548.550.5Z-1.47579-1.03643-0.64335-0.38532-0.15097-0.1509690.6128131.126391X52.554.556.558.560.562.564.5Z1.4050721.6448541.8807941.8807942.3263482.3263482.575829③ZX有線性相關(guān)性的檢驗(yàn)。用PEARSON相關(guān)系數(shù)r=SxzSxSz,|r|≤1,|r|的值越接近1則ZX線性相關(guān)程度越高。

其中:Sx=∑ni=1(xi-)2n,Sz=∑ni=1(zi-)2n,

Sxz=1n∑ni=1(xi-)(zi-)

編輯函數(shù)PEARSON(array1,array2),其中array1為X的集合,array2為Z的集合,r=0.989295,可見(jiàn)ZX之間相關(guān)性極高。

④求出回歸方程z=bx+a(II),其中b=∑ni=1(xi-)(zi-)∑ni=1(xi-)2,a=-b

編輯函數(shù)SLOPE(array1,array2)計(jì)算出b=0.147011的值,其中array1為Z的集合,array2為X的集合,在Excel中編輯函數(shù)INTERCEPT(array1,array2)計(jì)算出a=-6.60818的值,則ZX間的線性回歸方程為Z=0.147011x-6.60818,根據(jù)線性回歸理論可得分布參數(shù)的點(diǎn)估計(jì)值σ=1b=6.802203,u=-ab=44.95015。

⑤回歸方程的顯著性檢驗(yàn):構(gòu)造統(tǒng)計(jì)量F=SSR/1SSE/(n-2)~F(1,n-2)進(jìn)行檢驗(yàn)。其中SSR=∑(i-)2,SSE=∑(zi-)2,計(jì)算得F=597.4379。取顯著水平α=0.01,編輯函數(shù)FINE(0.01,1,n-2)得臨界值F0.01(1,13)=9.073806,則ZX間的線性回歸方程z=0.147011x-6.60818在顯著水平=0.01的水平下有顯著意義。

⑥分布區(qū)間的參數(shù)估計(jì):回歸方程z=bx+a中的回歸系數(shù)b的可信區(qū)間為b±tα/2,n-2Sb,其中:Sb=Szxlxx,Szx=SSEn-2,lxx=∑ni=1(xi-)2=1120。編輯函數(shù)TINVE(0.05,n-2)得t臨界值。

t(0.025,13)=2.160369,Sb=0.040774,b的0.95的置信區(qū)間為(0.058925,0.235097),由a=-b得a的0.95的置信區(qū)間為(-11.0565,-2.15984)。

由分布參數(shù)的點(diǎn)估計(jì)σ=1b,u=-ab,a=-b得σ和u的區(qū)間估計(jì)。

σ的區(qū)間估計(jì)為(4.253561,16.97065),u的區(qū)間估計(jì)為(36.6538,47.0296),置信度均為0.95。3推廣應(yīng)用

從上述過(guò)程中可見(jiàn)對(duì)于母體分布能用概率圖紙法檢驗(yàn),就可結(jié)合回歸理論進(jìn)行精確計(jì)算。同時(shí),對(duì)于某些隨機(jī)變量的函數(shù),若其分布能用某種概率圖紙法檢驗(yàn),也可用上述方法計(jì)算。

參考文獻(xiàn)

1魏宗舒.概率論與數(shù)理統(tǒng)計(jì)教程高等教育出版社,2002

2王曉明Excel2002高級(jí)運(yùn)用―數(shù)理統(tǒng)計(jì)機(jī)械工業(yè)出版社,2003

3劉璋溫,戴樹(shù)森,方開(kāi)泰概率紙淺說(shuō)科學(xué)出版社,1980