Minitab中的正態(tài)性檢驗(yàn)提供了三種方法:Anderson-Darling(AD),Ryan-Joiner(RJ)和Kolmogorov-Smirnov(KS)。AD檢驗(yàn)是默認(rèn)的,那它在檢驗(yàn)非正態(tài)的時(shí)候是不是最好的方法呢?
對(duì)于這三種正態(tài)性檢驗(yàn)方法,檢驗(yàn)結(jié)果有時(shí)是有差異的(如下圖),那么就有個(gè)問(wèn)題:到底以哪種方法的結(jié)果為準(zhǔn)?
今天我們就來(lái)比較一下每種正態(tài)性檢驗(yàn)在以下三種不同情形下檢驗(yàn)非正態(tài)數(shù)據(jù)的能力。我們將為每個(gè)情形使用模擬數(shù)據(jù),但是它們反映了在分析數(shù)據(jù)以提高質(zhì)量時(shí)可能遇到的常見情況。
三種情形
情形1:生產(chǎn)過(guò)程中產(chǎn)生較大的離群值。
在此模擬中,從平均值= 0,標(biāo)準(zhǔn)偏差= 1的正態(tài)分布中模擬了29個(gè)值,從均值= 0,標(biāo)準(zhǔn)偏差= 4的正態(tài)分布中模擬了1個(gè)值。
情形2:制造過(guò)程發(fā)生了變化,從而導(dǎo)致分布發(fā)生變化。
創(chuàng)建一個(gè)雙峰分布(如下圖),一個(gè)是均值為10,標(biāo)準(zhǔn)差為1的正態(tài)分布;一個(gè)是均值為14,標(biāo)準(zhǔn)差為1的正態(tài)分布。
情形3:測(cè)量結(jié)果自然遵循非正態(tài)分布,正如我們通常會(huì)看到的失效時(shí)間數(shù)據(jù)。對(duì)于這種情況,從Weibull(a = 1,b = 1.5)分布中模擬了30個(gè)值。
注意:此文中評(píng)估的三種情形并非旨在評(píng)估使用中心極限定理的檢驗(yàn)(例如單樣本t,雙樣本t和配對(duì)t檢驗(yàn))的正態(tài)性假設(shè)的有效性。我們的重點(diǎn)是在使用分布估計(jì)制造有缺陷(不合格)單元的可能性時(shí)檢驗(yàn)非正態(tài)性。
仿真(情形1為例)
步驟1:模擬數(shù)據(jù)(即29個(gè)來(lái)自正態(tài)分布+ 1個(gè)來(lái)自具有大標(biāo)準(zhǔn)差的正態(tài)分布)。
步驟2:運(yùn)行正態(tài)性檢驗(yàn)(AD,RJ和KS),并記錄P值。
步驟3:重復(fù)步驟1和2 ,N次。
步驟4:分析每個(gè)正態(tài)性檢驗(yàn)的P值,并基于不同的alpha值繪制拒絕正態(tài)性概率的置信區(qū)間。
仿真結(jié)果比較
在情形1中,Ryan-Joiner檢驗(yàn)顯然是贏家,仿真結(jié)果如下。
在情形2中,Anderson-Darling檢驗(yàn)是最好的,仿真結(jié)果如下。
在情形3中,AD和RJ檢驗(yàn)之間沒有太大差異。兩者都比Kolmogorov-Smirnov檢驗(yàn)更有效地檢驗(yàn)非正態(tài)性,仿真結(jié)果如下。
小結(jié)
總而言之,AD檢驗(yàn)從來(lái)都不是最糟糕的檢驗(yàn),但在檢驗(yàn)離群值方面,其效果不及RJ檢驗(yàn)。如果您要分析制造過(guò)程中的數(shù)據(jù)往往會(huì)產(chǎn)生單個(gè)離群值,則最適合使用Ryan-Joiner檢驗(yàn)。
RJ檢驗(yàn)在情形1和情形3下均表現(xiàn)出色,但是當(dāng)數(shù)據(jù)發(fā)生變化時(shí)(情形2),在檢驗(yàn)非正態(tài)性方面表現(xiàn)不佳。如果您要分析制造過(guò)程中的數(shù)據(jù),該數(shù)據(jù)由于意外更改而趨于變化,那么AD檢驗(yàn)是最合適的。
KS檢驗(yàn)在任何情況下均表現(xiàn)不佳。
在后續(xù)文章中,我還將討論當(dāng)從正態(tài)分布模擬數(shù)據(jù)并且對(duì)數(shù)據(jù)進(jìn)行一定程度的舍入時(shí),這三個(gè)檢驗(yàn)在不拒絕正態(tài)性方面的表現(xiàn)如何。
審核編輯:符乾江
-
Minitab
+關(guān)注
關(guān)注
0文章
161瀏覽量
11651 -
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1413瀏覽量
33987
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論