x2檢驗的用途


x2檢驗的用途

文章插圖
一、卡方檢驗是用途非常廣的一種假設檢驗方法,它在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等 。
二、卡方檢驗就是統計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越??;若兩個值完全相等時,卡方值就為0,表明理論值完全符合 。
三、X2檢驗的基本原理是假設各個樣本來自同一屬性的總體,各組中實際數之間的差別僅僅由于抽樣誤差造成的;通過分別計算各組實際數與理論數的離散情況,求得總的誤差X2值,從而測定假設存在的概率,即可能性 P 。
如果假設成立,那么X2值就不會很大,而保持在一定范圍內,相應的 P值就大于 5%(P>0.05),即僅僅由于抽樣誤差而造成樣本之間這么大小差別的可能性大于5%,說明各樣本間的差別本質上無明顯差異,它們來之于同一屬性的總體,假設被肯定 。
反過來說,如果推算出的X2值很大,而超出了一定范圍,相應的P值就小于 5%或1%,即由于抽樣誤差造成樣本之間如此大的差別的可能性小于5%或1%;說明各組間差別不是由于抽樣造成的,可能兩者的確有差別,它們不是來之于同一屬性的總體,假設被否定 。
擴展資料:
如果性別和化妝與否沒有關系,四個格子應該是括號里的數(期望值,用極大似然估計55=100*110/200,其中110/200可理解為化妝的概率,乘以男人數100,得到男人化妝概率的似然估計),這和實際值(括號外的數)有差距,理論和實際的差距說明這不是隨機的組合 。
注:獨立四格表的擬合度公式可以寫成n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d)
【x2檢驗的用途】總結:獨立四格表資料檢驗
四格表資料的卡方檢驗用于進行兩個率或兩個構成比的比較 。
1、專用公式:
若四格表資料四個格子的頻數分別為a,b,c,d,則四格表資料卡方檢驗的卡方值=n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d),(或者使用擬合度公式)
自由度v=(行數-1)(列數-1)=1
2、應用條件:
要求樣本含量應大于40且每個格子中的理論頻數不應小于5 。當樣本含量大于40但有1=<理論頻數<5時,卡方值需要校正,當樣本含量小于40或理論頻數小于1時只能用確切概率法計算概率 。
參考資料來源:百度百科-卡方檢驗
x2檢驗的基本公式是x2=∑[(fo—fc)2/fc],fo表示實際所得的次數,fc表示由假設而定的理論次數,∑為加總符號 。x2檢驗對于定類與定類或定類與定序變量之間的相關檢驗應用較多 。
相關檢驗又稱獨立性檢驗 。進行相關檢驗時,要先根據交互分類表中的邊緣次數分配來計算出各格中的理論次數fcij 。計算理論次數的一般公式為:fcij=Fxi·Fyi/n式中,Fxi表示x變量各類別的邊緣次數分配,Fyj表示y變量各類別的邊緣次數分配,n為總次數 。
χ2檢驗的基本公式為:χ2=∑(A-T)2/T;χ2值反映了實際頻數和理論頻數之間的吻合程度 。若H0成立,則A與T相差不應該很大,即χ2統計量不應該很大 。
A與T相差越大,χ2值越大,相應的P值越小 。若P≤α,則A與T相差較大,有理由認為無效假設不成立,從而拒絕H0,接受H1 。
性質:
1、X^2 分布在第一象限內,卡方值都是正值,呈正偏態(右偏態),隨著參數v的增大,X^2 分布趨近于正態分布;卡方分布密度曲線下的面積都是1 。
2、X^2 分布的均值與方差可以看出,隨著自由度v的增大,χ2分布向正無窮方向延伸(因為均值v越來越大),分布曲線也越來越低闊(因為方差2v越來越大) 。
3、不同的自由度決定不同的卡方分布,自由度越小,分布越偏斜 。

    推薦閱讀