x2檢驗的用途

2026-05-08 生活百科理論

文章插圖
一、卡方檢驗是用途非常廣的一種假設檢驗方法，它在分類資料統計推斷中的應用，包括：兩個率或兩個構成比比較的卡方檢驗；多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。
二、卡方檢驗就是統計樣本的實際觀測值與理論推斷值之間的偏離程度，實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小，如果卡方值越大，二者偏差程度越大；反之，二者偏差越??；若兩個值完全相等時，卡方值就為0，表明理論值完全符合。
三、X2檢驗的基本原理是假設各個樣本來自同一屬性的總體，各組中實際數之間的差別僅僅由于抽樣誤差造成的；通過分別計算各組實際數與理論數的離散情況，求得總的誤差X2值，從而測定假設存在的概率,即可能性 P 。
如果假設成立，那么X2值就不會很大，而保持在一定范圍內，相應的 P值就大于 5％(P＞0.05)，即僅僅由于抽樣誤差而造成樣本之間這么大小差別的可能性大于5％，說明各樣本間的差別本質上無明顯差異，它們來之于同一屬性的總體，假設被肯定。
反過來說，如果推算出的X2值很大，而超出了一定范圍，相應的P值就小于 5％或1％，即由于抽樣誤差造成樣本之間如此大的差別的可能性小于5％或1%；說明各組間差別不是由于抽樣造成的，可能兩者的確有差別，它們不是來之于同一屬性的總體，假設被否定。
擴展資料：
如果性別和化妝與否沒有關系，四個格子應該是括號里的數（期望值，用極大似然估計55=100*110/200，其中110/200可理解為化妝的概率，乘以男人數100，得到男人化妝概率的似然估計），這和實際值（括號外的數）有差距，理論和實際的差距說明這不是隨機的組合。
注：獨立四格表的擬合度公式可以寫成n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d)
【x2檢驗的用途】總結：獨立四格表資料檢驗
四格表資料的卡方檢驗用于進行兩個率或兩個構成比的比較。
1、專用公式：
若四格表資料四個格子的頻數分別為a，b，c，d，則四格表資料卡方檢驗的卡方值=n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d)，（或者使用擬合度公式）
自由度v=（行數-1）（列數-1）=1
2、應用條件：
要求樣本含量應大于40且每個格子中的理論頻數不應小于5 。當樣本含量大于40但有1=<理論頻數<5時，卡方值需要校正，當樣本含量小于40或理論頻數小于1時只能用確切概率法計算概率。
參考資料來源：百度百科-卡方檢驗
x2檢驗的基本公式是x2=∑[（fo—fc）2/fc]，fo表示實際所得的次數，fc表示由假設而定的理論次數，∑為加總符號。x2檢驗對于定類與定類或定類與定序變量之間的相關檢驗應用較多。
相關檢驗又稱獨立性檢驗。進行相關檢驗時，要先根據交互分類表中的邊緣次數分配來計算出各格中的理論次數fcij 。計算理論次數的一般公式為：fcij=Fxi·Fyi/n式中，Fxi表示x變量各類別的邊緣次數分配，Fyj表示y變量各類別的邊緣次數分配，n為總次數。
χ2檢驗的基本公式為：χ2=∑（A-T）2/T；χ2值反映了實際頻數和理論頻數之間的吻合程度。若H0成立，則A與T相差不應該很大，即χ2統計量不應該很大。
A與T相差越大，χ2值越大，相應的P值越小。若P≤α，則A與T相差較大，有理由認為無效假設不成立，從而拒絕H0，接受H1 。
性質：
1、X^2 分布在第一象限內，卡方值都是正值，呈正偏態（右偏態），隨著參數v的增大，X^2 分布趨近于正態分布；卡方分布密度曲線下的面積都是1 。
2、X^2 分布的均值與方差可以看出，隨著自由度v的增大，χ2分布向正無窮方向延伸（因為均值v越來越大），分布曲線也越來越低闊（因為方差2v越來越大）。
3、不同的自由度決定不同的卡方分布，自由度越小，分布越偏斜。

推薦閱讀

上一篇：不傷墻的月季墻做法怎樣打造月季花墻

下一篇：韓國組合男團有哪些