樣本標準差符號 標準差符號

標準偏差符號(樣品的標準偏差符號)
所有接觸到高質量工作的人都被認為熟悉休·哈特的控制圖 。休哈特告訴我們,如果標準差超過3倍,就可以判斷為異常值,需要找出波動不穩定的特殊原因 。
自從通用電氣前CEO杰克·韋爾奇在全球大力推廣六適馬以來,六適馬近年來在企業中蓬勃發展 。很多人會聽到老師說,所謂六適馬,就是過程中的波動小到可以容納6倍標準差的“單邊”公差,這叫六適馬 。
很多人好奇,兩者有什么區別?
要回答這個問題,首先要理解兩個概念,“標準差”和“正態分布” 。
鄭文·石開
一、什么是標準差?讓我們看看下面兩組數字:
1 3 5 7 9
3 4 5 6 7
這兩組數字的平均值是5,那么哪組數字波動更大呢?顯然是上層集團 。那么我們應該用什么數字來描述每組數字之間的“離散程度”呢?
我們的第一步是考慮每個點和中值的差距,累加然后取平均值 。但結果是:

為了抵消正負數值的影響,我們用平方,然后加上,再除以數字 。這個值叫做“方差” 。我們計算這兩組數據的方差如下:

但這是平方的結果 。所以我們又要給他們根數,這樣算出來的值就叫做“標準差”,用希臘字母σ(發音為適馬適馬)表示,可以分別表示每個數與平均值比較后的偏離程度 。常見的縮寫有S(總標準差)或σ(樣本標準差) 。

作為小白的科普文章,我不會放過標準差的完整公式 。先知道標準差是怎么來的 。
需要提醒的是,這里有五個數字,底部是五除二 。但是在實踐中,比如工廠抽樣,在計算標準差的時候,要寫n-1,比如從所有產品中取10來計算整體標準差,在底部除以9 。至于為什么,我先不說這篇文章,有興趣的朋友可以研究一下 。(注意下面的鏈接)
【樣本標準差符號 標準差符號】為什么樣本方差的分母是n-1?
這是小白科普的第一關,然后是第二關 。
隨著時代的進步,我們可以用數學方法對各種數據進行采樣或計數 。例如,我們可以對中國男性的平均身高進行抽樣,并計算出平均值和標準差 。如果你去抽查一個集團公司1000個人的身高,把統計數據畫成柱狀圖 。毫不奇怪,它可能是這樣的:

雖然上圖的數據是我編的,但相信還是比較接近我們的常識的 ??梢钥闯觯骄禐?69 cm,約70%的人位于163-175之間 。雖然有一些人特別高或特別矮,但這個數字正在減少 。
巧了,你大概發現上圖右手邊的標準差是5.9,上面提到的163-175正好在雙標準差的范圍內 。
關于這個神奇的現象,是200多年前由德國數學家高斯發現的,他把自然界中這種無處不在的分布稱為正態分布 。
讓我們看看下面關于正態分布的電影 。只要數量足夠,球就會通過下面的隨機碰撞,最后落到下面,這也符合正態分布 。
為了紀念高斯的成就,德國人特意把高斯的頭像和他的正態分布的圖解公式放在德國硬幣上 。

通過高斯提出的正態分布的計算,可以計算出正態分布圖中不同標準差的位置和出現概率 。

從上圖可以看出,在正態分布中,1 σ、2 σ和3 σ的概率分別為68.3%、95.5%和99.73% 。
把這個數學模型和上面的身高分布對比一下,是不是很有意思?你也可以再想想生活中的其他正態分布 。
第三關來了,該說重點了 。
隨著時間的推移,1924年,美國的休哈特博士提出了世界上第一張控制圖,并將其應用到工廠的生產線上 。
休哈特認為,當你的參數數據呈正態分布時,99.73%的數據應該在標準差的3倍以內(詳見上一節) 。
一旦你的值超過標準偏差的三倍,你就應該保持警惕 。這個小概率事件是正常波動還是特殊原因造成的?你的生產過程是否處于穩定狀態?通過繪制控制圖,可以檢查過程的穩定性并實時監控 。

如果我們把三個標準差之間的數據波動看作是我們公司的處理能力 ??蛻艚o出的上下公差規格線視為客戶要求 ??蛻粜枨笈c過程能力的比率通常被稱為過程能力指數Cp 。

當規格線與3個標準偏差一致時,Cp值等于1 。如果你的工藝能力更強,產品波動更小,標準差更小,Cp值更大,可能達到1.33或1.67,以此類推 。。。
遠非重點,過程能力指數超出了本文的范圍 。感興趣的朋友可以看看這個微信官方賬號的漫畫系列,里面包含了相當多的討論 。
回到控制圖,你需要知道的是,控制圖中提到的3倍西格瑪(標準差)僅指正態分布條件下過程數據99.73%的波動范圍 。與合格率或公司能力無關 。(除非添加客戶規格行進行比較)

推薦閱讀