方差與標準差


方差與標準差

文章插圖
標準差(StandardDeviation) , 也稱均方差(meansquareerror) , 是各數據偏離平均數的距離的平均數 , 它是離均差平方和平均后的方根 , 用σ表示 。標準差是方差的算術平方根 。標準差能反映一個數據集的離散程度 。平均數相同的 , 標準差未必相同 。方差是各個數據與平均數之差的平方的平均數 。公式:1、方差s=[(x1-x)^2+(x2-x)^2+(xn-x)^2]/n(x為平均數)2、標準差=方差的算術平方根它們的意義:1、方差的意義在于反映了一組數據與其平均值的偏離程度;2、方差是衡量隨機變量或一組數據時離散程度的度量 。概率論中方差用來度量隨機變量和其數學期望(即均值)之間的偏離程度 。統計中的方差(樣本方差)是各個數據分別與其平均數之差的平方的和的平均數 。3、方差的特性在于:方差是和中心偏離的程度 , 用來衡量一批數據的波動大?。催@批數據偏離平均數的大?。┎阉凶鲞@組數據的方差 。在樣本容量相同的情況下 , 方差越大 , 說明數據的波動越大 , 越不穩定 。4、標準差是方差的算術平方根 , 意義在于反映一個數據集的離散程度 。
我們可以代入期望的數學表達形式 。比如連續隨機變量:
Var(X)=E[(X?μ)2]=∫+∞?∞(x?μ)2f(x)dx
方差概念背后的邏輯很簡單 。一個取值與期望值的“距離”用兩者差的平方表示 。該平方值表示取值與分布中心的偏差程度 。平方的最小取值為0 。當取值與期望值相同時 , 此時不離散 , 平方為0 , 即“距離”最??;當隨機變量偏離期望值時 , 平方增大 。由于取值是隨機的 , 不同取值的概率不同 , 我們根據概率對該平方進行加權平均 , 也就獲得整體的離散程度——方差 。
方差的平方根稱為標準差(standard deviation, 簡寫std) 。我們常用σ表示標準差
σ=Var(X)??????√
標準差也表示分布的離散程度 。
正態分布的方差
根據上面的定義 , 可以算出正態分布
E(X)=1σ2π??√∫+∞?∞xe?(x?μ)2/2σ2dx
的方差為
Var(X)=σ2
正態分布的標準差正等于正態分布中的參數σ 。這正是我們使用字母σ來表示標準差的原因!
excel的標準差函數是:STDEVP函數 。
使用STDEVP函數的方法:
1、首先點擊選中需要計算標準差的單元格位置 , 并選擇上方的“fx”圖標插入函數 。
2、在插入函數對話框中輸入STDEVP , 并在查找到的結果中雙擊STDEVP開啟函數參數設置 。
3、在打開的參數設置對話框中選中需要計算標準差的單元格區域 , 可以根據需要自行選中 。
4、點擊確定后即可對應生成標準差 , 針對多組數據可以向下填充公式生成批量的計算結果 。
標準差的兩種計算公式如下:
std(A):
std(A)函數求解的是最常見的標準差 , 此時除以的是N-1 。
此函數命令不能對矩陣求整體的標準差 , 只能按照行或者列進行逐個求解標準差 , 默認情況下是按照列 。
在MATLAB主窗口中輸入std(A)回車 , 結果如下:
輸出的是每一列的標準差 。
std(A , flag):
這里flag代表的是用哪一個標準差函數 , 如果取0 , 則代表除以N-1 , 如果是1代表的是除以N , 
我們在MATLAB主窗口中輸入std(A , 1)回車 , std(A , 0) 。
std(A , flag , dim):
【方差與標準差】第三個參數代表的是按照列求標準差還是按照行求標準差 , std(A , 1 , 1)代表的是按照列求標準差 , std(A , 1 , 2)代表的是按照行求標準差 。

    推薦閱讀