用Excel做數據分析——回歸分析您需要了解的

我們已經知道在Excel自帶的數據庫中已有線性擬合工具 , 但是它還稍顯單薄 , 今天我們來嘗試使用較為專業的擬合工具來對此類數據進行處理 。
在數據分析中 , 對于成對成組數據的擬合是經常遇到的 , 涉及到的任務有線性描述 , 趨勢預測和殘差分析等等 。 很多專業讀者遇見此類問題時往往尋求專業軟件 , 比如在化工中經常用到的Origin和數學中常見的MATLAB等等 。 它們雖很專業 , 但其實使用Excel就完全夠用了 。 我們已經知道在Excel自帶的數據庫中已有線性擬合工具 , 但是它還稍顯單薄 , 今天我們來嘗試使用較為專業的擬合工具來對此類數據進行處理 。
注:本功能需要使用Excel擴展功能 , 如果您的Excel尚未安裝數據分析 , 請依次選擇“工具”-“加載宏” , 在安裝光盤支持下加載“分析數據庫” 。 加載成功后 , 可以在“工具”下拉菜單中看到“數據分析”選項
實例 某溶液濃度正比對應于色譜儀器中的峰面積 , 現欲建立不同濃度下對應峰面積的標準曲線以供測試未知樣品的實際濃度 。 已知8組對應數據 , 建立標準曲線 , 并且對此曲線進行評價 , 給出殘差等分析數據 。
【用Excel做數據分析——回歸分析您需要了解的】 這是一個很典型的線性擬合問題 , 手工計算就是采用最小二乘法求出擬合直線的待定參數 , 同時可以得出R的值 , 也就是相關系數的大小 。 在Excel中 , 可以采用先繪圖再添加趨勢線的方法完成前兩步的要求 。
選擇成對的數據列 , 將它們使用“X、Y散點圖”制成散點圖 。

用Excel做數據分析——回歸分析您需要了解的

文章插圖
在數據點上單擊右鍵 , 選擇“添加趨勢線”-“線性” , 并在選項標簽中要求給出公式和相關系數等 , 可以得到擬合的直線 。
用Excel做數據分析——回歸分析您需要了解的

文章插圖
由圖中可知 , 擬合的直線是y=15620x+6606.1 , R2的值為0.9994 。
因為R2 >0.99 , 所以這是一個線性特征非常明顯的實驗模型 , 即說明擬合直線能夠以大于99.99%地解釋、涵蓋了實測數據 , 具有很好的一般性 , 可以作為標準工作曲線用于其他未知濃度溶液的測量 。
為了進一步使用更多的指標來描述這一個模型 , 我們使用數據分析中的“回歸”工具來詳細分析這組數據 。
用Excel做數據分析——回歸分析您需要了解的

文章插圖
在選項卡中顯然詳細多了 , 注意選擇X、Y對應的數據列 。 “常數為零”就是指明該模型是嚴格的正比例模型 , 本例確實是這樣 , 因為在濃度為零時相應峰面積肯定為零 。 先前得出的回歸方程雖然擬合程度相當高 , 但是在x=0時 , 仍然有對應的數值 , 這顯然是一個可笑的結論 。 所以我們選擇“常數為零” 。
“回歸”工具為我們提供了三張圖 , 分別是殘差圖、線性擬合圖和正態概率圖 。 重點來看殘差圖和線性擬合圖 。
用Excel做數據分析——回歸分析您需要了解的

文章插圖
在線性擬合圖中可以看到 , 不但有根據要求生成的數據點 , 而且還有經過擬和處理的預測數據點 , 擬合直線的參數會在數據表格中詳細顯示 。 本實例旨在提供更多信息以起到拋磚引玉的作用 , 由于涉及到過多的專業術語 , 請各位讀者根據實際 , 在具體使用中另行參考各項參數 , 此不再對更多細節作進一步解釋 。
殘差圖是有關于世紀之與預測值之間差距的圖表 , 如果殘差圖中的散點在中州上下兩側零亂分布 , 那么擬合直線就是合理的 , 否則就需要重新處理 。
用Excel做數據分析——回歸分析您需要了解的

文章插圖
更多的信息在生成的表格中 , 詳細的參數項目完全可以滿足回歸分析的各項要求 。 下圖提供的是擬合直線的得回歸分析中方差、標準差等各項信息 。
用Excel做數據分析——回歸分析您需要了解的

文章插圖

    推薦閱讀