幾種面板數據模型的解釋 面板數據模型

面板數據模型(幾種面板數據模型的解釋)
1混合效應模型
就是各省都一樣 , 就是同一個方程 , 截距項 , 斜率項都一樣 。
Yit = c+bxit+it c和b是常數 。
2固定效應模型和隨機效應模型 。
即各省有相同的部分 , 即斜率項相同;還有不同的部分 , 也就是不同的截距項 。
2.1固定效應模型
yit=ai+bxit+?it cov(ci , xit)≠0
固定效應方程意味著跨組差異可以用常數項的差異來描述 。每個ai被視為待評估的未知參數 。xit中任何不隨時間變化的變量都會模擬因人而異的常數項 。
2.2隨機效應模型
yit=a+ui+bxit+?it cov(a+ui , xit)=0
a是常數項 , 是不可觀測差的平均值 , ui是第I次觀測的隨機差 , 不隨時間變化 。
3變系數模型(變系數可分為固定效應和隨機效應)
每組由一個方程估計 。即各省線性回歸方程的截距項和斜率項不同 。
yit=ui+bixit+?it
1.混合估計模型是指每個截面估計方程的截距項和斜率項都是相同的 , 也就是說回歸方程的估計結果在截距項和斜率項上都是相同的 。如果我們看每個省 , 歷年的收入對消費的影響 。那么每個省份的回歸方程是完全一樣的 , 無論是截距還是斜率 。
2.隨機效應模型和固定效應模型具有相同的斜率項 , 但截距項不同 。區別在于截距項是否與自變量相關 , 不相關選擇隨機效應模型 , 相關選擇固定效應模型 。然后各省回歸方程斜率相同 , 不同的是截距項 , 也就是平移項 。
3.變系數模型 , 即無論是截距項還是系數項 , 對于不同的省份 , 每個省份都有一個回歸方程 , 最適合自己的 , 不考慮整體 。各省的回歸方程無論是斜率還是截距都與其他省份不同 。
簡而言之 , 從混合估計模型 , 到變截距模型 , 再到變系數模型 , 被調查的省份完全服從整體 , 沒有個性(回歸方程是從整體的角度確定和估計的 , 是一刀切的 , 完全沒有差異和個性 , 完全犧牲自己) , 到任意的 , 完全個性化的(每個省份都有一個最適合自己的回歸方程) 。也就是從完全沒有人格到完全人格 。
二、固定效用模型和隨機效用模型選擇中的一種醫友篩選方法 。
關于隨機效應模型和固定效應模型的選擇 , 通常的做法是對兩種模型進行分析 , 看結果是否一致 。如果它是一致的 , 很少或沒有異質性 , 選擇固定效應模型 。如果結果不一致且異質性 , 選擇隨機效應模型 , 進行亞組分析尋找異質性來源 , 結論要保守 。幾個薈萃分析都說“所有匯總的結果指標都是用隨機效應模型確定的” 。在方法學部分 , “所有匯總的結果指標都是用DerSimonian和Laird描述的隨機效應模型確定的” 。為什么用隨機效應模型而不用固定效應模型?因為RCT的異質性 , 直接用隨機效應模型嗎?
1.它基于12個值來確定模型的使用 。多數認為> 50% , 存在異質性 。他們用隨機效應模型 , ≤50% 。它們是固定的 , 具有異質性 。通過敏感性分析或亞組分析 , 我們可以尋找異質性的來源 。不過兩者都是定性的 , 不一定能發現 。即使你做了 , 你也可以做一個元回歸來發現異質性 。
2.在任何情況下都要使用隨機效應模型 , 因為如果異質性很小 , 隨機效應模型和固定效應模型的最終組合結果不會有太大差異 。當異質性較大時 , 只能使用隨機效應模型 , 所以可以說無論如何都會使用隨機效應模型 。3.還有一個 , 看P值 , 一般建議P的邊界值是0.1 , 現在大多用0.05 , 也就是P > 0.05 。
其實個人更喜歡第三種 , 因為P值可以看出是否存在異質性 , I2是定量描述一致性的大小 。
本來隨機效應的假設是我們的樣本是從一個大母體中抽取的 , 所以大家的期望(平均值)是一樣的;如果我們的樣本幾乎都是媽媽 , 不能說個體差異是隨機的 , 那么固定效果更好;這是從模型的設定角度來說的 。但是隨機效應模型有一個致命的缺陷 , 就是假設cov(x , ui)=0 , 而固定效應不需要這個假設 。豪斯曼檢驗所做的就是檢驗這個假設對于隨機效應模型是否成立 。否則 , 隨機效應模型的估計是有偏差的 。就算B-P的LM測試顯示有隨機效應 , 你也不能用 。

推薦閱讀