這章比較難,要注意把握核心概念
【一元回歸模型】
一、一元線性回歸模型
yi=α+βxi+ui(就是初中學的y=kx+b)
1、其中ui是隨機項,每個ui均為獨立同分布,分布服從正態分布的隨機變量
2、e(ui)=0,v(ui)=σ^2=常數
3、隨機項ui和任意觀察值不相關(cov(ui,xj)=0
記住上面三個結論
二、樣本回歸函數
從總體中抽取一定樣本,對于解釋變量(自變量)x,被解釋變量(因變量)y的樣本觀測值也可計算其條件均值,且這個均值隨x而變化的軌跡,稱為樣本回歸線。
三、可決系數(擬合優度)
回歸直線和樣本觀察值擬合程度,就叫可決系數
公式:r^2=ess/tss=1-rss/tss=觀測的得方差/估計值的方差
r^2就是看有多少點落在回歸直線上。0<r^2<1
1、tss總離差平方和,反應全部總離差變化最好的量,
2、ess反映了tss中被y對x回歸說明的部分(在樣本回歸線的點)
3、rss一切隨機因素構成的
tss=ess+rss
四、回歸參數
ols最小二乘準則
找到一個方程,最能夠說明y和x關系的表達式(知識點過深,一般考得都比較簡單,真得考深的,就放棄吧qaq)
【多元線性回歸模型】
y=x1β1…..+xkβk+e
多個原因共同導致一個結果
一、模型假定
1、x和y具有一種線性關系
2、x之間不具有線性關系
3、隨機擾動項在觀察值x上的條件期望值為0,表示所有x的觀察值都不能為隨機擾動的期望值提供任何信息(e和前面的x沒有任何關系)
4、隨機擾動的方差和協方差假設,所有隨機擾動的方差都相等,不同的隨機擾動互不相干
5、xi是非隨機的(導致因變量變動的因素是確定的)
二、多元線性回歸模型
y=b0+b1x1+b2x2…..+bkxx+e
三、二元回歸模型
y=b0+b1x1+b2x2+e
【線性回歸模型的特征】
1、引入隨機誤差項(e),將變量用一個線性隨機方程來描述
2、線性回歸模型中,有解釋變量和隨機誤差項共同決定的
【非線性模型的線性比)
1、非線性模型線性化的經典例子:
y=(e^β1)(x2^β2)(x3^β3)(xk^βk)(e^epsilon)
兩邊同時取對數
iny=β1+β2inx2+….
2、非線性回歸模型的分類
1)x和y不存在線性關系,但是未知參數之間存在線性關系的非標準線性回歸模型
2)x,y,未知參數之間都不存在線性關系的可線性化的非線性回歸模型
3)x,y,未知參數之間都不存在線性關系的不可線性化的非線性回歸模型
【回歸模型常見的問題】
首先記住常見問題的名字(多選題)多重共線性,異方差問題,序列相關性模型(自相關模型)
其次記住這些問題的概念、原因、影響和解決辦法(概念和原因最重要)
一、多重共線性//說的x之間的問題
1、概念:多重共線性:解釋變量(x)之間存在相關關系,有一定程度的共線性,近似共線性
2、原因:1)滯后變量的引入(歷史累積,每期都會對下一期有影響,自變量之間存在近似相關)
2)樣本資料的限制(就是樣本不足)
3)經濟變量相關的共同趨勢(經濟繁榮的時候,企業擴展,收入上漲,消費上漲,投資上漲,這些變量之間本身就有相關關系)
3、影響,參數估計量不存在了,ols估計量非有效,參數的經濟含義不合理、、、等等,反正就是那個沒用了
4、解決辦法:排除引起共線性的變量、差分法、減少參數估計量的方差(了解)
二、異方差問題說的μ的方差的問題
隨機誤差項的方差不是常數二是隨機項(本應都是相等的)
原因:漏了某些解釋變量,函數有問題,樣本數據測量有誤差,隨機因素的影響(選壞的就行,全選)
影響:無偏性、有效性、顯著性檢驗都有影響(選壞的)
三、序列相關性(自相關)說的μ之間的問題
原本應該隨機誤差項之間不相干,cov(ui,uj)=0
但是如果隨機誤差項之間有關系,就會出現這種錯誤
例子:消費習慣,一個人的消費習慣如果是隨機誤差項,但是這個跟每個人的經歷有關系,所以這個回歸里的隨機誤差項就是相關的
影響:參數估計量,顯著性檢驗、模型預測失效(選壞的)
解決辦法:首先用ols對模型估計,獲取隨機干擾項的近似估計量,然后通過這些近似估計量的相關行,判斷隨即誤差項是否具有序列相關性。(ols就是找到回歸方程的那個方法)
檢驗辦法有:圖示法、回歸檢驗法、拉格朗日乘數法、杜賓=瓦森檢驗法(dw檢驗)
dw檢驗,在du<dw<4-du,就是無自相關,=2時,完全不存在,小于dl就是正相關,大于4-du,負相關,dl和du之間,4-du和4-dl之間不確定
版權聲明:本文采用知識共享 署名4.0國際許可協議 [BY-NC-SA] 進行授權
文章鏈接:http://bjjkllab.cn/news/4741.html
該作品系作者結合行業標準及互聯網相關知識整合。如若侵權請通過投訴通道提交信息,我們將按照規定及時處理。
客服:13198516101