stata面板回归分析步骤+案例分析+代码
部分数据展示
分析结果
1.基本描述性统计分析
本文首先通过平均值mean、标准差sd 等统计量来分析描述了各个变量对应样本数据的分布结构,其中平均值mean 能够反映样本数据的集中趋势,标准差sd 能够反映样本的分散和波动状态,通过基本描述性统计分析对所用到的样本数据有一个初步的了解,具体结果如表 1所示:
2.相关性分析和多重共线性分析
在对样本数据有一定初步了解之后,本文在此进行了相关性分析,以此来了解各个变量之间的相关程度,具体结果如表 2所示:
从表2中的相关性分析结果开看,在解释变量之间的相关性结果中,多数解释变量之间的相关性程度较低,这说明在后续的回归模型中,解释变量之间的多重共线性在容忍范围之内,因此可以通过进一步建立模型对它们之间的关系进行探究。
进一步地,我们用方差膨胀因子(Variance Inflation Factor,VIF) 来判断解释变量的多重共线性问题。多重共线性检验有两个评判标准:最大的VIF 大于10;平均的VIF 大于1。仅当这两个标准同时满足时,才能认为变量之间存在多重共线性。但是根据检验结果来看,各变量的VIF 值均小于10,所以结果仅仅满足了平均值大于1 这一标准,因此可以认为各变量之间不存在多重共线性。
3.回归分析
首先我们通过 F 检验来判断 pooled effect model 和 fixed effect model 这两种模型那种更优,通过 F 检验选择出来的是 fixed effect model;接着,需要进一步通过 Hausman test 来判断 fixed effect model 和 random effect model 这两种模型哪种更优。一系列的检验结果显示,模型选择固定效应模型更佳。
根据设定的计量模型,以表4中的回归结果做进一步的说明:
首先,模型的模型解释力均较高,三个模型解释力分别为59.8%、52.1%、78.6%,关键自变量对三个因变量均在1%或5%的显著水平上有显著影响,从列(1)和列(3)中可以看到,在控制其他变量后,Gdebt对Tertiary_ind和Urban_Rate有显著的正向影响,而Sdebt对Tertiary_ind和Urban_Rate均无统计意义上的显著影响,列(2)表明Gdebt和Sdebt对CPI_growth均有显著影响。
其次,控制变量也显示出有意义的结果,对于因变量Tertiary_ind 和Urban_Rate,Gov_Selffin对其有1%显著水平上的显著负向影响,而LTD_Rate对Urban_Rate则是有10%显著水平的正向影响,lnGov_fin对CPI_growth和Urban_Rate分别有5%和1%显著水平上的正向影响。
完成本次分析核心代码展示:
import excel 面板数据自回归.xlsx,firstrow clear
order Area Year GDP_Growth Urban_Rate Tertiary_ind PCDI_Growth CPI_growth Gdebt SDebt Geo_East Geo_Weast Eco_loca1 Eco_loca2 Gov_fin Gov_Selffin GDP GDP LTD_Rate
*设定面板
egen id=group(Area)
xtset id Year
gen lnGov_fin=ln(Gov_fin)
gen lnGDP=ln(GDP)
drop Gov_fin GDP
order id Area
*描述性统计分析
asdoc sum GDP_Growth-lnGov_fin, stat(mean sd min max median) save(table1.doc) title(Table1: Descriptive statistics) replace
*相关性分析
asdoc pwcorr GDP_Growth Urban_Rate Tertiary_ind PCDI_Growth CPI_growth Gdebt SDebt Gov_Selffin LTD_Rate Indvag lnGov_fin, star(.01) bonferroni save(table1.doc) title(Table2: Correlation) append
*数据属于大N小T,这类数据通常无需考虑单位根和协整的问题
*多重共线性检验
reg Tertiary_ind Gdebt SDebt Gov_Selffin LTD_Rate Indvag lnGov_fin
vif
********模型选择*********
*step1:检验个体效应,看选择混合模型还是固定模型*
xtreg Tertiary_ind Gdebt SDebt Gov_Selffin LTD_Rate Indvag lnGov_fin,fe
*F统计量概率为0.0000,固定效应模型优于混合OLS模型*
*注意是看底下那个F和P*
*step2:检验时间效应,看选择随机效应模型还是混合模型*
xtreg Tertiary_ind Gdebt SDebt Gov_Selffin LTD_Rate Indvag lnGov_fin,re
xttest0
*LM检验P值为0.0000,随机模型优于混合效应模型*
*Hausman检验选固定效应还是随机效应*
*固定效应模型,不可观测的个体效应和某个解释变量相关*
*随机效应模型,不可观测的个体效应和所有解释变量不相关*
*混合回归模型,不存在个体效应*
*STEP1:固定效应模型估计*
quietly xtreg Tertiary_ind Gdebt SDebt Gov_Selffin LTD_Rate Indvag lnGov_fin,fe
est store fe1
*STEP2:随机效应模型估计*
quietly xtreg Tertiary_ind Gdebt SDebt Gov_Selffin LTD_Rate Indvag lnGov_fin,re
est store re1
*STEP3:进行Hausman检验*
hausman fe1 re1
工作时间:8:00-24:00(全年无休)
关注我们
友情链接: