您好,欢迎来到意榕旅游网。
搜索
您的当前位置:首页第三章经典假设条件不满足时的问题与对策

第三章经典假设条件不满足时的问题与对策

来源:意榕旅游网
第三章 经典假设条件不满足时的问题与对策

第三章 经典假设条件不满足时的问题及对策 OLS估计量令人满意的性质是根据一组假设条件而得到的在实践中如果某些假设条件不能满足则OLS就不再适用于模型的估计下面列出实践中可能碰到的一些常见问题 l

误设定Misspecification 或specification error l 多

异方差性Heteroscedasticity或

重共线性Multicollinearity l Heteroskedasticity l

自相关Autocorrelation l 随机解释变量

Stochastic explanatory variables 本章将对上述问题作简要讨论主要介绍问题的后果检测方法和解决途径 第一节 误设定 采用OLS法估计模型时实际上有一个隐含的假设即模型是正确设定的这包括两方面的含义函数形式正确和解释变量选择正确在实践中这样一个假设或许从来也不现实我们可能犯下列三个方面的错误 选择错误的函数形式 遗漏有关的解释变量 包括无关的解释变量 从而造成所谓的误设定问题 但在很多情况下我们可以根据实际问题提供的信息估计 矩阵再应用GLS法这种方法称为可行广义最小二乘法Feasible Generalized Least Squares FGLS 例如在仅存在异方差性的情况下如果在实际问题中研究人员确信可以准确估计异方差性的结构如扰动项方差与某个解释变量成正比就可以采用FGLS法由于FGLS法的核心是估计 矩阵因此亦称为估计的广义最小二乘法Estimated Generalized Least Squares EGLS FGLS法的第一步是确定异方差性的具体形式也就是找出决定扰动项方差与某组已知数值之间关系的函数形式然后用这个关系得到每个扰动项方差的

估计值从而得到 矩阵的估计值 最后计算FGLS估计量 例37 Yt β1β2Xt ut t 12n 其中 Y 家庭消费支出 X 家庭可支配收入 我们在前面已分析过高收入家庭有较大的扰动项方差因此不妨假定扰动项方差与可支配收入成正比即 Var ut δXt t 12n 式中δ是一未知常数由于Xt为已知相当于 而δ相当于 因此 应用GLS法即可得出β的FGLS估计量 在上例中我们假设扰动项方差与解释变量的取值成正比这种假设是否真正合理呢根据经验和分析做出的这种假设虽然有一定道理但未免显得过于武断这方面还可做一些比较细致的工作 Glesjer检验法不仅可检验异方差性的存在还可用于提供有关异方差形式的进一步信息对于确定Ω矩阵很有用下面我们扼要说明格里瑟检验法的思路和步骤 格里瑟检验法的思路 格里瑟检验法的思路是假定扰动项方差与解释变量之间存在幂次关系方法是用 对被认为与扰动项方差有关的解释变量回归确定 和该解释变量的关系由于与该解释变量之间关系的实际形式是未知的因此需要用该解释变量的不同幂次进行试验选择出最佳拟合形式 具体步骤如下 1 因变量Y对所有解释变量回

归计算残差et t 12n 2 对所选择解释变量的各种幂次形式回归如 然后利用决定系数选择拟合最佳的函数形式 3对β1进行显著性检验若显著异于0则表明存在异方差性否则再试其它形式 例38 Yt β1β2X1tβk

Xkt ut 假设我们根据经验知道扰动项方差与Xjt有关并用格里瑟法试验得出 则 在大多数应用中由于通过矩阵运算计算相对复杂因而对于仅存在异方差性的问题通常采用另一种等价的方法-加权最小二乘法WLS 加权最小二乘法 对于仅存在异方差性的问题其Ω矩阵是一个对角矩阵即 在这种情况下应用广义最小二乘法也就是在原模型两端左乘矩阵 变换原模型再对变换后的

模型应用普通最小二乘法进行估计 这种作法实际上等价于在代数形式的原模型 Yt β0β1X1 tβk X k t u t 的两端除以 t得变换模型 相当于在回归中给因变量和解释变量的每个观测值都赋予一个与相应扰动项的方差相联系的权数 然后再对这些变换后的数据进行OLS回归因而被称为加权最小二乘法WLS法 Weighted Least Squares 加权最小二乘法是FGLS法的一个特例在 矩阵为对角矩阵这种特殊情形下我们既可以直接应用矩阵形式的可行广义最小二乘估计量公式得到FGLS估计值亦可避开矩阵运算采用加权最小二乘法得到其WLS估计值两者结果完全相同无论你称之为FGLS估计值还是WLS估计值二者是一码事 例39 其中Y RD支出X 销售额 采用美国

1988年18个行业的数据估计上述方程结果如下括号中数字为t值 这里是横截面数据由于行业之间的差别可能存在异方差性 假设 应用格里瑟法试验得到异方差性形式为 将原模型1的两端除以 得 用OLS法估计2式结果如下括号中数字为t值 与1式的结果比较两个方程斜率系数的估计值相差不大但采用WLS法估计的比直接用OLS法估计的系数更为显著 2 仍采用OLS法估计系数 但采用OLS估计量标准误差的异方差性一致估计值代替其OLS估计值 怀特H White在1980年提出的产生OLS估计量的异方差性一致标准误差的方法为解决异方差性问题提供了另一种途径 怀特的贡献是解决了异方差性造成系数的置信区间和假设检验结果不可信赖的问题该后果是由于方差的OLS估计量不再是无偏估计量而造成的 我们用简单线性回归模型对怀特方法作一说明在异方差的情况下 的方差是 可以证明 将涉及所有的 而不是一个共同的 这意味着回归软件包所报告的 作为

的方差估计值有两个错误 第一它用的不是方差的正确公式525 第二它用 估计一个共同的 而事实上诸 是不同的 怀特的方法是在525式中用 取代 这里 是第i个OLS残差即 请注意我们并不能用 得到 的一致估计量因为在这种情况下每个要估计的参数仅有一个观测值当样本增大时未知的的数目也在同步增加怀特得到的是 的一致估计量它是 的加权平均同样的分析适用于多元回归OLS估计量的情况在这种情况下用怀特方法得到的第K个OLS回归系数的方差的异方差性一致估计值由下式给出 其中 是从 对方程中所有其它解释变量回归得到的OLS残差 的平方 为原多元回归模型的第i个OLS残差很多回归软件包提供诸方差的怀特异方差性一致估计值以及对应的稳健t统计值robust t-statistics例如使用EViews先点击Quick选择Estimate Equation再击Options从下拉菜单中选其中的一个选项White即可得到诸方差的异方差性一致估计值 通过使用诸方差的怀特异方差性一致估计值代替其OLS估计值我们解决了异方差性造成系数的置信区间和假设检验结果不可信赖的问题从而也就解决了在异方差性存在的情况下能否使用OLS法估计方程的问题 结论是我们仍可用OLS法估计方程的系数因为尽管存在异方差性系数的OLS估计量毕竟还是无偏和一致估计量应该说还是具有良好性质的估计量只不过方差-协方差矩阵不能再用OLS法估计而要采用怀特之类的方法得到一致估计量如怀特的异方差性一致估计量 这类估计量的性质不是最好但它们对于某些假设条件在这里是同方差性的违背不敏感这类的估计量称为稳健估计量robust estimators 与我们前面介绍的FGLS法相比本段介绍的解决异方差性的方法的优越之处在于不需要知道异方差性的具体形式因此在异方差性的基本结构未知的情况下建议仍采用OLS法估计系数而

采用其方差的稳健估计量如怀特的异方差性一致估计量 第四节 自相关 一 定义

若Cov ui uj E uiuj 0 i≠j不成立即线性回归模型扰动项的方

差协方差矩阵的非主对角线元素不全为0则称为扰动项自相关或序列相关Serial Correlation 二 自相关的原因及后果 1.原因 自相关主要发生在时间序列数据的情形因而亦称为序列相关主要有以下两种原因 1冲击的延期影响惯性 在时间序列数据的情况下随机冲击扰动的影响往往持续不止一个时期例如地震洪水罢工或战争等将在发生期的后续若干期中影响经济运行 微观经济中也与此类似如一个工厂的产量由于某种外部偶然因素的影响如某种原材料的供应出了问题该厂某周产量低于正常水平那么随后的一周或几周中由于这种影响的存在或延续产量也很可能低于正常水平即扰动项为负 不难看出观测的周期越长这种延期影响的严重性就越小因此年度数据比起季度数据来序列相关成为一个问题可能性要小 2误设定 如果忽略了一个有关的解释变量而该变量是自相关的则将使扰动项自相关不正确的函数形式也将导致同样后果在这些情况下解决的方法是纠正误设定本章后面将介绍的纠正自相关的方法都不适用于这种情况的自相关 2.后果 自相关的后果与异方差性类似 1在扰动项自相关的情况下尽管OLS估计量 仍为无偏估计量但不再具有最小方差的性质 即不是BLUE 2OLS估计量的标准误差不再是真实标准误差 的无偏估计量使得在自相关的情况下无法 再信赖回归参数的置信区间或假设检验的结果 三 自相关的检验 1.检验一阶自相关的德宾沃森检验法DurbinWatson test 1一阶自相关 自相关的最简单模式为 其中ρ称为自相关系数-1≤ρ≤1这种扰动项的自相关称为一阶自相关即扰动项仅与其前一期的值有关 ρ 0 正自相关

ρ 0 负自相关 ρ 0 无自相关 在一阶自相关模式中假定

εt具有以下性质 E εt 0 E εt2 ζ2 常数 E εiεj 0 i≠j εt服从正态分布 在计量经济学中具备上述性质的

量称为白噪声White noise表示为 εt White noise 或 εt 白噪声 2德宾沃森检验法 Durbin-Watson d test 统计软件包和研究报告在提供回归结果时通常都给出DW或d统计量的值该统计量是从OLS

回归的残差中计算得来的它被用于一阶自相关的检验计算公式为 DW和一阶自相关系数ρ的估计值之间存在以下近似关系具体推导过程见书上P61-62 DW ≈ 2 - 2 由于 -1 ≤ρ ≤1因而0 ≤ DW ≤4 不难看出直观判断准则是当DW统计量接近2时则无自相关DW值离2越远则自相关存在的可能性越大 DW检验的缺陷 我们当然期望有一张能够给出相应的nk和α值下各种DW临界值的表就象t检验F检验一样使得我们可以按常规假设检验那样根据临界值作出判断 不幸的是DW统计量的分布依赖于解释变量的具体观测值即依赖于X矩阵因此不象tF检验那样有一张能够给出DW临界值的表 为解决这一问题德宾和沃森证明DW统计量的真实分布位于两个极限分布之间这两个分布分别称为下分布和上分布如下图所示 4 使用VIF检验 VIF是方差膨胀因子的英文 Variance Inflation Factors 缩写 这是一种比较正规的检验方法该方法通过检查指定的解释变量能够被回归方程中其它全部解释变量所解释的程度来检测多重共线性 方程中每个解释变量有一个VIF该VIF是关于多重共线性使相应的系数估计值的方差增大了多少的一个估计值高VIF表明多重共线性增大了系数估计值的方差从而产生一个减小了的t值 VIF检验的具体步骤如下 设原方程为 Y 0 1X1 2X2

kXk u 我们需要计算K个不同的VIF每个Xi一个为指定Xi计算VIF涉及以下三步 1Xi 对原方程中其它全部解释变量进行OLS回归例如若i 1则回归下面

的方程 X1 1 2X2 3X3 kXk v 2计算方差膨胀因子 VIF 其中Ri2是第一步辅助回归的决定系数 3分析多重共线性的程度 VIF越高 多

重共线性的影响越严重 由于没有VIF临界值表我们只能使用经验法则 若 则存在严重多重共线性 也有人建议用VIF 10作为存在严重多重共线性的标准 特别在解释变量多的情形应当如此 需要指出的是所有VIF值都低并不能排除严重多重共线性的存在这与使用相关系数矩阵检验的情况相似 四 解决多重共线性的方法 思路加入额外信息 具体方法有以下几种 增加数据 对模型施加某些约束条件 删除一个或几个共线变量 将模型适当变形 1.增加数据 多重共线性实质上是数据问题因此增加数据就有可能消除或减缓多重共线性具体方法包括增加观测值利用不同的数据集或采用新的样本 例31 需求函数Yt β1β2Xtβ3Pt ut 在时间序列数据中收入X和价格P往往是高度相关的用时间序列数据估计往往会产生多重共线性然而在横截面数据中则不存在这个问题因为某个特定时点P为常数如果取一横截面样本如从5000个家庭取得的数据则可用来估计 Yi α

1α2Xi ui 然后将得到的估计值 作为一个约束条件β2 施加于时间序列数据的回归计算中即估计 Yt - Xt β1β3Pt ut 得到 2.对模型施加某些约束条件 在存在多重共线性的模型中依据经济理论施加某些约束条件将减小系数估计量的方差如在CobbDouglas生产函数中加进规模效益不变的约束可解决资本和劳动的高度相关而引起的多重共线性问题 3.删除一个或几个共线变量 这样做实际上就是利用给定数据

估计较少的参数从而降低对观测信息的需求以解决多重共线性问题删除哪些变量可根据假设检验的结果确定 应注意的是这种做法可能会使得到的系数估计量产生偏倚因而需要权衡利弊 4.将模型适当变形 例32 某商品的需求函数为 其中Q 需求量 X 收入 P 该商品的价格 P 替代商品的价格 在实际数据中P和P往往呈同方向变动它们之间高度相关模型存在多重共线性 如果我们仅要求在知道两种商品的相对价格变动时对需求量进行预测则可将需求函数变为 就可以解决多重共线性问题 例33 有滞后变量的情形 Yt β1β2Xtβ3 Xt-1 ut 一般而言Xt和Xt –1往

往高度相关将模型变换为 Yt β1β2Xt - Xt –1β3′Xt -1 ut 其中β3′ β3 β2 经验表明△Xt和Xt –1的相关程度要远远小于和Xt和Xt –1的相关程度因而这种变换有可能消除或减缓多重共线性 5.主成分法 可将共线变量组合在一起形成一个综合指数 变量 用它来代表这组变量构造综

合指数的最常用方法是主成分法主成分法的计算相当复杂这里不做介绍 主成分的特点是各主成分之间互不相关并且用很少几个主成分就可以解释全部X变量的绝大部分方差因而在出现多重共线性时可以用主成分替代原有解释变量进行回归计算然后再将所得到的系数还原成原模型中的参数估计值 五 处理多重共线性问题的原则 1 多重共线性是普遍存在的轻微的多重共线性问题可不 采取措施 3 如果模型仅用于预测则只要拟合好可不处理多重共线性问题存在多重共线性的模型用于预测时往往不 影响预测结果 2 严重的多重共线性问题一般可根据经验或通过分析回归结果发现如影响系数的符号重要的解释变

量t 值很低要根据不同情况采取必要措施 1E ut 0 t 12n

扰动项均值为0 2Cov uiuj E uiuj 0 i≠j 扰动项相

互 3Var ut E ut2 2 t 12n 常数方差 4ut ~N 02 正态性 对于1我们可论证其合理性而第4条也没有多大问题大样本即可假定扰动项服从正态分布而对于23两条则无证其合理性实际问题中这两条不成立的情况比比皆是下面将讨论它们不成立的情况即异方差性和自相关的情形 第三节 异方差性 回顾我们应用OLS法所需假设条件其中大部分是有关

扰动项的统计假设它们是 一 异方差性及其后果 1. 定义 若Var ut 常数的假设不成立即 Var ut ≠常数则称扰动项具有异方差性 2.

什么情况下可能发生异方差性问题 解释变量取值变动幅度大时常数

方差的假设往往难以成立异方差性主要发生在横截面数据的情况时间序列问题中一般不会发生除非时间跨度过大 例34 Yi αβXi ui 其中Y 指定规模和组成的家庭每月消费支出 X 这样的家庭的每月可支配收入 设X的N个观测值取自一个家庭可支配收入的横截面样本某些家庭接近于勉强维持生存的水平另一些家庭则有很高的收入 不难设想低收入家庭的消费支出不大可能离开他们的均值E Y 过远太高无法支持太低则消费将处于维持生存的水平之下因此低收入家庭消费支出额的波动应当较小因而扰动项具有较小的方差而高收入家庭则没有这种其扰动项可能有大得多的方差这就意味着异方差性 3.异方差性的后果 1参数估计量不再具有最小方差的性质 异方差性不破坏OLS估计量的无偏性但不再是有效的 事实上异方差性的存在导致OLS估计量既不是有效的也不具有渐近有效性 这有两层含义首先小样本性质BLUE的丧失意味着存在着另外的线性无偏估计量其抽样方差小于OLS估计量的方差其次渐近有效性这一大样本性质的丧失意味着存在着另外的一致估计量其抽样分布当样本容量增大时向被估计的回归参数收缩的速度要比OLS估

计量快 2系数的置信区间和假设检验结果不可信赖 更为严重的是在异方差性的情况下矩阵 主对角元素不再是OLS估计量方差的无偏估计量从而导致系数的置信区间和假设检验结果不可信赖 在异方差性的情况下系数估计量的方差既有可能低估也有可能高估真实方差在这两种情况下都会产生检验结果的误导例如被检验的系数实际上不是统计上显著的而由于矩阵 的主对角元素低估了OLS估 计量的相应方差检验结果却表明其显著 二 异方差性的检验 异方差性后果的严重性意味着我们在实践中必须了解是否存在异方差性 常用的检验方法有 戈德弗尔德匡特检验法 Goldfeld Quandt test 格里瑟检验法Glesjer test 帕克检验法Park test 怀特检验法 Whites General Heteroscedasticity test 布鲁奇-帕根检验法 Breusch-Pagan Test 1戈德弗尔德匡特检验法 基本思路假定 随Yt的数值大小变动 检验步骤 1将数据分为三组小Yt值组中Yt值组大Yt值组数据项大致相等 2对小Yt值组估计模型给出 3对大

Yt值组估计模型给出 4 H0 H1 或 检验统计量为F0 ~Fn3-k-1 n1-k-1 若F0>Fc则拒绝H0存在异方差性 例35 S αβY u 其中S 储蓄 Y 收入 设 195160年 001625 197079年 09725 F0 09725001625 599 查表得 df为88时5 Fc 344 ∵F0>Fc 因而拒绝H0 结论存在异方差性 2 怀特检验法 怀特提出的检验异方差性的方法在实践中用起来很方便下面用一个三变量线性模型扼要说明其检验步骤设模型如下 White检验步骤如下 1用OLS法估计原模型得到残差e i 2进行如下辅助回归 即残差平方对所有原始变量变量平方以及变量交叉积回

归得到R2值 3进行假设检验 原假设 H0不存在异方差性即辅助回归方程全 部斜率系数均为零 备择假设 H1存在异方差性 即H0不成立 怀特证明了下面的命题 在 原假设 H0成立的情况下从辅助回归方程得到的R2值与观测值数目n的乘积n× R2服从自由

度为 k的2分布自由度 k 为辅助回归方程中解释变量的个数即

n· R2 2 k 因此怀特检验的检验统计量就是n· R2 其抽样分布为自由度为k的2分布 检验步骤类似于t检验和F检验 例36 根据2006年内地31省市的数据研究文化娱乐支出ama与人均可支配收入income和文化娱乐价格priceama之间的关系建立回归模型得到如下估计结果 Ama 1661

0135income -20priceama t 1444 -118 由于各个省市的收入差距比较大文化娱乐支出的差距也会比较大因此可能存在异方差性下面通过white检验来判断是否存在异方差性 先对该模型作OLS回归得到残差 然后做如下辅助回归 这里 X1i income X2i priceama 使用EViews软件得到辅助回归的 因此 3 检验 不存在异方差性 存在异方差性 查表在5的显著性水平下自由度为5的 值为1107因为 1107所以拒绝原假设结论是存在异方差性 三 广义最小二乘法 1.消除异方差性的思路 基本思路变换原模型使经过变换后的模型具有同方差性然后再用OLS法进行估计 对于模型 Yt β0β1X1tβk Xkt ut 1 若扰动项满足 E ut 0E uiuj 0 i≠j 但 E ut2 ζt2 ≠常数 也就是说该模型只有同方差性这一条件不满足则只要能将具有

异方差性的扰动项的方差表示成如下形式

由于 所以变换后模型的扰动项的方差为常数可以应用OLS法进行估计得到的参数估计量为BLUE但这里得到的OLS估计量是变模后模型2的OLS估计量对于原模型而言它已不是OLS估计量称为广义最小二乘估计量GLS估计量 其中 为一未知常数 表示一组已知数值则用λt去除模型各项得变换模型 2. 广义最小二乘法 Generalized least squares 下面用矩阵形式的模型来推

导出GLS估计量的一般计算公式 设GLS模型为

1 满足 E u 0E uu′ X非随机 X的秩 K1<n 其中 为正定矩阵 根据矩阵代数知识可知对于任一正定矩阵 存在着一个满秩非退化非奇异矩阵P使得 用P-1左乘原模型1对原模型进行变

换 令 Y P-1Y X P-1Xu P-1u得到 Y Xβ u 2 下面的问题是模型2的扰动项u是否 满足OLS法的基本假设条件 我们有 这表明模型2中的扰动项u满足OLS法的基本假设可直接用OLS估计估计量向量 这就是广义最小二乘估计量GLS估计量 的公式该估计量是BLUE 从上述证明过程可知我们可将GLS法应用于Ω为任意正定矩阵的情形 如果只存在异方差性则 其中 我们显然有 四解决异方差问题的方法 1 可行广义最小二乘法FGLS法 广义最小二乘法从理论上解决了扰动项存在异方差性的情况下模型的估计问题但在实践中是否可行呢 从GLS估计量的公式可知要计算GLS估计值我们必须知道 矩阵而实际问题中 矩阵极少为已知因此在实践中直接应用GLS法基本上不可行 本章内容 第一节 误设定 第二节 多重共线性 第三节 异方差性 第四节 自相关 第五节 随机解释变量 一 选择错误的函数形式 这类错误中比较常见的是将非线性关系作为线性关系处理函数形式选择错误所建立的模型当然无法反映所研究现象的实际情况后果是显而易见的

因此我们应当根据实际问题选择正确的函数形式 我们在前面各章的介绍中采用的函数形式以线性函数为主上一章还介绍了因变量和解释变量都采用对数的双对数模型下面再介绍几种比较常见的函数形式的模型为读者的回归实践多提供几种选择方案这几种模型是 半对数模型 双曲函数模型 多项式回归模型 1 半对数模型 半对数模型指的是因变量和解释变量中一个为对数形式而另一个为线性的模型因变量为对数形式的称为对数-线性模型 log-lin model 解释变量为对数形式的称为线性-对数模型 lin-log model 我们先介绍前者其形式如下 对数-线性模型中斜率的含义是Y的百分比变动即解释变量X变动一个单位引起的因变量Y的百分比变动这是因为利用微分可以得出 这表明斜率度量的是解释变量X的单位变动所引起的因变量Y的相对变动将此相对变动乘以100就得到Y的百分比变动或者说得到Y的增长率由于对数-线性模型中斜率系数的这一含义因而也叫增长模型 growth model 增长模型通常用于测度所关心的经济变量如GDP的增长率例如我们可以通过估计下面的半对数模型 得到一国GDP的年增长率的估计值这里t为时间趋势变量 线性-对数模型的形式如下 与前面类似我们可用微分得到 因此 这表明 上式表明Y的绝对变动量等于 乘以X的相对变动量因此 线性-对数模型通常用于研究解释变量每变动1引起的因变量的绝对变动

量是多少这类问题 2 双曲函数模型 双曲函数模型的形式为

不难看出这是一个仅存在变量非线性的模型很容易用重新定义的方法将其线性化 双曲函数模型的特点是当X趋向无穷时Y趋向 反映到图上就是当X趋向无穷时Y将无限靠近其渐近线Y 双曲函数模型通常用于描述著名的恩格尔曲线和菲利普斯曲线 3 多项式回归模型 多项式回归模型通常

用于描述生产成本函数其一般形式为 其中Y表示总成本X表示产出P为多项式的阶数一般不超过四阶 多项式回归模型中解释变量X以不同幂次出现在方程的右端这类模型也仅存在变量非线性因而很容易线性化可用OLS法估计模型 二 遗漏有关的解释变量 模型中遗漏了对因变量有显著影响的解释变量的后果是将使模型参数估计量不再是无偏估计量 三 包括无关的解释变量 模型中包括无关的解释变量参数估计量仍无偏但会增大估计量的方差即增大误差 [注] 有关上述两点结论的说明请参见教科书P42-43 四 选择解释变量的四条原则 在模型设定中的一般原则是尽量不漏掉有关的解释变量因为估计量有偏比增大误差更严重但如果方差很大得到的无偏估计量也就没有多大意义了因此也不宜随意乱增加解释变量 在回归实践中有时要对某个变量是否应该作为解释变量包括在方程中作出准确的判断确实不是一件容易的事因为目前还没有行之有效的方法可供使用尽管如此还是有一些有助于我们进行判断的原则可用它们是 选择解释变量的四条原则 1 理论 从理论上看该变量是否应该作为解释变 量包括 在方程中 2 t检验该变量的系数估计值是否显著 3 该变量加进方程中

后 是否增大 4 偏倚 该变量加进方程中后其它变量的系数 估计值是 否显著变化 如果对四个问题的回答都是肯定的则该变量应该包括在方程中如果对四个问题的回答都是否 则该变量是无关变量可以安全地从方程中删掉它这是两种容易决策的情形 但根据以上原则判断并不总是这么简单在很多情况下这四项准则的判断结果会出现不一致例如有可能某个变量加进方程后 增大但该变量不显著 在选择变量的问题上应当坚定不移地根据理论而不是满意的拟合结果来作决定对于是否将一个变量包括在回

归方程中的问题理论是最重要的判断准则如果不这样做产生不正确结果的风险很大 在这种情况下作出正确判断不是一件容易的事处理的原则是将理论准则放在第一位 五模型的选择 上一段讨论了某个解释变量应否包括在模型中的几条原则实践中要解决的一个问题是如何从大量的潜在解释变量的集合中选择一个最合适的子集以得到一个正确设定的模型 上个世纪六十年代后相当一段时间人们使用逐步回归法来解决解释变量的选择问题这种由计算机机械挑选变量的做法如今已不流行了目前比较通行的做法是从少量精心设定的备选模型中选择一个 计量经济学家就此提出了很多基于统计学的选择标准我们这里讨论其中几种如表3-1所示 令RSSj表示第j个模型有kj个解释变量包括常数项的残差平方和并定义 为第j个模型的的 估计值我们 用表示包含全部k个解释变量的模型的 估计值 表3-1 选择回归模型的准则 准则 计算公式 1 准则 希尔Theil的 准则基于如下假设所考虑的模型中有一个是正确模型对于正确模型 对于不正确模型 因此选择 最小的模型一般就能选出正确模型由于 最小化与 最大化是一回事我们习惯上称该准则为 最大准则 这个准则的主要问题是一个包括

正确模型的所有解释变量但同时也包括一些无关变量的模型也会给出 在这种情况下我们所选择的其实并非正确模型当备选模型包含大量无关变量时选出正确模型的概率较低 2 基于预测的均方误差最小的三个准则 希尔的准则是基于回归的标准误差最小下列三个准则则是基于预测的均方误差MSE最小这三个准则是 马娄斯Mallows的 准则 霍金Hocking的 准则 阿美米亚Amemiya的PC准则 假设正确的方程

有k个解释变量我们考虑的方程有 个解释变量问题是如何选择k1

以及具体的k1个解释变量的集合在上述三个预测准则中这是通过使的均方误差 达到最小实现的其中 是Y的未来值而 是预测值 上述三个准则都是基于预测的均方误差最小但在估计预测的均方误差时采用的假设有所不同因而形成各自的计算公式孰优孰劣并无定论在实践中可根据所用软件提供的输出

结果选用其中一个作为模型选择的准则具体做法是比较备选的几个模型的 或PC值选其中最小的即可 在三个预测准则的情况下我们感兴趣的是改善预测的MSE只要能改善可以去掉某些变量即便是正确模型中包括它们也在所不

惜 3 赤池信息准则AIC 赤池信息准则Akaikes Information CriterionAIC是一个更一般的准则它可以应用于任何一个可用极大似然法估计的模型对于我们这里的应用AIC的计算公式为 与赤池信息准则类

似的还有施瓦茨信息准则Schwarz information criterionSIC

上述两个准则与前述准则 一样可用于模型选择其值也是越小越好 六 检验误设定的RESET方法 前面给出了选择解释变量的四条原则可是有时这些原则不能提供足够的信息使研究人员确信其设定是最恰当的在这种情况下可考虑使用一些更正规的检验方法来比较不同估计方程的性质这类方法相当多这里就不一一列出仅介绍拉姆齐J B Ramsey的回归设定误差检验法RESET法 Regression Specification Error Test RESET检验法的思路 RESET检验法的思路是在要检验的回归方程中加进 等项作为解释变量然后看结果是否有显著改善如有则可判断原方程存在遗漏有关变量的问题或其它的误设定问题 直观地看这些添加的项是任何可能的遗漏变量或错误的函数形式的替身如果这些替身能够通过F检验 表明它们改善了原方程的拟合状况则我们有

理由说原方程存在误设定问题 另一方面

等项形成多项式函数形式多项式是一种强有力的曲线拟合装置因而如果存在函数形式方面的误设定则用这样一个装置可以很好地代表它们 RESET检验法的步骤 拉姆齐RESET检验的具体步骤是 1 用OLS法估计要检验的方程得到 2 由上一步得到的值 i 12n计算 然后用OLS法估计 3 用F检验比较两个方程的拟合情况类似于上一章中联合假设检验采用的方法如果两方程总体拟合情况显著不同则我们得出原方程可能存在误设定的结论使用的检验统计量为 其中RSSM为第一步中回归有约束回归的残差平方和RSS为第二步中回归无约束回归的残差平方和M为约束条件的个数这里是M 3 应该指出的是拉姆齐RESET检验仅能检验误设定的存在而不能告诉我们到底是哪一类的误设定或者说不能告诉我们正确的模型是什么但该方法毕竟能给出模型误设定的信号以便我们去进一步查找问题另一方面如果模型设定正确RESET检验使我们能够排除误设定的存在转而去查找其它方面的问题 第二节 多重共线性 应用OLS法的一个假设条件是矩阵X的秩 K1 N即自变量之间不存在严格的线性关系观测值个数大于待估计的参数的个数这两条无论哪一条不满足则OLS估计值的计算无法进行估计过程由于数学原因而中断就象分母为0一样 这两种情况都很罕见然而自变量之间存在近似的线性关系则是很可能的事 当某些解释变量高度相关时尽管估计过程不会中断但会产生严重的估计问题我们称这种现象为多重共线性解释变量间存在严格线性相关关系时称为完全的多重共线性 一 定义 在实践中若两个或多个解释变量高度线性相关我们就说模型中存在多重共线性 二 后果 1 不改变参数估计量的无偏性 这是因为尽管解释变量之间存在多重共线性但并不

影响扰动项和解释变量观测值的性质故仍有 事实上对于不完全多重共线性参数估计量仍为BLUE 2 但各共线变量的参数的OLS估计值方差很大即估计值精度很低BLUE表明在各线性无偏估计量中方差最小但不等于方差的值很小 3 由于若干个X变量共变它们各自对因变量的影响无法 确定 4 各共线变量系数估计量的t值低使得犯第Ⅱ类错误的可能性增加 由于各共线变量的参数的OLS估计值方差大因而系数估计量的t值低使得我们犯第Ⅱ类错误接受错误的原假设H0 βj 0的可能性增加容易将本应保留在模型中的解释变量舍弃了 三 多重共线性的判别和检验 1.根据回归结果判别 判别是否存在多重共线性的最简单方法是分析回归结果 如果发现 系数估

计值的符号不对 某些重要的解释变量t值低而R2不低 当一不太重要的解释变量被删除后回归结果 显著变化 则可能存在多重共线性其中上述第二种现象是多重共线性存在的典型迹象 此方法简便易行因而是实践中最常用的方法缺点是无 法确诊 2.使用相关矩阵检验 统计软件一般提供各解释变量两两之间的相关系数矩阵如发现某些相关系数高绝对值高于08或090则表明多重共线性存在但即使解释变量两两之间的相关系数都低也不能排除存在多重共线性的可能性 3.通过条件指数检验 条件指数Condition index或条件数Condition number是XX矩阵的最大和最小特征根之比的平方根条件指数高表明存在多重共线性至于什么程度算高也没有一个绝对的标准通常认为大于10即存在多重共线性大于30表明存在严重多重共线性大多数统计软件提供此检验值

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- yrrf.cn 版权所有 赣ICP备2024042794号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务