目录
一、引言
二、理论原理
三、小样本 OLS 和大样本 OLS 的区别
四、数据准备
五、程序代码及解释
六、代码运行结果
一、引言
在统计学和计量经济学中,普通最小二乘法(Ordinary Least Squares,OLS)是一种广泛应用的线性回归方法,用于估计线性模型中的参数。本文将详细介绍大样本 OLS 模型的理论原理,并结合 Stata 软件进行具体的操作演示,同时补充小样本 OLS 和大样本 OLS 的区别。
二、理论原理
OLS 的基本思想是通过最小化残差平方和来估计模型的参数,使得观测值与模型预测值之间的差异最小。对于线性回归模型 Y = Xβ + ε
,其中 Y
是因变量向量,X
是自变量矩阵,β
是待估计的参数向量,ε
是误差项。
三、小样本 OLS 和大样本 OLS 的区别
-
抽样分布的性质:
- 小样本情况下,OLS 估计量的抽样分布可能不服从正态分布。
- 大样本时,根据中心极限定理,OLS 估计量的抽样分布趋近于正态分布。
-
有效性和一致性:
- 小样本中,OLS 估计量不一定是最有效的。
- 大样本下,OLS 估计量具有一致性,即随着样本量的增加,估计值趋近于真实参数值。
-
假设检验:
- 小样本的假设检验通常依赖于精确的分布假设,如 t 分布。
- 大样本可以基于渐近正态性进行假设检验,使用 z 检验。
-
对模型误差的容忍度:
- 小样本对模型的设定误差和异方差等问题较为敏感。
- 大样本对这些问题相对更稳健。
四、数据准备
我们使用 Stata 自带的数据集 auto.dta
作为示例,该数据集包含了汽车的各种特征和价格信息。
sysuse auto
五、程序代码及解释
- 首先,我们设定一个简单的线性回归模型,以汽车价格(
price
)作为因变量,汽车重量(weight
)作为自变量:
reg price weight
reg
命令用于执行线性回归,price
是因变量,weight
是自变量。
- 查看回归结果:
estimates store model1
estimates store
命令用于存储回归结果,以便后续调用和比较。
- 输出详细的回归结果:
esttab model1, title("OLS Regression Results")
esttab
命令用于以表格形式输出回归结果,title
选项用于设置表格标题。
- 假设我们想要添加更多的控制变量,比如汽车的里程数(
mpg
)、维修记录(rep78
)以及是否为外国车(foreign
):
reg price weight mpg rep78 foreign
estimates store model2
esttab model2, title("OLS Regression Results with Controls")
- 考虑交互项,例如汽车重量和里程数的交互作用对价格的影响:
reg price weight mpg rep78 foreign weight*mpg
estimates store model3
esttab model3, title("OLS Regression Results with Interaction Term")
- 对模型进行稳健标准误估计,以处理可能存在的异方差问题:
reg price weight mpg rep78 foreign, robust
estimates store model4
esttab model4, title("OLS Regression Results with Robust Standard Errors")
六、代码运行结果
运行上述代码后,我们将得到不同模型的回归结果输出,包括系数估计值、标准误差、t 值、p 值等。以下是一个可能的示例结果(实际结果会因数据和模型设定而有所不同):
Model 1 | Model 2 | Model 3 | Model 4 | |
---|---|---|---|---|
weight | 2.891 | 2.135 | 1.987 | 2.056 |
(0.523) | (0.511) | (0.498) | (0.502) | |
5.52 | 4.17 | 3.99 | 4.10 | |
0.000 | 0.000 | 0.000 | 0.000 | |
mpg | -53.82 | -38.97 | -35.12 | -37.25 |
(27.63) | (24.56) | (23.85) | (24.11) | |
-1.95 | -1.59 | -1.47 | -1.55 | |
0.052 | 0.112 | 0.141 | 0.128 | |
rep78 | -385.98 | -289.17 | -255.33 | -270.11 |
(225.47) | (198.35) | (189.76) | (192.38) | |
-1.71 | -1.46 | -1.34 | -1.40 | |
0.087 | 0.144 | 0.182 | 0.165 | |
foreign | -1256.32 | -1025.87 | -987.55 | -1003.21 |
(456.23) | (423.58) | (412.78) | (418.96) | |
-2.75 | -2.42 | -2.39 | -2.40 | |
0.006 | 0.016 | 0.017 | 0.016 | |
weight*mpg | 0.87 | 0.75 | ||
(0.32) | (0.29) | |||
2.72 | 2.59 | |||
0.007 | 0.010 |
通过这些结果,我们可以分析每个自变量、控制变量以及交互项对因变量的影响程度和显著性。
高级计量经济学 8:大样本OLS(上) (qq.com)https://mp.weixin.qq.com/s?__biz=MzI3MTcyMjY2MQ==&mid=2247484797&idx=1&sn=aba9c8018ff38b2b9125e8996df88335&chksm=eb3c34b7dc4bbda1c620c0db5a916d56c341a4276dbfa5e257c334184eb17954a7b45a65020d#rd【stata学习】大样本OLS的Stata 命令及实例 (qq.com)https://mp.weixin.qq.com/s?__biz=MzkwOTYxOTk1MA==&mid=2247483772&idx=1&sn=3fdbbde27eff44b439c25e4b8362f204&chksm=c136a6fdf6412feb98b260aa65a20784877d7a7649a5c79a1c2fe0548d2c3f1e8dff9b70f3b4#rd