在回归分析的领域中,我们常常需要关注系数估计值的稳定性。具体来说,当我们将整个样本分割成不同的子样本分别进行回归时,我们期望这些子样本能够得到相近似的估计系数。这一原则对于时间序列数据和横截面数据同样适用。对于时间序列数据,它反映了经济结构是否随时间推移而发生改变;而对于横截面数据,比如包含男性和女性的样本,我们可以根据性别将数据一分为二,分别进行估计。
当划分样本的变量不是离散型而是连续型变量时,如企业规模或人均收入,我们需要设定一个明确的“门槛值”来区分不同的样本。
门槛模型详解
门槛效应指的是当一个经济参数达到特定数值后,会引发另一个经济参数发生结构性的变化。这个特定的数值就被称为门限值。在经济研究中,我们经常会遇到各种门槛效应的例子。
例如,我们想要探究大企业与小企业的投资行为是否存在差异。又如,受到流动性约束的企业与没有此约束的企业,其投资行为也可能有所不同。再如,不同因经济发展水平不同,其经济增长规律也可能存在差异。这些情况都提示我们,经济规律可能是非线性的,其函数形式可能依赖于某个“门限变量”而发生变化。
当我们的研究对象包含多个个体和多个年度数据时,所涉及的便是面板门槛模型。
面板门槛模型的原理探究
进行回归分析时,关键在于研究系数的估计值是否稳定。许多经济变量都存在结构突变的问题。传统的做法是确定这些结构突变点,并进行分段回归。这类似于我们在高中学习的分段函数概念。
门槛回归模型的实质是利用门槛值将样本分组。只有当两组样本的估计参数存在显著差异时,才采用门槛回归模型。否则,若线性模型能充分解释数据,则无需使用门槛回归模型。对模型进行显著性检验是至关重要的。
对于如何在大样本的面板数据中寻找结构突变点,Hansen(1999)提出了一种固定效应的门限回归模型。
模型优点概览
(1)该模型不需要预先设定非线性方程的具体形式,门槛值及其数量完全由样本数据自身决定;
(2)该方法提供了一个渐近分布理论,用于构建待估参数的置信区间。它还支持使用bootstrap方法来评估门槛值的统计显著性。
门槛变量的选择应当基于理论模型的外生性。汉森指出,若门槛变量含有较强的时间趋势,应避免选择其作为门槛变量,因为这可能会将趋势带入模型中,改变突变点的似然分布检验。更重要的是,在这种情况下,我们无法构建置信区间,使得问题无法进一步研究。
面板门槛模型的Stata操作指南
1. threshold命令详解
在使用该命令时,需指定被解释变量(depvar)、解释变量(indepvars)和门槛变量(threshavar)。还可以添加options来选择额外的操作选项。
2. xthreg命令介绍
该命令需指定被解释变量、解释变量和门限变量。还需要指定门槛值的数量(thnum)。在Stata中,门槛值是一个必要参数,其数值应大于1且小于等于3,默认值为1。
3. xtthres命令详解
该命令允许用户指定门槛值变量、显示门槛值效果的变量等。它还提供了设置bootstrap次数(bs1、bs2、bs3)和置信区间置信度(level)的选项。minobs参数用于指定在搜索时每个区域中的最小观测数。
对于希望深入了解此内容的朋友们,可以在Stata中使用help命令查看更多细节。