msc和pool哪个好用（互助问答第61期:）

今日问题

问题：老师您好：做实证数据相关性分析，样本总数量265，时间周期7年，分别用面板回归、TOBIT、OLS模型做相关性测试，显著情况如表所示（应提问者要求，表未展出）。问题如下：

1、样本数量是否足够？

2、以上结果用哪一个模型结果更理想？这几个模型的优劣势？

3、对实证结果分析是侧重于显著性指标的数量还是显著程度？

今日解答

问题解答：

（1）样本数量是否足够是个很难界定的问题。理论上只有样本量大于参数个数，总是可以估计的；给定能够估计的情况，样本量越大，参数估计的有效性越高，但是我们无法设定一个标准，来判断样本量是否足够大。

（2）面板数据的分析方法有很多，FE,RE,pooled OLS等等，不清楚表中的面板回归指的是哪一种回归。Tobit适用于truncated data；OLS理论上可以适用于任何数据结构。我们无法笼统的讲哪种方法更合适，是否合适需要考虑方法所需要的假设、数据特征、研究的具体问题以及研究目的，判断某一种具体方法的优劣势也是如此。

（3）实证分析可以大概分为两种类型：对相关性的描述性分析和侧重于因果推断的分析。前者一般会同时考察多个解释变量同因变量的关系，此时我们会关心多个解释变量的统计显著性；或者则往往只关注某一个解释变量。我们所关心的变量也并非总是显著才是“好”的，这取决于我们研究的具体问题和待检验的假说。

（4）从统计意义上来说，265个样本是大样本，样本量足够进行实证分析。但是，样本量是否足够还取决于研究主题。如果所选取样本能够很好地反映研究主题，那么265个样本没有问题。例如，有学者研究省级层面问题，谷克鉴和陈福中在《经济研究》发表《净出口的非线性增长贡献——基于1995-2011年中国省级面板数据的实证考察》一文中，样本量为510个；如果所选样本不能很好反映研究主题，即样本没有代表性，则会存在比较大的问题。如果这里的265个样本是研究工业企业相关问题的，则样本就没有代表性。总的来说，样本量是否足够不仅取决于数值，还需要根据研究主题内容判断。

（5）这里给出的估计结果并不全，难以据此直接判断模型好坏。一般来说，当数据为面板数据时，应当采用面板估计，包括固定效应、随机效应和混合效应估计。Tobit模型，又称截尾回归模型或删失回归模型，一般应用在被解释变量取值存在一定限制的情况下。

（6）对回归结果的分析，一般侧重于核心指标的显著性程度。

学术指导：张晓峒老师

本期解答人：张川川老师任婉婉老师

编辑：李宁宁

统筹：易仰楠李丹丹

技术：知我者赵雅轩郭凯

往期回顾

互助问答第59期：多期DID平行趋势检验以及因子分析累计方差贡献率

互助问答第58期：多对多匹配中的joinby与merge

互助问答第57期：门槛回归和取对数问题

msc和pool哪个好用（互助问答第61期:）(1)