今日问题
问题:老师您好:做实证数据相关性分析,样本总数量265,时间周期7年,分别用面板回归、TOBIT、OLS模型做相关性测试,显著情况如表所示(应提问者要求,表未展出)。问题如下:
1、样本数量是否足够?
2、以上结果用哪一个模型结果更理想?这几个模型的优劣势?
3、对实证结果分析是侧重于显著性指标的数量还是显著程度?
今日解答
问题解答:
(1)样本数量是否足够是个很难界定的问题。理论上只有样本量大于参数个数,总是可以估计的;给定能够估计的情况,样本量越大,参数估计的有效性越高,但是我们无法设定一个标准,来判断样本量是否足够大。
(2)面板数据的分析方法有很多,FE,RE,pooled OLS等等,不清楚表中的面板回归指的是哪一种回归。Tobit适用于truncated data;OLS理论上可以适用于任何数据结构。我们无法笼统的讲哪种方法更合适,是否合适需要考虑方法所需要的假设、数据特征、研究的具体问题以及研究目的,判断某一种具体方法的优劣势也是如此。
(3)实证分析可以大概分为两种类型:对相关性的描述性分析和侧重于因果推断的分析。前者一般会同时考察多个解释变量同因变量的关系,此时我们会关心多个解释变量的统计显著性;或者则往往只关注某一个解释变量。我们所关心的变量也并非总是显著才是“好”的,这取决于我们研究的具体问题和待检验的假说。
(4)从统计意义上来说,265个样本是大样本,样本量足够进行实证分析。但是,样本量是否足够还取决于研究主题。如果所选取样本能够很好地反映研究主题,那么265个样本没有问题。例如,有学者研究省级层面问题,谷克鉴和陈福中在《经济研究》发表《净出口的非线性增长贡献——基于1995-2011年中国省级面板数据的实证考察》一文中,样本量为510个;如果所选样本不能很好反映研究主题,即样本没有代表性,则会存在比较大的问题。如果这里的265个样本是研究工业企业相关问题的,则样本就没有代表性。总的来说,样本量是否足够不仅取决于数值,还需要根据研究主题内容判断。
(5)这里给出的估计结果并不全,难以据此直接判断模型好坏。一般来说,当数据为面板数据时,应当采用面板估计,包括固定效应、随机效应和混合效应估计。Tobit模型,又称截尾回归模型或删失回归模型,一般应用在被解释变量取值存在一定限制的情况下。
(6)对回归结果的分析,一般侧重于核心指标的显著性程度。
学术指导:张晓峒老师
本期解答人:张川川老师 任婉婉老师
编辑:李宁宁
统筹:易仰楠 李丹丹
技术:知我者 赵雅轩 郭凯
往期回顾
互助问答第59期:多期DID平行趋势检验以及因子分析累计方差贡献率
互助问答第58期:多对多匹配中的joinby与merge
互助问答第57期:门槛回归和取对数问题
长按二维码识别关注我们
,