从上一期的聚类分析,可以大致推测城市化率和人口出生率有可能有负相关性,于是本期采用城市化率数据和人口出生率数据做相关性实证分析。
我们首先看一下大陆各省城市化率的相关数据:
城市化率排名
可以看出大陆城市化率最高的地区是上海,达89.3%,最低的地区是西藏,仅为36.6%。
大陆的平均城市化率已经达到60%。
2021年大陆各省城市化率示意
我们再看一下人口出生率数据,目前手头有2019年的人口数据,可以尝试用一下:
人口出生率排名
可以看出西藏的人口出生率最高,达千分之14.6,而黑龙江省的出生率最低,仅为千分之5.73,大陆平均人口出生率为千分之10.48。
人口出生率示意
从这两幅条状图及词云图,暂时还看不出,城市化率和人口出生率有啥关系。
对此,我们对城市化率和人口出生率建立散点图,看看散点分布是否存在一定规律。
城市化率-人口出生率散点图
从散点图上可以大致看出,2021年城市化率和2019年人口出生率呈一定负相关性。
对此,我们对这两个变量进行皮尔森相关性分析,可以得出皮尔森相关系数r=-0.565,
显著性水平值P=0.0009269,明显小于0.05,说明这两个因素显著相关。
对此我们采用机器学习中的一元回归分析模型,进行线性回归拟合,预测出如图拟合线:
城市化率-人口出生率线性回归
通过算法运算可以得出结论:
a=-0.13, b= 19.05, 该拟合线函数方程可以列为:y = -0.13x 19.05
从图上拟合线可以清楚的得出如下结论:城市化率和人口出生率呈负相关性。
对此如何面对这个问题呢?城市的居住成本,抚育成本,儿童上学专人接送及学习花费,一般而言,高于乡镇农村,如果能够在推进城市化的进程中,充分考虑到抚育子女及读书的成本和便捷,并且解决大家相亲难,结婚晚,生育迟,多生娃的顾虑和实际困难,人口出生率的问题或有可能得到积极的变化。
,