什么是虚拟变量/哑变量虚拟变量实际上是一种将多分类变量转换为二分类变量的一种形式,Dummy这个词的意思是虚拟的、假的,所以也叫做哑变量、假的变量,所谓的虚拟变量就是把原先的一个多分类变量转换为多个二分类变量,如果多分类变量中有k个类别,则可以转换为k-1个二分类变量,如变量x为赋值1、2、3、4的四分类变量,那么就可以转换为3个赋值为0和1的二分类变量,而分类变量的结果需要结合参照来解释通过生成虚拟变量,就把原来的一个系数变成了多个系数,这多个系数更详细地展示了自变量和因变量之间的关系,尤其在自变量和因变量之间呈非线性关系时更为重要,我来为大家科普一下关于统计学数据的整理与显示实践总结?下面希望有你要的答案,我们一起来看看吧!

统计学数据的整理与显示实践总结(白话统计阅读笔记)

统计学数据的整理与显示实践总结

什么是虚拟变量/哑变量

虚拟变量实际上是一种将多分类变量转换为二分类变量的一种形式,Dummy这个词的意思是虚拟的、假的,所以也叫做哑变量、假的变量,所谓的虚拟变量就是把原先的一个多分类变量转换为多个二分类变量,如果多分类变量中有k个类别,则可以转换为k-1个二分类变量,如变量x为赋值1、2、3、4的四分类变量,那么就可以转换为3个赋值为0和1的二分类变量,而分类变量的结果需要结合参照来解释。通过生成虚拟变量,就把原来的一个系数变成了多个系数,这多个系数更详细地展示了自变量和因变量之间的关系,尤其在自变量和因变量之间呈非线性关系时更为重要。

Ref:《白话统计》 冯国双著

,