Excel 作为最常用的 Office 办公软件之一,拥有强大的数据处理能力,各行业不同岗位的同学都离不开 Excel。对于数据分析师而言,Excel 更是每天必用的工具。
这里我分享两个 Excel 独特且重要的技巧:vlookup 函数及透视表功能。
这两个技巧对数据分析师来说非常实用,而且是 Excel 典型代表,其他数据工具很少有像 vlookup 这样互动性强又便捷的函数。而透视表被很多 BI 工具模仿,因为它靠简单拖曳就可完成数据统计,如果使用得当,可以帮助我们节约不少工作时间,提高工作效率。
01巧用 vlookup 函数
vlookup 函数功能,即通过表格首列查找该函数指定需要查询的值,并返回当前表格中指定列的数值。函数表达式如下所示:
1. vlookup(查找值,数据表,列序数,匹配条件)
下面通过一个案例帮你来理解这个函数。
现有一列记录了用户注册省份名称的数据,希望你可以补充省份对应的“省份简称”和“省会城市”数据。
这种情况下,如果你没有掌握 vlookup 函数,就需要一行行地手动添加,需要处理的数据量少还好说,但如果需要补充的数据源有几十万行,那该怎么办?手动处理会变成一场噩梦。
这时,通过 vlookup 函数,就可以瞬间解决这个问题。
第一步,我们需要制作一个省份、简称、省会的映射表,如图所示。
第二步,添加 vlookup 函数,按照前面我们讲的格式填写 4 个参数,如下所示。
第1个参数 M8 指的是要查找单元格的值。
第2个参数 F:H 指的是要查找的位置。
第3个参数数字 2,表示要返回的值的区域中的列号。
第4个参数设置为 FALSE 是表示严格匹配才返回,如果设置为 TRUE 或 1 则表示模糊匹配。
接下来只需要复制函数到 N 列的每个对应的单元格,瞬间省份的简称就填写到对应位置上了,见下图。
可以看到,通过上面的操作,我们非常便捷地完成了通过表格首列(即 F 列)查找该函数指定需要查询的值(如"山东省"这个值),并返回当前表格中指定列(即 G 列)的数值(即"鲁")。
这就是 vlookup 函数最常用的一个应用场景。即给出查询内容,在指定区域查询对应内容,然后返回。
下面我们看 vlookup的另外一种应用场景,连续数值划分区间。
现假设有一列记录了 10 万条 App 用户注册年龄的数据,我们希望能够按年龄段进行划分(比如:0~7 岁、8~18 岁、19~24 岁、25~35 岁、36~50 岁、51 岁以上等),以便统计各年龄段用户的分布情况。面对这样的需求,vlookup 仍然能够轻松实现,下面我们一步步完成数据的统计。
第一步,先按需求准备划分的年龄段,输入两列数据。第一列是划分段最小值,第二列填写分段名称,这里要注意上个分段和下个分段的数据连续性,即下个分段最小值是上个分段最大值加 1。以“0~7 岁”为例,“0”为该分组下限,“7”为下个分组上限减 1。
第二步,输入 vlookup 函数, 填写 4 个参数,然后按回车键就会输出正确的结果,如图所示。
上面介绍了两个 vlookup 常用案例,也是数据分析师日常处理数据经常遇到的场景,一个快速匹配,一个是连续数值分段。工作中,使用 vlookup 函数的场景我们经常遇到,希望你能够活学活用,利用它实实在在地提高我们的工作效率。
02巧用透视表
接下来我们学习第二个技巧。同 vlookup 函数一样,透视表在我们的工作中也非常的重要。
你可以把透视表理解为数据处理的"最后一公里",它可以很方便通过鼠标“点点点”完成数据的分组统计、排序、求平均、行列计算占比等常用数据分析功能,并且如果原始数据更新,透视表的数据也会同步更新。
这对我们进行数据分析整理无异于提供了一个便捷的工作方式和手段,下面我们通过一个例子来介绍 Excel 透视表的常用功能。
数据源包括 4 列数据,分别是用户注册 ID、性别、省份、App 使用时长。我们希望了解该 App 对不同性别用户的吸引力,以及女性用户在不同地区的覆盖情况。我们看透视表如何完成分析目标。
针对这个目标,我们可以统计下面两个数据:
1. 不同性别用户数量差异、人均 App 使用时长、总使用时长占比;
2. 女性用户在不同省份的数量、女性用户人均 App 使用时长,以及女性用户总使用时长占比。
第一步,生成透视表。使用Ctrl A 快捷键,将数据源全部选中,然后点击菜单栏“插入”->“数据透视表”。
你可以看到透视表主要包括字段列表、透视表区域,以及筛选器等,三者有着不同的作用。
第二步,将“性别”字段拖入“行”区域。将“App 使用时长”字段拖入两次到“值”区域, 第一次,将值字段设置为求平均值;第二次,将值字段设置为求和。
接下来,单击其中一个弹框左侧“值字段设置”对话框,将值字段设置为想要的汇总字段计算类型,这里一个设置求和,一个设置求平均值。
第三步,统计女性用户所处不同省份的 App 使用时长分布。这是个筛选操作,我们把性别拖入筛选器。然后,再将省份拖入列区域,将 App 使用时长拖入值区域,并设置相应统计方式,我们便可得到想要的结果。
由于透视表出色的数据处理能力及其灵活性、普适性。很多编程语言如 Python 中的 pivot_table 函数,以及 SQL 中的 pivot 函数,都是模仿的透视表功能。
上面举出了 Excel 经常用到的两个典型技巧,非常有用。但对于数据分析来说,也不过是冰山一角。
Excel 作为数据分析师必备技能,学习的正确方式:动手实践->遇到问题->网上搜索 官网 Help->再实践->记录核心技巧案例,如果能够按照这样的路径,相信你很快就能熟练掌握!
本文转自公众号:勾勾谈数据分析
欢迎大家来找勾勾畅谈[做鬼脸]
,