最近很多人都在问我关于PQ、PP、PBI的问题,我感觉是时候带大家了解Excel的这些插件了。大家知道我极力推荐大家卸载2013之前的Excel,很大一部分原因就是因为Excel2013之后的版本集成了这些插件。那接下来的时间,就让我们看看这些简称都是什么意思?他们都能做些什么?

微软的BI发展战略

微软有一款企业级的产品叫SQLServer,相信有的同学肯定听说过。它是一款商业用的数据库产品(意味着是收费的),包含了数据处理过程中的各种内容。核心功能包括:数据清洗、数据建模、数据呈现

而近几年微软的发展慢慢向个人市场倾斜,将这些功能开放到Excel这个产品中。通过Excel庞大的用户基数,迅速占领分析和BI市场。事实证明微软的战略是对的。下图为Gartner公司2020年分析与商业智能 BI 平台魔力象限。微软正处于这个领域领先的位置。

excel里rankeq函数怎么用(你们说的PQ指的是什么)(1)

数据清洗工具PQ

PQ全称为PowerQuery,Power Query 是 Excel 中可用的三大数据分析工具之一。但在2016之后的版本中这个名字已经找不到了,但是大家还是喜欢称为PQ。因为其功能的强大微软在2016之后的版本已经将其内化入Excel

excel里rankeq函数怎么用(你们说的PQ指的是什么)(2)

主要功能:

PowerQuery是一种数据连接技术,功能主要包含三个部分:连接(获取)、转换、合并

excel里rankeq函数怎么用(你们说的PQ指的是什么)(3)

连接其实就是获取数据的数据的能力。PowerQuery的数据获取能力很强操作也很简单。按照分类来说可以分为以下几类:

1. 文件类:Excel文件、CSV文件、JSON文件、XML文件等以文件存储的数据

2. 数据库:SAP HANA、Mysql、SQLServer、Oracle等主流数据库

3. 网页:PowerQuery通过简单操作即可获取网页数据,俗称:爬虫。有了这个功能大部分的API,PowerQuery也能调用了

4. 其他数据源:Facebook、Azure、ODBC、Hadoop等

还要一点就是PowerQuery已经在PowerBI中集成了Python和R语言,相信很快也会被集成在Excel中。有了Python和R的加持,PowerQuery的获取能力将更加强大,可以说PowerQuery将无所不能。所以我称其为最强手臂。

转换的能力就是将数据清洗为可用于分析的能力。关于转换这一点不是我们这篇短文能讲清楚的。你只用先了解以下几点就好:

1. PowerQuery转化数据是有专门的语言称为M语言

2. PowerQuery大部分功能只需要点击鼠标即可生成M语言

3. 每一步操作都可以生成一个表缓存,你可以在任何节点再引用

4. 数据存储的空间有List、Record、Table,数据类型常用的有Text、Number、Date;

5. M语言其实是函数语言,通过操作上面的对象来完成数据清洗工作;

上面这几点现在听不懂没关系,随着逐渐的了解后你再回来看看就会明白。

合并能力就是将不同的表连接到一起,主要有两种:合并和追加

1. 追加最容易理解就是上下拼接在一起

2. 合并是指将两种表根据一个或多个字段的关联关系横向拼接在一起

学习难度

在学习难度上有一张图可以说明一切,由下图可以看出。PowerQuery比公式和VBA的功能都要强大,比公式和VBA学习花的时间要短很多。可以说是性价比之王。

excel里rankeq函数怎么用(你们说的PQ指的是什么)(4)

关于PowerQuery今天就先介绍到这里,明天我们再来解释另外两个名词,保证你看完会为Excel的强大惊叹。

,