这两天遇到一个Excel问题,看似挺容易,但是其中涉及到的数据处理问题挺典型。今天就用这个例子,讲一下用Excel进行数据统计和整理的流程。
涉及到的知识点:Trim公式、分列操作、“&”连接符的运用。
先看一下原始文档:
要达成的结果:
首先来分析一下原始文档,只需要对B列进行处理。
B列中包含序号、英文句点、单词、词性、中文意思。特殊情况包括,句号前面有些有空格、有些没有,词性大部分是一种、有些有两种后面也有英文句点。
接下来分析达成结果的要求:话题列不变,单词列包括单词 空格 词性 “.”,解释列为你中文解释。
这样整体的思路可以确定了。
第一步,将序号前的空格去掉,目的是将需要全部删掉。去空格一般有两种方式,一是用公式trim,用来去掉首尾空格;另一种是替换,查找内容为空格,替换内容什么也没有,可以去掉选择单元格所有空格。本例用trim公式。
如下:
第二步,通过分列操作,将序号、词性和解释分开。#注意,单元格内有公式无法做分列操作,所以需要先把C列内容粘贴为数值。复制-选择性粘贴-粘贴为数值。
分列的分隔符为英文句点和空格,这样我们可以同时将序号、单词、词性和解释分开。
如下:
分列后的结果如下:
如果想要保留分列前的列,可以在选择分列后结果所在位置的时候,选择后一列即可。
第三步 特殊内容单独处理。对于有两个词性的词条,相应中文解释分列至H列。可以通过辅助列的方式,将单词与词性,以及中文解释同时处理。在下一列I列,通过&连接符录入单词和词性,再下一列J列,录入中文解释。
处理的方式是先处理特殊行(通过筛选H列有内容部分),再处理其他行。
如下:
注意:两个单元格的连接可以直接用&,如果单元格后面接字符,字符需要使用“”。
处理其他行,筛选H列空白部分。
如下:
中文解释也是通过筛选H列的方式处理。
这样,需要的单词和词性在I列,中文解释在J列。可以通过公式呈现在新的表单,也可以通过粘贴为数值的方式,保留想要的结果。
总结一下,整个过程分三个步骤,第一步分析要处理的数据,确定好想要达成怎样的结果。第二步,确定主要处理方式,并对数据进行清洗,使整体数据格式或形式大体一致。第三步,单独处理特殊类型数据。第四步,做数据整理,也就是将结果归集到需要的位置。
,