用某软件获取到一些某文库数据,但该数据中有很多是重复的,现在需要得到无重复,并且按下载量降序排列的数据,那我们应如何做呢?
1、鼠标选中某中一个单元格,然后选择“数据/删除重复项”,在出现的对话框中啥也不选,直接点击确定。
2、系统会将重复数据删除掉,并提示删除了多少条。这里的删除重复是指每一列的值都是一样的就算是重复的。
3、但光是这样还并没有去除完整,我们再次点击“删除重复项”,在对话框中点“取消全选”,然后再在列框中选择“简介”,那么只要简介是一样的就算是重复项。
4、经过上述步骤,可能还没有删除完重复数据,因为有些简介内容长短不一样,即使是重复的,但由于长度不同,系统也会判定为不重复,那这时我们就要将每个简介都只截取固定长度来进行对比。5、我们在新的列,使用如下公式:
=LEFT(F2,10)
或者:
=MID(F2,1,10)
注:这样我们就只取10个字符,MID函数的第2个参数是指起始位置,是从1开始的,不是从0开始,如果输入为0会出现错误。
6、对K列所有单元格应该上述公式,得到长度统一的简介,对现有数据再次像第3步中那样应用“删除重复项”,只是这次要选中“截取后的简介”。
7、这样就又去除掉了一些重复的项。
8、去重以后,我们再对下载量应用降序排列,那么最后就得到了我们想要的结果了。
,