python 数据挖掘篇 一 结巴分词


第二章 词云统计

python数据分析与挖掘实战(python数据挖掘篇二)(1)

python数据分析与挖掘实战(python数据挖掘篇二)(2)

python数据分析与挖掘实战(python数据挖掘篇二)(3)

这是一个非常有意思的功能,数据可视化,我这里,前两个图使用了词云统计人名、地名,最后一个图使用条状图列出词频最高的名词

统计部分,使用的结巴分词,这节主要讲下绘图部分

封装的函数,根据字典生成 key—权重 比如(唐僧--6)

python数据分析与挖掘实战(python数据挖掘篇二)(4)

由结巴分词后的列表生成,

python数据分析与挖掘实战(python数据挖掘篇二)(5)

调用:

python数据分析与挖掘实战(python数据挖掘篇二)(6)

条形图

根据字符串列表及对应的字符串出现次数列表,绘制条形图

python数据分析与挖掘实战(python数据挖掘篇二)(7)

,