python 数据挖掘篇 一 结巴分词
第二章 词云统计
这是一个非常有意思的功能,数据可视化,我这里,前两个图使用了词云统计人名、地名,最后一个图使用条状图列出词频最高的名词
统计部分,使用的结巴分词,这节主要讲下绘图部分
封装的函数,根据字典生成 key—权重 比如(唐僧--6)
由结巴分词后的列表生成,
调用:
条形图
根据字符串列表及对应的字符串出现次数列表,绘制条形图
,
python 数据挖掘篇 一 结巴分词
这是一个非常有意思的功能,数据可视化,我这里,前两个图使用了词云统计人名、地名,最后一个图使用条状图列出词频最高的名词
统计部分,使用的结巴分词,这节主要讲下绘图部分
封装的函数,根据字典生成 key—权重 比如(唐僧--6)
由结巴分词后的列表生成,
调用:
条形图
根据字符串列表及对应的字符串出现次数列表,绘制条形图
,