"词云"这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于近日提出。戈登做过编辑、记者,曾担任迈阿密先驱报(Miami Herald)新媒体版的主任。他一直很关注网络内容发布的最新形式--即那些只有互联网可以采用而报纸、广播、电视等其它媒体都望尘莫及的传播方式。通常,这些最新的、最适合网络的传播方式,也是最好的传播方式。 因此,"词云"就是对网络文本中出现频率较高的"关键词"予以视觉上的突出,形成"关键词云层"或"关键词渲染",从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
关注,转发,私信小编“01”领取Python学习资料!
利用python的wordcloud模块可以轻松实现词云功能,一个简易的词云只需要5行代码,使用前需pip install wordcloud下载该第三方库。这次演示的代码仅适用用于英文文章,如果是中文的文本还需安装并导入 jieba模块,其实就是在原来的基础上再简单加上几行,自己百度一下jieba的用法就行啦!
代码奉上:
图片将导出为test.png。代码中的词云背景颜色、字体字号等都可以自己调整,是不是很简单呢?其实python完全可以生成各种各样漂亮的词云,大家在掌握基本方法后可以自己尝试一下哦。
,