子曰:一图胜千言。“安安小小姐姐”,一个专注于将生活中见闻感想用数据来展现的原创型自媒体。

《增广贤文》,又名《昔时贤文》,或曰《古今贤文》,是成书于明朝期间的一本儿童启蒙读物。

此书名曰“贤文”,即取古今经典诗句,汇集成册。用今天的话说,这叫《古今贤文摘录》。

今日的数据,使用人工智能中的自然语言处理(NLP)技术,对这份流传甚广的百年经典读物,做个小小的分析,将这个文本中那些不为人知的信息,分享给诸位网友。

何谓自然语言处理(NLP),简单来说,让计算机跟人类一样思考和处理语言。

借助计算机强大的运算能力,计算一句话是积极的、消极的还是中性情感,只需要几秒钟时间即可完成。

而人类,要处理这样一份包含上千个句子的文本,可能需要几天时间。

将计算机统计出来的数据,按照情感倾向的特别消极、消极、中性、积极和特别积极,将这千句名言,绘制成比例图。

增广贤文100句精辟(1000句增广贤文情感分布)(1)

从图表看,特别消极和消极的句子,总共有300句,占全部句子的比例在30%左右。而特别积极的句子,则有312句,占比在30%以上。

从分布比例来看,这本儿童启蒙读物,还是比较适合儿童那纯洁又美好的心灵的。

提取上述150句特别消极的句子,和312句特别积极的句子,使用自然语言处理的另外一项技术,将各句分解成若干个词语,再统计出各个词语出现的次数。

出现次数越多,在词云图中,字体就越大,效果如下。

增广贤文100句精辟(1000句增广贤文情感分布)(2)

在特别积极的句子中,父母、富贵出现的次数最多。看起来,在古人眼中,富贵也是极让人羡慕的。富贵于我如浮云,大抵只是极少数人已经实现的梦想而已。

而特别消极的句子中,君子和小人出现的频率差不多。

最后,来看看那些特别消极的句子和特别积极的句子,分别都有哪些。

增广贤文100句精辟(1000句增广贤文情感分布)(3)

有些句子,在我们看来,是比较消极的,但出现在积极的分类里面。这正是现阶段人工智能的弱点之一,自然语言处理(NLP)是人工智能中最为困难的问题之一。

在此分享几个句子:

一,消极的:

1,福满须防有祸,凶多料必无争。

2,教子教孙须教义,栽桑栽柘少栽花。

3,钱多不经用,儿多不耐撕。

4,与人不和,劝人养鹅;与人不睦,劝人架屋。

5,父母恩深终有别,夫妻义重也分离。

这几句,简直比《厚黑学》还厚黑,人情冷暖、世态炎凉,皆是如此,得到最低评分也是理所当然。

二,积极的:

1,受恩深处宜先退,得意浓时便可休。

2,志宜高而身宜下,胆欲大而心欲小。

3,好学者则庶民之子为公卿,不好学者则公卿之子为庶民。

4,夫妻相和好,琴瑟与笙簧。

5,父子和而家不败,弟兄和而家不分。

正能量这几句,于简明扼要之处,点明了为人处世之道。

------------------------------------------

本文图片和内容均为作者原创,感谢阅读,欢迎关注。

,