上一期中我们已经采集到了很多的男生颜值和女生颜值的数据,现在我们就开始分析了,
打开你的jupyter notebook,新建python文件,如图
之后写入代码:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
此时要运行一下,点击上图的运行按钮,如果没有错可以继续写下面的代码了,
我使用的笔记本是macos系统,设置语言处理中文问题要:
plt.rcParams['font.sans-serif'] = ['Arial Unicode MS'] # 处理中文问题
但是如果你的操作系统windows就可以这样设置:
plt.rcParams['font.sans-serif']=['SimHei'] # 处理中文问题
因为我们的提取的明星名字都是中文的。
接下来添加:
data= pd.read_csv('./boy/颜值测评.csv',error_bad_lines=False)
data
使用pandas将数据读出,然后交给matplotlib和seaborn处理,显示柱状图
beauty = data.groupby('name')['beauty'].mean().sort_values(ascending=False)
sns.barplot(x=beauty.index, y=beauty.values,palette=sns.color_palette('husl'))
依次运行上面的代码,最终可以看到如图所示的数据分析图:
答案终于揭晓,肖战的颜值实力确实更胜一筹啊!坤坤也不赖......
下期我们开始带着大家玩爬虫,快来围观吧!
,