Hello 大家好~ 我肥来啦

上一篇文章语调太过沉重啦,回头想想,其实每个人都有自己的难处,生活本来就是破开重重迷障要么会所嫩模要么下海干活的过程。所以收拾收拾心情,继续写点有趣的东西给大家

毕竟生活还得继续不是

python怎么爬取文库(python爬取B站封面标题)(1)

作为一名浑水摸鱼不想在专业方向深耕的非典型程序员

最苦恼的事就是自己辛辛苦苦写的文章、做的视频没有人看

是我封面的胸不够大?还是标题不够骚?

其他人写的那些妖艳贱货就那么吸引你吗?!

python怎么爬取文库(python爬取B站封面标题)(2)

带着深深的愤懑和不解

我操起电脑

开始了寻找答案之旅!

python怎么爬取文库(python爬取B站封面标题)(3)

开始

带着嫉妒的眼神,我打开B站【社科人文分类】(因为我一般投在这个分类中)

python怎么爬取文库(python爬取B站封面标题)(4)

python怎么爬取文库(python爬取B站封面标题)(5)

python怎么爬取文库(python爬取B站封面标题)(6)

就是它们!播放量是我的几万倍!(馋啊)

可是B站一个网页就展示20个视频,这怎么够我们分析?

没事,对程序猿来说都是小意思~

python怎么爬取文库(python爬取B站封面标题)(7)

准备

打开浏览器的开发者模式,瞅瞅网络请求

python怎么爬取文库(python爬取B站封面标题)(8)

找到了!嘿嘿,小样,还想跑

python怎么爬取文库(python爬取B站封面标题)(9)

在浏览器里访问一下

python怎么爬取文库(python爬取B站封面标题)(10)

妥了!就是你了!

稍微对请求的做一下分析

python怎么爬取文库(python爬取B站封面标题)(11)

20?好熟悉的数字..

这特么不就是网页视频的数量么

果断改成100!

python怎么爬取文库(python爬取B站封面标题)(12)

哼哼,不会以为我会一页一页点过去吧,不会吧不会吧

接下来就是傻瓜式操作了

发请求,拿数据,工具性语言什么的最方便了

python是世界上最好的语言!

开始码代码

python怎么爬取文库(python爬取B站封面标题)(13)

撸代码

按照装大象的流程,把大象装进冰箱需要三步

发送请求获取数据(打开冰箱门)

python怎么爬取文库(python爬取B站封面标题)(14)

下载封面(把大象装进去)

python怎么爬取文库(python爬取B站封面标题)(15)

存储到本地(关上冰箱门)

python怎么爬取文库(python爬取B站封面标题)(16)

ok,搞起

python怎么爬取文库(python爬取B站封面标题)(17)

run一下!

python怎么爬取文库(python爬取B站封面标题)(18)

搞定!

分析

来来来,让大爷看看为什么你们这么会勾男人?

先分析一下封面

python怎么爬取文库(python爬取B站封面标题)(19)

ok,我们把下载的封面都做一下统计

python怎么爬取文库(python爬取B站封面标题)(20)

排名前51的视频封面中,以人物为封面的有26个

男性 22个,女性4个(可能是因为我选取的是【社科人文分类的榜单】...)

其中封面人物的平均年龄是33.92岁

封面人物的情绪以「黯然神伤」和「半嗔半喜」居多

python怎么爬取文库(python爬取B站封面标题)(21)

再来看看标题

标题就很简单了

python怎么爬取文库(python爬取B站封面标题)(22)

直接做个词频分析

python怎么爬取文库(python爬取B站封面标题)(23)

python怎么爬取文库(python爬取B站封面标题)(24)

so... 我懂了!

在「社科人文」里

能吸引你们这些小可爱的封面是34岁左右,要么装深沉,要么犹抱琵琶半遮面的男性老流氓

然后标题配一个「特朗普为什么违约」「多年金融洛可可之谜」

这还不简单

python怎么爬取文库(python爬取B站封面标题)(25)

成了,坐等百万播放!

我是方木

喜欢分析和思考

喜欢生产一些有趣有价值的东西~

欢迎关注~

,