如何爬取微信文章数据(爬取微信公众号文章)(1)

试了多种方法,发现还是使用自己创建一个公众号再搜索的方式最有用。

有三种方法,

第一种:用搜狗微信公众号搜过,这个只能收到前10条;

第二种:用fiddler或手机抓包,从访问链接去获得appmsg_token,发现虽然这个值就在html页面里,但只有抓包的数据里含有效值,直接访问的是空的,而且还有时效性。这样,每次都要抓包获取,就很麻烦。

第三种:就是这种用公众号搜公众号的,虽然速度慢点,但便捷了不少。

* 程序原理:

>> 通过selenium登录获取token和cookie,再自动爬取和下载

* 使用前提: *

>> 电脑已装Firefox、Chrome、Opera、Edge等浏览器

>> 下载selenium驱动放入python安装目录,将目录添加至环境变量

(https://www.seleniumhq.org/download/)

>> 申请一个微信公众号

(https://mp.weixin.qq.com)

演示视频:

效果如下:

如何爬取微信文章数据(爬取微信公众号文章)(2)

如何爬取微信文章数据(爬取微信公众号文章)(3)

如何爬取微信文章数据(爬取微信公众号文章)(4)

如何爬取微信文章数据(爬取微信公众号文章)(5)

py源码和exe程序:

github:https://github.com/1061700625/WeChat_Article

若下载链接被屏蔽,可私聊小编获取。

,