python豆瓣电影爬虫课程设计报告（详解python 模拟豆瓣登录豆瓣6.0）

时间：2021-10-14 00:08:36类别：脚本大全

python豆瓣电影爬虫课程设计报告

详解python 模拟豆瓣登录豆瓣6.0

最近在学习python爬虫，看到网上有很多关于模拟豆瓣登录的例子，随意找了一个试了下，发现不能运行，对比了一下代码和豆瓣网站，发现原来是豆瓣网站做了修改，增加了反爬措施。

首先看下要模拟登录的网站：

python豆瓣电影爬虫课程设计报告（详解python 模拟豆瓣登录豆瓣6.0）

打开开发者模式：

python豆瓣电影爬虫课程设计报告（详解python 模拟豆瓣登录豆瓣6.0）

在账号和密码随意填入数据：

python豆瓣电影爬虫课程设计报告（详解python 模拟豆瓣登录豆瓣6.0）

发现会发送一个post请求：

python豆瓣电影爬虫课程设计报告（详解python 模拟豆瓣登录豆瓣6.0）

ur是:https://accounts.douban.com/j/mobile/login/basic

数据格式是:

python豆瓣电影爬虫课程设计报告（详解python 模拟豆瓣登录豆瓣6.0）

于是可以来编写代码：

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22 import requests

def main():

url_basic = 'https://accounts.douban.com/j/mobile/login/basic'

url = 'https://www.douban.com/'

ua_headers = { "user-agent":'mozilla/4.0 (compatible; msie 8.0; windows nt 6.0; trident/4.0)'}

data = {

'ck': '',

'name': '自己的账号',

'password': '自己的密码',

'remember': 'false',

'ticket': ''

}

s = requests.session()

s.post(url=url_basic, headers=ua_headers, data=data)

response = s.get(url=url, headers=ua_headers)

with open('douban.html' , 'wb') as f:

f.write(response.content)

if __name__ == '__main__':

main()

第一步:

创建 s = requests.session()

作用是跨请求保持参数，也就是说s这个session对象所发出的所有请求之间会保持cookies

第二步：

用创建好的session对象携带账号，密码去发送post请求。

由于改版后的豆瓣返回的是一个josn数据，而不是像以前一样重定向，所以需要我们来重定向。

第三步：

携带登录成功保存的cookie去访问首页，就会得到你自己的首页.

最后得到个人首页:

python豆瓣电影爬虫课程设计报告（详解python 模拟豆瓣登录豆瓣6.0）

以上所述是小编给大家介绍的python模拟豆瓣登录详解整合，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对开心学习网网站的支持！

原文链接：https://www.cnblogs.com/xiaozx/p/10722779.html

标签：

Python 模拟登录豆瓣

python豆瓣电影爬虫课程设计报告（详解python 模拟豆瓣登录豆瓣6.0）

python豆瓣电影爬虫课程设计报告

猜您喜欢

热门推荐