当前位置:脚本大全 > > 正文

python豆瓣电影爬虫课程设计报告(详解python 模拟豆瓣登录豆瓣6.0)

时间:2021-10-14 00:08:36类别:脚本大全

python豆瓣电影爬虫课程设计报告

详解python 模拟豆瓣登录豆瓣6.0

最近在学习python爬虫,看到网上有很多关于模拟豆瓣登录的例子,随意找了一个试了下,发现不能运行,对比了一下代码和豆瓣网站,发现原来是豆瓣网站做了修改,增加了反爬措施。

首先看下要模拟登录的网站:

python豆瓣电影爬虫课程设计报告(详解python 模拟豆瓣登录豆瓣6.0)

打开开发者模式:

python豆瓣电影爬虫课程设计报告(详解python 模拟豆瓣登录豆瓣6.0)

在账号和密码随意填入数据:

python豆瓣电影爬虫课程设计报告(详解python 模拟豆瓣登录豆瓣6.0)

发现会发送一个post请求:

python豆瓣电影爬虫课程设计报告(详解python 模拟豆瓣登录豆瓣6.0)

ur是:https://accounts.douban.com/j/mobile/login/basic

数据格式是:

python豆瓣电影爬虫课程设计报告(详解python 模拟豆瓣登录豆瓣6.0)

于是可以来编写代码:

  • ?
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • import requests
  •  
  • def main():
  •   url_basic = 'https://accounts.douban.com/j/mobile/login/basic'
  •   url = 'https://www.douban.com/'
  •   ua_headers = { "user-agent":'mozilla/4.0 (compatible; msie 8.0; windows nt 6.0; trident/4.0)'}
  •   data = {
  •     'ck': '',
  •     'name': '自己的账号',
  •     'password': '自己的密码',
  •     'remember': 'false',
  •     'ticket': ''
  •   }
  •  
  •   s = requests.session()
  •   s.post(url=url_basic, headers=ua_headers, data=data)
  •   response = s.get(url=url, headers=ua_headers)
  •   with open('douban.html' , 'wb') as f:
  •     f.write(response.content)
  •  
  • if __name__ == '__main__':
  •   main()
  • 第一步:

    创建 s = requests.session()

    作用是跨请求保持参数,也就是说s这个session对象所发出的所有请求之间会保持cookies

    第二步:

    用创建好的session对象携带账号,密码去发送post请求。

    由于改版后的豆瓣返回的是一个josn数据,而不是像以前一样重定向,所以需要我们来重定向。

    第三步:

    携带登录成功保存的cookie去访问首页,就会得到你自己的首页.

    最后得到个人首页:

    python豆瓣电影爬虫课程设计报告(详解python 模拟豆瓣登录豆瓣6.0)

    以上所述是小编给大家介绍的python模拟豆瓣登录详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对开心学习网网站的支持!

    原文链接:https://www.cnblogs.com/xiaozx/p/10722779.html

    上一篇下一篇

    猜您喜欢

    热门推荐