python爬虫登录豆瓣（一）

原創

2020-06-19 17:58

使用第三方库 requests
通过使用 chrome 浏览器抓包，可以得到这个请求，将其中的 headers 和 data 提交。最后输出到 douban.html 的文件中，即可查看登录的界面。这次请求是第一次登录，所有界面为提示修改个人信息。

import requests

url = "https://accounts.douban.com/login"
# 将账号和密码改为自己的帐号和密码
data = {"source": "None", \
        "redir": "https://www.douban.com",\
         "form_email": "帐号", \
         "form_password": "密码",\
         "login": "登录"}
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36",\
            "Accept": "text/html,application/xhtml+xml, application/xml;q=0.9",\
            "Host": "accounts.douban.com", \
            "Referer": "https://accounts.douban.com/login"}
r = requests.post(url, data=data, headers=headers)
with open("douban_login.html", "w") as f:
    print(r.text.encode("utf-8"), file=f)
    # 将网页源代码转化为 utf-8 输出

也可根据相同的原理使用程序修改个人信息。
最后有一个小问题，网页源代码 meta 标签显示编码方式为 utf-8，最后也将字符转化为 utf-8 输出，但保存在本地之后再用浏览器打开却是乱码，将编码方式改为 bg2312 之后就能正常观看，不知道什么原因，求指教 (^o^)／

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

获取迁木网QS世界大学排名信息

處理網址：http://www.qianmu.org/ranking/1528.htm # 獲取qianmu遷木網QS世界大學排名信息 import requests from lxml import etree import re

执笔写回憶

2020-07-05 18:00:13

Python+Scrapy爬虫实战

目錄1. Scrapy簡介與實例解析2. 解析html文件中的下載地址3. 對比文件是否需要更新4. 使用Scarpy爬取文件創建爬蟲settings.pyitems.pytestone.pypipelines.py啓動爬蟲5.

太阳花的小绿豆

2020-07-01 03:39:44

Doccano标注系统安装与二次开发

Doccano標註系統安裝與二次開發（機器學習從業開發者標註工具，支持多語言）文章目錄Doccano標註系統安裝與二次開發（機器學習從業開發者標註工具，支持多語言）Doccano標註系統安裝1.1 linux上單獨部署1.1 l

带着梦想飞翔

2020-06-25 16:23:22

python调用文件对话框获得文件夹路径名称--实用删除文件小工具

""" 此代碼用於刪除文件夾下面以txt結尾的文件（同理將.txt-->.py可以刪除py文件）借用pyqt5調用文件選擇對話框看起來比較人性化點本來是用win32ui的，但是win32ui不太人性化，不能選擇文件夾，需要經過一

2020-06-23 12:51:29

python项目之 ftp服务器

python項目之 ftp服務器源碼參考官方簡介自己編寫其中目錄是文字會變成亂碼，是由於內部採用字符非unicode，此問題待解決。使用庫pyftpdlib # -*- coding: utf-8 -*- # edit

小六工作室

2020-06-20 03:09:09

一寸照白底改红底

使用 python3 的 PIL 庫，使用其中 Image.open 方法打開，然後使用 getpixel() 方法獲取像素信息，若爲白色則使用 putpixel() 改爲紅色。但選區不會選，只能大致改一下，若有解決方法請指教

2020-06-19 19:02:18

python爬虫登录豆瓣（二）

之前使用 requests 庫普通登錄了豆瓣，這次爲帶驗證碼登錄。（故意幾次使用錯誤的帳號和密碼登陸可以出現驗證碼登錄，也因此這次請求時需要提交 cookies，說明之前幾次密碼是錯誤的）同上一篇的過程一樣，能過 chro

2020-06-19 19:02:18

用 python 将图片软化为字符串

網上已有很多教程，本文可當一個參考。 from PIL import Image img = Image.open("1.jpg") # 打開一個圖片，並返回圖片對象 w,h = img.size # 返回圖片寬

2020-06-19 19:02:06

猜数字—— python 图形化界面编程初探

本文難度並不高，只是對 python 的 tkinter 庫的一個初步運用，算是初控圖形化界面界面編程吧。具體實現的是一個猜數據遊戲，程序會從 1-10 中隨機取一個數，然後由玩家猜，猜對爲止。 from tkinter im

2020-06-19 17:58:41

Python项目-----CMDB自动化资产扫描

文章目錄一、項目介紹二、項目環境搭建連接並配置遠程服務器遠程服務器虛擬環境的配置遠程服務器解釋器和目錄映射的配置三、MySQL數據庫配置Django數據庫配置初次運行項目：查看後臺管理頁面四、Django工程多配置文件五、Djan

2020-06-16 06:40:34

分类问题中已有准确率、精准率和召回率，为什么还要提出ROC？

在上一篇“分類問題中的幾個衡量指標”中，我們介紹了分類問題中常見的幾種分類精度衡量指標。這些指標從整體到個體等不同程度上地體現了分類模型的分類精度。那麼，分類問題中已有準確率、精準率和召回率等指標，爲什麼還要提出ROC呢？什麼是ROC呢？

liushuijingying2

2020-06-12 23:16:48

2、数据库设计

商品的SKU、SPU及其之間的關係： https://www.cnblogs.com/lingyejun/p/9569563.html 表的設計：也用Redis來保存用戶瀏覽記錄（快速保存）

icy城市稻草人

2020-06-09 08:28:17

WSGI、uWSGI、uwsgi、Nginx概念知识及uWSGI+Django+Nginx的工作原理流程与部署历程

uWSGI+Django+Nginx的工作原理流程與部署歷程：https://blog.csdn.net/c465869935/article/details/53242126 WSGI WSGI的全稱是Web Server Gatewa

人生苦短，python陪伴

2020-06-08 07:28:08

自学中的 Django 坑

版本：Django 1.10.3，python 3.4.3 1 mysql 數據庫（2）安裝 MySQL-python：pip install MySQL-python #安裝時報錯 Microsoft Visu

2020-06-07 23:34:26

基于Django的电商平台

2020-05-02 00:31:42

24小時熱門文章

Spring Cloud 部署时如何使用 Kubernetes 作为注册中心和配置中心

最新文章

最新評論文章