HPU lib 河南理工大學圖書館已借書籍爬取 Python

原創

jinqimu

2018-09-05 06:48

看了下我們學校圖書館，順手爬個已借書籍

一開始把學校想得沒那麼簡單，嘗試模擬登錄，提交表單裏面出現了一堆奇奇怪怪的東西，查了一下發現是.net生成的，又花了一會時間去抓這個參數

最後，emmmm，沒毛病，篩子系統果然cookies就能過，真是暴力

import requests
from bs4 import BeautifulSoup
def main():
    headers = {
        'User-Agent': 'Mozilla / 5.0(X11;Linux x86_64) AppleWebKit / 537.36(KHTML, like Gecko) Ubuntu Chromium / 68.0.3440.106 Chrome / 68.0.3440.106 Safari / 537.36',
        'Cookie': 'ASP.NET_SessionId=dnlcydvvqwnc3yax1ymja2ji',
    }
    wb_data = requests.get('http://218.196.244.90:8080/Borrowing.aspx', headers = headers)
    soup = BeautifulSoup(wb_data.text, 'lxml')
    titles = soup.select('#ctl00_ContentPlaceHolder1_GridView1_ctl0{}_HyperLink1'.format(str(3))    #format從2開始到你借的書數量+1)
    print(titles)

main()

這裏沒對輸出處理

[<a href="Book.aspx?id=0199151729" id="ctl00_ContentPlaceHolder1_GridView1_ctl03_HyperLink1" style="color:#980000;color: #800000; font-weight: 700; font-size: small;" title="海邊的卡夫卡">海邊的卡夫卡</a>]

有空再繼續阿

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

HPU lib 河南理工大學圖書館已借書籍爬取 Python

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

sublime ubuntu && windows 配置註冊

HPU lib 河南理工大學圖書館已借書籍爬取 Python

codeforces round #306 div2 B Preparing Olympiad && HPU SummerCamp round6 B 二進制枚舉

牛客練習賽25 A 簽到題因數個數和

FFT 快速傅立葉變換 NTT 數論變換轉載

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

HPU lib 河南理工大學圖書館 已借書籍爬取 Python

HPU lib 河南理工大學圖書館已借書籍爬取 Python