python小爬虫脚本

原創

2020-06-23 08:50

靶场：

http://hackinglab.cn/ShowQues.php?type=scripts
其中题目很有意思：
http://lab1.xseclab.com/xss2_0d557e6d2a4ac08b749b61473a075be1/index.php

payload：

很简单，就是写一个小爬虫，爬下来里面数字内容，然后使用eval函数将其计算出来，不过可能很多简单题目中会使用到这种爬虫：

import re
from bs4 import BeautifulSoup
import requests
import json
x = "http://lab1.xseclab.com/xss2_0d557e6d2a4ac08b749b61473a075be1/index.php"
session = requests.session()  #设置session连接，能保证连接的稳定性
line = session.get(x)
new2 = re.findall('            .+\)',line.text) #提取html流中数据的内容
new3 = new2[0]
new = new3.lstrip()	#去掉前面的空格
p = eval(new)
d = dict(v=p) #将要提交的计算结果提交
exp = session.post(x,data=d) #data代表了post传参
print(exp.text)

运行脚本：

可以看到，key很简单就出来了

踩坑：

其中这种题目要首先看看存不存在session，这个平台题目都带有session，所以要使用session方式来建立连接，这样才能保持连接的稳定性。
另外，进行传参的时候可以直接传入字典，不一定非要json化，有的时候甚至会报错，另外就是re库正则表达式的使用，要总结一下，最好是用beautifulsoup库来进行解析，不过没有正则更加精准一些。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

python小爬虫脚本

靶场：

payload：

踩坑：

钉钉打卡速度慢

Nginx R31 doc 官方文档-01-nginx 如何安装

Python 潮流周刊#51：用 Python 绘制美观的图表

Qt/C++音视频开发74-合并标签图形/生成yolo运算结果图形/文字和图形合并成一个/水印滤镜

挑战程序设计竞赛 2.2章习题 POJ - 3617 Best Cow Line 贪心

字节面试：MySQL什么时候锁表？如何防止锁表？

.NET8连接SQL SERVER 2008 R2 报：证书链是由不受信任的颁发机构颁发的

golang开发环境搭建(win10)

python计算机视觉学习笔记——PIL库的用法

Golang初学：获取程序内存使用情况，std runtime

NTFS文件隱寫

LNMP學習流程

php反序列化漏洞基礎入門

編譯原理上機題目

python小爬蟲腳本

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結