import requests
import re
import time
class get_Address():
def get_Dy(self,pages):
for n in[1,pages]:
#print(n)
a_url="http://www.ygdy8.net/html/gndy/dyzz/list_23_"+str(n)+".html"
html_1=requests.get(a_url)
#制定網頁編碼格式
html_1.encoding='gb2312'
#print(html_1.text)
#正則匹配()裏的內容 用.*?匹配
detil_list=re.findall('<a href="(.*?)" class="ulink">' ,html_1.text)
#print(detil_list)
for m in detil_list:
b_url="http://www.ygdy8.net/"+m
#print(b_url)
#睡眠一秒
time.sleep(1)
html_2=requests.get(b_url)
#制定網頁編碼格式
html_2.encoding='gb2312'
# print(html_2.text)
# break
ftp=re.findall('<a href="(.*?)">.*?</a></td>',html_2.text)
#print(ftp)
#寫入本地
with open(r'E:\personal\vscode\1.txt','a',encoding='utf-8') as ff: # 打開本地文件前面加上r或者用雙反斜槓,a是追加的意思,編碼格式爲utf-8
ff.write(ftp[0]+'\n')
#類實例化
tm = get_Address()
tm.get_Dy(5)
運行一下,會看到電影ftp的下載地址寫入到了本地文件中