使用requests和BeautifulSoup库实现从任意网站爬取数据_附源代码+注释

一.了解页面信息

这里我们以酷狗音乐古风榜为例
在这里插入图片描述
由此可见我们需要我曲目和歌手的信息都在框住的class里面

二.爬取数据代码

#导入requests和BeautifulSoup库
import requests
from bs4 import BeautifulSoup

url = "https://www.kugou.com/yy/rank/home/1-33161.html?from=rank"
#获取所有网页信息
response = requests.get(url)
#利用.text方法提取响应的文本信息
r=requests.get(url)
html = r.text
soup =BeautifulSoup(html,'html.parser')
#解析出歌名,find_all()函数返回的是tag的列表
names = soup.find_all('a',class_='pc_temp_songname')
# 打印names
print(names)
for name in names:
 #利用split方法把歌手和曲目分隔返回成列表形式赋值给item
    item = name.get_text().split('-')
 #q巧妙利用数组格式化依次输出曲名和歌手
   print("曲名:{}  歌手:{} ".format(item[1],item[0]))

三.获取数据结果

在这里插入图片描述到这就结束了,一起学习共同进步 😃

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章