css 选择器
1.通过标签查找
通过p标签获取
print(soup.select('p')) #使用的bs4 select 方法,selenium driver.find_elements(By.CSS_SELECTOR,'p') 类似
2.通过类名查找
在类的前面加一个点“.”
例如: 查找 class=onion的标签
print(soup.select('.onion'))
3.通过id查找
在id名字前加 “#”
id="line3"
print(soup.select('#line3'))
4.组合查找 通过标签名和类名、id名进行组合
例:
1.查找p标签中,id等于box的内容,二者需要用空格分开
print(soup.select('p #box'))2. 直接通过子标签查看 用 > 分割
print(soup.select('head > title'))
5. 通过属性查找
查找时还可以加入属性元素,属性需要用中括号括起来,
属性和标签属于同一节点,所有中间不能加空格,否则无法匹配到print(soup.select('a[href=“https://xxxx.com”]'))
6. 在根据类名或者id进行查找的时候,如果还要根据标签名进行过滤。那么可以在类的前面或者id的前面加上标签名字
div标签下id为line3
div#line3
div标签下类名为line的
div.line