提取數據處理03---非結構化數據處理

文本、電話號碼、郵箱地址

  • 正則表達式

HTML 文件

處理方法

  • XPath
  • 正則表達式
  • CSS選擇器

XPath使用方法

將 HTML文件 轉換成 XML文檔,然後用 XPath 查找 HTML 節點或元素

正則表達式

詳細見文章

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章