PHP編寫爬蟲參考

phpQuery
PHP Simple HTML DOM Parser
phpQueryList
php snoopy
PhantomJS 
1 、 Guzzle :功能很完善的 httpclient ,帶異步併發功能,別的腳本語言找不到這麼好的 httpclient

2 、 Goutte :對 symfony 的 dom-crawler 和 css-selector 的簡單封裝,你也可以直接用 symfony 的 css-selector 來抽取 html 的 dom 元素

3 、 symfony/process : symfony 出品的 php 開進程的庫(封裝的 proc_open ),兼容 windows ,要知道 pcntl 擴展不支持 windows 的

4 、 php-webdriver : Facebook 官方維護的 selenium 的 php 客戶端
 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章