不用寫代碼也能學會採集海量企業電話及郵箱數據 原

本文主要介紹如何使用后羿採集軟件的智能模式,免費採集順企網上企業的公司名稱、法人名稱、聯繫電話、企業地址及郵箱等信息。

採集工具簡介:

后羿採集軟件是一款基於人工智能技術的網絡爬蟲軟件,只需要輸入網址就能夠自動識別網頁數據,無需配置即可完成數據採集,是業內首家支持三種操作系統(包括Windows、Mac和Linux)的爬蟲軟件。

這是一款真正免費的數據採集軟件,對採集結果導出沒有任何限制,小白用戶也能輕鬆上手。

採集對象簡介:

順企網是深圳市順企網絡科技有限公司開發並運營的B2B電子商務平臺及企業黃頁平臺。順企網爲企業提供互聯網服務,提供全國114企業黃頁信息查詢服務,企業產品供應、採購、展會、招聘信息發佈,企業商鋪建立 ,宗旨是:一心爲企業服務,爭創網絡湘軍。

採集字段:

銀行名稱、銀行標題、主營產品、地址、成立時間、法人名稱、聯繫人、 聯繫電話、郵箱

功能點目錄

如何對採集字段進行配置

如何採集列表+詳情頁類型網頁

採集結果預覽:

下面我們來詳細介紹一下如何採集順企網中的企業信息,我們以杭州商業銀行黃頁爲例,具體步驟如下:

步驟一:下載安裝后羿採集軟件,並註冊登錄

1、打開后羿採集軟件官網,下載並安裝最新版

2、點擊註冊登錄,註冊新賬號,然後登錄

【溫馨提示】您可以直接使用此款爬蟲軟件,不需要進行註冊,但是匿名賬戶下的任務在切換到註冊用戶時會丟失,因此建議您註冊後使用。

后羿採集軟件爲神箭手旗下產品,神箭手用戶可直接登錄。

步驟二:新建採集任務

1、複製順企網杭州商業銀行黃頁的網頁地址(需要搜索結果頁的網址,而不是首頁的網址)

點此瞭解關於如何正確地輸入網址。

2、新建智能模式採集任務

您可以在軟件上直接新建採集任務,也可以通過導入規則來創建任務。

點此瞭解如何導入和導出採集規則。

步驟三:配置採集規則

1、設置提取數據字段

在智能模式下,我們輸入網址後軟件即可自動識別出頁面上的數據並生成採集結果,每一類數據對應一個採集字段,我們可以右擊字段進行相關設置,包括修改字段名稱、增減字段、處理數據等。

點此瞭解如何對採集字段進行配置。

在列表頁上,我們需要採集杭州商業銀行的銀行名稱、銀行鏈接、主營產品、地址及成立時間等信息,字段設置效果如下:

2、使用深入採集功能提取詳情頁數據

在列表頁上只展示出了杭州商業銀行的部分信息,如果需要銀行的法人名稱、聯繫方式等信息,我們需要右擊銀行鏈接使用“深入採集”功能,跳轉到詳情頁進行採集。

點此深入瞭解如何採集列表+詳情頁類型網頁。

在詳情頁面我們可以看到法人名稱、聯繫人、聯繫電話以及郵箱等信息,我們可以點擊“添加字段”添加採集字段,字段設置效果如下:

步驟四:設置並啓動採集任務

1、設置採集任務

完成了採集數據添加,我們可以開始啓動採集任務了。在啓動之前我們需要對採集任務進行一些設置,從而提高採集的穩定性和成功率。

點擊“設置”按鈕,在彈出的運行設置頁面中我們可以進行運行設置和防屏蔽設置,這裏我們勾選“跳過繼續採集”,設置“2”秒請求等待時間,勾選“不加載網頁圖片”,防屏蔽設置就按照系統默認設置,然後點擊保存。

點此深入瞭解如何對採集任務進行配置。

2、啓動採集任務

點擊“保存並啓動”按鈕,可在彈出的頁面中進行一些高級設置,包括定時啓動、自動入庫和下載圖片,本次示例中未使用到這些功能,直接點擊“啓動”運行爬蟲工具。

點此深入瞭解什麼是定時採集。

點此深入瞭解什麼是自動入庫。

點此深入瞭解如何下載圖片。

【溫馨提示】免費版本可以使用非週期性定時採集功能,下載圖片功能是免費的。個人專業版及以上版本可以使用高級定時功能和自動入庫功能。

3、運行任務提取數據

任務啓動之後便開始自動採集數據,我們從界面上可以直觀的看到程序運行過程和採集結果,採集結束之後會有提醒。

步驟五:導出並查看數據

數據採集完成後,我們可以查看和導出數據,軟件支持多種導出方式(手動導出到本地、手動導出到數據庫、自動發佈到數據庫、自動發佈到網站)和導出文件的格式(EXCEL、CSV、HTML和TXT),我們選擇自己需要方式和文件類型,點擊“確認導出”。

點此深入瞭解如何查看和清空採集數據。

點此深入瞭解如何導出採集結果。

【溫馨提示】:所有手動導出功能都是免費的。個人專業版及以上版本可以使用發佈到網站功能。

 

再給您推薦幾個關於企業信息採集的教程:

如何免費採集企查查企業信息

如何採集天眼查企業列表

如何採集企業電話和地址信息(中國五金網)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章