Xenu軟件檢查網站死鏈接

1 軟件介紹

         Xenu是一款出色的死鏈接檢測工具,全稱爲:Xenu Link Sleuth。它是由德國柏林的Tilman Hausherr爲網頁死鏈檢測專門開發的免費軟件。Xenu也許是你所見過的最小但功能最強大的檢查網站死鏈接的軟件了。你可以打開一個本地網頁文件來檢查它的鏈接,也可以輸入任何網址來檢查。它可以分別列出網站的活鏈接以及死鏈接,連轉向鏈接它都分析得一清二楚;支持多線程,可以把檢查結果存儲成文本文件或網頁文件。

         Xenu的特點:檢測範圍廣、 檢測速度快、操作簡單、一次檢測可以涵蓋100萬以上的URL總量、報告採用HTML格式輸出、可以按照網頁標題自動生成網站地圖、支持重定向和SSL。

         Xenu是被廣泛使用的死鏈接檢測工具。可以檢測到網頁中的普通鏈接、圖片、框架、插件、背景、樣式表、腳本和java程序中的鏈接。那麼什麼時候出現死鏈接:

l   動態鏈接在數據庫不再支持的條件下,變成死鏈接。

l   某個文件或網頁移動了位置,導致指向它的鏈接變成死鏈接。

l   網頁內容更新並換成其他的鏈接,原來的鏈接變成死鏈接。

l   網站服務器設置錯誤。

1.1 軟件作用
         用於檢測網站鏈接有效性的綠色軟件,使用簡單,最大支持100線程( Parallel threads),檢測速度非常快。在對某網站的6層連接100630個連接進行檢測時,使用默認的100線程耗僅費了1小時40分鐘。當然耗費的網絡資源比較多。

1.2 功能特點
1)        優點:

l   免費的

l   體積小巧(軟件大小不到1MB),界面簡單易學

l   檢查完後,可生成鏈接情況報告,還能自動將報告發送到指定 email 信箱

l   給出死鏈接所在頁面,方便修改或刪除死鏈接;

l   可設置並列線程和測試最大層次

l   可以一鏈即查看所有“失敗鏈接報表”

l   有重新檢查失敗鏈接的功能“recheckbroken”

2)        缺點:

l   只檢查鏈接是否有效,不檢查是否正確

l   只有Windows版本

l   網速慢,可能會發生超時(Timeout)錯誤,導致無法得知目標鏈接到底是不是死鏈接

l   存在檢測不準確的問題(極少,大家可以通過點擊死鏈接,查看是否能鏈接正確來再次確認)

2 測試原理
         從待測網站的根目錄開始搜索所有的網頁文件,對所有網頁文件中的超級鏈接、圖片文件、包含文件、CSS文件、頁面內部鏈接等所有鏈接進行讀取,如果是網站內文件不存在、指定文件鏈接不存在或者是指定頁面不存在,則將該鏈接和處於什麼文件的具體位置記錄下來,一直到該網站所有頁面中的所有鏈接都測試完後才結束測試,並輸出測試報告。

         如果發現被測網站內有頁面既沒有鏈接到其他資源也沒有被其他資源鏈接,則可以判定該頁面爲孤立頁面,將該頁面添加到孤立頁面記錄,並提示用戶。

         測試鏈接目標是否存在和是否有孤立頁面都可以通過程序自動完成,但是程序卻不能判斷目標頁面是否與用戶的用意是否相符合,如果鏈接到不正確的頁面,例如將公司介紹鏈接到產品介紹,則程序無法進行判斷,因此鏈接頁面的正確性需要人工進行判斷。

         測試完畢後,可以通過REPORT菜單中的HTMLREPORT來進行測試結果的查看,可以查看的方式包括:

l   錯誤鏈接報告

l   完整的報告

l   測試文件清單

l   用戶自定義的HTML報告,可以允許用戶定義顯示條件。

l   重定向鏈接列表

         鏈接測試因爲技術含量不高,很多測試人員都不願意做鏈接測試,但是鏈接的正確卻直接影響用戶對該網站的印象,一個網站如果出現鏈接上的錯誤,不管其頁面做的如何漂亮,用戶對其信任度都會大打折扣。因此,我們首先必須重視鏈接測試,雖然其需要耗費很多的時間,但是可以提高網站的整體質量,另外引入鏈接自動化測試工具可以加快鏈接測試進行的速度。

3 下載與使用
1)        下載地址:http://home.snafu.de/tilman/xenulink.html

           下載中文版 : https://pan.baidu.com/s/157KQPUvWE1ETSeI5xafDDg

下載的英文版需要安裝,中文版直接解壓即可使用

2)        安裝或下載完之後,打開應用,會有提示與技巧

3)        點擊File->Check URL…添加URL地址

4)        輸入需要測試的信息,例測試https://www.sohu.com/

5)        點擊ore options..可進行一些參數設置

6)        可最多設置100個並列線程,最大測試層數貌似沒有限制,但最大層次建議在6以內,否則會有很多鏈接,測試的速度和有效性會大打折扣,相信一般的網站鏈接也不會超過6層。報告(Report)可全選。比較關心的是中斷鏈接、中斷內部鏈接、統計、有效文字鏈接。

7)        點擊確認,ok後開始檢查;檢查結果顯示常見有3中狀態:

l   Skip external ——跳過外部鏈接測試

l   OK —測試通過

l   Not found ——死鏈接

8)        檢查完成後,提示是否需要生成報告,點擊“是”,等待報告生成

9)        報告生成後,Xenu會將所有錯誤鏈接列表供大家參考,同時還會生成一個XML網站地圖。不過生成的報告總體來說並不利於瀏覽,一方面是報告英文的,另一方面需要大家逐一瀏覽,很費精力。可將檢查結果導出爲製表符分割的文件。

10)     導出的文件爲txt文件,此時大家就可以使用Excel表格的數據整理功能進行數據整理,在Excel表格中點擊數據->自文本,導入剛剛的txt文件,其他默認配置

11)     最終結果如下圖:

12)     此時只要勾選404就能通過狀態碼找出哪些頁面是死鏈接,方便快捷

13)     選擇某條記錄,右鍵->URL properties,可以查看該鏈接的信息

14)     根據鏈接的網址以及錨文本,對所鏈網頁進行查找

4 狀態識別
         檢測完的鏈接狀態常用的有:ok、timeout、noconnection、no such host、not found、no info to return、no object data、keep same verb等等。

l   ok、mail host ok :表示鏈接正常;

l   timeout、no connection、no such host:表示訪問超時或者無法訪問(不代表是空鏈);

l   not found:如果是not found,表示沒有找到,即空鏈接。

l   no info to return:沒有對象返回,即空頁面。

l   no object data:沒有對象數據,常見於訪問服務器出現400錯誤等訪問出錯情況

l   keep same verb:url是一致的,例如<a href="網址鏈接A">網址鏈接A</a>這種形式,在軟件識別此狀態後,建議在源碼裏檢查一下,如只有類似剛纔舉例形式是無需擔心的,如有其他形式的鏈接,需要看其是否符合seo優化標準再做修改

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章