高逼格地收集資料,常用搜索引擎語法

百度語法


1.site

把搜索範圍規定在特定的站點中 。但是有時候你需要找一些特殊的文檔,特別是針對於專業性比較強的網站合理使用site可以讓你取得事半功倍的效果。

舉例說明:site:sina.com(不要加www)

【注意事項】“site:”和後面的網站域名之間不要帶空格,也不要帶“http://”。


2.intitle

把搜素範圍限定在標題中。一般情況下標題是整篇文章的綱要,使用這種方法可以有利於快速的找到你所需要的文章。

舉例說明:網站優化 intitle:論壇

【注意事項】 intitle:和後面的關鍵詞之間沒有空格。


3.inurl

網址中url的一些信息,常常具有一些含義的。你可以通過inurl把這些鏈接找出來。比如說你想找關於photoshop的技術類文檔,可以這樣操作:photoshop inurl:jishu就可以找到相關知識了。

“inurl”語法返回的網頁鏈接中包含第一個關鍵字,後面的關鍵字則出現在鏈接中或者網頁文檔中。有很多網站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網頁名稱中,比如“MP3”、“GALLARY”等,於是,就可以用INURL語法找到這些相關資源鏈接,然後,用第二個關鍵詞確定是否有某項具體資料。

INURL語法和基本搜索語法的最大區別在於,前者通常能提供非常精確的專題資料。

inurl 可以查詢網站具體頁面的收錄情況

inurl:sina.cominurl

可以查詢高質量外鏈搜索:inurl:gov 旅遊

【注意事項】“inurl:”和後面所跟的關鍵詞之間不要有空格。


4. 使用中括號、雙引號或書名號,可精確匹配,縮小搜索範圍。

舉例說明:[說體驗]或“說體驗”或《說體驗》

【注意事項】書名號在百度有兩個特殊功能,首先書名號會出現在搜索結果中;而是被書名號括起來的內容不會被拆分,這個在查詢電影書籍時特別有效。


5. 減號使用,顧名思義“-”就是你不想要查詢的內容,用來排除某一搜索。

這個主要是比較容易搞混的東西。比如說你要在線看一部電影,不想下載看的。因爲有好多站長喜歡把播放、下載全部做到頁面標題中。那麼你就可以這樣操作:

[博物館驚魂夜] intitle:在線播放 -下載谷歌語法[竊聽風雲3] intitle:觀看 -下載

【注意事項】 前一個關鍵詞和減號之間必須有空格,沒有空格減號會被當成連字符。


6.filetype

搜索指定擴展名的文件如filetype:.doc百度支持搜索.doc .pdf .xls .ppt .txt 文件7.index ofindex of可以檢索到哪些允許目錄遍歷的服務器的內容,得到網站的資源列表。

例如最經典的index of pdf進入網站後可以直接下載。


谷歌語法


1.site

表示搜索結果侷限於某個具體網站或者網站頻道,如“edu.sina.com.cn”、“www.seoanyi.com”,或者是某個域名,如“com.cn”、“com”等等。

如果是要排除某網站或者域名範圍內的頁面,只需用“-網站/域名”。如:seo site:www.seoanyi.com


2.link

語法返回所有鏈接到某個URL地址的網頁。

示例:搜索所有含指向健康論壇“www.renliubbs.com”鏈接的網頁。

搜索:“link:www.renliubbs.com”


3.inurl

搜索網址中包含的指定字符串。它更精確的用法是:allinurl。語法返回的網頁鏈接中包含第一個關鍵字,後面的關鍵字則出現在鏈接中或者網頁文檔中。

有很多網站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網頁名稱中,比如“MP3”、“GALLARY”等,於是,就可以用INURL語法找到這些相關資源鏈接,然後,用第二個關鍵詞確定是否有某項具體資料。

INURL語法和基本搜索語法的最大區別在於,前者通常能提供非常精確的專題資料。

如:搜索:“inurl:pdf seo”


4.allinurl

語法返回的網頁的鏈接中包含所有查詢關鍵字。這個查詢的對象只集中於網頁的鏈接字符串。示例:查找可能具有PHF安全漏洞的公司網站。通常這些網站的CGI-BIN目錄中含有PHF腳本程序(這個腳本是不安全的),表現在鏈接中就是“域名/cgi-bin/phf”。

語法:“allinurl:”cgi-bin” phf +com”


5.related

用來搜索結構內容方面相似的網頁。例:搜索所有與中文新浪網主頁相似的頁面(如網易首頁,搜狐首頁,中華網首頁等),“related:www.sina.com.cn/index.shtml”。

【注意事項】related只適用於Google


6.cache

用來搜索GOOGLE服務器上某頁面的緩存,這個功能同“網頁快照”,通常用於查找某些已經被刪除的死鏈接網頁,相當於使用普通搜索結果頁面中的“網頁快照”功能。


7.info

用來顯示與某鏈接相關的一系列搜索,提供cache、link、related和完全包含該鏈接的網頁的功能。


8.or

當我們要同時搜索Google和baidu的最新情況時,我們用“Google OR baidu”【注意事項】中間的OR要大寫


9.引號“”的用法

加上雙引號後的搜索結果是完全匹配,不加引號的則是可以把搜索的詞拆分了模糊匹配。


另附上【Google hack之精簡部分】

1.查看基本情況

info:xx.com   返回一些基本信息

site:xx.com   返回所有與該有關的url

link:xx.com   返回所有與該站做了鏈接的站

site:xx.com filetype:txt   查找txt文件


2.查找後臺

site:xx.com intext:管理

site:xx.com inurl:login

site:xx.com intitile:後臺


3.查看服務器使用的程序

site:xx.com filetype:asp

site:xx.com filetype:php

site:xx.com filetype:jsp

site:xx.com filetype:aspx


4.查看上傳漏洞

site:xx.com inurl:file

site:xx.com inurl:load


5.查找注射點

site:xx.com filetype:asp


雅虎語法


1.title

用於針對標題進行搜索。

例如:搜索 title:張學友 ,搜索引擎會返回所有標題中包含“張學友”的網頁。由於網頁的標題通常會準確的描述網頁的內容,所以使用“title:”進行搜索的效果可能更精確。


2.link

用於查找所有鏈接到某個網址的網頁。

例如:搜索 link:http://www.seoanyi.com/ ,會得到所有鏈接到“www.seoanyi.com”的網頁;

搜索 姚明 link:http://www.yahoo.com.cn/ 

或者 link:http://www.yahoo.com.cn/姚明 ,

會得到所有鏈接到“www.yahoo.com.cn”的網頁中,包含“姚明”一詞的網頁。

【注意事項】搜索時不能缺少“http://”。


3.site或者domain用於限定搜索結果的來源。

例如:搜索姚明 site:yahoo.com.cn 或者 姚明 domain: yahoo.com.cn 或者將“姚明”與site、domain語句調換位置(注意中間使用空格隔開),搜索引擎會返回在域名“www.yahoo.com.cn”及其子域名中的、所有包含“姚明”一詞的網頁。


4.hostname

用法與“site:”、“domain:”相同,只不過使用“hostname:”時返回的只是在當前域名下的網頁,而不包括其子域名中的網頁。


5.url

用於精確搜索url。

例如:搜索 url:http://www.cycbbs.com ,搜索引擎只會返回一個結果——自行車騎行。


6.linkdomain

返回的是某個域名的反向鏈接。雅虎的反向鏈接數據還比較準確,是SEO人員研究競爭對手外部鏈接情況的重要工具之一。

比如搜索linkdomain:www.buxiugangw.com-site:www.buxiugangw.com得到的就是不鏽鋼網的外部鏈接,因爲-site:www.buxiugangw.com已經排除了本身的頁面,也就是內部鏈接,剩下的就都是外部鏈接了

【注意事項】linkdomain只適用於雅虎


 本文作者 @產品小妖 ,歡迎轉發請保留此說明 。

獲取更多精彩信息,可以訂閱我的簡書專題,或關注我的新浪微博,微信訂閱號產品小妖


微信訂閱號產品小妖
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章