網絡信息挖掘筆記

GoogleHacking——web信息挖掘

指從大量的訓練樣本中獲得數據之間的內在特徵
1.Googlehacking
Google常用語法

指令 意義
Site 指定域名
Inurl URL中存在關鍵字的網頁
Intext 網頁中正文的關鍵字
Filetype 指定文件類型,支持ppt,xls,doc,rtf,pdf,txt
Intitle 網頁標題中的文字
Link Link: baidu.com表示返回有baidu.com做了鏈接的URL
Info 查找指定站點的一些基本信息
Cache 搜索Google裏關於某些內容的緩存

Whois——標準的互聯網協議

查詢已註冊的域名的所有者信息:
域名登記人信息、聯繫方式、域名註冊時間和更新時間、權威DNS的IP地址
Kali中使用whois:
指令: whois 域名
指令
在線查詢:
愛站網: https://whois.aizhan.com/
站長之家: https://whois.chinaz.com/
網站備案:
天眼查: https://www.tianyancha.com/

指紋識別

識別網站、操作系統等的特徵碼
網站CMS識別、計算機操作系統及web容器的指紋識別
CMS(Content Management System)文章系統或整站系統;

CMS指紋是應用程序在html、JS、CSS中包含的一些特徵碼
常見:
Dedecms(織夢)、Discuz、PHPwind、PHPWeb等

常見工具:
Web指紋識別、Whatweb、WebRobo、輕量WEB指紋識別

在線CMS指紋識別:
Bugscaner: http://whatweb.bugscaner.com/look/
雲悉指紋: http://www.yunsee.cn/finger.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章