GoogleHacking——web信息挖掘
指從大量的訓練樣本中獲得數據之間的內在特徵
1.Googlehacking
Google常用語法
指令 | 意義 |
---|---|
Site | 指定域名 |
Inurl | URL中存在關鍵字的網頁 |
Intext | 網頁中正文的關鍵字 |
Filetype | 指定文件類型,支持ppt,xls,doc,rtf,pdf,txt |
Intitle | 網頁標題中的文字 |
Link | Link: baidu.com表示返回有baidu.com做了鏈接的URL |
Info | 查找指定站點的一些基本信息 |
Cache | 搜索Google裏關於某些內容的緩存 |
Whois——標準的互聯網協議
查詢已註冊的域名的所有者信息:
域名登記人信息、聯繫方式、域名註冊時間和更新時間、權威DNS的IP地址
Kali中使用whois:
指令: whois 域名
在線查詢:
愛站網: https://whois.aizhan.com/
站長之家: https://whois.chinaz.com/
網站備案:
天眼查: https://www.tianyancha.com/
指紋識別
識別網站、操作系統等的特徵碼
網站CMS識別、計算機操作系統及web容器的指紋識別
CMS(Content Management System)文章系統或整站系統;
CMS指紋是應用程序在html、JS、CSS中包含的一些特徵碼
常見:
Dedecms(織夢)、Discuz、PHPwind、PHPWeb等
常見工具:
Web指紋識別、Whatweb、WebRobo、輕量WEB指紋識別
在線CMS指紋識別:
Bugscaner: http://whatweb.bugscaner.com/look/
雲悉指紋: http://www.yunsee.cn/finger.html