网络信息挖掘笔记

GoogleHacking——web信息挖掘

指从大量的训练样本中获得数据之间的内在特征
1.Googlehacking
Google常用语法

指令 意义
Site 指定域名
Inurl URL中存在关键字的网页
Intext 网页中正文的关键字
Filetype 指定文件类型,支持ppt,xls,doc,rtf,pdf,txt
Intitle 网页标题中的文字
Link Link: baidu.com表示返回有baidu.com做了链接的URL
Info 查找指定站点的一些基本信息
Cache 搜索Google里关于某些内容的缓存

Whois——标准的互联网协议

查询已注册的域名的所有者信息:
域名登记人信息、联系方式、域名注册时间和更新时间、权威DNS的IP地址
Kali中使用whois:
指令: whois 域名
指令
在线查询:
爱站网: https://whois.aizhan.com/
站长之家: https://whois.chinaz.com/
网站备案:
天眼查: https://www.tianyancha.com/

指纹识别

识别网站、操作系统等的特征码
网站CMS识别、计算机操作系统及web容器的指纹识别
CMS(Content Management System)文章系统或整站系统;

CMS指纹是应用程序在html、JS、CSS中包含的一些特征码
常见:
Dedecms(织梦)、Discuz、PHPwind、PHPWeb等

常见工具:
Web指纹识别、Whatweb、WebRobo、轻量WEB指纹识别

在线CMS指纹识别:
Bugscaner: http://whatweb.bugscaner.com/look/
云悉指纹: http://www.yunsee.cn/finger.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章