Skip to main content

基础爬虫

背景#

众所周知，爬虫是主动漏洞扫描中极其重要的一环。在漏洞扫描中，爬虫被用作一种数据收集工具，用于获取目标系统的信息以帮助我们发现漏洞。

Yakit 漏洞扫描中的基础爬虫通常包含以下三个主要步骤：

网站爬取：爬虫首先会爬取目标系统中的网站，并将网站的源代码和相关信息存储到扫描器的数据库中。这些信息包括网站的URL、页面结构、表单、脚本和其他与网站相关的信息。
爬取数据分析：基础爬虫会对爬取的网站数据进行分析，并从中提取相关的信息，如网站的结构、链接、表单和参数等。
漏洞检测：基础爬虫会使用爬取到的信息根据加载的相关的Yakit插件进行漏洞扫描，并根据扫描结果提供相应的漏洞报告。

需要注意的是，漏洞扫描中的爬虫与普通的爬虫有所不同。它并不是为了抓取网站上的数据而设计的，而是为了获取网站结构和参数等信息以帮助我们发现漏洞。同时，进行漏洞扫描时需要遵守相关的法律和道德规范，不能进行未经授权的攻击行为。

使用方法#

在输入框中输入 IP / 域名 / 主机名 / URL，多目标可以逗号分隔，点击开始执行即可开始爬取

更多参数#

额外参数可设置更多内容，方便爬虫更好运行。

参数说明：
设置代理：有些网站访问不到的，可以加入代理进行访问，格式为http://127.0.0.1:7890 或者 socks5://127.0.0.1:7890
超时时间：每个请求的最大超时时间
最大深度：设置爬虫的最大深度（逻辑深度，并不是级数）
并发量：爬虫的并发请求量（可以理解为线程数）
最大URL数：爬虫获取到的最大量URL（这个选项一般用来限制无限制的爬虫，一般不需要改动）
最大请求数：本次爬虫最多发出多少个请求？（一般用于限制爬虫行为，一般不需要改动）

背景
使用方法
更多参数