| ID | Name |
|---|---|
| T1589.001 | 社交工程伪装身份验证交互 |
| T1589.002 | 凭证泄露数据伪装合法爬虫 |
| T1589.003 | 跨平台碎片化信息拼图采集 |
凭证泄露数据伪装合法爬虫(Credential Leakage Disguised as Legitimate Crawler)是一种利用合法网络爬虫协议框架实施隐蔽数据采集的技术。攻击者通过构建符合Robots协议规范的网络爬虫,将身份信息收集任务分解为符合目标网站访问策略的离散请求,利用搜索引擎爬虫的流量特征掩盖恶意数据采集行为。该技术特别针对大规模公开数据源(如社交媒体、代码仓库、文档共享平台),通过模拟主流搜索引擎的User-Agent、请求间隔和访问深度参数,使恶意爬虫流量融入正常搜索引擎索引流量中。
匿迹实现的核心在于协议层特征伪装与采集节奏的动态控制。攻击工具会严格遵循目标网站的robots.txt规则限制,仅在允许的目录路径内执行数据抓取,避免触发反爬虫机制。在流量特征层面,采用分布式代理节点轮换IP地址,并模拟Googlebot、Bingbot等合法爬虫的TCP指纹和TLS握手特征。数据抽取阶段采用渐进式采集策略,将敏感信息字段(如邮箱、手机号)的提取任务拆解到多个会话周期,通过时间维度分散数据关联性。这种技术使得攻击流量在协议合规性、行为模式、数据关联性等维度均与合法爬虫高度相似,传统基于请求频次或内容模式的检测方法难以有效识别。
This type of attack technique cannot be easily mitigated with preventive controls since it is based on the abuse of system features.
Coming soon