深入了解无效流量(Invalid Traffic):识别、分类与应对策略

Ad Verification Platform Haran 6年前 (2020-05-14) 7307次浏览 0个评论
文章目录[隐藏]

更新时间:2025年11月5日

在数字营销与网站分析领域中,“流量”是最基础也是最被关注的指标之一。

但并非所有流量都是真实的用户访问,其中相当一部分其实是「无效流量Invalid Traffic,简称 IVT)」。

它不仅侵蚀广告预算、扭曲数据洞察,还破坏了整个行业的信任基础。

根据 MRC(Media Rating Council)与 IAB(Interactive Advertising Bureau)的最新统计,2024 年全球广告欺诈与无效流量造成的直接经济损失高达840亿美元,占总数字广告支出的 15% 以上。

在中国市场,PC与移动端平均IVT率更是高达 29.5%(所有的监测平台,第三方报告出的有关无效流量的报告都宣称无效流量占比30%左右,这是一个业内的共识,),部分垂直行业(如游戏、电商导流)甚至超过 50%。

什么是无效流量(Invalid Traffic, IVT)

无效流量Invalid Traffic)是指不会带来真实业务价值、且会干扰正常数据分析或广告效果评估的访问行为。它既包括恶意的欺诈行为(如刷量、自动点击),也包括非恶意的技术访问(如爬虫、监测工具、测试流量)。

根据中国广告协会的标准,无效流量(Invalid Traffic,IVT)被分为两类——GIVT 和 SIVT :

General Invalid Traffic(GIVT)一般无效流量

GIVT是General Invalid Traffic的缩写,即常规无效流量一般无效流量,是指能够通过应用多种名单或标准化参数等常规方式进行过滤的流量。

包括:

  • a) 机器人和爬虫或其他伪装成合法用户的流量数据以及非浏览器用户代理头或其他形式的未知浏览器带来的流量;
  • b) 超出频次、时间间隔等目标设定的流量数据;
  • c) 通过隐藏/堆叠/覆盖或其他方式导致用户无机会看到正常广告内容的流量;
  • d) 已知的来自数据中心的流量(指明显具有非人类访问广告所在的特定网络 IP 或 IP 段所产生的流量来源);
  • e) 预获取或浏览器预览的广告流量;
  • f) 已知的来自高危或者作弊来源的流量;
  • g) 基本信息缺失或不一致的流量(基本信息至少应包含事件类型、广告系列 ID、时间戳、IP、请求方式、用户代理 UA 字段)。

 

Sophisticated Invalid Traffic(SIVT)复杂无效流量

SIVT是Sophisticated Invalid Traffic 的缩写,即复杂无效流量,这种类型的流量无法通过简单的规则识别出来,一般需要通过高级分析,多方合作与协调,乃至人工干预等方法以及广告投放活动以外更大范围的数据信号才能分析和识别。

包括:

  • a) 劫持设备以及设备中的会话;
  • b) 非法劫持广告创意和操纵流量;
  • c) 内容盗用、伪造、虚假展示;
  • d) 恶意修改、插入或删除 cookie 内容以改变用户访问记录;
  • e) 操纵或伪造位置数据以及相关属性;
  • f) 无效代理流量(即来自中间代理设备的无效流量,包括通过代理设备操纵流量计数、创建/传输非人类流量或无法通过协议验证的流量)。

 

 

拓展:国际上无效流量的定义和划分

  • 常规无效流量可根据已知“蜘蛛”程序和漫游器列表或通过其他例行检查识别出来。
  • 复杂无效流量往往难以识别,需要通过人工干预或更深入的分析才能识别出来。

常规无效流量 (GIVT) 的类别

数据中心广告流量源自 IP 与无效活动相关联的数据中心内的服务器,通常为非真人带来的流量。这类 IP 通常为众所周知的数据中心 IP,可能已收录在行业清单中(例如 Trustworthy Accountability Group [TAG] 发布的“数据中心 IP 清单”)。
已知的抓取工具一种程序或自动脚本,会请求内容,并通过各种身份识别机制声明自己并非真人。这类抓取工具通常已收录在《IAB International Spiders and Bots List》(IAB 国际“蜘蛛”程序和漫游器清单)中。
不规则模式广告流量包含一项或多项与自动刷新流量、重复点击等已知的不规则模式相关的属性(例如:用户 Cookie)。

复杂无效流量 (SIVT) 的类别

自动浏览一种程序或自动脚本(例如僵尸网络,同时主要也是指僵尸网络),无需用户参与便会请求网络内容(包括数字广告),并且不声明自己是抓取工具。
虚假陈述一种广告请求,涉及的目标广告资源并非所提供的实际广告资源,包括如下情况下的广告请求:实际广告呈现在另一网站、应用、设备或其他位置(例如地理位置)上。
误导性界面经过篡改的网页、应用或其他视觉元素,旨在以错误方式包含一个或多个广告。这包括:呈现用户看不到的广告、未征得发布商同意便植入广告,或诱使用户点击广告。
被操控的行为浏览器、应用或其他程序未经用户同意便触发广告互动,例如意外点击、意外转化或错误地归因某个移动应用的安装事件。
利诱性质的行为借助明确的奖励,驱使用户仅为了获得所宣称的奖励而与一个或多个广告互动,并且相关广告客户并不知道存在该奖励。通常,此类奖励本质上为经济方面的奖励。
未披露的分类无法归到分类体系中任何其他类别的无效流量,或无法披露的敏感无效流量

 

 

无效流量的8大核心类型

类型
描述
典型场景
技术特征
自动化程序(Bots)
脚本或爬虫模拟人类行为
流量农场、点击机器人
无头浏览器、固定点击路径
点击农场(Click Farms)
人工或半人工批量点击
东南亚“任务众包”平台
低成本设备集群、VPN 轮换
发布商自点击
站长或开发者测试/刷量
应用内测、收入作弊
单一 IP/设备高频点击
误点击(Accidental Clicks)
用户非故意触碰
移动端横幅广告、插屏误触
极短停留时间(<1s)
激励性点击(Incentivized Traffic)
以奖励诱导用户点击
“看广告领金币”应用
高 CTR 但低转化
广告堆叠/隐藏(Ad Stacking/Hijacking)
多层广告重叠或劫持
恶意 SDK、域名伪装
0px广告、iframe 嵌套
数据中心流量(Data Center Traffic)
来自服务器而非真实用户的访问
云主机刷量、CDN 误判
已知 DC IP 段(如AWS、阿里云)
地理位置欺诈(Geo-Masking)
使用 VPN/代理伪造位置
跨境套利、规避区域限制
IP 与时区/语言不匹配
案例:2023 年 Google 封禁了 50 亿条广告,其中 39 亿条 因检测到“数据中心流量”被直接过滤。

 

无效流量的危害

  • 数据分析失真
    • 会话、用户数、跳出率被拉高或扭曲
    • 营销渠道评估失真(如Direct流量异常上升)
    • 影响A/B测试与转化率分析的准确性
  • 广告预算浪费
    • 部分程序化广告或展示广告被“假曝光”消耗
    • CTR异常高但ROI极低
    • 真实转化与展示的对应关系被破坏
  • 归因模型偏移
    • 无效点击被错误归因为有效来源
    • 误导后续优化方向
  • 品牌与安全风险
    • 部分IVT来自恶意攻击或内容抓取
    • 数据安全与隐私风险提升

 

检测技术:从规则到AI的多层防御体系

无效流量的检测可以通过技术特征分析、行为特征分析、数据分布异常检测、机器学习与算法等识别出来

类型
方法
技术特征分析
  • User-Agent 检查:检测是否包含 “bot”、“crawler”、“spider”等关键词。
  • IP & ASN 检测:匹配已知的云服务商(AWS、DigitalOcean、Hetzner等)。
  • Hostname 验证:确认访问域名是否为业务真实域。
  • 请求模式分析:频率、间隔、路径结构是否异常。
行为特征分析
  • 停留时间极短(<1s)
  • 浏览深度为 1 页
  • 没有触发 scroll、click、view_item 等互动事件
  • session 间隔规律、时间戳分布不自然
数据分布异常检测
  • 某渠道或国家流量突然暴涨
  • 夜间访问量异常集中
  • 新用户比例异常高且无复访
机器学习与算法
  • 异常检测(Isolation Forest)
  • 识别点击环(Click Rings)
  • LSTM 序列预测

 

规则:无效流量排除列表

为了行业统一,和便于维护,也可减少各方之间的差异,一般行业组织会发布通用的规则构建统一的“无效来源黑名单”,也叫无效流量排除列表,一般需要付费才可以使用。

有两个知名的无效流量排除列表

  • GIVT List一般无效流量数据,这是国内的,是由中国广告协会统筹指导,是中国唯一的行业级“一般无效流量数据”。数据内容包括:IP地址黑名单、IP地址白名单、Device ID黑名单、Device ID白名单。
  • IAB/ABC  List:叫IAB爬虫和机器人列表可帮助公司识别自动化流量,这是国际的,例如搜索引擎爬网程序,监视工具以及其他他们不想在其分析和可计费计数中显示的非人为流量。

 

AI+人工

简单的规则并不能过滤掉所有的无效流量,各家公司通常还会使用机器学习,AI算法等去检测SVIT,结合人工去处理一些申诉和可能的新模式。

 

 

排除机制:谁为无效流量买单?

角色
是否承担费用
平台政策
广告主
不收费
Google/Meta 承诺“只为有效互动付费”
发布商
扣除收入
AdSense:当月无效点击收入归零
代理商
需退款
合同中通常含 IVT 扣款条款

 

 

应对策略:广告主与发布商的实战指南

广告主5大防护措施

  • 启用广告平台自带的 IVT 报告:Google Ads → 报告 → 预定义报告 → 无效点击
  • 使用白名单投放:仅限Premium库存(如 Google Preferred)
  • 使用第三方验证:接入IAS、DoubleVerify、Moat
  • 排除高风险来源:IP段、设备类型、地理位置
  • 关注异常指标:CTR>5% 或转化率<0.1% 时人工复核

 

发布商5大自保策略

  • 禁止自测点击:使用测试设备 + 白名单 IP
  • 避免激励设计:不使用“看广告领奖励”机制
  • 定期清理 SDK:移除可疑广告联盟代码
  • 监控流量来源:使用 Cloudflare / AWS WAF 拦截 DC 流量
  • 申诉机制:保存原始日志,必要时提交 Google 复审

参考

  • 中国广告协会GIVT列表
  • MMA中国的《MMA中国无线营销联盟移动互联网广告无效流量验证标准V.1.0》


如有疑问,可以在文章底部留言或邮件(haran.huang@ichdata.com) 我~
喜欢 (6)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址