上面我们介绍了垃圾流量的发展历史和分类特征,如何快速简单识别作弊,根据作弊的级别可以分为三个类型。
- 浅层次作弊,用技术分析可以搞定,这个一般第三方工具会内置有的,如Google Analytics的垃圾和机器过滤的规则是遵循IAB/ABC internationalspiders &bot list上的,只要勾选就可以开启自动过滤。
- 中层次作弊,看用户行为的异常;流量分布;以及一些数据指标异常等,下面会详细介绍一些角度去判别。
- 高层次作弊,这个很难排除,通常是掺杂部分流量而已,不会大规模出现。
对于没有被过滤掉的垃圾流量,我们可以通过数据的角度去分析判断:
方法1、查看主机名
可以在探索报告里查看主机名:

看这个报告是否有除了你现有主机名之外的其他主机名,如果有,这些都是垃圾流量。
这种垃圾流量产生的原因是,知道GA4的衡量ID,我们就可以给这个衡量ID发送数据。
以此类推,如果你要干扰你竞争对手的数据,可以将它的跟踪id挂在一些网站上去,这样它的GA就可以收到一些干扰数据,为什么说是可能呢?因为这些垃圾流量可以用过滤器过滤的,如果对方开启了过滤器过滤,那么就不会对其产生营销。
看图中, 第三是垃圾流量,可以将其滤掉或看GA4上屏蔽来自gtm-msr.appspot.com的机器流量。
方法2:IP的角度
第二种方法是从ip的角度,通常这种类型的造假是通过重复访问的,也就是定时切换ip,清除cookie,但我们可以通过获取用户的id,看这个ip的数据,如某个ip在这端时间段的会话数真多,但是跳出率是100%,这种就是重复访问造成的。
现在这种不常用,但是还是有人会用的,在这里只是作为一个方法介绍,GA4可以通过一些设置可以获取ip的,具体的方法去网站上看在Google Analytics 4 中获取用户的IP(基于ipinfo.io)
方法3:热力图
正常访客进来,产生比较密集的点击热力图,如果是机器流量进来,点击会是很稀疏的热力图,甚至是没有,通过这个可以对比分析出,这个来源的流量是否有机器流量,这是热力图的使用方法之一。
但这种方法的实用性不强,因为数据太少的话,真实的和机器的渠道都是会比较稀疏的,如果多的话,足够明显能够判别出这个渠道是垃圾流量,那么这个就是个很严重的问题,整个来源都是机器流量,推广的人要么是没发现,要么是知道不处理,这就是你们内部的问题。
目前GA4不支持热力图,建议使用其他工具,延伸阅读:网站热力图工具有哪些?
方法4:不该出现的
非电商网站,出现金额百万的订单
方法5:异常好,无转化

异常好,无转化,如下图中的,跳出率是非常好的,可以说这个来源的访客在站内的表示是不错的,但是这个渠道完全没有转化,那么就需要注意了,这个很有可能是会有二次页面访问的造假形式,这个是比较很高级的作弊方法,能够将着陆页的各个指标模拟的很真实的,让用户很难判断,这时候就就需要看这个页面的在浏览器,设备,时间上的 分布集中情况,如果没有异常,再去页面行为流,看这个渠道在第二个页面之后的行为表现,如果第二页基本就退出,那这个很大可能是垃圾流浪。
方法6:异常集中
异常集中,如时段上,你的潜在用户跟踪不会在晚上访问你的站点的,你没做时间显示,晚上数据异常,有很多的流量在点击你的广告消耗你的广告位,这个直接就垃圾流量,目的为了消耗你的广告费的。其他的如地域,设备上的高度集中,可以作为辅助参考。

延伸阅读:「Google Analytics 4」垃圾流量的识别与处理
方法7:新用户=用户数=会话数
新用户=用户数=会话数,也就是新用户进来,很短的时间就离开了,通常这类用户的跳出率是100%的,所以这个肯定是有问题的流量,这种方法屡试不爽,总能找到问题,是我使用最多的一种访问,可以从各个维度去看这个等式,如来源,城市,网站等。

下面看看各个方法的有优劣,最实用的方法是新用户=用户数=会话数,这个是最快捷的方式,很容易就定位到问题的,然后就是异常好,无转化和维度中不应该出现的类型,这两种比较常用,其他的都是方法实用性不强的。查看主机名这个是非常有效的判断方法,但是你设置好过滤器后就不会再有问题的了;
在使用这些方法的时候往往还会结合对比和次级维度来做更细致的判断。
那什么情况下才会考虑到是不是垃圾流量呢?或是说什么时候需要做垃圾流浪识别呢?
我一般情况下会在流浪暴涨的时候,这时候你就需要注意,是不是机器流量,另一个是新增渠道的时候,要留意渠道数据是否合理,有问题的,最后一个是定期做review。出现问题及时排除。
如果发现有垃圾流量,ad可以去申诉,如果是国内的百度,搜索,今日头条这些,我不知道有没有申诉的途径,如果没有,停掉该系列的广告,或做限制性投放。





