• 加入Google Analytics、Google Tag Manager QQ群一起交流谷歌分析小站—总群
  • 加入Adobe Analytics、Adobe Launch交流群,加入请附上Adobe的组织ID,没有请勿加Adobe Analytics交流群
  • Google Analytics和Google Tag Manager视频课程第三版http://ke.ichdata.com/course/50

浅谈虚假流量识别的几个方法

数据分析 GA小站 3年前 (2017-07-19) 3809次浏览 已收录 0个评论
浅谈虚假流量识别的几个方法

本篇节选自 《互联网营销与产品优化》 中的第四章第5节中的“防范策略”。

上面我们介绍了垃圾流量的发展历史和分类特征,如何快速简单识别作弊,根据作弊的级别可以分为三个类型。

浅层次作弊,用技术分析可以搞定,这个一般第三方工具会内置有的,如Google Analytics的垃圾和机器过滤的规则是遵循IAB/ABC internationalspiders &bot list上的,只要勾选就可以开启自动过滤。

中层次作弊,看用户行为的异常;流量分布;以及一些数据指标异常等,下面会详细介绍一些角度去判别。

高层次作弊,这个很难排除,通常是掺杂部分流量而已,不会大规模出现。

       首先是内部机制,Google Analytics里面已经有一个垃圾流量过滤机制了,开启这个功能可以过滤掉很多的垃圾流量,设置的位置在管理>数据视图设置>漫游过滤器

浅谈虚假流量识别的几个方法

            只要勾选就可以了,虽然这个能去部分垃圾流量,但是你的报告里面一定还会有垃圾流量的,因为不断有新的形式的垃圾流量出现,而第三方工具还没有纳入到过滤规则或根本过滤不了,这时候就要通过一些数据的角度来分析了。

 

1、查看主机名

            在所有流量>渠道报告里面,点击“其他”输入“主机名”后回车,操作演示如下:

浅谈虚假流量识别的几个方法

这样就可以看到主机名维度的报告:

浅谈虚假流量识别的几个方法

            在这个地方原则上只应该出现一个主机名,也就是你自己的,如果有做跨站就出现多个。可以看到只有第一个是自身的流量,其他的几个都是垃圾流量, 至于出现其他主机名,是因为我们的Tracking ID让别人知道,别人模拟用户行为往这个媒体视图发送数据。

            解决的方案是将自身的主机名的流量过滤出来,设置是在过滤器里面,作如下设置,这样视图里面就只有本主机名的流量:

浅谈虚假流量识别的几个方法
2、新用户数=会话数=用户数

            从不同的广告维度、用户属性等角度去找上述等式,如果某种类型的流量符合上述的等式,那很大可能就是垃圾流量,因为在等式相等的时候,也就是访客进来后直接跳出的,完全没有访客回访,通常跳出率会有100%。

            举个例子,下面是某站在语言角度的:

浅谈虚假流量识别的几个方法

            可以看到新用户数等于会话数,跳出率为100%,再细看语言c,语言列表是没有这种语言的,这部分流量就肯定是垃圾流量了。

            继续在二级维度添加“来源/媒介”,可以知道这些流量都来自某搜索平台的ppc流量,所以不要觉得大的搜索平台就不会有垃圾流量,你的SEM里面很有可能也有上述的情况正在浪费你的广告费的。

            通常遇到这种情况是及时停掉对应的广告组或广告系列,然后去申诉,Adwords的是有比较完善的申诉机制,国内的平台我就不太了解,不知道能不能拿回你被骗的广告费。

 

3、某些流量站内表现异常好,就是没转化

            这种类型通常会是AFF或DSP的流量,跳出率很低,页面停留时间很长,看上去这个部分用户的页面表现很好,但就是没转化,那么这部分流量很可能就是垃圾流量了,需要注意:用户不会无缘无辜一直停留在你站点,真相只有一个,为了然这个渠道的质量看起来不错,让你多投广告。

            比如在DSP投放,带来的流量在页面变现很好,跳出率只有20%,要知道其他一些渠道都是在40%~60%,但这个DSP渠道就是完全没有转化的,你知道了为什么了吗?

            下面看一个实际的案例,如果只看新用户和跳出率:

浅谈虚假流量识别的几个方法

                第七个跳出率的只有9%,页面表现是非常好的,如果再告诉你,这个渠道完全么有转化,而且消耗了不少广告费用,你会怎么看呢?

4、时段和设备的角度

            如果是机器模拟流量,可能会在部分时段上高度集中某种设备的点击和访问,可以通过这角度去定位流量是否有问题。

浅谈虚假流量识别的几个方法

            如上图,我的站点的目标用户群访问时间是白天才合理的,但是某渠道的很多付费的流量确是在凌晨的时候访问,这时根本就没有客服在,怎么会有转化的呢,可以在二次维度上添加一些维度去判断这些流量是具有什么特征,辅助判断。(这只一种比较极端的例子,仅作为举例使用,通常成熟的平台不会犯这么明显的错误,比如上面提到的第二种情况,它就是在每天都有,但是不明显,就需要将这个渠道的流量从细分剥离出来,查看站内表现情况和访客属性特征方面去分析)

            另一个就是设备,目前在国内的移动端很多流量都会出现OPPO和Vivo这两个品牌的设备,多到让我怀疑人生,我一直认为这部分用户应该是三四线城市的,我一直觉得这些流量的可疑,有人用这些机子去开发批量模拟用户访问的设备。

5、从行为的角度

…………

更多案例请关注:一本关于Google Analytcs和Google Tag Manager的书

喜欢 (2)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址