• 加入Google Analytics、Google Tag Manager QQ群166794226一起交流,加入请附上"GA小站",没有不通过
  • 加入Adobe Analytics、Adobe Launch QQ交流群92602018,加入请附上Adobe的组织ID,没有请勿加
  • Google Analytics和Google Tag Manager视频课程第三版http://ke.ichdata.com/course/50

数据驱动归因的几个算法

Google Analytics GA小站 2个月前 (06-16) 284次浏览 已收录 0个评论

数据驱动归因,英文是Data-Driven Attribution,简称DDA,或数据驱动归因模型,英文是Data-Driven Attribution Models,简称DDAM,也叫算法归因

自Google 宣布即将推出归因模型以来,广告主对新的数据驱动模型表现出很大兴趣。

Google于2013年推出了Google Analytics Premium的数据驱动归因模型,并于2014年在AdWords中发布了该模型。

数据驱动归因是一种基于机器学习的归因模型,与基于规则的归因模型不同,数据驱动归因使用所有可用的路径数据,包括路径长度,曝光顺序和广告素材,来了解特定营销接触点的存在如何影响用户转化的可能性以更好地将功劳分配给任何接触点。

数据驱动归因是基于算法的,要想使用数据驱动归因,数据量需要积累到一定的规模才可以使用,目前数据驱动归因可在Google营销体系中的多个平台上使用:Google Attribution 360,Google Analytics 360,DoubleClick和AdWords,不同平台对数据量的要求是不一样的,如下:

数据驱动归因的几个算法

算法或机器学习中有两大类算法:分类和回归,转化可以用0和1来表示,那么算法归因实际是一个分类问题,理论上能用于分类的算法都可以用于算法归因的。实际常用的算法有马尔科夫链、沙普利值、生存分析和Harsanyi Dividend

前面三个算法在学精算的有涉及到,马尔科夫链是随机过程,沙普利值是计算投资组合,生存分析是寿险精算,但都只记得个名字了🤦‍♀️

具体的算法原理和实现过程有兴趣自己去谷歌一下吧。

Markov Chain:马尔科夫链

马尔可夫链因俄国数学家Andrey Andreyevich Markov得名,为状态空间中经过从一个状态到另一个状态的转换的随机过程。该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关。这种特定类型的“无记忆性”称作马尔可夫性质。

Shapley Value:沙普利值

Shapley Value是由经济学诺贝尔奖获得者Lloyd S. Shapley开发的,它是一种在团队成员之间公平分配团队产出的方法。对于以数据为依据的归因,要分析的“团队”具有营销接触点(例如自然搜索,展示和电子邮件)作为“团队成员”,而团队的“输出”就是转化。数据驱动的归因算法计算每个营销接触点的反事实收益,即,将暴露于这些接触点的相似用户的转换概率与路径中未出现接触点之一的概率进行比较。

Survival Analysis:生存分析

生存分析是研究生存现象和响应时间数据及其统计规律的一门学科。是将事件的结果和出现这一结果所经历的时间结合起来分析的一种统计分析方法,目前在多个方面都有应用。

Harsanyi Dividend

Harsanyi Dividend是沙普利值的延伸。可能只有Adobe使用,网络上的信息非常少,Adobe也只是文档放了两个原文链接。

请参阅原文:

  • Shapley, Lloyd S. (1953). A value for n-person games. Contributions to the Theory of Games, 2(28) , 307-317.
  • Harsanyi, John C. (1963). A simplified bargaining model for the n-person cooperative game. International Economic Review 4(2) , 194-220

业界使用情况

目前国际一线互联网公司,谷歌系的产品用的是基于Shapley值,如Google Attribution 360,Google Analytics 360,DoubleClick和AdWords,是要付费产品才可以使用,但是在Google Analytics归因工具的测试版里面也可以使用数据驱动归因
数据驱动归因的几个算法

Facebook也有使用归因算法,但并未公布使用的具体算法是哪个,只是说定期更新算法模型,Facebook的是预估增量影响为各个触点分配转化功,且只能衡量 Facebook、Instagram、Audience Network 和 Messenger 上的营销活动,我估计用的是增量模型(Uplift Modeling),这个模型在腾讯和阿里都有应用
Adobe Analytics是基于Harsanyi Dividend
国内有些公司使用的是Markov Chain。
参考内容:
https://docs.adobe.com/content/help/en/analytics/analyze/analysis-workspace/panels/attribution/algorithmic.html
https://maxket.com/attribution-shapley-value-vs-markov-chain/
https://www.merkleinc.com/emea/blog/data-driven-attribution-models-across-google-platforms

喜欢 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址