「Adobe Analytics」什么是哈希冲突&如何避免?

Adobe Analytics Haran 2天前 46次浏览 0个评论
文章目录[隐藏]

问题

你可能会遇到,有些eVar/Prop,本来不应该重复出现,但却重复出现,如Order ID,你可以看到有些Order ID出现了多次:

进一步分析时,会发现,相同的Order ID是在不同的行为流里产生,也就有不同的人,下了相同的订单。

而系统设计的Order ID是唯一,这就有冲突,是哪里出了问题呢?

 

原因

其实这是哈希冲突导致。

Adobe Analytics的维度收集到数据时,不管它的字符串是几个字节,还是几百个字节,为了提高性能,会将其转为哈希值存储,使用的是32哈希,理论上是有232个哈希组合(约43亿),但当这个维度的数据量比较多的时候,仍有可能会出现两个不同的值,计算的哈希值是一致,这就是所谓的哈希冲突

哈希冲突会出现在Workspace和ReportBuilder里。

 

解决方法

  • 使用Warehouse,Warehouse不受哈希冲突影响。
  • 更改时间范围:缩短时间范围,减少出现重复的可能
  • 减少唯一值的数量,减少出现重复的可能

如有疑问,可以在文章底部留言或邮件(haran.huang@ichdata.com) 我~
喜欢 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址