在Google Analytics 4 可以使用不同类型的标识符识别用户,将其整合到统一的跨设备用户行为历程中,这些标识符统称为“身份空间”。
身份空间
GA4中引入一个身份空间的概念,事件和用户的相关联是使用所有可用的身份空间来处理的,可以理解为身份空间就是标识符,它包含User ID、Google Signal和设备ID,后面又增加“建模”。
User ID
就是你自己的ID体系,前提是需要布署才可以使用,是最准确的。
Google Signal
Google 信号是指来自网站和应用的会话数据,Google 会将这些数据与已登录 Google 帐号且已启用广告个性化功能的用户关联起来。如果用户通过谷歌账号登录,且开启广告个性化功能,也就是通过谷歌收集数据,你在GA4里开启Google Signal,那么帮你扩充数据,以便提供跨设备受众群体和数据洞见等附加功能。
Google Signal支持如下功能:
- 跨平台报告
- 再营销
- 广告报告功能
- 受众特征和兴趣
设备ID
代表单个匿名的网站用户或移动应用用户的基于浏览器或移动应用的标识符。
- 在网站上,设备 ID 从
_ga
Cookie 的客户端 ID 属性中获取值,其实就是Client ID。 - 对于APP,GA4会自动为应用的每个实例生成并分配一个应用实例 ID。该 ID 用于在整个分析中计算用户指标。 设备 ID 通过应用实例 ID 获取值。
还是跟以前的定义是一样,在BigQuery里就是user_pseudo_id字段。
建模
当用户在Consent mode拒绝跟踪的时候,GA4不能使用cookie发送数据,但会发送不使用Cookie的ping,收集非个人信息,这些区分不了用户,比如发送10个页面,你是不知道这是1个用户产生的,还是10个用户产生的,谷歌用于数据建模,补充数据。
将建模也放到身份空间,个人感觉不太合理。
- 混合:优先级顺序是用户 ID>谷歌信号>设备 ID>建模。如果已收集,则使用用户 ID。如果未收集任何用户 ID,则 Analytics 会使用来自 Google 信号的信息(如果有)。如果用户 ID 和 Google 信号信息均不可用,则 Analytics 使用设备 ID。如果没有可用的标识符,Analytics 将使用建模。
- 观察:优先级顺序是用户 ID>Google 信号>设备 ID。如果已收集,则使用用户 ID。如果未收集任何用户 ID,则 Analytics 会使用来自 Google 信号的信息(如果有)。如果用户 ID 和 Google 信号信息均不可用,则 Analytics 使用设备 ID。
- 基于设备:仅使用设备 ID 并忽略收集的所有其他任何 ID。
如果你选择其他类型,可能会遇到阈值问题,当数据太少的时候,没有超过阈值,为了保护用户隐私,数据会不显示。
这里一般建议设置为“基于设备”,这样能够避免阈值问题。
有关用户的指标
在GA4里侧重“活跃用户数”,有关用户的指标定义如下:
- 新用户数:有first_open的用户
- 活跃用户数:活跃用户是指进行过感兴趣的会话的用户
- 总用户数:基于Client ID去重