• 加入Google Analytics、Google Tag Manager QQ群一起交流谷歌分析小站—总群
  • 加入Adobe Analytics、Adobe Launch交流群,加入请附上Adobe的组织ID,没有请勿加Adobe Analytics交流群
  • Google Analytics和Google Tag Manager视频课程第三版http://ke.ichdata.com/course/50

用户的唯一性识别

RTB GA小站 11个月前 (07-16) 1816次浏览 已收录 0个评论

不同的设备终端数识别的人方式不同,基本原则都是通过尽量通过各种唯一的ID去作为人的唯一标识,具体如下表:

终端识别方式主流方式
WebIP、MAC地址、CookieCookie
Wap/H5IP、MAC地址、Cookie、浏览器指纹Cookie
IOS端IMEI、UDID、UUID、OPEN-UDID 、MAC、IDFV、IDFAIDFA
Android端IMEI、MAC、ADID、DEVICE_ID,ADDROID_ID……IMEI
OTT基于IOS或Android,声纹IDFA/IMEI

Web

Web是网络最早的终端,早期的识别是基于有什么,能获取到什么?

IP

IP的全称是Internet Protocol,中文名为互联网协议地址,是分配给用户上网使用的网际协议 的设备的数字标签。常见的IP地址分为IPv4与IPv6两大类。IP的唯一性使得曾被作为用户的唯一标识,但由于后来网络环境的复杂,使得IP唯一标识的特征被弱化,如同一家公司的是一个IP出口访问互联网,但是很多人在使用;动态IP和IP偏移使得IP识别用户的准确度大大下降,另外,各国政府立法将IP作为PII信息使得整个信息变得很敏感。

但目前国内的百度统计仍然提供IP这个维度的数据,国内的用户群喜欢了IP这个维度,但是不依赖于IP识别用户的,百度统计是通过访客标识码识别用户,百度统计根据访客的访问设备、系统环境、cookie等参数生成的一个用于识别唯一访客的标记。

MAC

MAC网卡信息,其实是一串字符号,每个网卡厂家自己编码上去的,MAC网卡地址虽然看似唯一,但实际上并不唯一,MAC协议只是保证本地唯一,而全局不唯一,就像你的中国身份证是1000,美国也有个身份证是1000,但是明显你们是两个不同的人,所以MAC不适合作为唯一标识。

Cookie

Cookie是能够让网站服务器可以从客户端存储或读取少量数据的一种技术,一般以小文件的形式存储,可以实现个人信息的记录,是的web的访问是连续性的,简单的就是原有的互联网是无状态的,你访问A页面后访问B页面,服务器是不知道是同一个人,但有了Cookie就知道了。

在Web发展初期的时候,浏览网页只涉及一系列独立页面的获取,浏览器请求服务器,服务器返回响应。但是当浏览器下次请求这个服务器时,服务器并不知道已经浏览器请求过它,这被称作HTTP无状态

Cookie能够很好的解决HTTP无状态的问题,但是这项技术因的隐私安全问题也带来很多争议的,但毫无以为,Cookie是精准营销的基础。

Cookie还可以分为第一方cookie和第三方cookie,第一方cookie是你访问的站点域名和生成的cookie的主域是一样的,如你访问www.ichdata.com,生成一个属于ichdata.com的,那这个就是第一方cookie;如果不一致就是第三方cookie,如你访问www.ichdata.com,生成一个baidu.com的cookie,那这个就是第三方cookie,第三方cookie常用广告的监测跟踪。

Cookie总是保存在客户端中,按在客户端中的存储位置,可分为内存Cookie和硬盘Cookie,对应的分为会话cookie和持久cookie。会话cookie是一种临时cookie,用户退出浏览器,会话Cookie就会被删除了,持久cookie则会储存在硬盘里,保留时间更长,关闭浏览器,重启电脑,它依然存在。

一般来说,我们将分为Http cookie、Flash Cookie和Ever Cookie。

HTTP Cookie

HTTP Cookie通常也叫做网站cookie,浏览器cookie。通过HTTP的Set-Cookie消息头,Web服务器可以指定存储一个cookie,通过Set-Cookie指定的选项只是应用于浏览器端,容易被清除,如果清除浏览器就识别不到。

Cookie的也存在一些缺陷

  • Cookie会被附加在每个HTTP请求中,所以无形中增加了流量。
  • 由于在HTTP请求中的cookie是明文传递的,所以安全性成问题。(除非用HTTPS)
  • Cookie的大小限制在4KB左右。对于复杂的存储需求来说是不够用的。
  • 跨域没法读取和写入Cookie的

Flash Cookie

FlashCookie是由FlashPlayer控制的客户端共享存储技术,即使清空浏览器所有隐私数据,这类顽固的Cookie还会存在硬盘上,但它只受Flash管理。

相比起Http Cookie,Flash Cookie具有更加强大的特性:

  • 容量更大,Cookies仅允许存储4KB,Flash Cookie可以容纳最多100千字节的数据
  • Flash Cookie没有默认的过期时间,HTTP Cookies是有消亡期的,它会在一段时间后自动消失;而Flash Cookies并不,如果你没有删除它,它就永远保留在你的电脑上。
  • Flash Cookie将被存储在不同的地点,这使得它们很难被找到,连这个Cookie文件放在哪里都不知道,更别说删除,就是这么神奇,实际还是可以删除,但难度增加不是一个等级

但后来这种技术被各大浏览器默认禁止而失去了作用。主要原因是Adobe Flash本身存在大量安全漏洞,并且越来越多的网站开始选择不再支持AdobeFlash以确保稳定和安全。

Ever Cookie

Ever Cookie是由Samy Kamkar开发的一组js Api,它的目的在于持久化cookie,即使用户清除标准cookie、Flash cookie等之后依然能够获取设置过的数据,并且重新恢复清除掉的cookie。

Evercookie是通过将cookie数据存储在尽可能多的浏览器存储机制上来实现的。 如果从任何存储机制中删除cookie数据,只要一个仍然完好无损,evercookie就会在每个机制中积极地重新创建它。

当你删除了其中的一种或多种cookie时,evercookie会尝试使用每一种可能的机制来重新创建它。这也就意味着,你访问过了某个使用evercookie的网站之后,就算你认为你已经清除了所有cookie,那么你再次访问该网站时,它仍然可能会识别出你的身份。杀不死的小强,如使用Chrome(谷歌浏览器)的隐身浏览模式,不一定能使evercookie失效。

不足或注意点:

  • 对用户上网隐私具有极大的潜在破坏力
  • 会有大量的HTTP请求,因为要尽可能的在各个位置设置cookie

 

Cookie是最适合作为用户识别,但目前也面临各种问题,如浏览器隐私状态访问,ITP规则的升级,欧洲GDPR的实施……对现有的以Cookie作为用户标识的跟踪体系造成了巨大的挑战。

 

Wap

 

浏览器指纹

WAP除了具备WEB的识别方式,还多一种识别方式,那就是浏览器指纹,浏览器中有多个特征信息,将这些信息综合分析计算后,可对客户端进行唯一性识别,进而锁定、追踪。设备指纹现在被很多互联网反欺诈公司拿来作为用户特征识别的方法,也被一些广告公司用来跟踪用户数据。

浏览器指纹分为普通指纹、高级指纹、硬件指纹和综合指纹。

基本指纹

基本指纹是指浏览器具有的特征标识,如浏览器中的插件,字体,UA头文件,位置设置,时区设置,防追踪选项是否打开,是否开启了广告拦截等可以标识用户的信息,这些我们称之为基本指纹。

高级指纹

高级指纹是指通过H5的高级技术来实现的,利用硬件和软件的差异生成不同的哈希值作为标识,如Canvas和AudioContext。Canvas的原理是相同的HTML5 Canvas元素绘制操作,在不同操作系统、不同浏览器上,产生的图片内容不完全相同,也就是基于各种因素生成一个唯一的对应的hash值,这个就是用户标识,你可以访问https://browserleaks.com/canvas 去看看自己的标识。

硬件指纹

硬件指纹就是获取硬件的一些信息作为用户特征,如CPU,GPU,摄像头,GPS……逻辑类似基本指纹,但硬件的重复率较高。

综合指纹

综合指纹就是综合应用前面的几种指纹技术去匹配或生成唯一的标识符,降低重复率。

目前Canvas是使用最多的,很多网站在使用的,但是由于影响指纹的参数有很多,所以稍微有一点差异会导致hash值不同,另一个就是目前有些浏览器已经关注到Canvas隐私保护问题,已经屏蔽了Canvas,使用的时候需要用户授权。

所以目前并不能替代Cookie,可以和Cookie结合使用,如果用户屏蔽了Cookie,那么用Canvas指纹。

 

IOS端

 IOS是一个封闭的生态环境,你能用什么ID去作为唯一标识符取决于苹果开放了什么。

IMEI

         IMEI,全称是International Mobile Equipment Identity,中文名为国际移动设备识别码,即通常所说的手机序列号、手机“串号”,用于在移动电话网络中识别每一部独立的手机等移动通信设备,相当于移动电话的身份证。早期的苹果是可以通过IMEI作为用户标识的,但是在IOS5以后就不是了,曾经发生过有手机厂商将整批手机都是用同一个IMEI的的情况,现在已经获取不到了。

UDID

         UDID,全称Unique Device Identifier的缩写,中文意思是设备唯一标识,它由40个字符的字母和数字组成。非唯一,可修改,于2013年5月禁用。

在iOS5中可以获取到设备的UDID,iOS7中已经完全的禁用了它。iOS7之前的使用了的app如果在iOS7上运行,它不会返回设备的UDID,而是会返回一串字符串,以FFFFFFFF开头,跟着identifierForVendor的十六进制值。

UUID

         UUID,全称是Universally Unique Identifier,中文意思是通用唯一识别码. UUID的目的,是让分布式系统中的所有元素,都能有唯一的辨识资讯,但是在用户重装或升级的时候UUID会不一样。

Open-UDID

Open-UDID,设备的识别码,每台iOS设备的Open-UDID是通过第一个带有Open-UDID SDK包的App生成,不同APP之前可以通过剪贴板复制黏贴传递。

MAC

MAC,硬件标识符,包括WiFi mac地址和蓝牙mac地址。iOS 7 之后被禁止,13年9月份iOS7的发布,苹果又采取别的措施,获取到的Mac地址在iOS7上都是相同的值,并且对剪贴板进行限制,同时禁止的还有Open-UDID。

IDFV

         IDFV,全称Identifier For Vendor,中文名为应用开发商标识符,根据vendor的值,如果vendor相同,则返回同一字符串;如果vendor不同,则返回不同的字符串。Vender是指应用提供商,就是开发者。适用于对内分析用户在应用内的行为等。

IDFA

         IDFA,全称Identifier For Advertising,iOS独有的广告标识符。在iOS 6 时面世,可以监控广告效果,同时保证用户设备不被APP追踪的折中方案。这个值不是唯一确定的!也就是说用户可以根据自己的意愿来还原或者禁止获取这个值。如系统重置、在设置里还原广告标识符; 用户可以在设置里打开“限制广告跟踪”。

        用户的唯一性识别

 目前IOS的用户识别是基于IDFA。

 

 

Android端

         Android的由于限制没有IOS的严格,所以各种ID都可以用,但是各个手机厂家做了深度的定制和优化,又有各种限制的存在,导致的麻烦不比IOS的少。

         除了IMEI和MAC是跟IOS一样的原理,Android还提供有DEVICE_ID,ANDROID_ID,ADID。

DEVICE_ID

DEVICE_ID,Android系统为开发者提供的用于标识手机设备的串号,非手机设备不适用。

ANDROID_ID

ANDROID_ID在设备首次启动时,系统会随机生成一个64位的数字,并把这个数字以16进制字符串的形式保存下来,这个16进制的字符串就是ANDROID_ID。不同的设备,ANDROID_ID可能会相同;重置会导致ANDROID_ID不同。

ADID

ADID,谷歌对标苹果的IDFA的一个东西,但是需要结合Google的其他产品来使用,由于大陆地区使用不了,所以获取不到这个ID,这个ID对大陆地区的废的。

综上,Android主要使用的识别ID是IMEI。

 

OTT

            OTT全称是Over The Top,是指基于开放互联网的视频服务,终端可以是电视机、电脑、机顶盒、PAD、智能手机等等,现阶段主要的就是电视了,OTT设备都有系统的,所以它能用什么识别取决于使用的系统。

         另外,由于OTT设备上比较兴起的是语音交互,有些厂家就引申出声纹识别,通过用户的声音去识别,原理就是前面的高级指纹类似

 

线下识别——Face ID

人脸识别,目前已经有比较成熟的解决方案提供商的,如旷视,可以用线下智慧营销的数据采集,如在商超入口,店铺里面VIP到店提醒,人群分析,实现线下店铺智慧化营销和线上数据的打通,目前比较权威数据有两个来源,一个是政府部门的,每次匹配都需要付费,一个是腾讯的,作为社交网站的腾讯,腾讯拥有全国八九成人口的过去十几年的脸部的变化的数据,目前腾讯是有基于人脸识别的智慧商城系统,但不知道是不是基于过去十余年的人脸数据为基础的。

喜欢 (2)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址