分别使用岭回归和Lasso解决上面回归问题当回归存在多重共线性的时候,可以使用最小二乘,岭回归,Lasso回归, 但当X的秩不存在的时候或变量的数量少于样本的数量是,作为无偏差估计的最小二乘就不适用,岭回归和Lasso回归更合适。过程:1、加载数据做中心化后做线性回归: 可以看到线性回归方程很不显著,存在多重共线性,下面做多……继续阅读 » Haran 9年前 (2016-09-17) 5321浏览 0评论1个赞
网址:https://book.douban.com/tag/%E5%B0%8F%E8%AF%B4现在将单线程版改为多线程运行:可以到看到运行时间不到1分钟,相较单线程版的5~6分钟,速度提高了6倍源码如下:from bs4 import BeautifulSoupimport requestsimport osimport urlli……继续阅读 » Haran 9年前 (2016-09-13) 4192浏览 0评论1个赞
数据驱动的背后是AB测试,AB测试这种方法在国内外互联网公司里面广泛应用于产品更迭。这一节聊聊AB测试的流程,还有其中的注意点,以便更好去使用Google Optimize或Adobe Target去做AB测试,不然很多人在用Optimize作AB测试,其实都没有遵循一些统计原理,也就不够科学的。提出假设AB测试的第一步是分析业务数据,确定当前最关键的……继续阅读 » Haran 9年前 (2016-09-09) 6877浏览 0评论1个赞
GA4因为其强大的功能而备受一些企业的青睐,但由于是免费的,GA4提供的数据存在抽样的,导致数据的准确大大降低,但GA4也提供一些API接口给用户,通过GA4 API分页查询功能能降低抽样的比例,甚至是没有抽样。Python这一篇介绍Python连接Google Analytics 4 API获取数据。启用API Google Cloud里新建项目……继续阅读 » Haran 9年前 (2016-09-09) 8835浏览 2评论5个赞
数据集 ex14.csv 是关于中国各个省份的三项指标数值。请根据这些指标数值,将各个省份分为3类,并尝试归纳出各个类别的特点查看数据图形分布:# coding=utf-8import osimport pandas as pdfrom sklearn.cluster import AgglomerativeClusteringfr……继续阅读 » Haran 9年前 (2016-09-07) 11072浏览 0评论7个赞
更新时间:2024年12月10号认识版本版本是容器配置在特定时间的快照。您可以随时将工作区的当前状态保存为一个版本。这样您就可以在必要时将工作区恢复到之前的版本。需要注意,需要具备容器「批准」或「发布」级别的权限,你才可以创建和发布版本。 版本的界面预览在GTM里点击「版本」,就可以看到版本的界面: 版本界面主要分为两部……继续阅读 » Haran 9年前 (2016-09-05) 4817浏览 0评论0个赞
1、 读入数据做时序图# -*- coding: UTF-8 -*- import pandas as pdimport matplotlib.pyplot as pltfrom statsmodels.graphics.tsaplots import plot_acffrom statsmodels.tsa.stattools ……继续阅读 » Haran 9年前 (2016-09-04) 11142浏览 0评论5个赞
更新时间:2024年10月25号这一篇介绍邮件跟踪,分为两部分:邮件流量跟踪:可以知道特定系列邮件带来的流量有多少邮件打开跟踪:可以知道邮件的打开情况,估EDM的打开情况。邮件流量跟踪邮件流量跟踪是基于UTM,只需要在邮件中有可点击链接的位置添加UTM就可以,对应的UTM就可以追踪到邮件的打开情况。延伸阅读:如何使用UTM参数追踪推广渠道数据……继续阅读 » Haran 9年前 (2016-08-21) 7969浏览 2评论0个赞
data2 是关于重伤病人的一些基本资料。自变量X是病人的住院天数,因变量Y是病人出院后长期恢复的预后指数,指数数值越大表示预后结局越好。尝试对数据拟合合适的线性或非线性模型过程:1、通过散点图可以判断可能可以使用的模型有:线性回归,对数,指数和冥指数回归# -*- coding: utf-8 -*-import pandas as pdfr……继续阅读 » Haran 9年前 (2016-08-10) 7677浏览 0评论0个赞
更新时间:2025年4月30号这一篇介绍如何找回Google Analytics 4账号的管理权限,适用于管理员账号丢失的情况。证明网站所有权首先需要验证网站是你的,在网站的根路径下创建analytics.txt文件,填入如下格式的资料:GooGhywoiu9839t543j0s7543uw1 - pls add {INSERT EMAIL ADDR……继续阅读 » Haran 9年前 (2016-08-09) 6983浏览 0评论0个赞
更新时间:2025年5月20号这一篇介绍GA4中的修改事件。认识修改事件修改事件是对现有的事件做修改,如可以修改事件名称,事件参数。修改最多可以创建50个。 设置过程演示GA4里的增强型衡量事件内置有对跳出链接的跟踪,事件名称是click,这个名称不太直观,打算改为outbound_link_click。设置修改事件在GA4中点……继续阅读 » Haran 9年前 (2016-08-08) 4817浏览 0评论0个赞
不建议使用这种方式这一节要介绍一种特别的事件跟踪方法,如果你学会这个,那你完全可以抛开开发,但这个需要你掌握js,下面进入正题。原理通过GTM中的自定义html注入js,给相关跟踪位置添加上属性,然后通过GTM里面控制触发的顺序,这样这个事件跟踪就已经添加上页面的html代码了,当你触发的时候就会发送事件。示例演示下面以点击“关于作者”做事件跟踪为……继续阅读 » Haran 9年前 (2016-08-08) 7154浏览 2评论0个赞