最近在复习R,买了两本书,参加一个在线课程,打算系统的过一遍,这一节关注R的数据结构,R中的数据结构主要有向量,矩阵,数组,数据框和列表。向量向量是R中最简单的数据结构了,有数值型,字符型,逻辑型和负数型。可以进行四则运算,函数运算,逻辑运算和切片操作,其中切片操作是最重要的,也是其他几种数据结构进行数据处理时常用的。矩阵矩阵是R中最常用到的数据结构……继续阅读 » Haran 8年前 (2017-11-16) 4392浏览 0评论0个赞
1、加载数据做成分分析:data9.2<-data.frame( x1=c(82.9,88.0,99.9,105.3,117.7,131.0,148.2,161.8,174.2,184.7), x2=c(92,93,96,94,100,101,105,112,112,112), x3=c(17.1,21.3,25.1,29.0,3……继续阅读 » Haran 9年前 (2016-09-27) 4501浏览 0评论0个赞
分别使用岭回归和Lasso解决上面回归问题当回归存在多重共线性的时候,可以使用最小二乘,岭回归,Lasso回归, 但当X的秩不存在的时候或变量的数量少于样本的数量是,作为无偏差估计的最小二乘就不适用,岭回归和Lasso回归更合适。过程:1、加载数据做中心化后做线性回归: 可以看到线性回归方程很不显著,存在多重共线性,下面做多……继续阅读 » Haran 9年前 (2016-09-17) 5107浏览 0评论1个赞