尔云间一个专门做科研的团队

原创小果生信果

首先是准备两个数据集，一个是分组的数据，另一个是基因表达数据。

(资料图片仅供参考)

分组数据是两分组，用0和1表示。基因表达数据就是基因的表达量了，不过这里要注意的是行为样本，列为基因。

library(glmnet)#载入所需R包y <- read.table(file = "Y.txt",header = T,sep = "\t",row.names = 1)#载入分组数据x <- read.table(file = "X.txt",header = T,sep = "\t",row.names = 1)#载入表达数据x<-as.matrix(x)#建立矩阵数据y<-as.matrix(y)#建立矩阵数据y[1:5,]#数据预览x[1:5,]#数据预览set.seed(20201015)fit = glmnet(x, y, family = " binomial")#执行LASSO分析，这个参数就是用于二分组时的分析参数，做预后分析的时候就是coxpar(mar=c(5,5,3,2),cex = 0.8)plot(fit,cex.axis=1)#绘制LASSO曲线图cvfit = cv.glmnet(x, y, family = " binomial")#执行交叉验证par(mar=c(5,5,3,2),cex = 0.8)plot(cvfit,cex.axis=0.8)#绘制交叉验证图coef.min = coef(cvfit, s = "lambda.min")#提取lambda取最小值时的LASSO系数active.min = which(coef.min != 0)#提取不为0的LASSO系数index.min = coef.min[active.min]index.mincoef.min

最后得到两张图，如下图所示：

图一

图二

小果的这个数据最后是得到了5个基因，这样就可以对这些基因继续进行分析了。

这就是今天的主要内容了，希望对小伙伴们的分析有帮助，小果觉得这个还是挺实用的，小伙伴们觉得如何呢？小伙伴们有问题欢迎来和小果分享讨论啊。

推荐阅读

GEO数据到底需不需要标准化，看这里

miRNA靶基因的集大成者，miRWalk数据库

不做实验也能看到的显微图像，HPA数据库

简单使用ICGC数据库进行数据查询与下载

铁死亡基因的专属仓库，FerrDb数据库

shengxinguoer