原创 小果 生信果
首先是准备两个数据集,一个是分组的数据,另一个是基因表达数据。
(资料图片仅供参考)
分组数据是两分组,用0和1表示。基因表达数据就是基因的表达量了,不过这里要注意的是行为样本,列为基因。
library(glmnet)#载入所需R包y <- read.table(file = "Y.txt",header = T,sep = "\t",row.names = 1)#载入分组数据x <- read.table(file = "X.txt",header = T,sep = "\t",row.names = 1)#载入表达数据x<-as.matrix(x)#建立矩阵数据y<-as.matrix(y)#建立矩阵数据y[1:5,]#数据预览x[1:5,]#数据预览set.seed(20201015)fit = glmnet(x, y, family = " binomial")#执行LASSO分析,这个参数就是用于二分组时的分析参数,做预后分析的时候就是coxpar(mar=c(5,5,3,2),cex = 0.8)plot(fit,cex.axis=1)#绘制LASSO曲线图cvfit = cv.glmnet(x, y, family = " binomial")#执行交叉验证par(mar=c(5,5,3,2),cex = 0.8)plot(cvfit,cex.axis=0.8)#绘制交叉验证图coef.min = coef(cvfit, s = "lambda.min")#提取lambda取最小值时的LASSO系数active.min = which(coef.min != 0)#提取不为0的LASSO系数index.min = coef.min[active.min]index.mincoef.min
最后得到两张图,如下图所示:
图一
图二
小果的这个数据最后是得到了5个基因,这样就可以对这些基因继续进行分析了。
这就是今天的主要内容了,希望对小伙伴们的分析有帮助,小果觉得这个还是挺实用的,小伙伴们觉得如何呢?小伙伴们有问题欢迎来和小果分享讨论啊。
推荐阅读
GEO数据到底需不需要标准化,看这里
miRNA靶基因的集大成者,miRWalk数据库
不做实验也能看到的显微图像,HPA数据库
简单使用ICGC数据库进行数据查询与下载
铁死亡基因的专属仓库,FerrDb数据库
shengxinguoer
生信果
生信硬核知识解答
和小果一起学生信
X 关闭
Copyright © 2015-2022 海峡纸业网版权所有 备案号:皖ICP备2022009963号-10 联系邮箱:396 029 142 @qq.com