当前位置: 首页 >  资讯中心  > 正文

LAASO的非癌症形态,LASSO的诊断分析

时间:2023-01-19 11:27:36     来源:哔哩哔哩

尔云间  一个专门做科研的团队

原创 小果 生信果

首先是准备两个数据集,一个是分组的数据,另一个是基因表达数据。


(资料图片仅供参考)

分组数据是两分组,用0和1表示。基因表达数据就是基因的表达量了,不过这里要注意的是行为样本,列为基因。

library(glmnet)#载入所需R包y <- read.table(file = "Y.txt",header = T,sep = "\t",row.names = 1)#载入分组数据x <- read.table(file = "X.txt",header = T,sep = "\t",row.names = 1)#载入表达数据x<-as.matrix(x)#建立矩阵数据y<-as.matrix(y)#建立矩阵数据y[1:5,]#数据预览x[1:5,]#数据预览set.seed(20201015)fit = glmnet(x, y, family = " binomial")#执行LASSO分析,这个参数就是用于二分组时的分析参数,做预后分析的时候就是coxpar(mar=c(5,5,3,2),cex = 0.8)plot(fit,cex.axis=1)#绘制LASSO曲线图cvfit = cv.glmnet(x, y, family = " binomial")#执行交叉验证par(mar=c(5,5,3,2),cex = 0.8)plot(cvfit,cex.axis=0.8)#绘制交叉验证图coef.min = coef(cvfit, s = "lambda.min")#提取lambda取最小值时的LASSO系数active.min = which(coef.min != 0)#提取不为0的LASSO系数index.min = coef.min[active.min]index.mincoef.min

最后得到两张图,如下图所示:

图一

图二

小果的这个数据最后是得到了5个基因,这样就可以对这些基因继续进行分析了。

这就是今天的主要内容了,希望对小伙伴们的分析有帮助,小果觉得这个还是挺实用的,小伙伴们觉得如何呢?小伙伴们有问题欢迎来和小果分享讨论啊。

推荐阅读

GEO数据到底需不需要标准化,看这里

miRNA靶基因的集大成者,miRWalk数据库

不做实验也能看到的显微图像,HPA数据库

简单使用ICGC数据库进行数据查询与下载

铁死亡基因的专属仓库,FerrDb数据库

shengxinguoer

生信果

生信硬核知识解答

和小果一起学生信

X 关闭

最新推荐

Copyright  © 2015-2022 海峡纸业网版权所有  备案号:皖ICP备2022009963号-10   联系邮箱:396 029 142 @qq.com