贤阅信息

宏基因组在复杂疾病中的应用习题说明

文件大小6.42 KB

文件格式docx

分享时间2023-07-06

更多此类文档

立即下载

文本内容:

宏基因组在复杂疾病中的应用习题说明某些复杂疾病因为通过传统方法诊断困难，而又因为肠道菌群或者其他部位的菌群与该种复杂疾病相关性较强，因此研究人员会使用与疾病比较相关的某些菌的数据来对疾病进行分类此次习题需要大家有一定的编程语言（R或者python等）以及统计学习基础本次习题不限方法，可以通过随机森林、lass或者其他方法对菌群数据进行筛选并且使用筛选后的菌群数据达到相对较好的疾病分类效果表中的数据包括四个表单因为保证判别模型的稳健性除模型训练样本外，还需要外部验证数据（此处的外部数据不参与训练模型的构建，只用于判断训练模型的效果）因此本次练习中包括两部分的数据，baseline和validationo各自分别表示基线样本和验证样本

1.表单baseline-group”为基线样本名称以及分组信息其中HC表示健康人，SCZ表示病人2表单“baseline・profile”为样本-菌群相对丰度数据，行名为肠道菌的名称，列名为样本名称

3.表单validation-group为基线样本名称以及分组信息其中HC表示健康人，SCZ表示病人4表单“validation-profile”为样本-菌群相对丰度数据，行名为肠道菌的名称，列名为样本名称提示.常用的模型随机森林，lass等.模型效果判断AUCAreaUnderCurve ROC曲线下与坐标轴围成的面积该值越接近1越好.注意过拟合的问题.注意需要对菌群数据进行筛选，即实现少量的菌也能达到较好的判别效果.R或者python中都有相应的包或者模块，请自行查阅。

更多此类文档

关于文档

贤阅信息

个人认证

贤阅信息

优秀文档

贤阅信息

获得点赞 0

{{userForDocInfo.isFavorite ? '已点赞':'赞一个'}}

{{userForDocInfo.isColle ? '已收藏':'加收藏'}}

文件大小6.42 KB

文件格式docx

分享时间2023-07-06

更多此类文档

立即下载

贤阅信息在线客服qq:2360752722 如有侵权请及时联系qq:2360752722

Copyright © 2022-2023 All Rights Reserved. 成都贤阅网络信息科技有限公司版权所有蜀ICP备2023003372号

用户协议 | 隐私政策 | 用户上传协议与声明

贤阅信息

在线客服qq:2360752722

如有侵权请及时联系qq:2360752722

Copyright © 2022-2023 All Rights Reserved. 成都贤阅网络信息科技有限公司版权所有蜀ICP备2023003372号

用户协议 | 隐私政策 | 用户上传协议与声明