还剩1页未读,继续阅读
文本内容:
成都市第五人民医院科研项目检测分析服务及实验耗材供应项目技术参数一基本要求测序平台IlluminaNovaseqPE15O测序设备TruSeqNanoDNALTLibraryPrepKit、Q5@High-FidelityDNAPolymerase、Quant-iTPicoGreendsDNAAssayKit、AgilentHighSensitivityDNAKit、AgilentBioanalyzerinstrument、PromegaQuantiFluor;更高的数据质量Q2090%Q3085%数据量10Gb/样本免疫荧光检测设备修复仪、CV数字切片扫描仪WB检测设备高速低温组织研磨仪、热循环仪、化学发光凝胶成像仪、全功能酶标仪、电泳仪RT-PCR检测设备酶标仪、实时荧光定量RT-PCR仪二信息分析内容
1、数据质控本项目基于IlluminaNovaSeq/HiSeq高通量测序平台,采用全基因组鸟枪法WholeGenomeShotgunWGS策略,将提取获得的菌群宏基因组总DNA或宏转录组以mRNA为模板合成的CDNA双链随机打断为短片段,并构建合适长度的插入片段文库,对这些文库进行双端Paired-endPE测序首先对高通量测序下机的双端序列原始数据进行质量筛查,去除非目的序列,获取可用于下游宏基因组分析的高质量数据集Cleandata接着,对高质量序列进行宏基因组序列拼接组装,构建基因组Contigs和Scaffolds序列集,并进行基因预测,获得非冗余蛋白序列集随后,对蛋白序列用多种常用数据库进行功能注释,获得各等级的功能类群丰度谱并进行功能组成分析、多样性分析、差异分析等同时,我们也对高质量数据集拼接序列进行物种注释获得种以及种以下精细水平的物种组成谱,并进行物种组成分析、多样性分析、差异分析等通过多种多种数据可视化和交互式工具,绘制具备论文发表水准的二维/三维图表,全方位、客观地呈现以上分析结果具体处理步骤如下
2、生物信息学分析原始数据的质量控制原始数据质量概况原始数据质量评估原始数据质量控制非目的片段的去除基于非拼接序列的物种注释非拼接物种注释方法简介非拼接物种注释非目的序列过滤序列拼接拼接方案简介有效序列拼接合并拼接重叠群去冗余基丁拼接序列的物种注释重叠群比对与物种注释非目的重叠群的过滤基于拼接的物种丰度表基因预测蛋白功能注释KEGG注释EggNOG注释GO注释CAZy注释NRSwi与Prot数据库比对
3、物种组成谱分析物种组成分析分类学组成分析基于MEGAN的分类组成可视化基于GraPblAn的分类组成可视化(样本数>3)基于Krona的分类组成交互展示优势物种的关联网络分析(样本总样本数>10推荐大于20)物种Alpha多样性分析物种Beta多样性分析PCA主成分分析(样本数>3;建议样本数>10)PCoA主坐标分析(样本数>3;建议样本数>10)NMDS非度量多维尺度分析(样本数>3;建议样本数>10)UPGMA层次聚类分析(样本数>3;建议样本数>10)物种差异分析341物种韦恩图(样本数/分组数>2且V5)物种差异分析(分组>2切每组样本数>3)343差异物种聚类热图(样本数〉3建议样本数>10)LEISe分析(分组>2且每组样本数>3)PLS-DA分析(分组>2最大分组样本数不少于4)随机森林分析
4、功能水平分析功能类群丐代谢通路统计功能与代谢通路组成分析功能Beta多样性分析PCA主成分分析(样本数>3;建议样本数〉10)PCoA主坐标分析(样本数>3;建议样本数>10)NMDS非度呈多维尺度分析(样本数>3;建议样本数>10)UPGMA层次聚类分析(样本数>3;建议样本数>10)组间差异分析(样本数>3;建议样本数>10)功能一物种一致性分析(分组〉2;建议样本数>10)功能差异分析.共有功能类群分析(分组>2;建议样本数>10)功能单元差异分析(分组>2;建议样本数>10)KO的代谢通路映射图(分组>2;建议样本数>10)差异功能单元聚类热图(分组>2;建议样本数>10)富集分析(分组>2;建议样本数>10)LEfSe分析(分组>2;建议样本数>10)PLS-DA分析(分组>2;建议样本数〉10)随机森林分析(分组>2;建议样本数>10)。