还剩2页未读,继续阅读
文本内容:
系统进化分析实习四系统进化分析--phylip
一、实习目的phylip掌握利用、、和法构建进化树学会使用检验进化树的可靠性
1.mp mlnj/upgma fm
二、实习内容
2.bootstrap查找同源蛋白质或核酸序列利用做前期准备工作
1.利用、、和构建进化树
2.clustalx
三、作业
3.mp mlnj/upgma fm任意选取五个以上的物种的同源核酸或蛋白质序列,分别采用最大简约法,最大似然法和距离法构建进化树,给出简洁的步骤和必要的图示,并分析这三种方法的差别答步骤如下
一、查找同源序列在搜索(谷光氨肽过氧化氢酶)、protein、、、、、entrez glutathioneperoxidasehomosapiens和同源蛋白质序列,输出同源序列pantroglodytes canisfamiliaris bostaurus musmusculus rattusnorvegicus
二、构建系统进化树gallusgallus daniorerio
(一)前期准备工作用进行多条序列比对,在选定格式,构建进化树需要文件
1.clustalx outputformatoptionphy图phy打开软件,选择刚才生成的文件1图
2.seqboot phy设置参数,如图,在执行程序得到文件,将文件名改成2图
3.3outfile seqb
(一)最大简约法建树()3maximumparsimony打开,将刚才生成的文件名输入,按,改选项为分析,其它参数不变,再根据提示设置数据个数为,随机数种子
1.protpars seqbenter m为,设置为,再按,得到的界面如下multipledatasets1005numberoftimestojumble2enter图1图参数设置4运行将生成两个文件和,将更名为,将更4名为用写字板打开,如下图;用打开后,得
2.outfile outtree outfile mpfileouttree到下图,可以看到这两个文件都含有个进化树图、是其中任一一个mptree mpfile5mega
5.05mptree610056danioreriogallusgallcanisfamilbostauruspantroglodhomosapienrattusnorvmusmusc图图ulu打开(将多个伪样本建成的不同树,根据原则,得出一致5oneofmpfile6oneofmptree树)软件,将刚才生成的文件输入生成两个文件和
3.consense majority可用记事本打开,可用打开将两个文件更名为mptree outfile outtree和,这就是采用方法,并使用检验,最后得到的最优树outfile outtree mega
5.05cmpfile如下图cmptree mpbootstrap710010099100rattusnorvmusmusculuhomosapienpantroglod8093bostauruscanisfa图最优树milgallusgalldaniorerio
(二)最大似然法建树()7mp打开软件将刚才生成的文件输入,更改选项为分析多个数maximumlikelihood据参数设置和法相同,不再赘述
1.protml seqbm生成两个文件和将更名为,将更名为mp用记事本和分别打开,可以看到这两个文件都含有个进化
2.outfile outtreeoutfile mlfileouttree树图、为其中之一mltree mega
5.05100892rattusnorvgallusgalldanioreriobostauruscanisfamilhomosapienpantroglodmusmusc图图ulu
0.02打开软件,将刚才生成的文件输入,生成两个文件和89可用记事本打开,可用打开将两个文件更名
3.consense mltreeoutfileouttree outfile outtree mega
5.05为和这是我们采用方法,并使用检验,得到的最优树cmlfile cmltree.ml bootstrap100569910095rattusnorvmusmusculudanioreriogallusgallbostaurus98canisfamilp图最优进化树antroglodhomosapien
(三)距离法建树()10ml打开软件,将刚才生成的文件输入,更改选项为分析多个数distancemethod据,参数设置和、法相同,运行后生成文件该文件包含了与输入
1.protdist seqbm文件相同的个,只不过每个伪样本是以两两序列的进化距离来表mp mloutfile示,将改名为100replicate图用程序计算出来的序列两两之间的距离outfile distfile执行软件,这个软件包括了和两种建树方法将上一步生成11protdist的输入,更改,选择建树方法,更改选项为分析多个数据,生成两个
2.neighbor njupgma文件和将其分别更名为和distfile nm用记事本和打开后,可以看到这两个文件都含有个进化树图outfile outtreenjfile/upgmafile njtree/upgmatree、为任意一个mega
5.0510012133pantroglodhomosapiencanisfamilbostaurusrattusnorvmusmusculugallusgalldaniore图图rio
0.05再将文件输入软件,得到两个文件和1213可用记事本打开,可用打开将两个文件更名
3.njtree/upgmatree consenseoutfile为和这是我们采用方法,并使outtreeoutfileouttreemega
5.05用检验,得到的最优树cnjfile/cupgmafile cnjtree/cupgmatree.nj/upgmabootstrap1009910010099danioreriogallusgallrattusnorv100musmusculucanisfamilbostauru图方法最优树shomosapienpantroglod执行软件,将输入,更改选项为分析多个数据,生成两个文件14nj/upgma和将其分别更名为和用记事本和打开
4.fitch distfilem后,可以看到这两个文件都含有个进化树outfileouttreefmfile fmtreemega
5.05100pantroglodhomosapienbostauruscanisfamildanioreriogallusgallrattusnorvmusmusc图图ulu1516再将文件输入软件,得到两个文件和可用记事本打开,可用打开将两个文件更名为和
5.fmtree consenseoutfileouttreeoutfile这是我们采用方法,并使用检验,得到的最优树outtree
0.02mega
5.05cfmfilecfmtree.fm bootstrap4pantroglod10096100musmusculurattusnorvgallusgall100danioreriobostaurus1001图方法最优树00canisfamilhomosapien
三、结果分析17fm虽然三种方法构建进化树的思想不同,是基于距离的算法,它抛开真实的数据完全依照序列比对距离构建进化树,进化树的拓扑结构由两序列的进化距离决distance定;就是对树的所有拓扑结构进行计算,找出替换数最小的那个树为最优树;对每一可能的进化位点分配概率,找出概率maximumparsimony最大的为最优树三种方法的具体操作却有很多类似之处,所构建的进化树是一样maximumlikelihood的三种方法各有长短,就速度而言,的计算速度最慢,而其他两种方法较快maximumlikelihood从得到的进化树来看仅谷光氨肽过氧化氢酶(家犬)和(黄牛)、(小家鼠)和(褐家鼠)、canisfamiliarisbostaurus(红原鸡)和(斑马鱼)之间的进化距离最近,蛋白质序列匹配度接近musmusculusrattusnorvegicusgallusgallus而(现代智人)和(黑猩猩)之间的进化距daniorerio离比较远100%homosapiens pantroglodytes5。