构建系统发育树
2007年05月18日 17:55:18 作者: downsea
构建系统发育树
多序列比对软件Clustal和系统发育分析软件Phylip的应用
1.
源序列的Fasta格式准备:
访问Ncbi主页,查询书上p109表4-5上p17gag的9个Genbank登录号,找到对应序列后,让其用Fasta格式显示,将这些Fasta格式的序列拷贝进一个word文档中。该word文档中的Fasta格式序列如下排列:
>gi|1532267|gb|U68521.1|HIVU68521 HIV-1 sample 9939 patient 10 from Sweden matrix protein (gag) gene, p17 region, partial cds
ATGGGTGCGAGAGCGTCAGTATTAAGCGGGGGAGAGTTAGATAAATGGGAAAGAATTCGGTTAAGGCCAG
GGGGAAAGAAAAAATATAAATTAAAACATATAGTATGGGCAAGCAGGGAGCTAGAACGATTCGCAGTTAA
TCCTGGCCTTTTAGAAACATCAGAAGGCTGTAGACAAATACTGGGACAGCTACAACCAGCCCTTCAGACA
GGATCAGAAGAACTTAAATCATTACATAATACAGTAGCAGTCCTCTATTGTGTGCATCAAAGGATAGATG
TAAAAGACACCAAGGAAGCTTTAGAGAAAATAGAGGAAGAGCAAAACAAAAGTAAGAAAAAAGCACAGCA
AGCAGCAGCTGACACAGGAAACAACAGCCAGGTCAGCCAAAATTACCCTATAGTGCAGAACCTTCAGGGG
CAAATGGTA
>gi|1532263|gb|U68519.1|HIVU68519 HIV-1 sample 256 patient 9 from Sweden matrix protein (gag) gene, p17 region, partial cds
ATGGGTGCGAGAGCGTCAGTATTAAGCGGGGGAGAATTAGATAAATGGGAAAAAATTCGGTTAAGGCCAG
GGGGAAAGAAAAAATATAAATTAAAACATATAGTATGGGCAAGCAGGGAGCTAGAACGATTCGCAGTTAA
TCCTAGCCTTTTAGAGACATCAGAAGGCTGTAGACAAATACTGGGACAGCTACAACCGGCCCTTCAGACA
……
……
对照书上表4-5记下各个序列的gi号(如p10.9939—U68521—gi1532267)
2. Clustal多序列比对——Phylip的源数据文件准备:
访问Clustal主页,将准备好的9个Fasta格式序列都粘贴到其input窗口,将其输出格式选择为Phylip,
然后运行比对。
在phylip9596文件夹中建一个文本文件(如infile.txt),将比对结果中的Phylips格式数据段拷贝存入其中。Phylips格式数据段如下:
9 438
gi|1532267 ATGGGTGCGA GAGCGTCAGT ATTAAGCGGG GGAGAGTTAG ATAAATGGGA
gi|1532259 ATGGGTGCGA GAGCGTCAGT ATTAAGCGGG GGAGAATTAG ATAGATGGGA
gi|1532263 ATGGGTGCGA GAGCGTCAGT ATTAAGCGGG GGAGAATTAG ATAAATGGGA
gi|1532243 ATGGGTGCGA GAGCGTCRGT ATTAAGCGGG GGAGAATTAG ATAAATGGGA
gi|1532253 ATGGGTGCGA GAGCGTCAGT ACTAAGCGGG GGAGAATTAG ATAAATGGGA
gi|1532255 ATGGGTGCGA GAGCGTCAGT ATTAAGCGGG GGAGAATTAG ATAAATGGGA
gi|1532249 ATGGGTGCGA GAGCGTCAGT ATTAAGCGGG GGAGAATTAG ATAAATGGGA
gi|1532247 ATGGGTGCGA GAGCGTCAGT ATTAAGCGGG GGAGAATTAG ATAAATGGGA
gi|1532257 ATGGGTGCGA GAGCGTCAGT ATTAAGCGGG GGAGAATTAG ATAAATGGGA
AAGAATTCGG TTAAGGCCAG GGGGAAAGAA AAAATATAAA TTAAAACATA
AAAAATTCGG TTAAGGCCAG GGGGAAAGAA AAAATATAAA TTAAAACATA
……
……
3. Phylip程序构树:(以邻接法为例)
a)
自展:
双击运行phylip9596文件夹下的seqboot程序,进入dos窗口;输入文件名infile.txt, 回车;seed=1, 回车;Y(注意R=100表示自展次数), 回车,等待计算;
这时,你会发现,在phylip9596文件夹下增加了一个outfile文件,将此文件重命名为seqboot。
b)
距离计算:
双击运行phylip9596文件夹下的DNADist程序,进入dos窗口;输入文件名seqboot, 回车;D, 回车, D,回车,直到D为J-C置换模型;M,回车,100(表示自展次数), 回车;Y,回车,等待计算;
这时,你会发现,在phylip9596文件夹下增加了一个outfile文件,将此文件重命名为DNADist。
c)
构树:
双击运行phylip9596文件夹下的Neighbor程序,进入dos窗口;输入文件名DNADist, 回车;注意N为Neighbor Joining(邻接法);M,回车,100(表示自展次数), 回车;Y,回车,等待计算;
这时,你会发现,在phylip9596文件夹下增加了一个treefile文件,将此文件重命名为Neighbor。
d)
推定一致树:
双击运行phylip9596文件夹下的consense程序,进入dos窗口;输入文件名Neighbor, 回车;Y,回车,等待计算;
这时,你会发现,在phylip9596文件夹下增加了一个outfile文件和一个treefile文件;将outfile文件重命名为outfile.txt, 双击查看可以了解一致树的树型和主要参数;
e)
显示结果(一致树)树形:
双击运行phylip9596文件夹下的drawtree程序,进入dos窗口;输入文件名font1, 回车;x,回车;I,回车;x resolution为
400,回车;y resolution为300,回车;Y,回车,再回车两次,显示构树结果。