威望、酷币、资源币获取方法及用途
基因酷保藏中心资源获取规则
保藏中心资源获取流程详细说明
基因酷保藏中心资源进出明细
领取红包获得资源币和威望
各版诚拜版主,每版欲聘5名
生物科研网址导航使用说明
生物科研网络助手使用说明
基因酷资源免费,望您点击广告
来支持基因酷
基因酷大事件回顾
论坛使用说明及酷友指南
基因酷FTP的使用及说明
基因酷个人空间(博客)使用帮助
邀请您参与《生物信息学分析系列图书》编写
祝贺酵母共享平台的建立,征集细胞株共享实验技术支持!
科研文献、资料分享交流倡议
基因酷网络资源调整公告!
情系灾区,奉献爱心
发新话题
打印

[分子进化] 序列长度不同如何建立进化树


武林三国

序列长度不同如何建立进化树

找到了一个蛋白质在多个物种中的序列,可是长度不一样,用clustal X得到.aln文件后,再用mega3.1转换成.meg文件,然后准备建树,可是mega3.1总是提示这几个序列长度不同。是不是必须序列长度相同才能建树?如果序列长度不同怎么处理?用什么软件编辑?

TOP



回复 1# 的帖子

我没有遇到过这种情况啊,不同长度照样成树啊
亲爱的甘荻丽娜
我终将远行
风帆扬起,迷雾散尽

TOP


武林三国
应该是你的序列中最长的序列与最短的序列之间的差异太大,需要你自己斟酌去掉几个最长的或是最短的序列,我也经常遇到这样的情况

TOP


楼上说的没错,这些情况我也遇到过,差别太大会提示出错,

TOP


武林三国
对,去掉的序列不同,得到的树差别还不小,所以做完后要评估

TOP


根据MEGA说明书,该软件处理的序列(不论核酸、蛋白)应当为一样长度,所以在分析之前必须对序列进行联配(align)。

如果序列长度差异在在内部,即存在插入/缺失(insert/deletion),联配后短序列中缺失的部分会自动以连字符(dash)填充;若序列长度差异在两端,则联配后须要手动将序列修剪齐平(trim)。

联配(align),传统上使用 Clustal 来完成,不过 MEGA 已经集成了该功能,所以我几乎就不用 Clustal 了。

经 MEGA 联配的一组序列默认保存为 .mas 格式文件,此格式为 MEGA 联配序列专用,可编辑,包括进行序列修平(trim),即选中多于的部分按Delete键删除。当保存完 .mas 格式文件退出 MEGA 时,程序会提示用户是否保存 .meg 格式文件,这是 MEGA 做进化分析的专用文件格式,一旦保存,程序本身不再提供对该文件的修改——当然,用记事本可以打开该文件,但相信几乎没人会在记事本中编辑序列吧。所以,如果对联配结果不满意(问题基本上出在对插入/缺失位点核苷酸的对齐上),可以用MEGA打开 .mas 格式文件,手工微调、修正后重新保存为 .meg 格式文件,然后再作进一步分析:基本多态统计、遗传距离、建树等。

经以上处理过的序列长度一致,就不会报错了

TOP


武林三国
楼上的睡觉太迟了!!夜猫子~~~

TOP

发新话题