威望、酷币、资源币获取方法及用途
基因酷保藏中心资源获取规则
保藏中心资源获取流程详细说明
基因酷保藏中心资源进出明细
领取红包获得资源币和威望
各版诚拜版主,每版欲聘5名
生物科研网址导航使用说明
生物科研网络助手使用说明
基因酷资源免费,望您点击广告
来支持基因酷
基因酷大事件回顾
论坛使用说明及酷友指南
基因酷FTP的使用及说明
基因酷个人空间(博客)使用帮助
邀请您参与《生物信息学分析系列图书》编写
祝贺酵母共享平台的建立,征集细胞株共享实验技术支持!
科研文献、资料分享交流倡议
基因酷网络资源调整公告!
情系灾区,奉献爱心
发新话题
打印

[基因分析与比对] Clustalx 多重序列比对图解教程(By Raindy)



Clustalx 多重序列比对图解教程(By Raindy)

本帖首发于Raindy'blog,转载请保留作者信息,谢谢!

软件简介:
  CLUSTALX-是CLUSTAL多重序列比对程序的Windows版本。Clustal X为进行多重序列和轮廓比对和分析结果提供一个整体的环境。
  序列将显示屏幕的窗口中。采用多色彩的模式可以在比对中加亮保守区的特征。窗口上面的下拉菜单可让你选择传统多重比对和轮廓比对需要的所有选项。

主要功能
  你可以剪切、粘贴序列以更改比对的顺序;
  你可以选择序列子集进行比对;
  你可以选择比对的子排列(Sub-range)进行重新比对并可插入到原始比对中;
  可执行比对质量分析,低分值片段或异常残基将以高亮显示。

当前版本:1.83
PS:如果你是新手或喜欢中文界面,推荐使用本人汉化的Clustalx 1.81版
  链接地址:http://www.hanzify.org/index.php?Go=Show::List&ID=7435 (请完整复制)

应用:Clustalx比对结果是构建系统发育树的前提

实例:植物呼肠孤病毒属外层衣壳蛋白P8(AA序列)为例

流程:载入序列―>编辑序列―>设置参数―>完全比对―>比对结果

  1.载入序列:运行ClustalX,主界面窗口如下所图(图1),依次在程序上方的菜单栏选择“File”-“Load Sequence”载入待比对的序列,如图2所示,如果当前已载入序列,此时会提示是否替换现有序列(Replace existing sequences),根据具体情形选择操作。
本帖隐藏的内容需要回复才可以浏览
                      图1
本帖隐藏的内容需要回复才可以浏览

             图2
  2.编辑序列:对标尺(Ruler)上方的序列进行编辑操作,主要有Cut sequences(剪切序列)、Paste sequences(粘贴)、Select All sequences(选定所有序列),Clear sequence Selection(清除序列选定)、Search for string(搜索字串)、Remove All gaps(移除序列空位)、Remove Gap-Only Columns(仅移除选定序列的空位)
本帖隐藏的内容需要回复才可以浏览

             图3
  3.参数设置:可以根据分析要求设置相对的比对参数。通常情况下,我们可以使用默认参数。比对参数主要有六个,分别是Reset New Gaps before Alignment(比对前重置新的空位参数),Reset All Gaps before Alignment(比对前重置所有空位参数),Pairwise Alignment Parameters(两两序列比对参数),Multiple Alignment Parameters(多重序列比对参数),Protein Gap Parameters(蛋白空位参数),Secondary structure Parameters(二级结构参数),如图4所示:
本帖隐藏的内容需要回复才可以浏览

             图4
  修改参数只需点击相应标签,示例比对的是多序列比对,故可选择“Multiple Alignment Parameters”弹出参数设置窗口,如图5所示:
本帖隐藏的内容需要回复才可以浏览

             图5
  4.完全比对:返回菜单栏选择“Complete Alignment”标签,此时会弹出输出文件路径的设置窗口,设置Guide Tree File(向导树或指导树文件)、Alignment File(比对文件)的保存位置(存放路径),点击“Align”按钮程序自动开始序列的完全比对,比对所需时间因序列文件大小和长度、计算机性能而异,如图6-8所示:
本帖隐藏的内容需要回复才可以浏览

             图6
本帖隐藏的内容需要回复才可以浏览

             图7
本帖隐藏的内容需要回复才可以浏览

             图8
  当主界面的左下状态栏会提示“CLUSTAL-Alignment File created []”时说明比全完毕,这时文件保存位置的目录下会生成生成两个文件,分别是*.aln和*.dnd,aln是序列比对的文件,可以进一步用于构树系统发育树,dnd是向导树文件(指导树),这两个文件可以用Windows系统中的“记事本”或第三方程序“UltraEdit”等打开,如:
本帖隐藏的内容需要回复才可以浏览

             图9 ALN文件
本帖隐藏的内容需要回复才可以浏览

             图10 dnd文件

  5.后续分析:
  1)Clustalx比对生成的结果可读性不是太好,一般需要专业的序列着色软件处理,如Boxshade、ESPript,这两个工具都是在线进行,其中Boxshade图解教程详见本Blog日志。
Boxshade在线网址:http://www.ch.embnet.org/software/BOX_form.html
ESPript在线网址:http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi

  2)转换ALN文件,进一步构建系统发育树,转换格式依不同软件而有所不同,如在PHYLIP分析前需要将ALN格式转换为PHY格式方可...
本帖隐藏的内容需要回复才可以浏览


注意事项
1)dnd是向导树文件,可以用TreeViews软件查看树图。注意:向导树不是系统发育树,两者区别敬请关注近期-系统发育分析专题。
2)多重比对文件推荐要求为规范的FASTA格式,文件扩展名不限,格式大致如下:
引用:
>RGDV_BAA02676
MSRQAWIETSALIECISEYGTKCSFRHLWVIMSFIAVFGRYYTVN
>RGDV_ABC75537
MSRQAWIETSALIECISEYGTKCSFCHLWVIMSFIAVFGRYYTVN
>RGDV_AAO64253
MSRQAWIETSALIERISEYGTKCSFRHLWVIMSFIAVFGRYYTVN
>RGDV_AAY14576
常见问题
正在整理中,欢迎大家将使用过程存在的问题在此提出,以便于解答...

一点唠叨:
  Clustalx的使用教程最早源自原数字基因网站长曹又方博士的·用ClustalX做多序列比对分析·一文,曹兄无私奉献未做署名。不过,网上有些人实在恶心,明明转载他人文章,居然还冠上自己大名,美其名曰原创,不是不感慨国人的“劣根性”。
本帖最近评分记录
  • 纤夫 威望 +2 原创佳作,感谢分享。 08-6-11 08:12
·听雨轩·http://www.raindy.org
·红意网·http://www.nn11.com

TOP


欢迎有写生物学软件专长的战友,请加入生信教程写作群:13559330,接头暗号:你所擅长的生物学软件名称
·听雨轩·http://www.raindy.org
·红意网·http://www.nn11.com

TOP



再学习一遍!

再学习一遍!看到了楼主的版主申请,知道楼主是个生物信息强人,
今后还请多多指教!
亲爱的甘荻丽娜
我终将远行
风帆扬起,迷雾散尽

TOP


非常有用,谢谢

TOP


非常感谢,感谢非常

TOP


学习学习中!!!!

TOP


have a look

TOP



谢谢

谢谢呵,非常有用

TOP



谢谢 我想看

非常感谢您,我想看一下操作

TOP


thanks very much

TOP

发新话题
本功能由奇虎问答实现

相关主题

标题 作者 最后发表
原创]序列着色软件Boxshade图解教程 Raindy 2008-06-05
点击阅读更多关于的相关帖子  更多相关主题