发新话题
打印

[分子生物学] NCBI使用说明

本主题由 WANZHAN 于 07-11-15 14:45 分类

NCBI使用说明

NCBI使用说明


; C2 n9 k* ?2 h- }9 |# R本篇内容:( e0 ^' r( ]+ |. i0 m2 F; Z* j

# j/ q+ x: N' Y7 F声明:
9 m& v# @2 g  V1、 本篇涉及的资源主要源于网络及相关书籍,由酷友搜集、分析、整理、审改,供大家学习参考用,如有转载、传播请注明源于基因酷及本书的工作人员;若本书侵犯了您的版权或有任何不妥,请Email genecool@126.com告知。; N% A5 u9 O6 G+ D& s. k* K
2、 由于我们的学识、经验有限,本书难免会存在一些错误及缺陷,敬请不吝赐教:请到基因酷论坛(www.genecool.com/bbs)本篇对应的专题跟贴指出或Email genecool@126.com
( o! u  J" d5 }, G5 J1 c致谢:
5 ~5 ?8 N% h; X! }0 L0 H$ Z3 U整理者:WANZHAN   审改者:小宝、纤夫、caterpillar、kaige88
# |4 S  M! H- a$ b/ l2 W2 m主要参考资料:
1 G& J0 ?0 W( W. M2 p1. 《分子克隆实验指南》: l8 ~% J# [/ f
2. 如何查找基因序列?——在Genbank中寻找目的基因的实例(纤夫), e- ~. z2 ~% Y( X
3. 一步一步教你使用NCBI(查找DNA、mRNA、cDNA、Protein、promoter、引物设计、BLAST序列比对等——已发布第  三部分/共四部分(urbest)
附件: 您所在的用户组无法下载或查看附件,亲爱的酷友别忘了登陆注册加入基因酷!
生命的精彩在于大家共同的努力~~

TOP

GenBank数据库简介

GenBank数据库简介

$ M* C5 D4 A  L2 G; C. i" B
基本信息 :1 x1 W! g; c$ W& P% U& l! H: g
1. GenBank属于一个序列数据库的国际合作组织,包括EMBL和DDBJ。是NIH遗传序列数据库,一个所有可以公开获得的DNA序列的注释过的收集。GenBank同日本和欧洲分子生物学实验室的DNA数据库共同构成了国际核酸序列数据库合作。唯一人类基因序列集合(UniGene),人类基因组基因图谱,分类学浏览器,同国立癌症研究所合作的癌症基因组剖析计划(CGAP)等数据库。GenBank以指数形式增长,核酸碱基数目大概每14个月就翻一个倍。5 p3 A" G5 Z) P0 \
2. 纪录样本 - 关于GenBank的各个字段的详细描述,以及同Entrez搜索字段的交叉索引。
) M7 u( U; Q; \. b" M5 Y  h; D. }3. 访问GenBank - 通过Entrez Nucleotides来查询。用accession number,作者姓名,物种,基因/蛋白名字,还有许多其他的文本术语来查询。关于Entrez更多的信息请看下文。用BLAST来在GenBank和其他数据库中进行序列相似搜索。用E-mail来访问Entrez和BLAST可以通过Query和BLAST服务器。另外一种选择是可以用FTP下载整个的GenBank和更新数据。 6 ?3 ]2 l1 o% X/ B3 T9 O
4. 增长统计 - 参见公布通知的2.2.6(每个分类的统计),2.2.7(每个物种的统计),2.2.8(GenBank增长)小节。
9 G, f! a" F. f! O! K5. 公布通知,最新 - 最近和即将有的变化,GenBank的分类,数据增长统计,GenBank的引用。
% L- ~. L4 V1 n$ W6 s4 a+ n6. 公布通知,旧 - 同上相同,是过去公布的统计。 ' Q! e* z2 v& e, g0 D# _1 z7 E
7. 遗传密码 - 15个遗传密码的概要。用来确保GenBank中纪录的编码序列被正确的翻译。 . \! I9 i8 L/ f* d  i% p4 w
) `$ S: P5 t, c- T) B) o
向GenBank提交数据 :6 p/ F7 B; l' ]+ p* h
1. 关于提交序列数据,收到accession number,和对纪录作更新的一般信息。
% c* ~) V. N1 Z6 B1 \( o" ^2. BankIt - 用于一条或者少数条提交的基于WWW的提交工具软件。(请在提交前用VecScreen去除载体)
8 s1 w) q3 ?9 q# ]4 O3. Sequin - 提交软件程序,用于一条或者很多条的提交,长序列,完整基因组,alignments,人群/种系/突变研究的提交。可以独立使用,或者用基于TCP/IP的“network aware”模式,可以链接到其他NCBI的资源和软件比如Entrez和PowerBLAST。(请在提交前用VecScreen去除载体) " [* E  z3 X- y. j
4. ESTs - 表达序列标签,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE实验的cDNA序列。
4 r0 J% [2 |3 e; w! Z4 d- C5. GSSs - 基因组调查序列,短的、单次(测序)阅读的cDNA序列,exon trap获得的序列,cosmid/BAC/YAC末端,及其他。
: N$ ?+ Z, v- G1 [: h6. HTGs - 来自于大规模测序中心的高通量基因组序列,未完成的(阶段0,1,2)和完成的(阶段3)序列。(注意:完成的人类的HTG序列可以同时在GenBank和Human Genome Sequencing页面上访问。)
- l, ?* U. s8 Y7 O3 g7. STSs - 序列标签位点。短的在基因组上可以被唯一操作的序列,用于产生作图位点。 : ]5 L3 y' m3 f) @! h8 E9 A
8. 注:SNPs - 人类的和其他物种的遗传变异数据可以提交到NCBI数据库的单核苷酸多态性库中(dbSNP)。
" X7 j& q" L+ {# ~* K& ~
7 F# R/ w7 J; J国际核苷酸序列数据库合作组织 :
: p! ~2 U2 A/ N6 }' H; X1 t- f1. GenBank,DDBJ,EMBL - 合作计划的概述,并链接到相应的主页。GenBank,DDBJ(DNA Data Bank of Japan),and EMBL (European Molecular Biology Laboratory)数据库共享的数据是每天都交换的,因此他们是相等的。数据纪录的格式和搜索方式可能会不一样,但是accession number,序列数据和注解都是一模一样的。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相应纪录,得到的结果是完全一样的序列数据,参考内容等等。? $ F6 w6 U+ s' W& ~: @, x* _
2. DDBJ/EMBJ/GenBank特性表 — 特性表格式和标准被合作数据库用在序列记录的注释上,使得数据共享成为可能,包括详细的描述生物特性和特性限定语的附录,以及IUPAC规定的核苷酸和氨基酸的代号。? 1 {% X4 P' [- }9 I+ j0 g
5 x6 E1 c: r/ E' r4 v" F
FTP GenBank and Daily Updates:
+ j% E+ U* H2 @) X
1. GenBank普通文件格式 — 参见GenBank记录样本和在GenBank公布通知中的详细描述,下载大多数最近的完全公告和日常积累或非积累更新数据。?
& x6 p+ S! `. R: O# H2 R  j2 V2. ASN.1格式 — 摘要句法记号1,国际标准组织(ISO)数据表示格式,下载大多数最近的完全公告和日常积累或非积累更新数据。
2 u$ c+ v- k% n+ ]: }$ q# c3. FASTA格式 — 定义行号后只跟随序列数据(示例),参见描述数据库的readme文件,包括nt.Z(每天更新的非冗余BLAST核酸数据库,包括GenBank+EMBL+DDBJ+PDB序列,但是不包括EST, STS, GSS, or HTGS序列),nr.Z(每日更新的非冗余蛋白质),est.Z, gss.Z, htg.Z, sts.Z,和其它文件。
  Z! p2 {# i* M- \. h% y
: n0 g- J4 W* A2 W% q/ E3 _# Z分子数据库:
% h0 `: x) |! o' B1. 核酸序列3 H9 i+ \: ]4 Q. {7 n
1、 Entrez核酸: 用accession number,作者姓名,物种,基因/蛋白名字,以及很多其它的文本术语来搜索核酸序列记录(在GenBank + PDB中)。更多的关于Entrez的信息见下。如果要检索大量数据,也可使用Batch Entrez(批量Entrez)。 6 ~) G+ U3 B5 {9 q& J
2、 RefSeq : NCBI数据库的参考序列。校正的,非冗余集合,包括基因组DNA contigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。 1 @+ f  _5 d8 ]4 k
3、 dbEST :表达序列标签数据库,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE实验的cDNA序列。 2 M! X$ \0 z6 F) D* P
4、 dbGSS :基因组调查序列的数据库,短的、单次(测序)阅读的cDNA序列,exon trap获得的序列,cosmid/BAC/YAC末端,及其他。
: w' M7 m% I) S$ j' `$ u5、 dbSTS :序列标签位点的数据库,短的在基因组上可以被唯一操作的序列,用于产生作图位点。
- a  h! e6 \/ C( z: n6、 dbSNP :单核苷酸多态性数据库,包括SNPs,小范围的插入/缺失,多态重复单元,和微卫星变异。
) Q; q5 J2 k- l( A2. 完整的基因组 :
5 d8 l+ w$ R% a1、 参见下面Genome和Maps部分,包括各种物种资源,人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒。 8 U1 g: [$ A4 z( \: r9 c
2、 发UniGene : 被整理成簇的EST和全长mRNA序列,每一个代表一种特定已知的或假设的人类基因,有定位图和表达信息以及同其它资源的交叉参考。序列数据可以以cluster形式在Unigene网页下载,完整的数据可以从FTP站点repository/UniGene目录下下载。 & v4 X7 S' g8 b' e+ t/ @7 q/ ^
1) 人类:UniGene , p3 m2 n, R" |8 u* `
2) 小鼠:UniGene + u, O; L( q* c0 i( m
3) 大鼠:UniGene
) o7 I6 F) N) D# H  K2 l7 v4) 斑马鱼:UniGene ( G; n! |' p+ M
3、 BLAST :将你的序列同核酸库中的的序列比较,检索相似的序列。(更详细的信息见下面Tools/Sequence相似搜索部分)
- u) l) |9 q& u; A2 t! d3 S: d7 W7 R) R  z# p, u: ^2 a# }7 v1 f  p0 z0 I
蛋白序列 :
& `8 K( i0 A: y  L5 J( w
1、 Entrez蛋白 :用accession number,作者姓名,物种,基因/蛋白名字,以及很多其它的文本术语来搜索蛋白序列记录(在GenPept + Swiss-Prot + PIR + RPF + PDB中)。更多的关于Entrez的信息见下。如果要检索大量数据,也可使用Batch Entrez(批量Entrez)。 RefSeq — NCBI数据库的参考序列。Curated, 非冗余集合包括基因组DNA contigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。 FTPGenPept — 下载“genpept.fsa.Z”文件,这个文件包含了从GenBank/EMBL/DDBJ记录中翻译过来的FASTA格式的氨基酸序列,这些记录都有一到两个CDS特性的描述。 0 c* h1 E0 c4 n$ |/ X  U9 @6 G' e
2、 完整基因组 :参见下面Genome和Maps部分,包括各种物种资源,人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒。 ! v! E% b, d- k8 ]
1) Entrez基因组 :提供了一个编码区的概要和各种物种的分类表(TaxTable)。编码区概要列出了在基因组中所有的的蛋白,并提供链接到FASTA文件和BLAST。分类表总结了蛋白BLAST分析的结果,建议他们的可能功能,并用颜色编码的图来显示物种同其它物种之间的关系(参见下面'Genomes和Maps,'部分Entrez基因组的一般描述)
1 {* }' j* J1 u  d6 C7 W2) FTP基因组蛋白 :从ftp站点的genbank/genomes目录下下载各种物种的FASTA格式的氨基酸序列*.faa和蛋白表文件*.ptt。参见readme文件。蛋白表也可以在Entrez基因组中看到。
2 x5 J) [, E; ^6 H' w3、 PROW : Web上的蛋白资源,关于大约200种人类的CD细胞表面分子的简短官方向导。互相检索,为每个CD抗原提供大约20中标准信息的分类(生化功能,配体,等等) ( S  S: Q4 Q) n1 `- p
4、 BLAST : 将你的序列同蛋白库中的的序列比较,检索相似的序列。(更详细的信息见下面Tools/Sequence相似搜索部分)
3 S0 Q4 A# O2 |9 l1 T& a. p1 j% i0 `) l+ @# V$ ?; R2 p- Q
结构: ' |( T/ x6 L4 k, k' l' ]) `  N
1、 结构主页 — 关于NCBI结构小组的一般信息和他们的研究计划,另外也可以访问分子模型数据库(MMDB)和用来搜索和显示结构的相关工具。
2 F9 t' L' \- D! ]/ F4 K2、 MMDB:分子模型数据库 — 一个关于三维生物分子结构的数据库,结构来自于X-ray晶体衍射和NMR色谱分析。MMDB是来源于Brookhaven蛋白数据库(PDB)三维结构的一部分,排除了那些理论模型。MMDB重新组织和验证了这些信息,从而保证在化学和大分子三维结构之间的交叉参考。数据的说明书包括生物多聚体的空间结构,这个分子在化学上是如何组织的,以及联系两者的一套指针。利用将化学,序列,和结构信息整合在一起,MMDB计划成为基于结构的同源模型化和蛋白结构预测的资源服务。MMDB的记录以ASN.1格式存储,可以用Cn3D, Rasmol, 或 Kinemage来显示。另外,数据库中类似的结构已经被用VAST确认,新的结构可以用VASTsearch来同数据库进行比较。
5 N% J2 m' [, A$ j. v7 Q2 Q3、 Cn3D — “See in 3-D”, 一个用于NCBI数据库的结构和序列相似显示工具,它允许观察3-D结构和序列—结构或结构—结构同源比较。Cn3D用起来就象你浏览器上的一个帮助工具。
/ K& `* E( x+ h% {/ M4、 VAST — 矢量同源比较搜索工具—一个在NCBI开发的计算算法,用于确定相似的蛋白三维结构。每一个结构的“结构邻居”都是预先计算好的,而且可以通过MMDB的结构概要页面的链接访问。这些邻居可以用来确认那些不能被序列比较识别的远的同源性。
; h: z( @1 s: q- D5、 VAST 搜索 — 结构—结构相似搜索服务。比较一个新解出的蛋白结构和在MMDB/PDB数据库中的结构的三维坐标。VAST搜索计算一系列可能会被交互浏览的结构邻居,用分子图形来观察重叠和同源相似。 % y! B. j. M% k: A
4 @4 X# N# ]) h& n
分类学 :) d/ \9 w/ Z' o
1、 NCBI的分类数据库主页 — 关于分类计划的一般信息,包括分类资源和同NCBI分类学家合作的外部管理者的列表。 5 G9 A5 V4 p+ j4 V8 w! n9 E
2、 分类浏览器 — 搜索NCBI的分类数据库,包括大于70000个物种的名字和种系,这些物种都至少在遗传数据库中有一条核酸或蛋白序列。可以检索一个特定种或者更高分类(如属,科)的核酸,蛋白,和结构记录。如果有新物种的序列数据被放到数据库中,这个物种就北加到(分类)数据库中。NCBI的分类数据库的目的是为序列数据库建立一个一致的种系发生分类学。
/ d+ I* J4 @) s. M! I
+ T1 m+ a4 N* I9 ^文献数据库概要 :% D* f5 b/ q9 l/ @' |" q( w
1、 PubMed — 一个关于生物医药科学的检索系统,包括引用,摘要,和杂志的索引术语。它包括直接由出版商提供给NCBI的文献引用以及链接到在出版商网址上的全文的URLs。PubMed包括MEDLINE和PREMEDLINE的完整内容。它还包括一些被MEDLINE认为超出范围的文章和杂志,(这些文章或杂志)由于内容或在某一时期不在索引范围内。因此PubMed是比MEDLINE的更大的集合。 # e$ U; u- c7 y6 s; U' X5 P
2、 杂志浏览器 — 允许你去查找收录到PubMed系统的杂志的名字,MEDLINE的缩写,或ISSN号码。 * ]7 _4 Q+ J% J4 ]# R4 w1 n
3、 PubRef(开发中)— 一个关于来自于广大范围的科学杂志的数目记录,和链接到出版商网址的全文。PubRef包含了PubMEd,加上了来自其它学科的杂志出版商提供的引用和摘要。因此它是比PubMed更大的集合。这个计划的启动是因为NAS要求为科学领域的核心刊物提供一个“白皮书”服务。 6 }2 C( B$ t8 \" S9 t7 T- Z
4、 PubMed中心(开发中) — PubMed中心是一个无障碍的NIH资源,用于在生命科学领域中同业互查的基础研究报告。从2000年一月开始接受杂志文章。所有在PubMed中心的材料将由目前任一主要的摘要和索引服务中列出的杂志提供,或者在编辑委员会中拥有3个以上有主要资金机构的研究经费的拥有人的杂志提供。 ) Y3 n3 T* i' m0 J1 |1 h2 j
5、 OMIM — 在线人类孟德尔遗传—经常更新的人类基因和遗传失调的目录,有链接到其它相关的文献参考,序列记录,和相关数据库。
- M4 r7 V! R8 T8 _! s6、 书籍 — 同书籍出版商合作NCBI为网络改编了教科书,并把他们链接到PubMed—生物医药书目数据库。这是为了给PubMed提供背景信息,这样使用者可以探究在PubMed搜索结果中不熟悉的概念。目前收录的书有:
) G1 w+ E9 Q! Z0 o5 M, q7、 Molecular Biology of the Cell, 3rd ed. Alberts B., Bray D., Lewis J., Raff M., Roberts K., Watson J.D., 1994, Garland Publishing. ( N8 Y" D$ z. i( }" t8 O
8、 外部链接 — 一个登记服务,用于建立从在Entrez中的特定的文章,杂志,或生物数据到外部网址的链接。第三方可以提供一个URL,资源名字,关于他们网址的简要的描述,和关于从NCBI数据的哪里他们希望建立链接的详细说明。这个详细说明可以用对Entrez有效的布尔查询来写,也可以用特定的文章或序列的标志列表来写。这样NCBI PubMed的用户将可以通过“NCBI小房间”服务(开发中)来选择哪个外部链接在他们的搜索中是可见的。
# f  Q% V( T( f' b+ n* S* c. R9、 引用匹配 — 允许你找到任何一篇在PubMed数据库中的文章的PubMed ID或MEDLINE UID,给出书目信息(杂志,卷,页码等)。
! Y1 i8 m6 t8 S; g7 A10、 单篇文章的引用匹配。
* B7 J7 }2 h$ ]11、 许多文章的批量引用匹配。
9 f0 @7 I( P8 m; t: A# Y2 u1 J: b12、 E-mail引用匹配也是可以的,也可以用于单篇或许多文章。如果要获得帮助文件,给citation_matcher@ncbi.nlm.nih.gov写一封只有内容为HELP的E-Mail。 5 c3 v: k# g$ g- b7 O
, }, f7 `9 N2 j, L' m2 _, o& K( Q% c: x
Genomes and Maps Overview:
- n1 _) f5 q  H1 _+ U2 k
1、 Entrez基因组:人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒,和真核细胞器。   H2 @+ q0 G, G; {0 E, S- E- j, P9 w
2、 Entrez基因组(各种物种) 1 Q- t7 ]& H5 g
3、 Entrez基因组 — 超过800种在GenBank中被完整测序的物种,包括大于500种病毒,〉25种细菌,酵母,和许多viroids,质粒,和细胞器。还包括正在进行中的基因组,比如人,小鼠,线虫,疟原虫,果蝇,利什曼原虫,水稻,和玉米。提供完成的基因组/染色体的图形概览,并可以探究那些逐步细化的区域。也提供那些已经被NCBI工作人员分析过的物种的编码区的摘要和TaxTables。另外,Entrez Map Viewer,Entrez基因组的一个软件组成部分,提供整合的果蝇(细胞遗传学和序列图谱)和人类(细胞遗传学,遗传连锁,序列,放射杂交,和其它图谱)的染色体图谱的浏览。 " u' d4 I- d9 B& C( b4 X  A
4、 通过每个物种的Entrez基因组页面来下载〈350kb的基因组。 5 _- O$ \) e2 H" t' \3 G, N
5、 通过NCBI ftp站点来下载〉350kb的基因组—参见在genbank/genomes目录下的readme文件,ftp链接在每个物种的Entrez基因组页面上也有。9 V0 e$ t; g' @0 i, [; Q" q

  E% {. E$ ]5 |3 C9 h( LNCBI站点地图---其他基因组数据介绍:5 c! w1 `' V( Y+ x
1、 小鼠基因组 & M- @' a8 s+ G8 u
1) 小鼠基因组资源向导 :把从各个中心来的各种小鼠相关的资源整合在一起,包括序列,图谱,和克隆信息以及指向小鼠种系和突变资源的指针。 6 @- B4 ]4 q, ]2 v# J) |
2) 小鼠基因组测序:小鼠基因组计划的测序进展,HTG序列contigs(可以用大小和染色体号来浏览)由测序中心的数据建立,可以contig或染色体的形式来下载。 ) R) [# {3 J) ]' F
3) 小鼠UniGene :被整理成簇的EST和全长mRNA序列,每一个代表一种特定已知的或假设的基因,有定位图和表达信息以及同其它资源的交叉参考。序列数据可以以cluster形式在Unigene网页下载,完整的数据可以从FTP站点repository/UniGene目录下下载 % `: J+ J+ B: n0 g8 D: p
4) 位点链接(LocusLink) :为校正过的序列和遗传位点的描述信息提供一个单次查询界面。LocusLink给每个位点发布一个稳定的ID,并提供官方的命名,序列accesssion number, Unigene簇,图谱信息,和相关的网址。LocusLink是NCBI,人类基因命名委员会,OMIM和其它组织的合作结果。LocusLink目前包含人类,小鼠,大鼠,斑马鱼,和果蝇的位点,物种可以被分开或合在一起查询。
. X8 b. M7 S: J5) Entrez :包括了来自〉70000个物种的序列数据,可以用物种字段来限制记录只在小鼠搜索。 9 g% C( T" q& O
6) 人类/小鼠同源图 :University of California at Davis的M. F. Seldin建立,一张比较人和老鼠在同源区段DNA上基因的表,按在每个基因组上的位置排列。
, R+ P$ a+ X8 D, i# j4 \2、 大鼠基因组
- O) k4 p/ s9 G% p: K7 n1) 大鼠UniGene :被整理成簇的EST和全长mRNA序列,每一个代表一种特定已知的或假设的基因,有定位图和表达信息以及同其它资源的交叉参考。序列数据可以以cluster形式在Unigene网页下载,完整的数据可以从FTP站点repository/UniGene目录下下载 * h9 ?' c/ w" W5 T; e, Z+ m
2) 位点链接(LocusLink):为校正过的序列和遗传位点的描述信息提供一个单次查询界面。LocusLink给每个位点发布一个稳定的ID,并提供官方的命名,序列accesssion number, Unigene簇,图谱信息,和相关的网址。LocusLink是NCBI,人类基因命名委员会,OMIM和其它组织的合作结果。LocusLink目前包含人类,小鼠,大鼠,斑马鱼,和果蝇的位点,物种可以被分开或合在一起查询。5 R+ c: w. x, y; l9 _0 ^
3、 斑马鱼基因组( \! i' l6 a# r  K, ]$ ~: m# M& l( U
1) 斑马鱼UniGene :被整理成簇的EST和全长mRNA序列,每一个代表一种特定已知的或假设的基因,有定位图和表达信息以及同其它资源的交叉参考。序列数据可以以cluster形式在Unigene网页下载,完整的数据可以从FTP站点repository/UniGene目录下下载 " l+ ~' q; k7 r0 g$ K; ^
2) 位点链接(LocusLink) :为校正过的序列和遗传位点的描述信息提供一个单次查询界面。LocusLink给每个位点发布一个稳定的ID,并提供官方的命名,序列accesssion number, Unigene簇,图谱信息,和相关的网址。LocusLink是NCBI,人类基因命名委员会,OMIM和其它组织的合作结果。LocusLink目前包含人类,小鼠,大鼠,斑马鱼,和果蝇的位点,物种可以被分开或合在一起查询。 , }" M7 r; W2 Z
4、 果蝇基因组
3 c: M2 @& `; s1 w' z9 c/ Y" L1) 黑腹果蝇主页 : 提供所有可使用的果蝇资源的概要,用图形的方式显示了染色体,允许你通过Entrez基因组浏览器的方法来搜索整个基因组的细胞遗传和序列信息。Entrez基因组提供了对于一个物种一致的遗传,物理,和序列数据的图形界面。当你用一个基因的代号来搜索时,它给出搜索结果的一个图形的基因组视图,从那你可以放大到你所感兴趣的区域的更详细的图谱视图,并且链接到序列数据和包含更多信息的相关资源。 " V( T( s% m- `! i/ l5 _$ W& m
2) 黑腹果蝇基因组测序的状态 :描述了目前在GenBank,Entrez Genomes,和FTP站点中的数据的范围 3 U: o) L" }6 C# Y. u" {* F
3) Entrez图谱浏览器 :整合的染色体图谱—图谱浏览器是Entrez基因组的一个软件组成部分,用来显示一个或多个用共同标记或基因名字互相align过的图谱,以及用相同序列进行比较过的序列图谱。在人类基因组数据和搜索技巧文件中有关于目前可以使用的果蝇的序列和细胞遗传学图谱。Entrez图谱浏览器的帮助文件提供了关于如何使用这个工具的一般说明。 0 P6 @% Q9 X, @% [8 H, |, X
4) 位点链接(LocusLink): 为校正过的序列和遗传位点的描述信息提供一个单次查询界面。LocusLink给每个位点发布一个稳定的ID,并提供官方的命名,序列accesssion number, Unigene簇,图谱信息,和相关的网址。LocusLink是NCBI,人类基因命名委员会,OMIM和其它组织的合作结果。LocusLink目前包含人类,小鼠,大鼠,斑马鱼,和果蝇的位点,物种可以被分开或合在一起查询。 + E$ U( m4 Q( W9 `2 V9 ]& r
5、 线虫基因组
. T" |+ @6 X; sEntrez基因组:染色体的图形表示,可以整个的查看,也可以逐步放大的看。链接到相关的序列数据。
  I" x1 f- ~3 m6、 酵母基因组
, b7 n0 z+ R- J3 W" a2 ]+ W" L: J  v1) Entrez基因组 :染色体的图形表示,可以整个的查看,也可以逐步放大的看。链接到相关的序列数据。
) O* F) V' h$ H) C. Q2) COGs :相邻类的聚簇 — 来自于完整基因组的基因家族自然系统。COGs用比较21种完整的基因组的编码的蛋白序列描绘了17个主要的种系发生系统。每个COG包含至少来自3个世系的独立蛋白或蛋白家族的相邻体,所以对应了一个古老的保守domain。 # _( R! ]  @, [& F% k( Q/ X  ^) a$ W
7、 疟原虫基因组3 X1 e* |' X! ?" B
1) 疟原虫遗传学和基因组:提供与疟原虫遗传学和基因相关的数据和信息。资源包括物种特异的序列BLAST数据库(恶性疟原虫,所有疟原虫,以及弓形虫),基因组图谱,连锁标记,以及遗传学研究信息。链接到其他的疟原虫网站和相关的寄生虫遗传学数据库包括弓形虫。
* C) h0 N2 }9 p) J: c2) Entrez基因组 — 恶性疟原虫的染色体全长的图形视图,完整的染色体序列数据(2和3),链接到正在进行的染色体的分离数据表(来自于HB3 X Dd2杂交的染色体),链接到其他基因组测序中心。 5 w- z' S; ?/ A5 R' W* E: I
3) FTP站点 (pub/Malaria目录):用于查找在DNA序列中STS的电子PCR疟原虫版。 $ C+ r4 d. s2 {8 a0 p
4) FTP站点 (genbank/genomes 目录):下载各种格式的完整的染色体序列数据(2和3),包括GenBank的flat file (*.gbk),GenBank的概要文件(*.gbs),FASTA核酸文件(*.fna),FASTA氨基酸文件(*.faa),蛋白表(*.ptt)和其他。
6 o+ u5 [: j4 x5 {7 {/ ^" m8、 细菌基因组
: r% _2 o- Y, f8 [1 s* k2 a; S# ~1) Entrez基因组 — 完整细菌基因组的图形表示,可以整个的查看,也可以逐步放大的看。链接到相关的序列数据。对每一个细菌都提供了一个编码区域的概要和TaxTable。 & x0 u- @! W) v! u
2) 微生物基因组测序计划:完成的和正在进行的测序计划,链接到NCBI的图形视图和测序中心。 5 q6 X. f" P+ s  W* d7 x
3) COGs :相邻类的聚簇 — 来自于完整基因组的基因家族自然系统。COGs用比较21种完整的基因组的编码的蛋白序列描绘了17个主要的种系发生系统。每个COG包含至少来自3个世系的独立蛋白或蛋白家族的相邻体,所以对应了一个古老的保守domain。
1 J* z" b' ~: l- T& ~8 X4) FTP站点: 下载各种格式的完整的细菌染色体序列数据,包括GenBank的flat file (*.gbk),GenBank的概要文件(*.gbs),FASTA核酸文件(*.fna),FASTA氨基酸文件(*.faa),蛋白表(*.ptt)和其他。 # x% S3 @6 A3 f
5) 微生物基因组BLAST数据库 :与完成的和未完成的微生物基因组进行BLAST
生命的精彩在于大家共同的努力~~

TOP

查找目的基因序列

查找目的基因序列


) \2 g- F# l& m. N% v  S在Genbank中寻找目的基因的实例:
6 F: A- I2 a0 }4 P在文献中提到的基因在Genbank中的ID号:直接打开http://www.ncbi.nlm.nih.gov在Search后的下拉框中选择Nucleotide,把Genbank ID号输入GO前面的文本框中,点“GO”。举例说明,例如:在2003年JBC的文章(Conditional Knock-out of Integrin-linked Kinase Demonstrates an Essential Role in Protein Kinase B/Akt Activation)中出现了“calreticulin (GenBank accession number gi 16151096)”,那么把“16151096”输入GO前面的文本框中,点“GO”,就可以找到该基因。如下图所示:$ T3 o) }& X  S. o6 g2 Z

在出现了检索结果界面(下图)后,直接点击红箭头所指的 AY047586可以看到基因的相关信息。
( _; \1 ~, d4 [3 x4 t+ w

这里需要指出一下,在显示基因的页面右侧有一个Link,点击后出现一个小菜单,里面是与该基因相关的链接。: `6 [! C; y. ^3 D% a% X4 T

点击 AY047586后出现的界面如下:! j# R! ?) n- K

最下面就是核酸序列(ORIGIN后面) :' {6 b! ]4 y) y4 L7 n

) x: |3 a) j0 M/ c& H
如果只想获得序列(例如去设计PCR引物的时候),那可以选择FASTA可得到FASTA格式的序列文件,没有其他数字和格式的干扰。
, X! f7 i( @$ i$ [0 X! ]4 x6 p

FASTA格式的序列:
  ]1 m& D4 w; I4 N

1 z2 Q* E5 e/ y
& q7 \& @. r3 R1 H
[ 本帖最后由 WANZHAN 于 07-8-11 11:48 编辑 ]
附件: 您所在的用户组无法下载或查看附件,亲爱的酷友别忘了登陆注册加入基因酷!
生命的精彩在于大家共同的努力~~

TOP

Map viewer查找目的基因序列

Map viewer查找目的基因序列

0 d( q& t" N* m5 m$ u9 J
利用Map viewer查找基因序列、mRNA序列、启动子 (以人的白细胞介素6为例) :
1 Y  i6 k$ w- {  L9 z
1. 打开Map viewer页面,网址为:
# k% e2 x4 G& p9 shttp://www.ncbi.nlm.nih.gov/mapview/index.html
/ Q; H2 m: ?9 D/ H3 @, D$ Y在search的下拉菜单里选择物种,for后面填写目的基因。操作完毕如图所示:2 P* M! i. u' `) _

+ M8 z1 V5 n" ~
2. 点击“GO”出现如下页面0 ^0 Q- f( V" U# B: J0 A

3. 在上图示的右下角有一个Quick Filter,下面是供选择的几个复选框,在Gene前面的小方框里打勾,然后点击Filter. 出现下图:, Z9 }1 }3 p2 i" \
1、 染色体的红色区域即为目的基因所处位置。
* V) E6 b7 @" z' W8 a( {% }2、 下面参考序列给出了三个,是不同的部门做出来的,序列有微小的差异,但总体来说基本相同。分别点击后,序列代码等有所差异,但碱基基本一致,不影响研究分析序列。- W6 u. s2 }6 @; E3 m
3、 现在普遍采用的是最上面的那个序列,这一条是世界范围的生物科学家用计算机合成的一个序列。% T" u& p( Q8 ^; x

4. 点击上述三条序列第一条序列(即reference)对应的"Genes seq",出现新的页面:
) H* a2 k; ]- I# {/ L+ Y% d* `

5. 点击上图出现的“Download/View Sequence/Evidence ”,即下载查看序列等功能,结果如图所示:
0 `, B( p# N) U7 _* v

在Sequence Format(序列输出格式)后面是一个下拉式选择菜单,默认的为FASTA格式,只有基因序列。还有一个是GenBank格式,提供了很多该基因的信息。
1 M) u% u0 @! h0 F* ^在Sequence Format后选择GenBank,点击下面的Display,出现目的基因的相关信息和序列。可看到基因长度,基因序列,以及这个基因是如何被报道出来的等各种信息。点击后如图所示:! i8 x  p/ Y( `: k* m5 W

! X7 `, C7 t8 u, P

' M0 t4 |0 A! |% J8 g  t[ 本帖最后由 WANZHAN 于 07-8-11 11:42 编辑 ]
附件: 您所在的用户组无法下载或查看附件,亲爱的酷友别忘了登陆注册加入基因酷!
生命的精彩在于大家共同的努力~~

TOP

已知基因部分信息查找该基因

已知基因部分信息查找该基因


* p% U$ v6 h0 ]" S3 `根据已经获得的基因的相关信息(如基因名称)进行查找:
8 U+ o  Z, E( K! j举例说明,比如基因名称是人的VEGF基因,打开http://www.ncbi.nlm.nih.gov/在search后面的下拉框中选择Gene,然后在中间的文本框中输入基因名称“VEGF”,点击GO+ S) s* s- `& q- `0 n" B; g; [

结果中找出想要的基因:
) v. m. x% x! }1 A( f

点击箭头所指的Limits:6 ]' K7 c) F3 E  D2 ~# S! j; K

会出现如下界面:( \/ o' e2 z9 b, S+ w

可以在这里对检索词进行很多限制,先选Gene name(基因名称);选择Limit by Taxonomy(生物分类限定)中的Homo sapiens(人类),再点击“GO” * J5 X! X  ?. @) a

直接点击基因名称“VEGFA”可以看到有关基因的信息。需要指出的是,在Genbank中,基因有很多别名(Aliases),和Genbank中记录的名称有可能不一致。比如在这里,VEGFA是Genbank中记录的基因名称,还有很多别名,比如MGC70609, VEGF, VEGF-A, VPF;在这里可以看到该基因在染色体上的位置。. H, y# j+ R) x; E1 ?9 m

点击VEGFA后出现的界面:
; E/ x+ c' n+ a1 B1 ~

下面可以看到Genomic regions, transcripts, and products,这里显示了该基因在基因组中的位置,以及转录本的生成情况:2 \% [8 R% h$ A% j1 u- \

可以看见目的基因的mRNA的链接(如NM_001025366.1)和蛋白质的链接(如NP_001020537.2 )。有的基因也许只有一个编码序列,但有的基因有很多的mRNA剪接体,都是归在一个基因名称下面。比如,在VEGF基因下面有7个序列,分别是vascular endothelial growth factor A isoform a, isoform c, isoform d, isoform e, isoform f , isoform g, isoform b precursor ,哪个是想找的基因呢?这就需要根据查阅的文献以及在这些基因序列后面的解释来确定。/ l2 {2 D) r' ]8 c9 x3 W

如果想找的基因是第一个序列即isoform a, 可以点击NM_001025366.1,得到如下界面:( O5 g# u4 w8 ^# F0 L

对于一些常用的GENE,如果只知道缩写,请先用主题词表找到全称.然后在进行搜索:7 m/ [% P) e1 R/ h& s3 H; A

附件: 您所在的用户组无法下载或查看附件,亲爱的酷友别忘了登陆注册加入基因酷!
生命的精彩在于大家共同的努力~~

TOP

STS查找已经公布的引物序列

STS查找已经公布的引物序列

  n, h& g3 Y) _% t! {6 w- P  J/ ~+ n
运用STS查找已经公布的引物序列(人的IL6基因为例):' C4 |7 x' b& |' q; O# v1 \" n
1. 打开NCBI主页,在Search后面的下拉菜单选择UniSTS,在FOR后面填写目的基因。操作完毕如图所示:
* q& c% z" m9 u

点击GO以后出现以下页面:' B7 s3 M' Q. b  o

  这里NCBI又提供了很多序列,下面要初步筛选需要的序列:2 B/ l. L0 S1 Z5 l1 A
2. 根据物种、目的阴物所在染色体的位置等选择相应序列(可能不只一个),点击。下面以点击第一个进入的画面为例。  U# A! S5 D" j- `" n) L2 R! o' w


$ g7 w7 F' \1 h+ L( T" O这个页面直接就给出了引物序列,PCR之后的片段长度也是给了的(247bp)。下还有很多相关的信息……# W- v- I+ ?, [
3. 点击GeneBank Accession 后面的代码,进入下一个页面。. y( ~/ l* E8 \

附件: 您所在的用户组无法下载或查看附件,亲爱的酷友别忘了登陆注册加入基因酷!
生命的精彩在于大家共同的努力~~

TOP

PubMed使用说明

PubMed使用说明


6 m' h0 {" J2 E1 M- z* H  e% p+ Q1 RPubMed简介:PubMed是美国家医学图书馆(NLM)下属的国家生物技术信息中心(NCBI)开发的、基于WWW的查询系统。是NCBI Entrez 数个数据库查询系统下中的一个。提供免费的MEDLINE、PREMEDLINE与其他相关数据库接入服务,MEDLINE是一个拥有1亿字条的巨大数据库。PubMed也包含着与提供期刊全文的出版商网址的链接,来自第三方的生物 学数据,序列中心的数据等等。提供与综合分子生物学数据库的链接与接入服务,这个数据库归NCBI所有,其内容包括:DNA与蛋白质序列,基因图数据、3D蛋白构象,人类孟德尔遗传在线。
1 s* U$ Z- ]- m" i. Z+ v+ G" `& f; x. @5 N页面介绍:' W6 R: M6 p. C

在浏览器中的URL地址框中健入http://www.ncbi.nlm.nih.gov/pubmed/并单击回车键后,将进入Pubmed的主页面。如图:$ B- N) W; k" k7 [+ P- O5 M8 D8 T* D" f1 u
1. 主页面左侧框的介绍:
' `9 J- r$ D* Y+ G( c: {

主界面的左侧框有:/ {( a: }+ k0 I# D; ^2 H
1、 Journal Browser 期刊浏览
' B2 w0 L6 T2 B% ?5 G2、 MeSh Browser可以用它来分层流览MeSH表
6 N, T8 s, Z& \# f  a3、 Single Citation Matcher通过填表的形式输入期刊的信息可以找到某单篇的文献或整个期刊的内容5 d0 n. ?* d( W8 R3 l: `; d: G
4、 Batch Citution Matcher用一种特定的形式输入期刊的信息一次搜索多篇文献。      
: D- Y* Z+ V' v5、 Clinical Queries这一部分为临床医生设置,通过过滤的方式将搜索的文献固定在4个范围:治疗、诊断、病原学与预后。
7 X' L# L4 @; Y# I" b6、 Old PubMed (使用以前的PubMed查询方式)' m6 D5 X$ n' U' k4 W$ E
Related Resources :5 A7 l: O7 k$ M! [5 P, t5 p
1、 Order document.可以使用户在当地得到文献的全文, 但这是要收费的。4 j8 e, }/ n% N3 j. P5 \( n: O! A
2、 NLM Mobile:可利用流动的手机进行查询的服务。
/ Q4 D# u' X' d2 Z6 h9 e3、 NLM Catalog:期刊具体详细信息。
" U9 c0 D! V7 [* I+ O! T4、 NLM Gateway:数据库入口
/ y6 e1 f- ~+ Z, z5、 TOXNET:提供了毒理学,危险化学药品,环境健康以及有毒物质释放的数据库
* k' L% d7 A3 l% s! e+ {+ H6、 Consumer Health提供与Medline plus的链接,Medline plus是与消费者健康信息相关的国家医学图书馆的网络节点
0 Q& D- |2 k7 }4 e9 _7、 Clinical Alerts此部分的目的是加快NIH资助的临床研究成果公
7 K, z* [: W7 e8、 ClinicalTrials.gov:提供了关于政府或者私人支持的在自愿者上进行的临床研究最新信,能够告诉你进行该研究的参与者,位置以及电话等一系列详细信息。 * i% \  l5 x, j! [& Q
9、 PubMed Central:是美国国家健康研究所提供的一个关于生物医学和生命科学的全文免费期刊库。 / A; u6 V0 Y/ j: a, }0 g; `
10、 Grateful Med是对另一个NLM基于网络的查询系统的链接。Grateful Med也提供MEDLINE的接入,并且还有一些其他的数据库如AIDSLINE、HISTLINE等等。5 `/ p8 @! l# x* V8 M
简单检索:
; _$ R: ~( M% f+ y9 u; i" r  登陆PUBMED检索系统主页,在页面上部的检索框中输入检索词或几个检索词,然后单击"go"按钮或按回车键。& d5 G! k3 z4 X9 Z6 |

  假如是查找与gallstone、pain有关的文献。在对话框中输入查询词。比如输入gallstone pain,然后单击“go”按钮或按回车键,PubMed将会自动开始检索,并将检索到的相关条目显示在屏幕上。3 V. V4 \3 O& ]$ v! y

  可以随时向查询框输入查询词,点击“go”按钮开始新的查询。“clear”按钮可以清除查询框中的内容,然后开始一个新的查询。7 w* u& M2 I5 j! [# w

  在查询框前search提示后有一个下拉式菜单,可以在这里选择其他的信息资源或NCBI的数据库。7 v/ Z+ E# H) y4 w
1、 Structure 搜索分子结构数据库(MMDB)The Molecular Modeling Database,这个数据库保存的是由X线晶体成像、NMR分光光度法建立的三维分子结构。
0 ~; r' D2 J$ n5 `& |) w2、 Genome 提供所有基因与染色体纪录与图片的查询服务,这个库中数以百万的基因序列是由庞大的基因排序工作得来的。
$ r  Y9 @0 ?1 u5 V3、 PopSet 这个数据库中的内容是由相关种族、人类发展、突变研究得来的人类进化与人种差异的结果。
8 M0 S& [7 o' N& [% |: \注意事项:
6 _% |& N. a4 c1、 在检索时,要明确检索的关键词,同时要考虑到关键词的同义词,还可以利用限定时间和研究团队来精简检索范围。
9 U5 B6 r; Q  B2 x# w2、 利用布尔运算提高检索效率,最常用的三种:是and,or和not
7 L6 J* \' `. p6 G$ _2 X检索类型:) B1 t, E2 x) l- F. H2 U- O5 k! N
1、 主题检索: 在检索框中键入英文单词或短语(大写或小写均可)。然后回车或点击"Go"1 K2 G6 t  A: r. e* A' }" Z
2、 作者检索:格式:格式为:"著者姓 空格 名字首字母缩写"
! m4 M0 ^. B8 N  N3、 刊名检索:可以输入期刊全名,也可输入期刊简写或期刊的ISSN号& n4 F2 p* U8 D. S; [. D
4、 日期范围检索:日期的录入格式为YYYY/MM/DD;如:2005/09/08 也可以不录月份和日子,如:2005或2005/09。
+ _! N2 Y" A. l/ {, ?/ n6 K5、 检索带文摘的记录:格式:检索词AND has abstract
0 X, A  V* U* i( K+ `6、 布尔逻辑检索:利用 and or not定义检索。  4 S; f3 D0 l' t1 j' O6 a
检索结果:. q  S* p5 t) {8 ]: R) H
检索结果默认的显示方式:是Summary格式,每页20条记录,以时间倒序排列。显示作者,文章题目,以及文章来源的一些信息:
% B4 k  T4 E; ^2 p4 B5 e) K& W) {
% z: ~; P7 r- ]4 e9 q$ A: Z

  可以通过点击Display 选择其他的显示格式,同时在show后的下拉菜单选择每页的显示数量可进行5-10-20-50-100-200最多每页显示500条数据。Sort by 可以利用检索结果的作者,其刊名或更新时间来进行排序显示。* K/ O$ i7 t7 t# A
  如果只显示其中的一条记录,点击所选的记录的题目进入查看详细的信息:可以看到文章的数据库链接,相链接的数据库如果已经购买,就可以看到全文。Pubmed只提供相应的摘要。9 d* X0 Z) \6 w, ]
高级检索:; _/ g- K% f) E% q
  进入PubMed首页之后,在快速检索框的下方,有五个重要的功能按钮,即Limits按钮, Preview/Index按钮, History按钮, Clipboard按钮,及Details按钮。
% Q" u' C- i. O( w5 o3 I0 o0 n5 G# d0 u/ |+ B% u

简单了解一下这几个按钮的主要功能:
' W" a$ z, e: x' [( c7 W1. Limis:
& g5 ?% ~2 {/ u* u当单击Limits按钮后,可以看到如下界面。
: P9 d" a0 k8 q& T7 o& o+ p
/ t+ d/ B: O1 f' c

1、 All Fields: 将搜索范围设定在一个特定的域。4 W) K4 n1 v2 E/ [& y0 o, x! u! h
2、 Ages,humans and animal,gender: 将搜索范围设定在特定的年龄组、性别组、人类或动物学范围。
3 p! X& ?( b7 d% W5 F* G3、 Publication types: 搜索限定在某一语种出版的或某一特定的文章类型(如综述)。2 d( K+ b1 r4 ?7 b. w- L
4、 Only items with abstracts: 设定只搜索包含摘要的文献。
+ A+ C2 c! n& Y* Y1 L+ w+ K) v! H5、 Entrez date: 设定搜索Entrez数据库或Publication数据库。
- v  ]6 {: N% N$ }6、 Subsets: 设定搜索范围为PubMed数据库的某一子数据库(如Abridged Index Medicus 或AIDS相关的条目)
' t7 g9 i4 l7 o. F2. Preview/Index 按钮: 在按下Preview/Index按钮之后,可以进行的设定有:
! Q% g! l* k. w6 \; v- J* i7 T- C1、 在显示条目之前显示所查到的文献数。
5 g) t; T' f  @( m! @2、 随时通过增加查询单词来修改查询方案。
% O) s, D  B. H. H- d; E- T, M3、 在特定的搜索域中向方案里加入查询词。
* Q$ L# F7 X2 ?$ C2 g4、 从Index中查看并选择词语来修改查询方案。
8 j6 r3 ]& T1 I8 x& Y% i5、 在你修改查询时查看方案。
! M) H( X, j! S) f! f' G6 p( f  Preview(预览) 使用此功能可以在显示条目之前显示所查到的文献数。使用时,在输入框中键入搜索词,然后单击Preview,PubMed返回的信息是条目的数量。 Index(索引)使用此功能,可以从特定域中选择以索引的单词,并把他们加入查询方案之中;可以查看某一个特定搜索域中词语列表;也可以使用布尔运算符来建立一个查询方案。
8 J1 k. b# z' L3 S6 N3. History 按钮 :  8 ?" B( [+ ?. _* B# J7 G) L
  History (历史记录)历史记录中保存的是所有的查询方案与查询结果,只有当运行了一次查询之后,History中才有内容。History屏幕将会显示:查询方案、查询时间、查询到的文献数量。Preview显示的是历史记录中最近的三条记录,而使用History可以看到最近100次的查询结果。一旦查询数量超过100,PubMed会将最早的查询除去,加进最新的一次查询。如果两次查询内容相同,PubMed会将头一次的去除。
; Y5 j" X0 x, l$ f% ~+ \4. Clipboard 按钮 :
3 y1 ]4 ]! f. D  o/ W$ T  剪贴板可以帮助保存或查看在一个或多个查询中选择的条目,然后就可以打印、保存、订购剪切板中的内容了。将条目左边的复选框选中,单击"Add to clipboard"就可以将其加入剪切板中。当点击 Clear History可以将History中的所有内容清除。剪切板中最大的储存数是500条。而放在剪切板中的内容如果在一小时内没有任何操作,将会自动消失。
. }6 t. w0 I- Q8 W7 i: R) j/ D5. Details  按钮 :
. z- w7 f8 t3 @; M" o9 @% P7 ]& V3 W

    Details是用于帮助查看PubMed的检索策略。即在提问框中键入的检索词被PubMed用Details键可以对检索策略进行编辑,然后再一次检索。在Query Translation框内显示的是PubMed实际使用的检索策略和语法。该框下有三个区域:Result区显示检索结果的记录总数,点击这个数字,可回到检索结果显示屏;Database区显示检索的数据库;User Query 区显示用户键入的检索词或检索式。要对检索策略进行编辑可直接点击Query Translation框中的检索策略,将其增加、删除或修改后点击Search键。 9 a6 ?  d( }! u0 e; W' \
除了以上五个主要功能键以外,利用PubMed提供的其他一些功能,如MeSH 等。 * K! l0 U6 k3 D' t! C( o
全文索取:
; p2 r: G+ ^, `
1. PubMed :PubMed上约有5%的文献是可以免费看到全文的,通常这些文献的左上角会有一个Free Full Text的小标记。只要点击这个图标,系统就自动链接入该文献的全文。有两点值得注意的是:" s; t8 ?, G  q7 d5 \+ G" X
1、 很多时候,这个图标在PubMed处于显示简要(summary)状态下并不出现,而只有在选择显示摘要(abstract)时才出现。因此,如果不只是泛泛浏览,而希望看到全文的话,在display下拉菜单中选择摘要(abstract)状态。/ X! f& l" l6 G6 o
2、 有些时候,小图标上仅标着Full Text,而并没有Free字样,但仍然可以链接,很多链接到所购买的数据库中。
  t' J) K6 p2 J1 L: e$ ]2. 免费提供全文的期刊 :部分网上免费全文期刊如:PNAS, PMC journals, DOAJ数据库都是网络免费的数据期刊库。# z& G4 Q" x$ A/ P
注意事项:在网站中出现的SUBSET是子集的意思,是指数据库中包含的子集数据库。
附件: 您所在的用户组无法下载或查看附件,亲爱的酷友别忘了登陆注册加入基因酷!
生命的精彩在于大家共同的努力~~

TOP

部分DNA序列数据库简介

部分DNA序列数据库简介


& r9 z0 a( C. @- b6 s! }, T+ yEMBL:EMBL是欧洲生物信息学研究所(European Bioinformatics Institute, EBI)创建的一个核酸序列数据库。EMBL的数据来源主要有两部分,一部分由科研人员或某些基因组测序机构通过计算机网络直接提交,另一部分则来自科技文献或专利(Stoesser等, 1998)。EMBL与DDBJ、GenBank建有合作关系,他们分别在全世界范围内收集核酸序列信息,每天都将新发现或更新过的数据相互交换。1 F: d" E/ `. a0 w
DNA数据库的规模正在以指数方式增长,平均不到9个月就增加一倍。1998年1月,EMBL中收录的序列数已超过一百万,包括15,500个物种,其中模式生物的序列占50%以上,它们包括人类(Homo sapiens), 线虫(Caenorhabditis elegans),啤酒酵母(Saccharomyces cerevisiae),小鼠(Mus musculus)和拟南芥(Arabidopsis thalania)。$ `2 ]% q' _2 p- s5 o! v
可以利用序列查询系统 SRS(Sequence Retrieval System)从EMBL数据库中提取有关信息(Etzold等,1996年)。SRS序列查询系统通过超文本链接将DNA序列数据库和蛋白质序列、功能位点、结构、基因图谱以及文献摘要MEDLINE等各种数据库联系在一起。利用EBI网站提供的BLAST或FastA程序,可以对EMBL数据库进行未知序列同源性搜索。+ }1 T& n, T5 N
DDBJ:DDBJ是DNA Data Bank of Japan的简称,始建于1986年,由国立遗传学研究院负责数据库的建设,维护及数据的传播,并与EMBL和GenBank合作;可以从世界各地通过网络把序列直接提交该数据库。DDBJ网页上也提供了包括FastA和BLAST在内的数据库查询工具。
' Y0 Y0 |) Y: J  I! HdbEST:EST数据存储在dbEST数据库内,该数据库有自己的格式和识别代码系统。序列信息以及dbEST的注释摘要,也按DNA的分类分成了若干子数据库。1998年5月8日版的dbEST共包括1.6ⅹ106条EST。其中有1百万条属于人类(Homo sapiens),30万条属于++(Mus musculus),和++(Mus domesticus)。- c* S8 O' r/ J& G
GSDB:这个基因组序列数据库由位于新墨西哥州Santa Fe的国家基因组资源中心创建。GSDB收集、管理并且发送完整的DNA序列及其相关信息,以满足主要基因组测序机构的需要。这一资源是以在线服务器-客户式关系数据库的形式进行工作的,为远端的大规模测序机构向其提交数据提供了方便。以这种方式获取的数据,在被发送之前会先对数据进行检查以确保数据的质量。
" E8 {; j% j1 z; i$ i4 AGSDB中条目的格式与GenBank中的基本一致。这两种条目的主要区别是GSDB中有名为GSDBID的一项。: p' j9 b/ x" }9 B5 c
这个数据库可以通过万维网,或使用服务器-客户式关系数据库来使用;无论用哪种方法,熟悉数据库语言,SQL(结构化查询语言),会有所帮助。) {( c0 @0 A, }# w/ _7 {. I* q1 |8 q
特定基因组资源:除了涵盖从完整基因组到单个基因各个方面的综合DNA序列数据库,还有些更有针对性的基因组资源,或称专用数据库。在一定程度上,可以认为这些数据库既连接了一些基本的DNA数据库,把它们的数据抽调出来填充到自己的数据库中;又连接了一些经常调用这些数据库的查询结果的其他数据库。这种独特数据资源存在的意义在于强调(a)特定物种的基因组,(b)特殊的测序技术。每包含的序列信息对这类数据库也许并不重要,一般情况下,它们主要的目的是为某一特定的物种提供一个更为完整的数据库资源,如模式生酵母(Saccharomyces cerevisiae、 线虫(Caenorhabditis elegans)、果蝇(Drosophila melanogaster)、拟南芥(Arabidopsis thaliana)、幽门螺杆菌(Helicobacter pylori)等。因为某一系统中的序列数据只能提供该物种一定层次的信息,如果把更高层次的信息加以综合,就能对基因组的组织结构有一个完整的理解。
$ s# v% ^# E% s5 F6 M0 _. M. B因特网为科学家们在交流基因科学方面的研究成果上带来的影响,怎么夸张都不过分。下面选择了现在能见到的几个数据库为例作些说明,其中既有网站,也包括可下载的数据文件。' Z* Q% S: s  v" x2 h! b
SGD:酵母基因组数据库SGD(Cherry et al.,1998),是以方式工作的一种在线资源,包括了啤酒酵母的分子生物学及遗传学信息。通过因特网可以访问该数据库的全部基因组,包括基因及其产物,一些突变的表形还有各种数据的相关文字信息。酵母基因组的重要性在于,1998年它成为第一个完整测序的真核生物基因组。SGD通过若干功能的集成,为研究人员提供同源性查询,使用网络上的基因序列分析资源,注册酵母基因名称,查看基因组的各类图谱及三维结构信息,设计能够有效克隆酵母基因的引物序列等等。数据库通过一系列友好,生动的图形界面为用户展示各种物理、遗传、和序列特性图谱。3 C6 n6 }* V4 O+ A
UniGene:人类基因组计划的主要任务是对人类基因组进行全测序,(整个基因组估计有30亿对碱基),然而这里面只有大约3%可以编码蛋白质,其余部分的生物学功能还不清楚。转录图谱可以把基因组中实际表达的部分集中起来,因此是一种重要资源。0 w4 P! s! l: O* s, }- o2 ]
UniGene希望通过从GeneBank中调出一些不包括多余部分、面向基因的序列串组成一个转录图谱。这个库涵盖了多种生物的基因,每个序列串与唯一一个基因及其相关信息建立联系。如基因在什么生物组织中表达,图谱中的位置等。& r# D+ T6 X5 Z# h" Q
除了研究的已经很清楚的基因序列外,大量新发现的EST也包括在内。这就意味着,大部分序列只是片段序列,相应基因并没有搞清楚。因此,这个数据库的另一个价值就是发现新基因。在描绘基因图谱及大规模基因表达分析等项目中,UniGene也可以帮助实验设计者选择试剂。
* Q+ k+ `2 t( x0 O& h! z进入NCBI的主页,可以访问这个数据库。
  c3 H; K" w* v- s" @8 f) {TDB:TIGR数据库(TDB)包括DNA及蛋白质序列,基因表达,细胞功能以及蛋白质家族信息,并且还收录有人、植物、微生物等的分类信息,是一套大型综合数据库。特别之处在于,这套数据库包括一个微生物信息库,收录了TIGR自己以及世界范围内的其它基因组测序计划的成果,如、致Lyme病螺旋体(B. Burgdorferi)、流感嗜血菌(H. Influenzae)、幽门螺杆菌(H. Pylori)、和生殖道支原体(M. genitalium)等,寄生虫数据库(T. brucei P. falciparum),人、鼠、水稻等基因索引计划;拟南芥(A. Thaliana)数据库;以及人类基因组数据库等。其中有些数据可以由FTP站点下载,或是由TIGR的主页访问。% q* m& G! k/ J3 ^4 k
ACeDB:AceDB数据库,是线虫(C. Elegans)基因组计划的一个成果。库内的资源包括限制性图谱,基因结构信息,柯斯质粒图谱,序列数据,参考文献等等。通过软件ACEDB来管理并浏览这个数据库,ACEDB提供一个图形界面,使用户能够从大到整个基因组小到物理序列的各个层次考察基因组数据。ACeDB及ACEDB既可以指数据库又可以指浏览工具,这可能会引起混淆,用户应注意区分。
本帖最近评分记录
  • kaige88 威望 +1 资源分享 08-4-4 17:20
生命的精彩在于大家共同的努力~~

TOP

多谢,我是初学者,受益匪浅

TOP

引用:
原帖由 yddjh 于 07-8-30 14:30 发表
  d' `2 n5 n' O$ s: E多谢,我是初学者,受益匪浅
; q2 @. C" K' A; l! m  q
感谢您的支持,有什么不全的地方还希望您指出^_^
生命的精彩在于大家共同的努力~~

TOP

发新话题
本功能由奇虎搜索实现

相关主题

标题 作者 最后发表
请问为什么NCBI中blast和EMBL的clustalw的进化树不一样? yf-deng 2008-05-29
有介绍pdb使用的吗? 有空来看看 2008-05-04
FASTA格式的疑问 qiuyewutong1983 2008-05-28
高手帮忙看一下ncbi上关于猪的definition 有空来看看 2008-05-27
带着问题 我又来了^_^找狗的cytb基因 有空来看看 2008-05-23
点击阅读更多关于的相关帖子  更多相关主题