32 1234
发新话题
打印

[生物信息学] 生物信息学数据库及查询

本主题由 WANZHAN 于 07-11-15 14:59 分类

生物信息学数据库及查询

生物信息学数据库及查询

7 n& t4 k( E+ ?( }: `
主要内容:; ]! x4 T8 u4 k4 ?) Q4 B
1、核酸序列数据库概述& A( x* @8 q" n7 T7 A
2、GenBank数据库概述及子库分类4 S8 \8 }3 Z2 B6 {( {* I* w( {) l( T
3、GenBank数据库结构
, E3 f% n, c6 ^; l4、GeneBankNCBI)服务/工具平台之数据检索
! J7 T: h2 ^6 B# B$ l9 e& g% x5、GeneBankNCBI)服务/工具平台之序列相似搜索' {4 x% z2 f8 y. U  ~, C# o6 u
6、GeneBankNCBI)服务/工具平台之序列分析
2 n3 ?3 ~' X7 e4 l8 S7、序列提交-向GeneBank提交新序列+ f) O) j$ q' ~; n  \
8、EMBL数据库简介" _7 }0 r' ~$ O# m1 r
9、其它常用核酸序列数据库' h8 S# j7 V$ p) j4 k
10、基因组数据库- j3 @  S$ D6 s9 s
11、常用蛋白质序列数据库
# T# {' K9 V0 _0 n12、SwissProt数据库
& v" s! y) ~, y13、SwissProt蛋白质数据库子库
1 ~( I" q9 q9 }! `$ ^+ L14、PIRPSD)数据库及PROSITE数据库
0 J& h: u* P  I9 N( ^0 D1 d5 W, ?15、其它蛋白质序列数据库
7 D: V- r* C! V+ d" k: m' N2 }16、蛋白质序列二次数据库
1 e0 I9 J4 e6 d) \17、蛋白质结构数据库
, c7 h: ]2 Z  U1 g% O6 a18、数据库查询之Entrez查询系统
; s2 w4 Y7 I5 Z2 H! y: Z% r8 `6 u19、SRS数据库查询系统
" |0 X) u/ _9 @# W& {+ a% Q+ q$ O5 V: a2 c5 s
声明:
" h# `; o' T1 T1、本篇涉及的资源主要源于网络及相关书籍,由酷友搜集、分析、整理、审改,供大家学习参考用,如有转载、传播请注明源于基因酷及本篇的工作人员;若本篇侵犯了您的版权或有任何不妥,请Email genecool@126.com告知。
+ {  F0 X  }5 a" j2、由于我们的学识、经验有限,本篇难免会存在一些错误及缺陷,敬请不吝赐教:请到基因酷论坛(www.genecool.com/bbs)本篇对应的专题跟贴指出或Email genecool@126.com& ?- H$ o. C1 W2 f
3 i5 o& Y- A; p' V6 T
致谢:* F5 A1 C: Q  I- l2 _
整编者:flashhyh2 g' z; u% R# r- l; C: \
主要参考资料:《实用生物信息学技术》 罗静初;《生物信息学札记》 樊龙江;《生物数据库资源及其应用-ppt 中山大学生科院;《生物信息学数据库-ppt 复旦大学图书馆教研室
. W; y, p* L7 t, ?8 \# p) q
附件: 您所在的用户组无法下载或查看附件,亲爱的酷友别忘了登陆注册加入基因酷!
付出总有回报,努力会有结果!

TOP

核酸序列数据库概述

核酸序列数据库概述

* u6 a' B2 @3 U1 D' P. ]# w
        : t  C3 A1 @1 x; @6 F& i
        EMBLGenBankDDBJ是国际上三大主要核酸序列数据库。
% z: ^2 D) C! ~9 M- ]! j) Q+ ?        EMBL是由欧洲分子生物学实验室(European Molecular Biology Laboratory)1982年创建,其名称也由此而来,目前由欧洲生物信息学研究所负责管理, v# \) x9 C1 K9 b( E, W" p
    美国国家健康研究院(National Institurte of HealthNIH) 80 年代初委托洛斯阿拉莫斯(Los Alamos)国家实验室建立GenBank,后移交给国家生物技术信息中心NCBI,隶属于NIH下设的国家医学图书馆(National Library of MedicineNLM). {; i/ [$ J. y" f' L3 o5 R6 z
        DDBJDNA Data Base of Japan 的简称,创建于1986年,由日本国家遗传学研究所负责管理。
: i  w$ c. K) n2 @/ O        1988年,EMBLGenBank DDBJ共同成立了国际核酸序列联合数据库中心,建立了合作关系。根据协议,这三个数据中心各自搜集世界各国有关实验室和测序机构所发布的序列数据,并通过计算机网络每天都将新发现或更新过的数据进行交换,以保证这三个数据库序列信息的完整性。
5 D) G7 J9 Z7 A$ j/ i4 e# m    鉴于核酸序列数据库规模不断扩大,数据来源种类繁多,特别是大量的基因组序列片段迅速进入数据库,有必要将其分成若干子库,既便于数据库的维护和管理,也便于用户使用。例如,在对数据库进行查询或搜索时,有时不需要进行整库操作,而是将查询和搜索范围限定在一个或几个子库,不仅加快了查找速度,而且可以得到更加明确、可靠的结果。分类的原则:8 s; m+ K8 d8 c. e
    一是按照种属来源,如哺乳类、啮齿类、病毒等;9 n# J4 h4 E! t" T$ \  m
    二是根据序列来源,如将专利序列、人工合成序列单独分类;
  v$ f+ x% Q% n    此外,基因组计划测序所得到的序列已经占了数据库总容量的一半以上,而且增长速度远远超过其它各种子库,有必要将其单独分类,包括表达序列标记(Expressed Sequence Tags,简称EST)、高通量基因组测序(High Throughput Genomic sequencing,简称HTG),序列标签位点(Sqsequence Tag Site,简称 STS),基因组概览序列(Genome Survey Sequence,简称GSS)。其中 EST 序列条目占了整个核酸序列数据库的一半以上。
付出总有回报,努力会有结果!

TOP

GenBank数据库概述及子库分类

GenBank数据库概述及子库分类

# t4 F0 f) |5 S+ b. h# V
GenBank数据库
% \: c* X% K. h2 c; r" j6 W        Genbank几乎包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它由美国国立生物技术信息中心(NCBI)建立和维护的,数据直接来源于测序工作者提交的序列、测序中心提交的大量EST序列及其它测序数据以及与其它数据机构协作交换而来的数据。Genbank每天都会与欧洲分子生物学实验室(EMBL)的数据库及日本的DNA数据库(DDBJ)交换数据,实现三个数据库的数据同步。到19998月,Genbank中收集的序列数量达到460万条,34亿个碱基,而且数据增长的速度还在不断加快。Genbank的数据可以从NCBIFTP服务器上免费下载完整的库,或下载积累的新数据。NCBI还提供广泛的数据查询、序列相似性搜索以及其它分析服务,用户可以从NCBI的主页上找到这些服务。
) E, {8 v+ N' f& T9 Q5 f1 R1 ~; i) a        Genbank库里的数据按来源于约55,000个物种,其中56%是人类的基因组序列(所有序列中的34%是人类的EST序列)。每条Genbank数据记录包含了对序列的简要描述、它的科学命名、物种分类名称、参考文献、序列特征表、以及序列本身。序列特征表里包含对序列生物学特征注释如:编码区、转录单元、重复区域、突变位点或修饰位点等。所有数据记录被划分在若干个文件里,如细菌类、病毒类、灵长类、啮齿类,以及EST数据、基因组测序数据、大规模基因组序列数据等16类,其中EST数据等又被各自分成若干个文件。  t! E! h8 T" r+ @/ R% ]2 V: A

& G4 c6 ?& T8 q) U) i6 Q* PGeneBank数据库子库分类9 |( [( y  l! ~

GeneBank名称


2 @4 [$ Q! ]/ T% b0 s0 y: k' h

英文含义


) I5 B! P. _- N8 _1 r; A

中文含义

: ]2 m3 Y0 J( ~" r

PRI


, r9 c) T2 Y4 N0 P* I- D/ _: }
Primate. o- R6 e: I7 o. `' i4 {* h
人类、灵长类
) K/ G9 k* N1 r+ P9 j

MAM

* G: H7 N" Q' f' m
Other mammalian+ ^2 |0 t% B1 O; q
其它哺乳动物  S8 x; p9 M3 o: V3 E5 e% G

ROD

5 [2 G% z( [: K. _, a; L
Rodent
5 z/ L% y  B* A; G2 H  I0 @0 o; K
啮齿类动物
# \$ i4 l' A1 @

VRT

5 r+ d) p' _5 Z, _* B6 X! N
Other vertebrate
2 H8 U9 B! J# P
其它脊椎动物# k2 ~3 o* v$ c) T7 x

INV


6 x4 l# i+ o! t0 z- y1 U
Invertebrate
/ q' }8 P: _* `" q3 Z! k
无脊椎动物- v# P" B& U! l1 ^  u

PLN


2 F- U* N, e/ b, k
Plant, fungi, algi
8 T! |) S1 X# U* x
植物、真菌、藻类0 Z# b. z6 a: }4 R6 d, w

FUN


3 x/ ^7 R+ x9 e6 N
Fungal2 N1 o3 N/ K0 ]. m- N  E
真菌、藻类
: B" i, E( f: z# c; A9 P, K; D

BCT

7 p- V7 E( m5 @$ i, b; v
Prokaryotes, bacterial; n  [- R8 L! w: e8 N/ `+ l1 b3 z
细菌、原核生物3 {4 {+ y8 L6 @* P. d0 T

VRL


) |6 l) c, u$ W( D8 r# C. A- H
Viral5 N2 T- N5 C$ ~
病毒
4 `* r0 i, e' N% A

PHG

2 }* e) G' O5 N& ]4 S; z7 O
Bacteriophage4 n: u1 X1 z  ~8 h1 ]
噬菌体
" ~, J) G- ?3 }$ T/ K

SYN

( z, V9 t1 W* A) @$ O, u
Synthetic
; y% X+ ~) F  r1 u" x6 X) d
合成产物: p' u  C7 |# q4 S8 u$ R# ^

EST


6 |; a/ B3 I# c0 _
Expressed Sequence Tags* O% s! f/ e) @7 d2 o: q  }8 F$ q
表达序列标记6 U: R% i/ J" y5 Y: S) \# O/ s

PAT


& Y5 C( }4 ?5 C4 L
Patent
& }, K) O9 B$ o$ h" ^  Q
专利序列
' X5 Y' b5 h8 q: f* Q( h

STS

/ U4 a2 n9 g) T8 G9 V4 H5 K
Sequence Tagged Sites* s3 [, L2 I2 c
序列标记位点
0 w, ^; c2 Y. @4 D

GSS

; M( _; M* o9 j; o
Genome Survey Sequences! L) h2 g1 U/ o4 p% g- z1 l
基因组测序序列- `7 b$ b( s3 e7 N4 U

HTG


3 N9 Z( J9 D" [! N
High Throughput Genomic Sequences* Z" _0 v+ [8 [) e/ [% T  w' H
高通量基因组序列! @7 y6 f6 F) k

UNA

5 M/ G! R+ i$ z
Unclassified / Unannotated5 `9 D$ o0 t% Y
未分类 / 未注释
5 r" i7 x9 Y8 E) ^
付出总有回报,努力会有结果!

TOP

GenBank数据库结构

GenBank数据库结构

% f* g- W: l9 A$ W8 `0 _0 h
GenBank数据库结构0 _, a" |4 x8 a) h6 k
    完整的GenBank数据库包括序列文件、索引文件及其它有关文件。索引文件是根据数据库中作者、参考文献等建立的,用于数据库查询。GenPept是由GenBank中的核酸序列翻译而得到的蛋白质序列数据库,其数据格式为Fasta& _1 S5 R/ M' p1 ~5 N
    序列文件是GenBank中最常用的文件。序列文件的基本单位是序列条目,包括核苷酸碱基排列顺序和注释两部分。目前,许多生物信息资源中心通过计算机网络提供该数据库文件。
- I) a9 Y5 Y( ]& D' |ØGenBank序列文件由单个的序列条目组成;6 F$ G& y( L. F
Ø序列条目由字段组成:每个字段由关键字起始,后面为该字段的具体说明;
8 w! w* }, \; h- u* L  I& p( {0 K! MØ有些字段又分若干次子字段,以次关键字或特性表说明符开始;
( V: |; N' O4 B: {- y7 ZØ每个序列条目以双斜杠“//”作结束标记。
* s2 Z  a( k8 l    序列条目的格式非常重要,关键字从第一列开始,次关键字从第三列开始,特性表说明符从第五列开始。每个字段可以占一行,也可以占若干行。若一行写不下时,继续行以空格开始。
! Z( v! N/ O/ g* W* I  g    序列条目的关键字包括LOCUS (代码)DEFINITION (说明)ACCESSION (编号)NID(核酸标识)KEYWORDS (关键词)SOURCE (数据来源)REFERENCE (文献)FEATURES (特性表)BASE COUNT (碱基组成)ORIGIN (碱基排列顺序)。先版的核酸序列数据库将引入新的关键词SV (序列版本号),用编号.版本号表示,并取代关键词NID
0 y( p$ h9 t' Z$ s$ C! U        LOCUS (代码)是该序列条目的标记,或者说标识符,蕴涵这个序列的功能。该字段还包括其它相关内容,如序列长度、类型、种属来源以及录入日期等。说明字段是有关这一序列的简单描述。
" R) Q/ j' A2 v6 G        ACCESSION (编号)具有唯一性和永久性,在文献中引用这个序列时,应该以此编号为准。* u9 i9 s- _7 \6 h
        KEYWORDS (关键词)由该序列的提交者提供,包括该序列的基因产物以及其它相关信息。
- _# ]- W: w6 {1 ^1 o/ a& L% J5 u        SOURCE (数据来源)说明该序列是从什么生物体、什么组织得到的,次关键字ORGANISM (种属)指出该生物体的分类学地位。
: Q3 X8 r6 \& T( l* V        REFERENCE (文献)说明该序列中的相关文献,包括AUTHORS (作者)TITLE (题目)JOURNAL (杂志名)等,以次关键词列出。该字段中一般还列出医学文献摘要数据库MEDLINE的代码。该代码实际上是个超文本链接,点击它可以直接调用上述文献摘要。一个序列可以有多篇文献,以不同序号表示,并给出该序列中的哪一部分与文献有关。! w1 F1 y3 U. v* `; X4 T6 {; w
        FEATURES (特性表)具有特定的格式,用来详细描述序列特性,包括蛋白质编码区以及翻译所得的氨基酸序列,外显子和内含子位置、转录单位、突变单位、修饰单位、重复序列等信息,以及与蛋白质数据库SwissProt和分类学数据库Taxonomy等其它数据库的交叉索引编号。特性表中带有‘/db-xref/’标志的字符可以连接到其它数据库。
+ B. Z1 o  u( n; e        BASE COUNT(碱基含量)给出序列中的碱组成,ATGC每类的个数。6 G' c! ]1 g+ `% M$ G9 @/ l
        ORIGIN是序列的引导行,引导碱基序列,以双斜杠行“//”结束。
. L; i3 l9 _0 _0 n$ h" u0 `# N' I  O
注:DDBJ数据库的内容和格式与GeneBank相同。
+ p/ i$ l9 G! \- ?+ C* y
5 |8 @! T: `; Z0 fGeneBank数据库字段、关键字表:
7 a& g0 ~6 U; o0 _; \
3 z0 N: G" [) D8 j3 }7 t. ?/ M

关键字


# U/ D& O! H. g  P8 O/ J( |( M

释义及含义

0 e# J& L% i3 w$ G

LOCUS

序列名称

DEFINITION

序列简单说明

ACCESSION

序列编号

VERSION

序列版本号

KEYWORDS

与序列相关的关键词

SOURCE

序列来源的物种名

ORGANISM

序列来源的物种学名和分类学位置

REFERENCE

相关文献编号,或递交序列的注册信息

AUTHORS

相关文献作者,或递交序列的作者

TITLE

相关文献题目

JOURNAL

相关文献刊物杂志名,或递交序列的作者单位

MEDLINE

相关文献 Medline引文代码

REMARK

相关文献注释

COMMENT

关于序列的注释信息

FEATURES

序列特征表起始

BASE COUNT

碱基种类统计数

ORIGIN

序列

1 L) r; D$ G3 `" q7 r' {/ `) g' IGeneBank数据库特征表:: a. H4 g# o' X+ q% e

名称


. y7 s$ s) Q8 p1 V  P

含义

  B* x5 v3 n, y" H# A

释义及说明


1 B* D6 Z9 ?1 Q/ H9 I

Allele

) x; d6 T" S& `9 a
Related strain contains alternative gene form
) y3 Q2 P, j( n# j4 R
等位基因的不同形式
1 d  ^, g" t! ]4 O

Attenuator


! D' O/ [9 W, O5 s
Sequence related to transcription termination
" {7 m8 B* W9 c* o
转录终止区- Z- Q- m- o/ j0 z  v! S

C_region

6 j9 V* n; S7 l. `( N
Span of the C immunological feature. e: x5 P+ d) h0 O
C-免疫特征区4 h$ v% p( X- u+ b* s" g" a

CAAT_signal


/ e& j5 K5 q& u& w# I$ f
CAAT box in eukaryotic promoters6 |. q! Z3 _6 M  ?! B% d
真核生物启动子中CAAT
" J% W" f9 h# W7 f! j' e$ @. u

CDS

/ i2 p' G, L5 y8 l! d# T8 L# i& S
Sequence coding for amino acids in protein (includes stop codon)( p1 _, {* `  b6 _" {
蛋白质编码区! g+ b. t  s; ?/ H

Conflict

/ p( W4 _0 z3 T: n5 B' {
Independent sequence determinations differ4 G3 f, b1 U) ^0 t$ n
不同测定结果所得差异序列
  F% A' y; `- e; o; O" w- |! q

D-loop

" X) `. T6 D+ Q" B0 Q( Q* d" G4 f  }
Displacement loop6 l& R# d' j, Z) E' k/ I
转移环(代表作者意见)7 O2 {2 J3 V6 z. C

D_segment

+ K2 l0 V! L* s9 \; c0 r
Span of the D immunological feature
7 ~: L+ ^0 _% Z2 P; i
D-免疫特征区+ X- E) Y6 e8 @' d

Enhancer

% T2 d- c9 d4 \% {7 @0 d1 w0 S
Cis-acting enhancer of promoter function7 |. v/ \! v1 U; A# N  W& g
启动子顺式作用增强子
) q7 X4 r- f( l9 H2 U8 J. G* A

GC_signal

/ F% D. W8 Z: h: Z1 b3 }
GC box in eukaryotic promoters
1 X4 o* y% E* a8 p6 [3 {/ o. ?" ~4 M
真核生物启动子中GC
' _  O7 K. f4 G3 y- j- {

Gene

8 Q3 y% S/ f1 `8 i! G: P
Region that defines a functional gene possiblyincluding upstream (promotor, enhancer, etc) and downstream control elements, and for which a name has been assigned/ C/ I) o- F: w% b
基因区域,包括上游启动子增强子和下游控制区
/ T! s' u8 [! K, q4 `% h  `/ s) ^! |

IDNA


$ |: m1 Y. `$ _
Intervening DNA eliminated by recombination7 j5 j+ Z8 w" }# j1 ?% c$ c- I! Q
重组引入的插入区+ b; G% |! I5 a  q- D

Intron


' H! h3 c  w0 Q
Transcribed region excised by mRNA splicing
% X/ p$ S5 s. c  Z
内含子区域' P/ A0 @9 ^( Q% B, D+ o

J_region

5 L& r2 O3 ^0 i/ c% m/ S& h% J. G; m
Span of the J immunological feature
3 S* Z% D  l6 U) e" B
J-免疫特征区
( K  I- f7 s# R$ [+ T/ @

LTR

& F  j$ F# Q) l4 k* y3 E
Long terminal repeat% r1 ~- o  j) D; ]& V' `! o* p
长终止重复序列
2 _# B) e; l4 q0 ^& q0 i: q0 z3 u

Mat_peptide

4 ]* M0 t( {6 r& M
Mature peptide coding region(does not include stop codon
1 ]0 p6 G" M, w% N, a! }3 h  j+ @
长终止重复序列* e. j$ D$ Q: d' O6 B0 M

Mat_peptide


0 g1 O% @( _: \$ h
Mature peptide coding region(does not include stop codon)
* |- U4 P' m; g6 S/ W. q/ a! M9 W
成熟肽编码区
/ n; x5 b( r, Z9 z- j1 d& U  p  x

Misc_binding

. ~, A8 l# M  b# s- j9 D/ v
Miscellaneous binding site
8 e6 [, A( }) ^2 M. C" G
其它结合位点
0 _) T/ ?9 a) O

Misc_difference

1 l4 p8 X* g9 o
Miscellaneous difference feature
' H! H8 G0 u* W
其它特征区& f$ h" V5 A3 y4 ~% y2 p: ]+ Z

Misc_feature

6 c4 p1 l5 H4 J  }7 b- q4 u6 `
Region of biological significance that cannot be described by any other feature! i/ d4 |2 N. j* s
其它重要生物功能区
3 s6 o# h( \( w7 e9 R

Misc_recomb

  [$ J5 v/ ~) t5 g# j
Miscellaneous recombination feature8 P. I0 X. U& ]  V7 _
其它重组特征区
0 }: W. v9 c, n$ \: B

Misc_RNA


6 f7 h8 C8 N# f8 m
Miscellaneous transcript feature not defined by other RNA keys
% n$ b3 `1 A, f$ S4 s
其它转录特征区
- I, a* P! ^9 @5 K

Misc_signal

4 j9 \  Z0 r" X5 @& v
Miscellaneous signal
2 f4 a, z) \6 U' ~3 T/ r
其它信号区' y- D& z  U3 v* m# ]8 W" }

Misc_structure

9 f8 `# e. v& N' e9 [; j7 Q! ?" J
Miscellaneous DNA or RNA structure5 m/ x9 g3 S5 ]$ t
其它DNA RNA 结构
. j2 ^/ V) B" P) F3 f  l$ s

Modified_base


9 \/ y0 H/ Q7 a! @  ]
The indicated base is a modified nucleotide+ K2 o% i+ Y4 Y, M
修饰碱基! v: N, g: P" h0 L8 U

MRNA

4 R$ y1 H: h6 O9 ]
Messenger RNA
# E! i  Z' U) L6 o- Z4 y
MRNA 区域
3 ~9 {8 n8 w. o* A

Mutation


9 t3 c) N7 Q$ k4 e6 M
A mutation alters the sequence here
3 ~: v% r2 b0 |3 y& }
突变区
, A. N" u$ T+ x3 }0 Z% b

N_region


. S+ e& G! _; m9 b# s6 i- z
Span of the N immunological feature
5 P$ H7 t3 e" p  N) ?2 p
N-免疫特征区+ j. G" Y! j: i8 ?& ^# x7 k

Old_sequence

+ E6 g; m/ m$ I, m4 r  s
Presented sequence revises a previous version% o: C% s1 ]8 p' B0 J
旧版本序列
* r( j. }; f( i$ |8 F" r/ W8 z

polyA_signal

  ?6 ~) h6 I/ _+ j( O
Signal for cleavage & polyadenylation% A4 H. e% |  r) E
多聚A信号区
6 A$ R+ G1 U7 T8 i

polyA_site

7 d1 e, \' ]) p0 k' A* l
Site at which polyadenine is added to mRNA
/ O, v; ~. G- I1 X4 t
MRNA 的多聚A添加位点( I  d: ]# B  {3 {* E

precursor_RNA

8 b% I7 [! `0 n% ^6 ?
Any RNA species that is not yet the mature RNA product
6 e! n2 v' |# P
前体RNA$ v8 k+ S2 O: w; K6 X! r

prim_transcript

6 w5 Y0 Q+ Z$ \% C
Primary (unprocessed) transcript
$ ]) V+ h- g7 Y7 r  @
初始(未处理)转录区
# t6 }8 r# ^* N; ^3 q( `

Primer


: T9 T  p, i% I6 a- H5 h+ v& `- b
Primer binding region used with PCR% u! k& l- f( X9 R* P0 D, d1 ~5 Q
PCR 引物结合位点; d! f# l9 |3 u& C

primer_bind


) Y+ H# ~6 e. `! C- w, g
Non-covalent primer binding site
3 d" x5 k* a) h& F
引物非共价结合位点
6 T% ^* Z. `' O9 ^4 r: p

promoter

0 ]* l+ S- R0 {! y: v& j- [
A region involved in transcription initiation$ d/ H7 o, J5 k3 Q
启动子区域
  u5 [) ~0 x5 v) l  O: I3 _+ f. q

protein_bind

- H: E* W5 a& a( d' u
Non-covalent protein binding site on DNA or RNA
" o# L' u# I1 h1 X, |  @
蛋白质非共价结合位点
& Y$ _5 _+ E$ E2 ?

RBS

" j: ^3 }* l; z( f
Ribosome binding site
! K' p) @5 q+ I* l- b0 W) M. s$ E
核糖体结合位点( o( X) r0 j; l/ s2 K7 J0 J# `1 `. Z

Rep_origin

7 Y, M: P, l& s+ F) ^0 T1 D
Replication origin for duplex DNA
- i4 y& U0 G0 b9 n! T0 n5 u
复制起始区
8 T/ F$ ~$ v  A: f. W

repeat_region

; J8 j5 F+ x9 r  q# J; j/ ~
Sequence containing repeated subsequences
, N: h' W; z. i+ N& H
重复序列区域
. Z& u6 a% E% Y! [/ W

repeat_unit


7 O+ K9 C' w" W# [9 K/ f( B
One repeated unit of a repeat_region
# K& R7 ]3 p! k2 g- j- q2 w
重复序列区域的重复单位
5 f7 Y6 a% U+ `6 p& N& C3 H( Q

rRNA


% T0 Z9 c7 r1 e1 X7 ?2 ?
Ribosomal RNA3 |" m$ y1 ^- z! z
核糖体RNA
$ S$ G" u; j) k: e  k, n) {

S_region

2 V' r! }; ~# m3 J3 m& U
Span of the S immunological feature
0 l1 G( Y  Q+ j2 I. j/ M& k* z
S-免疫特征区
0 \. u/ j/ c/ t, \7 ]7 z: y4 @

Satellite


6 {1 y% W$ G, r2 o1 }6 U! h
Satellite repeated sequence& d9 G9 J9 S+ i+ ?5 z4 U# R" Y1 j9 d
卫星DNA 重复序列% E6 J  ]" `/ Q, }# v/ G+ g

scRNA

  x8 `2 h- |$ P( }  }
Small cytoplasmic RNA
/ @3 i+ o, V4 C* Q: I* @" v6 Z
胞浆内小RNA
$ \3 K' K/ ^- l# A3 K5 z

sig_peptide

2 j4 r9 G1 r4 w
Signal peptide coding region+ P' d) s% V7 r1 b7 X, `; x
信号肽编码区
8 o/ Y/ w- E0 @2 _

snRNA

, z( V6 n4 r3 Y
Small nuclear RNA1 j4 q. l) ?) e7 V0 Q* d. G
核内小RNA
& M4 P: e! M) s, ]3 P& s

source

' O/ b7 J$ m' m) [
A GenBank record. Mandatory feature, one or more per record
1 u- X6 x6 ~) [& ^+ k# h, Z
NCBI分类学数据库记录号
. q9 f; u  Q, g+ ?6 b

stem_loop

+ R9 ], j! l6 X5 N  h+ f9 P
Hair-pin loop structure in DNA or RNA7 N1 W7 a1 ^7 t2 z5 @
DNA RNA中的发夹环" O: j; V, _2 |$ t; u

STS

- V8 O, m2 V: S) N: }3 w; R
Sequence Tagged Site;operationally unique sequence that identifies the combination of primer spans used in a PCR assay
3 ]0 {$ v$ c$ ~  w: b  g, h9 P7 D
序列标签位点  @, [5 i3 F' J5 P" _

TATA_signal

# _% Y$ ~; Q& j4 k$ u
TATA box' in eukaryotic promoters
, K1 G+ T5 t# X! d  [# i+ o
真核生物启动子中TATA
* k4 [9 }8 p1 d& r. ^

terminator

. S2 ~  J. I8 R1 f"