其他引物设计知识
* w R$ l0 D( @. k6 G4 i& G" U
简并引物设计 2 w4 P3 s9 `) D# E# _! v
简并引物常用于:从已知蛋白到相关核酸分子的研究及用一组引物扩增一类分子。
; f' v2 b; A, C, U2 `" Z, |
简并引物设计过程4 @, `1 d( f# u$ e6 f$ e
1、 利用ncbi搜索不同物种中同一目的基因的蛋白或cDNA编码的氨基酸序列,因为密码子的关系,不同的核酸序列可能表达的氨基酸序列是相同的,所以氨基酸序列才是真正保守的。首先利用NCBI的Entrez检索系统,查找到一条相关序列即可。随后利用这一序列使用BLASTp(通过蛋白查蛋白),在整个Nr数据库中中查找与之相似的氨基酸序列。
) Y9 n% s; K0 |2 n
2、 对所找到的序列进行多序列比对
/ u" e* ^9 G6 ~; \7 m将搜索到的同一基因的不同氨基酸序列进行多序列比对,可选工具有Clustal W,也可在线分析。其结果如下图所示,所有序列的共有部分将会显示出来。“*”表示保守,“:”表示次保守。
1 }: ?/ i5 D' K% T' _4 X3、 确定合适的保守区域
: h7 ~' |, Z! l, X9 J% h; C+ q) k
设计简并引物至少需要上下游各有一个保守区域,且两个保守区域相距50~ 400个aa为宜,使得pcr产物在150~1200bp之间,最重要的是每一个保守区域至少有6个aa残基,因为每条引物至少18bp左右。若比对结果保守性不是很强很可能找不到6个aa的保守区域,这时可以根据物种的亲缘关系,选择亲缘相近的物种进行二次比对,若保守性仍达不到要求,则需进行三次比对。总之,究竟要选多少序列来比对,要根据前一次比对的结果反复调整。最终目的就是有两个6个aa且两者间距离合适的保守区域。
, B) e r1 [0 k( G/ l
4、 利用软件设计引物
, L2 C7 C1 M% D8 f3 c* [当得到保守区域后,就可以利用专业的软件来设计引物了,其中pp5支持简并引物的设计,将参与多序列比对的序列中的任一条导入pp5中,再将其翻译成核苷酸序列,有密码子简并性,其结果是有n多条彼此只相差以个核苷酸的序列群,该群可用一条有简并性的核苷酸链来表示(其中R=A/G,Y=C/T,M=A/C,K=G/T,S=C/G,W= A/T,H= A/C/T,B= C/G/T,V=A/C/G, D=A/G /T,N=A/C/G/T),该具有简并性的核苷酸链必然包含上一步中找到的氨基酸保守区域的对应部分,在pp5中修改参数,令其在两个距离合适的保守的nt区域内寻找引物对,总之要保证上下游引物都落在该简并链的保守区域内,结果会有数对,分数越高越好。
, u3 b* s/ q9 d1 `' w
对引物的修饰
6 z# t! @4 ?) z9 _) Z% N. _
若得到的引物为:
# R5 j, B1 P2 w3 W
5-NAGSGNGCDTTANCABK-3
2 k* J0 x* G& a2 v则其简并度=4×2×4×3×4×3×2=2304,很明显该条引物的简并度多高不利于pcr。可以通过用次黄嘌呤代替N(因为次黄嘌呤能很好的和4种碱基配对)和根据物种密码子偏好这两种方法来降低简并度(有个查密码子偏好的数据库我以前发过大家搜索一下把)。
1 H+ @$ |8 x h
最后,这样子设计出来简并引物对,适用于用于比对的氨基酸序列所属物种及与这些物种分类地位相同的其他物种。
5 D7 X# K, i+ n8 P1 `
注意事项:
4 n k3 s% k7 S) l* ]! t" `2 k% n/ L$ [1. 从蛋白到核酸,应注意:
, O- s: r( F' C" J! H; t. X
1、 尽量选择简并度低的氨基酸区域为引物设计区。如蛋氨酸和色氨酸均只有一个密码子。
1 b- n: o% P! o3 C' O
2、 充分注意物种对于密码子的偏好性,选择该物种使用频率高的密码子,以降低引物的简并性。
; K% a9 D+ H5 y$ R2 M+ x* T# U+ H. Q. @7 W
3、 引物不要终止于简并碱基,对于大多数氨基酸残基来说,意味着引物3’末端不要位于密码子的第三位。
+ F3 r4 E5 ~0 J
4、 在简并度高的位置,可用次黄嘌呤(dI)代替简并碱基。
* O; l+ C; P0 U+ }: y
2. 以上几点,遵循的总的原则为:尽量降低引物的简并度,尤其在3’末端或近3’末端。
9 X0 e# y% @: i( D) w+ o9 B用一对简并引物扩增一类DNA分子时,同样遵循上述总的原则,即尽量降低引物的简并度,尤其在3’末端或近3’末端。 在此种应用中,应先利用工具软件(多序列对准比较软件)或其它工具找到这些分子的保守区,然后根据共有序列,应用上面所述的一些原则来设计所需要的引物。
1 ^) n3 S) \2 o; ?. s% h
+ ^( F" `9 l3 Z9 _) R) C. x% W
测序引物设计 :) J! n4 q2 n0 u H7 Q
测序引物的设计一般都由测序公司来完成,如果需要自己设计的话;那么除了按照上面所提到的引物设计通用标准外,还需要注意两点:
3 \' T5 @, I$ v6 \/ F/ w% h( d) j
1. 测序引物的特异性的标准掌握应该更严格一些,也就是说设计时更优先考虑特异性。因为在测序反应中,如果引物与模板在非预期位置退火并引发链延伸,会对结果对来很大的干扰甚至造成结果无法识读。
7 Z/ c. [1 h8 [/ n2. 测序引物的Tm值适当高一些。现在大部分测序反应均选用耐热的测序级DNA聚合酶来催化,并采用PCR的热循环程序。选用的测序引物的Tm值稍高一些,有助于使反应顺利跨过待测模板的二级结构区,也有助于降低非特异反应。
( d" V1 }7 n5 C- G2 z, e! O
- \$ e5 M9 s" d探针的设计:
4 k+ J1 n9 c+ g! @# l探针的设计,根据不同的用途各有其设计特点:
/ x- z5 E: T* ^0 j; T2 j1 i' V1. 探针的长短一般在20-50核苷酸之间,过长合成成本高,且易出现聚合酶合成错误,杂交时间长。太短则特异性下降。确保探针的Tm值要比引物的Tm值高出10℃,这样可保证探针在煺火时先于引物与目的片段结合。因此探针最好是富含GC的保守片段,保证其的Tm值较高。
$ f# }1 a2 |, w* C
2. 注意G和C的含量努力控制在40-60%,同时一种碱基连续重复不超过4个,以免非特异性杂交产生。
- L! {$ s1 _: l6 i; {+ \7 g
3. 探针自身序列不能形成二聚体,也不能有“发夹”结构存在,这一点上的要求就要比普通引物设计严格得多。
5 M+ I& _5 d* Q* O! i. ^
4. 如果探针地靶目标是多个基因的混合物,就必须控制该探针与无关基因之间的相似性在70%以下。
, `. u. I6 ~2 f. [4 r v
5. 探针要绝对的保守,有时分型就单独依靠探针来决定。理论上有一个碱基不配对,就可能检测不出来。若找不到完全保守的片段,也只能选取有一个碱基不同的片段。且这个不同的碱基最好在探针的中间,对探针与目的片段的杂交影响不大,不相同的碱基最好不要在两端,因为两端不利于探针的杂交。且最好为A或T,而不能为G或A,因为A、T为双键,而G、A为三键。
* H: G1 w- ]0 P, w/ Q6. 探针的名称:应标记探针在基因组的位置及长度。
: L" K. ^3 Q8 \7. 探针Tm值计算
, p7 k- m, j) o& O用oligo或primer preiemer软件即可计算Tm值。确保探针中GC含量在30-80%。应避免探针中多个重复的碱基出现,尤其是要避免4个或超过4个的G碱基出现
9 [0 R4 [ a% n3 \! K$ f用DNAstar软件中的Primerselect软件,点击“log”菜单中的“create primer catalog”,在“name”中输入探针的名称、位置,按Tab键进入“sequence”,粘贴或输入要分析的探针序列。选中整个序列后,在“report”菜单下“primer self dimer”,分析探针的二聚体。弹出的窗口中就告诉此探针有多少个dimer,并对此探针用dG值进行评价(通常给出最差的dG值,理论上是dG值越大越好)。在“report”菜单下“primer hairpins”,分析探针的发夹结构。弹出的窗口中就告诉此探针有多少个hairpins,并对此探针的hairpins进行评价。多重荧光PCR时,要对多条探针进行“pair dimer”进行分析。
& |& d, d5 X; x% R& X7 W6 ~6 u9 d/ Z* I% N; m: p/ S* e8 ^' n8 t6 v$ \
合成cDNA引物的选择6 j' I1 r: t. u( a) M" H
1. 随机六聚体引物:当特定mRNA由于含有使反转录酶终止的序列而难于拷贝其全长序列时,可采用随机六聚体引物这一不特异的引物来拷贝全长mRNA。用此种方法时,体系中所有RNA分子全部充当了cDNA第一链模板,PCR引物在扩增过程中赋予所需要的特异性。通常用此引物合成的cDNA中96%来源于rRNA。
& d9 |0 U+ Y' Y+ `2. Oligo(dT):是一种对mRNA特异的方法。因绝大多数真核细胞mRNA具有3’端Poly(A+)尾,此引物与其配对,仅mRNA可被转录。由于Poly(A+)RNA仅占总RNA的1-4%,故此种引物合成的cDNA比随机六聚体作为引物和得到的cDNA在数量和复杂性方面均要小。
0 W& G! d5 _. P. `7 e Y
3. 特异性引物:最特异的引发方法是用含目标RNA的互补序列的寡核苷酸作为引物,若PCR反应用二种特异性引物,第一条链的合成可由与mRNA 3’端最靠近的配对引物起始。用此类引物仅产生所需要的cDNA,导致更为特异的PCR扩增。
/ Z3 p1 B" c, y, u7 P
A very useful primer for cDNA synthesis and cDNA PCR comes from a sequencing strategy described by Thweatt et al. (1990): this utilised a mixture of three 21-mer primers consisting of 20 T residues with 3'-terminal A, G or C, respectively, to sequence inside the poly(A) region of cDNA clones of mRNA from eukaryotic origin. I have used it to amplify discrete bands from a variety of poly(A)+ virus RNAs, with only a single specific degenerate primer upstream: the T-primer may anneal anywhere in the poly(A) region, but only molecules which anneal at the beginning of the poly(A) tail, and whose 3'-most base is complementary to the base next to the beginning of the tail, will be extended.
$ k- Y" \, z' n8 ?! J7 n4 e% `
4 {0 I6 H/ V& O3 Yeg: 5'-TTTTTTTTTTTTTTTTTTTTTTTTT(A,G,C)-3' 4 B& ~$ T+ E6 w
works for amplification of Potyvirus RNA, and eukaryotic mRNA 4 o) X3 [& M9 s+ U; w
多重PCR引物设计
) s7 y$ B; V* r$ k5 y" O' R4 M0 F# F% O 多重PCR在引物设计方面主要要考虑引物间的相互作用及引物的Tm值。引物设计好后要用评价软件看看你准备放在一起做的这些引物之间有没有很多二级结构,选择相互作用最少的引物。然后引物之间的Tm值要近似,当然不可能达到完全一样,那么在做PCR的时候可以做touch down 即梯度PCR,从高退火温度开始每个循环降低一定温度,然后以较低温度把PCR反应做完。这样既能照顾到每对引物的Tm值又不会影响较高Tm值的引物的产物的特异性。这个在其他帖子里有详细介绍楼主可以去搜索一下。另外就是设计时多个产物的大小应适当拉开,方便在PAGE胶或琼脂糖胶上面分辨。
, e" L! G0 `2 l3 P: l7 }4 i6 p关于做多重PCR方面,做之前最好将几对引物预先混合成预混液并算好每对引物在终反应体系中的浓度,以后每次做PCR就固定加多少预混液就行了。这样一来操作比较简便,二来可以保证每次做反应引物之间的比例都是固定的。
0 f/ f1 F. X) b: n( H6 a$ R5 U
产物片断越小就越容易扩增一些, 因此在预混液中产物片断小的引物对就要相对少放一些,以免跟其他引物竞争发生优势扩增。这需要一个摸条件的过程,一般先根据经验按照产物片断越小,引物越少加的原则先混合一些预混液行PCR反应,然后跑胶看产物条带的浓淡如何,再根据条带的浓淡调整引物的比例,达到最佳效果以后就可以一直按照这个比例混合引物了。这样就可以达到最好的实验效果。
% L9 B3 @' c/ j5 P有一个技巧可以使用primer设计多重pcr引物。
Q, J$ m% T0 N/ ~
1、把你要扩的基因序列联起来,记住每个基因的起始位置。(当然别太长了,否则每个选择编码区)
4 @! D5 N0 q; d# ~3 h8 F5 U( G7 H
2、使用primer中的nest引物设计程序,选择多重引物。
' ^) P! K) V, f" I2 Y# j3、设计中主要遵循两点原则:
$ h/ E& g- h( L) u, ?
1、引物间尽量减少二级结构形成。
" c0 V+ ^: e `1 F: `2、产物长度有差别但不能太大(相差100-200)。
: s! K0 A( S5 l8 L( \# d% o
" R2 f! q. ^ a; ~) p
克隆PCR引物的设计:
3 }6 j5 N8 W2 X9 R9 R: G7 j" \1. Complementary sequence of 18-20 bases is sufficient in most cases if you don't bother to calculate Tm (see links below if you want to calculate Tm).
/ U) p1 H9 `$ l; N% d: f- u5 U
2. If your protein is not fused to anything, you should add a start codon (ATG) immediately in front of your gene in the forward primer, and the complement of a stop codon (TAA/TGA/TAG - TAA is preferred) immediately after in your reverse primer.
g* ^4 e& X3 L9 T: z! ?& ?3. Introduce one or more restriction sites depending on how you wish to ligate the gene into the expression vector - e.g. if you use pET 21b, use NdeI (conveniently containing the start codon) for the forward primer, and XhoI for the reverse primer if you wish to fuse the protein to a C-terminal His-tag. Make sure that the restriction sites chosen are absent in the gene.
$ c0 n! w) u2 B) M% l
4. Put in extra bases at the 5'end to allow for efficient digest by restriction enzymes - consult NEB catalog . 8-10 are more than sufficient in most if not all cases (it's actually a bit of overkill as 3-4 are suitable for most). These extra bases are unnecessary if you are doing TA cloning.
2 S* d; Z9 ]7 l' M _! ]6 w
5. Two or more of these extra bases can form a GC clamp at the 5'end.
% j* e, @/ [5 F( ]: T8 H6. Avoid too many G or C at the 3'end.
6 b" K) _" l2 ^: E7. Avoid long runs of single nucleotide.
$ A" }- o# ~' `& s7 p7 `8. Make sure the forward and reverse primer don't form primer dimer (esp. no complementary sequences at the 3' end) or form significant secondary structure. See Alkami Biosystem Primer Design online for primer design sites.
, b9 ?) p q8 Z6 E+ z
9. It may be useful (though normally unnecessary) to check sequences of gene or vector for homology of 70% or more with the primer to avoid multiple PCR products.
, B( E, M4 J' I* @$ ?; Z The above guidelines should be sufficient in most cases, but if you'd like more details, see tips on primer design , notes on primer design, Tavi's PCR guide, and Primer design workshop. There are also a number of web-sites for primer design at Alkami Biosystems and at BioGuide.
3 a- P) @8 D9 {+ T( x
& c$ l$ g G1 d" A% `, n$ Z3 ]2 V* mExample
N can be any of the 4 nucleotides, therefore
. W7 H f, }/ ~7 n9 SForward oligo1 T* C! ]2 D3 J) Z1 Y/ q% ~4 f1 [
5' GGCGCAATACATATGAGAGACAGTGGGACCGTCTG 3'
; e4 |. `0 A$ ]3 z; b$ r
Reverse oligo& H J) A6 r# H
5' GGCCGAACTCGAGTTACTCTAGAATCCTCAAGTCCA 3'
. w6 l' |& I9 o0 }" q- x: w' c
(sequence complement to the sense strand)
9 S* L, d% G7 ~, ANote:. ~+ N: D5 x! R/ Y9 s, l" N6 E
1) If the N-terminus of your protein is not fused to any fusion partner or peptide, it is often useful to change wherever possible G or C to A or T for the first few codon. This will help reduce secondary structure on the translation initiation site and therefore improve expression.
: E! f% [. L3 p f+ U7 p1 v+ n2) Although we need not consider designing degenerate primer, but should the need arise, see degenerate PCR for guidance.
: a, ^$ g" M8 i9 C) A
. n! _4 ~" i: J2 z; E" X
巢式PCR引物:7 y; l4 G9 B( w, d- N
% [/ U/ Y' @% X" iThis gel photo shows the effect of nested PCR amplification on the detectability of Chicken anaemia virus (CAV) DNA in a dilution series: the PCR1 just detects 1000 template molecules; PCR2 amplifies 1 template molecule (Soin?C, Watson SK, Rybicki EP, Lucio B, Nordgren RM, Parrish CR, Schat KA (1993)? Avian Dis 37: 467-476).