研究一个蛋白质的第一步是拿到它准确的基因序列,有了基因序列,我们就可以构建合适的质粒,表达出所需要的蛋白。
质粒构建,英文名为plasmid construction。选定的目的外源基因(DNA)先要经过PCR扩增。随后用限制性内切酶分别切割载体和外源DNA片段,再使用DNA连接酶将切割后的载体与DNA片段连接,转入宿主细胞。最后经过筛选鉴定出正确的重组克隆质粒,实现目的基因在宿主细胞内的正确表达。
图一:质粒构建流程示意图
1、如何选择载体?
载体通常分为克隆载体(Cloning Vector)与表达载体(Expression Vectors)两种。
克隆载体大多是高拷贝载体,能够将外源基因与克隆载体的质粒连接,导入原核细菌内,进行大量复制克隆。主要用途是保存目的基因片段。
在选择克隆载体时应注意:
① 具有自主复制能力,拷贝数高;
②携带易于筛选的选择标记;
③含有多种限制酶的单一识别序列,以供外源基因插入;
④载体应尽可能小(<15kb),便于导入细胞和进行繁殖;
⑤使用安全。克隆载体应只存在于有限范围的宿主内,在宿主体内不进行重组,不发生转移,不产生有害性状,并且不能离开工程宿主自由扩散。
表达载体是为了使插入的外源DNA序列转录、翻译成多肽链而进行特殊设计的克隆载体。它含有特定的表达系统元件,即启动子--核糖体结合位点--克隆位点--转录终止信号。
根据表达的类型,表达载体可分四类:
非融合型表达载体,如PKK223-3;
分泌型表达载体,如PINⅢ-ompA1;
融合蛋白型表达载体,如PGEX;
包涵体型表达载体,如pBV220。
图二:基因片段选择
2、引物设计中的规则
运用PCR扩增目的基因的过程中,引物设计十分关键,以下是需要注意的:
① 引物长度最好在18-30bp左右,常用的长度是 20-22bp;
②引物 Tm 值最好在 60℃ 左右,两条引物间 Tm 值要保持接近,相差最好不要超过 5°C;
③GC 的含量标准通常为 40%-60% 或45-55%;
④引物自身不应含有连续超过4个的互补的碱基,避免形成发卡结构或形成引物二聚体;
⑤引物的3' 端要避免出现连续重复的碱基,如 GGG 或 CCC ,这会导致错配的发生,最后一个碱基最好是 G 或 C;
⑥在引物的 5′ 端添加酶切位点时(在不影响扩增的特异性的前提下),根据酶切位点序列,需要添加不同种类和数量的保护碱基,通常多加3个碱基即可满足保护酶切位点的需求;
⑦上下游引物最好加入不同的酶切位点,相同的酶切位点可能导致目的基因片段出现倒置连接现象,影响基因序列的正常表达。
3、PCR扩增中常见的问题
扩增基因的过程并不困难,但未必能保证百分之百的成功率。
如结果出现引物二聚体、非特异性条带(大小不对)的现象,可以通过降低模板和引物的浓度、降低镁离子浓度、适当减少酶量,提高退火温度,来提高扩增特异性。
若出现凝胶条带弥散状态,多为模板不纯、反应体系中各成分比例不合适、退火温度设置偏低、循环次数过多等原因。
长片段基因的扩增容易增加点突变和错配率,选用高扩增能力、高保真、可靠性强的聚合酶也很关键。
4、其他问题
在操作酶切连接的步骤时也要定性定量,保证酶活性充足,例如:双酶切尽可能选择同种缓冲buffer,一般用量40U单位以上(用量不超过总体积1/10),保证酶切过程充分;可根据 目标片段量(ng)=(载体量(ng)×目标片段长度(kb))/(载体DNA片段长度(kb))×目标片段和载体的摩尔比(1:3-1:8)计算出目标片段和载体的加入量,提高连接效率。
构建好的载体放入感受态细胞中转化(TOP10、DH5α、BL21等,感受态细胞在使用时尽可能保证新鲜,避免反复冻融,冰上孵育和热激时间应严格控制),经抗性、菌落PCR、酶切、测序等多道程序验证,确定是否转化成功,最终获得正确的重组克隆基因片段。
5、如何选择正确的菌株和载体(详见文末列表)
公司简介
「青云瑞晶」是一家专业的CRO(研发服务提供商)。公司拥有高标准的实验室、先进的设备,和丰富经验的博士硕士研究人员,在结构生物学,药物固态研究和新材料结构表征,三个业务板块,为客户提供最先进的解决方案。
公司自主开发了国际领先的MicroED结构解析平台,结合冷冻电镜单颗粒(CryoEM-SPA)及同步辐射单晶X射线衍射(XRD),为客户解决难点问题。
E coli strain list
No. |
strain |
annotation |
Resistant |
1 |
BL21 (DE3) |
最常用的 |
No |
2 |
Rosetta (DE3) |
稀有密码子AUA, AGG, AGA, CUA, CCC, GGA |
Cl |
3 |
Rosetta2 (DE3) |
稀有密码子AUA, AGG, AGA, CUA, CCC, GGA和CGG |
Cl |
3 |
Origami 2 (DE3) |
二硫键及稀有密码子 |
StrR,Tet |
4 |
C41 (DE3)orC43 (DE3) |
疏水性蛋白 |
No |
5 |
Arctic (DE3) |
TPN30 & TPN60 分子伴侣 |
Tet,Cam |
6 |
Tuner(DE3) |
通过IPTG精确控制表达量, 0.1mM IPTG |
No |
7 |
BL21 (DE3) pLysS |
降低毒性蛋白的本底表达 |
Cl |
8 |
Rosetta(DE3) pLysS |
降低毒性蛋白的本底表达,稀有密码子AUA, AGG, AGA, CUA, CCC, 和GGA。 |
Cl |
9 |
BL21(DE3) del-slyXD |
BL21(DE3) knock out slyXD |
No |
10 |
B834(DE3) |
Met缺陷菌株 |
No |
11 |
T7 pLys Y |
具有抗T1噬菌体感染能力 |
Cl |
12 |
BL21star(DE3) | ||
13 |
origamiB(DE3) |
二硫键 |
KanR,TetR |
14 |
Origami 2 (DE3) pLysS |
Origami 2 (DE3)的基础上加pLysS抑制本地表达。 |
Cl,StrR,Tet |
15 |
Dh5α |
克隆菌株 |
No |
16 |
Dh5α-T1 |
具有抗T1噬菌体感染能力 |
No |
17 |
Dh10bac |
Bacmid 制备 |
Tet,gentamicin |
18 |
BL21-Gold(DE3) |
可以同时用作蛋白表达菌株和质粒克隆菌株 |
No |
Plasmid list
名称 |
长度 |
抗性 |
特殊性能 |
PAO815 |
7709 bp |
Amp |
酵母表达 |
pAxCAwt |
44741 bp |
Amp |
腺病毒表达 |
pAxcw |
42410 bp |
Amp |
腺病毒表达 |
pAAV-MCS |
4.7 kbp |
Amp |
哺乳动物细胞表达 |
pBacPAK8 |
5.5 kbp |
Amp |
杆状病毒表达 |
PBI121 |
13.0 kbp |
Kan |
植物细胞表达 |
pBV220 |
3665 bp |
Amp |
原核表达 |
pCAMBIA 1300 |
植物细胞表达 | ||
pCAMBIA 1301 |
11837 bp |
Kan |
植物细胞表达 |
pCAT3-Basic |
4047 bp |
Amp | |
pcDNA 3 |
5446 bp |
Amp |
哺乳动物细胞表达 |
pcDNA 3.1( ) |
5428 bp |
Amp |
哺乳动物细胞表达 |
pcDNA 3.1/ mys-HisA |
5494 bp |
Amp |
哺乳动物细胞表达 |
pCl-neo |
5472 bp |
Amp |
哺乳动物细胞表达 |
pCMV-MCS |
4.5 kbp |
Amp |
哺乳动物细胞表达 |
pET-3a |
4640 bp |
Amp |
大肠杆菌表达 |
pET-11a |
5677 bp |
Amp |
大肠杆菌表达 |
pET-15b( ) |
5708 bp |
Amp |
大肠杆菌表达 |
pET-20b( ) |
3716 bp |
Amp |
大肠杆菌表达 |
pET-22b( ) |
5493 bp |
Amp |
大肠杆菌表达 |
pET-23a( ) |
3666 bp |
Amp |
大肠杆菌表达 |
pET-23b( ) |
3665 bp |
Amp |
大肠杆菌表达 |
pET-23c( ) |
3664 bp |
Amp |
大肠杆菌表达 |
pET-23d( ) |
3663 bp |
Amp |
大肠杆菌表达 |
pET-28a( ) |
5369 bp |
Kan |
大肠杆菌表达 |
pET-28b( ) |
5368 bp |
Kan |
大肠杆菌表达 |
pET-28c( ) |
5367 bp |
Kan |
大肠杆菌表达 |
pET-30a( ) |
5422 bp |
Kan |
大肠杆菌表达 |
pET-30b( ) |
5421 bp |
Kan |
大肠杆菌表达 |
pET-30c( ) |
5423 bp |
Kan |
大肠杆菌表达 |
pET-31b( ) |
5742 bp |
Amp |
大肠杆菌表达 |
pET-32a( ) |
5900 bp |
Amp |
大肠杆菌表达 |
pET-32b( ) |
5899 bp |
Amp |
大肠杆菌表达 |
pET-32c( ) |
5901 bp |
Amp |
大肠杆菌表达 |
pET-39b |
6106 bp |
Kan |
大肠杆菌表达 |
pET-42a |
5930 bp |
Kan |
大肠杆菌表达 |
pGAPZ-aA |
3147 bp |
Zeo |
酵母表达 |
pGBKT7 |
7.3 kbp |
Kan |
酵母表达 |
pGEM3Zb |
原核表达 | ||
pGEM3Zf( ) |
原核表达 | ||
pGEM7Zf( ) |
原核表达 | ||
pGEX-2T |
4969 bp |
Amp |
原核表达 |
pGEX-4T-1 |
4969 bp |
Amp |
原核表达 |
pGFP-N2 |
4732 bp |
Kan |
哺乳动物细胞 荧光蛋白表达 |
pEGFP-C1 |
4731 bp |
Kan |
哺乳动物细胞 荧光蛋白表达 |
pEGFP-C3 |
4727 bp |
Kan |
哺乳动物细胞 荧光蛋白表达 |
pEGFP-N1 |
4733 bp |
Kan |
哺乳动物细胞 荧光蛋白表达 |
pLEGFP-N1 |
6892 bp |
Amp |
哺乳动物细胞 荧光蛋白表达 |
pGL3-Basic |
4818 bp |
Amp | |
pGL36 | |||
pLNCX |
6620 bp |
Amp |
反转录病毒表达 |
pLNHX |
5.6 kbp |
Amp |
反转录病毒表达 |
pLXSN |
5.9 kbp |
Amp |
反转录病毒表达 |
pLXIN |
6.1 kbp |
Amp |
反转录病毒表达 |
pMAL-p2x |
6721 bp |
Amp |
原核融合蛋白表达 |
pMAL-c2x |
6721 bp |
Amp |
原核融合蛋白表达 |
pPIC3.5K |
9004 bp |
Amp/Kan |
酵母表达 |
pPIC9 |
8024 bp |
Amp |
酵母表达 |
pPIC9K |
9276 bp |
Amp |
酵母表达 |
pPICZ aA |
3593 bp |
Zeo |
酵母表达 |
pQBI PGK |
5387 bp |
Amp |
哺乳动物细胞 荧光蛋白表达 |
pQE-30 |
3461 bp |
Amp |
原核表达 |
pQE-9 |
3439 bp |
Amp |
原核表达 |
pRevTRE |
6487 bp |
Amp |
反转录病毒表达 |
pSE420L |
4617 bp |
Amp | |
pTac I |
Amp |
原核表达 | |
pTac I(BamH I) |
Amp |
原核表达 | |
pTAL-Luc |
4956 bp |
Amp |
哺乳动物细胞表达 |
pTWIN1 |
7375 bp |
Amp | |
pTXB1 |
6706 bp |
Amp | |
pVAX1 |
2999 bp |
Kan |