一、 RNA 聚合酶 (RNA Polymerase, RNAP)
-
原核生物:
- 单一类型: 只有一种主要的 RNA 聚合酶。
- 结构: 核心酶由 5 个亚基组成:α₂, β, β’, ω。核心酶本身可以催化 RNA 合成,但不能识别启动子。
- σ因子: 起始转录需要σ因子亚基(如σ⁷⁰)与核心酶结合形成全酶。σ因子负责特异性识别并结合启动子。不同σ因子识别不同类型的启动子,调控不同基因的表达(如热休克基因由σ³²识别)。
- 功能: 转录所有类型的 RNA(mRNA, tRNA, rRNA)。
-
真核生物:
- 多种类型: 存在三种主要的 RNA 聚合酶,位于细胞核内,分工明确:
- RNA 聚合酶 I (Pol I): 主要负责转录核糖体 RNA (rRNA)(主要是 28S, 18S, 5.8S rRNA)。
- RNA 聚合酶 II (Pol II): 负责转录信使 RNA (mRNA) 和大部分小核 RNA (snRNA)、microRNA (miRNA) 前体。是基因表达调控的核心,也是研究最深入的。
- RNA 聚合酶 III (Pol III): 负责转录转运 RNA (tRNA)、5S rRNA、小核仁 RNA (snoRNA) 和一些其他小 RNA。
- 结构复杂: 每种 RNA 聚合酶都由12 个或更多亚基组成。其中一些亚基在三种酶中是共享的,另一些是特异的。
- 无σ因子: 真核 RNA 聚合酶没有σ因子亚基。它们依赖于一套称为通用转录因子 (General Transcription Factors, GTFs) 的蛋白质来识别启动子并起始转录。
- 抑制剂敏感性: 不同聚合酶对抑制剂敏感性不同(如α-鹅膏蕈碱强烈抑制 Pol II,对 Pol I 基本无抑制,对 Pol III 中等抑制)。
- 多种类型: 存在三种主要的 RNA 聚合酶,位于细胞核内,分工明确:
二、启动子 (Promoter)
-
原核生物:
- 结构相对简单: 通常包含两个关键的保守序列元件:
- -10 区 (Pribnow 框): 位于转录起始位点上游约 10bp 处,保守序列通常为
TATAAT。这是σ因子结合和 DNA 解链的关键位点。 - -35 区: 位于转录起始位点上游约 35bp 处,保守序列通常为
TTGACA。这是σ因子初始识别和结合的主要位点。
- -10 区 (Pribnow 框): 位于转录起始位点上游约 10bp 处,保守序列通常为
- 位置固定: 这些元件相对于转录起始位点的位置相对固定。
- 上游元件 (UP elements): 某些强启动子在-35 区上游还存在富含 AT 的 UP 元件,可与 RNAP α亚基结合增强转录。
- 无增强子: 原核生物一般没有类似真核生物的长距离增强子。
- 结构相对简单: 通常包含两个关键的保守序列元件:
-
真核生物:
- 结构复杂多样: 启动子结构比原核复杂得多,不同基因、不同聚合酶的启动子差异很大(尤其是 Pol II)。
- 核心启动子元件 (Core Promoter Elements): 围绕转录起始位点(+1)的区域,包含:
- TATA 框: 位于-25 到-35bp 处,保守序列
TATAWAW(W=A 或 T)。主要由TFIID复合物中的TBP (TATA 结合蛋白) 识别并结合。是许多 Pol II 启动子的关键元件(但并非所有都有)。 - 起始子 (Initiator, Inr): 直接包围转录起始位点(-2 到+4),保守序列
YYANWYY(Y=C 或 T, N=任意碱基, W=A 或 T)。也可被 TFIID 识别。 - 下游启动子元件 (Downstream Promoter Element, DPE): 位于+28 到+32bp 处,保守序列
RGWYV(R=嘌呤, W=A 或 T, Y=嘧啶, V=非 T)。常存在于无 TATA 框的启动子中,由 TFIID 识别。 - TFIIB 识别元件 (BRE): 位于 TATA 框上游(-37 到-32),保守序列
G/C G/C G/A C G C C,被转录因子 TFIIB 识别。
- TATA 框: 位于-25 到-35bp 处,保守序列
- 近端启动子元件 (Proximal Promoter Elements): 位于核心启动子上游约 200bp 内,包含各种顺式作用元件(如 GC 框、CAAT 框等),由特异性转录因子结合,调节基础转录水平。
- 增强子 (Enhancers): 这是真核生物特有的关键调控元件。可以位于基因上游、下游、内含子中,甚至距离启动子非常远(数千至数十万 bp)。通过环化 (looping) 与启动子区域靠近,由激活蛋白 (Activators) 结合,显著增强转录起始效率。其作用具有位置和方向无关性。
- 沉默子 (Silencers): 与增强子类似但作用相反,抑制转录。
三、转录起始 (Initiation)
-
原核生物:
- 相对简单: RNAP 全酶(核心酶+σ因子)直接扫描 DNA,σ因子识别并结合-35 区和-10 区。
- 闭合复合物: RNAP 与未解链的启动子 DNA 结合形成闭合复合物。
- 开放复合物: RNAP 诱导-10 区附近约 14bp 的 DNA 解链,形成开放复合物。
- 起始: 第一个(通常是嘌呤)NTP 进入,与第二个 NTP 形成第一个磷酸二酯键。经历数次流产性起始(合成短链寡核苷酸并释放)后,成功合成约 10nt 的 RNA 并稳定下来,σ因子释放,核心酶进入延伸阶段。
-
真核生物:
- 高度复杂: 需要众多通用转录因子 (GTFs) 按特定顺序在启动子上组装成前起始复合物 (Pre-Initiation Complex, PIC)。Pol II 本身不能直接识别或结合启动子。
- PIC 组装 (以 Pol II 为例):
- TFIID 结合核心启动子(主要靠 TBP 结合 TATA 框,或结合 Inr/DPE)。
- TFIIA 结合 TFIID,稳定其结合(非必需)。
- TFIIB 结合 TBP 和 BRE 元件,并招募 Pol II/TFIIF 复合物。
- Pol II/TFIIF 复合物被招募到位。
- TFIIE 结合,招募TFIIH。
- TFIIH 结合完成 PIC 组装。TFIIH 具有解旋酶活性(解开启动子 DNA 形成转录泡)和激酶活性(磷酸化 Pol II 的羧基末端结构域 CTD)。
- 起始: PIC 组装完成后,TFIIH 解旋 DNA 形成开放复合物。在起始因子帮助下,合成最初的几个核苷酸。
- 启动子清除 (Promoter Clearance) 和延伸复合物形成: 合成约 20-60nt RNA 后,Pol II 的 CTD 被 TFIIH 磷酸化(特别是 Ser5 和 Ser7),导致 GTFs(除 TFIID 和 TFIIA 外)大部分解离,中介子复合物 (Mediator Complex) 结合磷酸化的 CTD(中介子在起始前也可能与激活蛋白协同作用帮助招募 GTFs 和 Pol II),Pol II 从启动子脱离,进入高效的延伸阶段。CTD 磷酸化是启动子清除和进入延伸的关键信号。
- 中介子作用: 中介子是一个巨大的多亚基复合物,作为桥梁连接结合在增强子/启动子上的特异性转录因子 (激活蛋白/阻遏蛋白) 与 PIC,传递调控信号,对转录水平进行精细调控。
四、转录延伸 (Elongation)
-
原核生物:
- 相对直接: 核心酶沿模板链移动,按碱基互补配对原则合成 RNA。延伸速度约为 40-80 nt/s。
- 拓扑问题: RNAP 移动时会在前方产生正超螺旋,后方产生负超螺旋。需要拓扑异构酶 (I 型和 II 型) 来消除这些张力。
- 延伸因子: 存在一些延伸因子(如 NusA)可调节延伸速度、暂停和解离。
- 偶联翻译: mRNA 合成的同时即可被核糖体结合并翻译(无核膜屏障)。
-
真核生物:
- 染色质障碍: DNA 紧密包裹在核小体中形成染色质,是延伸的主要障碍。
- 染色质重塑和修饰: 需要染色质重塑复合物利用 ATP 水解的能量滑动或移除核小体。组蛋白修饰(如乙酰化、甲基化)也参与调控染色质的可及性,影响延伸。
- 延伸因子: 存在多种延伸因子(如 P-TEFb,可磷酸化 Pol II CTD 的 Ser2)调控延伸效率、克服暂停、确保保真度。P-TEFb 的招募常依赖于特异性激活蛋白和中介子。
- 延伸暂停: Pol II 常在启动子近端发生暂停,这是一个重要的调控检查点。P-TEFb 磷酸化 CTD 的 Ser2 是释放暂停进入高效延伸的关键步骤。
- CTD 的功能: Pol II 大亚基的羧基末端结构域 (CTD) 由多个重复的七肽序列(
YSPTSPS)组成。CTD 在起始时被磷酸化(Ser5, Ser7),在延伸时被进一步磷酸化(Ser2)。磷酸化的 CTD 作为平台招募RNA 加工因子(如加帽酶、剪接因子、加尾因子),实现转录与加工的偶联。 - 延伸速度: 约 20-60 nt/s,通常比原核慢。
五、转录终止 (Termination)
-
原核生物: 主要有两种机制:
- ρ-非依赖型终止 (内在终止):
- RNA 转录物自身形成富含 G-C 的发夹结构 (茎环结构)。
- 发夹结构下游是一串多聚 U 残基。
- 发夹结构形成会干扰 RNA-DNA 杂合双链的稳定性,导致 RNA 聚合酶暂停。后面不稳定的 A-U 配对(DNA 模板链是 polyA,RNA 是 polyU)使 RNA 更容易从模板解离,导致转录终止。
- ρ-依赖型终止:
- 需要ρ因子蛋白(一种解旋酶)。
- RNA 转录物上有特定的富含 C、缺乏二级结构的rut (ρ utilization) 位点,ρ因子结合于此。
- ρ因子沿着 RNA 向 RNA 聚合酶方向移动(利用 ATP 水解的能量)。
- 当 RNA 聚合酶在终止位点暂停时,ρ因子追上并利用其解旋酶活性解开 RNA-DNA 杂合双链,释放 RNA,导致转录终止。
- ρ-非依赖型终止 (内在终止):
-
真核生物: 终止机制因聚合酶而异,且不如原核生物了解得透彻。
- RNA Pol I: 终止需要一个终止因子 (TTF-I) 结合到基因下游的终止子序列,导致 Pol I 暂停并释放转录本。
- RNA Pol III: 终止依赖于转录本中的寡聚 U 序列(类似原核ρ非依赖型,但机制不完全相同)。转录在模板上一串 T(通常 4 个或更多)处终止,产生含 polyU 尾的转录本(但此尾通常会被加工掉)。
- RNA Pol II: 终止与mRNA 3’ 端加工(切割和加 polyA 尾)紧密偶联。
- Pol II 转录经过多聚腺苷酸化信号 (Polyadenylation Signal, PAS),通常是
AAUAAA(位于 3’非翻译区)。 - 一系列切割和聚腺苷酸化因子 (CPSF, CstF, CFI, CFII, PolyA Polymerase PAP 等) 识别并结合 PAS。
- 这些因子与 Pol II 的 CTD(特别是 Ser2 磷酸化形式)相互作用。
- RNA 在 PAS 下游约 10-30nt 处被切割。
- 切割后,PAP立即在切开的 3’端添加约 200-250 个腺苷酸 (polyA 尾)。
- 切割事件触发了一种终止机制,导致 Pol II 在切割点下游几百到几千碱基处最终解离。目前模型包括:
- Torpedo 模型: 切割后产生的下游 RNA 片段被5’→3’ 外切酶 (如 Xrn2) 降解。当外切酶追上仍在延伸的 Pol II 时,导致其解离。
- 变构模型: 切割和加尾因子与 Pol II 结合,诱导其构象改变,降低延伸能力,最终导致终止。
- 终止效率受加尾信号强度、下游序列以及延伸因子影响。
- Pol II 转录经过多聚腺苷酸化信号 (Polyadenylation Signal, PAS),通常是
六、转录与翻译的时空关系
-
原核生物: 转录和翻译在空间和时间上紧密偶联 (偶联转录翻译)。
- 由于没有细胞核,转录在细胞质中进行。
- mRNA 的 5’端一旦被合成,尚未完成转录,核糖体就可以立即结合并开始翻译。
- 形成多聚核糖体 (polyribosome/polysome),即多个核糖体同时翻译同一条正在合成的 mRNA 链。这是原核生物高效快速响应环境变化的关键。
-
真核生物: 转录和翻译在空间和时间上完全分离。
- 转录在细胞核内进行。
- 新生的 RNA 转录本在核内经历一系列复杂的转录后加工(5’加帽、剪接、3’切割加 polyA 尾)。
- 加工成熟的 mRNA 通过核孔复合物转运到细胞质中。
- 只有在细胞质中,核糖体才能结合到 mRNA 上并开始翻译。
- 这种分离允许在 RNA 输出到细胞质之前进行严格的质量控制和调控。
总结对比表
| 特征 | 原核生物 | 真核生物 |
|---|---|---|
| RNA 聚合酶 | 一种 (核心酶+σ因子) | 三种 (Pol I, II, III), 结构复杂 |
| σ因子 | 有 (识别启动子) | 无 |
| 通用转录因子 (GTFs) | 无 | 有 (组装前起始复合物 PIC 必需) |
| 启动子结构 | 相对简单 (-10, -35 区) | 高度复杂 (核心元件 TATA/Inr/DPE/BRE, 近端元件) |
| 增强子 | 无 | 有 (长距离调控, 位置方向无关) |
| 转录起始 | RNAP 全酶直接结合启动子 | 需 GTFs 按顺序组装 PIC, 需中介子传递调控信号 |
| 启动子清除关键 | σ因子释放 | Pol II CTD (Ser5/Ser7) 磷酸化 |
| 延伸障碍 | 拓扑张力 | 核小体 (染色质结构) |
| 延伸调控关键 | NusA 等因子 | P-TEFb (磷酸化 CTD Ser2), 染色质重塑/修饰 |
| CTD 功能 | 无 | 关键 (招募加工因子, 调控延伸/终止) |
| 转录终止机制 | ρ非依赖 (发夹+polyU), ρ依赖 | Pol I: TTF-I; Pol III: oligo U; Pol II: 与 3’端加工偶联 (切割加尾后通过 Torpedo/变构模型终止) |
| 转录后加工 | 很少 (部分 mRNA 需切割) | 必需且复杂 (5’加帽, 剪接, 3’切割加 polyA 尾) |
| 转录与翻译关系 | 偶联 (在细胞质同时进行) | 分离 (核内转录加工, 胞质翻译) |