词语大全 > 割裂基因

割裂基因

又称不连续基因或断裂基因.在真核生物的染色体上,由于内含子的存在,使真核生物基因成为不连续基因或断裂基因。

在本世纪70年代以前,人们一直认为遗传物质是双链DNA,在上面排列的基因是连续的。Robert and Sharp彻底改变了这一观念。他们以腺病毒作为实验对象,因为它的排列序列同其他高等动物很接近,包括人。结果发现它们的基因在DNA上的排列由一些不相关的片段隔开,是不连续的。
  他们的发现改变了科学家以往对进化的认识,对于现代生物学的基础研究以及生物进化论具有重要的奠基作用,对于肿瘤以及 其他遗传性疾病的医学导向研究,亦具有特别重要的意义。

荣获1993年诺贝尔生理学或医学奖
  发现发现断裂基因
  罗伯茨
  Richard J. Roberts
  美国
  贝弗莉新英格兰生物实验室
  1943年--
  夏普
  Phillip A. Sharp
  美国
  麻省理工学院癌症研究中心

真核生物的基因组十分复杂,DNA的含量也比原核生物的大得多。噬菌体由于基因组很小,但又要编码一些必不可少的蛋白,碱基显然不够用,这样不仅几乎所有的碱基都参加编码,而且在进化中还出现了“重叠基因”,以有限的基因编码更多的遗传信息。真核基因组正好相反,DNA十分富余,这样不仅无需“重叠基因”,而且很多序列不编码,如重复序列、间隔序列 (spacer) 和间插序列(intervening sequence) 即内含子(intron)等。但不编码并不等于没有功能。有的我们可能还不了解,如重复序列。间隔区和间插序列这两个概念是不同的,间隔区是指基因间不编码的部分,有的转录称转录间隔区(TS),有的不转录称为非转录间隔区(NTS)。间插序列是指基因内部不编码的区域,也称内含子,在初始转录本中存在此序列,但在加工后将被切除掉,所以常不作为翻译的信息。间隔区常常含有转录的启动子和其它上游调节序列。有的内含子也可以编码,如成熟酶和内切酶等。
  在遗传学上通常将能编码蛋白质的基因称为结构基因。真核生物的结构基因是断裂的基因。一个断裂基因能够含有若干段编码序列,这些可以编码的序列称为外显子。在两个外显子之间被一段不编码的间隔序列隔开,这些间隔序列称为内含子。每个断裂基因在第一个和最后一个外显子的外侧各有一段非编码区,有人称其为侧翼序列。在侧翼序列上有一系列调控序列(图3-3)。
  调控序列主要有以下几种:①在5′端转录起始点上游约20~30个核苷酸的地方,有TATA框(TATA box)。 TATA框是一个短的核苷酸序列,其碱基顺序为TATAATAAT。TATA框是启动子中的一个顺序,它是RNA聚合酶的重要的接触点,它能够使酶准确地识别转录的起始点并开始转录。当TATA框中的碱基顺序有所改变时,mRNA的转录就会从不正常的位置开始。②在5′端转录起始点上游约70~80个核苷酸的地方,有CAAT框(CAAT box)。CAAT框是启动子中另一个短的核苷酸序列,其碱基顺序为GGCTCAATCT。CAAT框是RNA聚合酶的另一个结合点,它的作用还不很肯定,但一般认为它控制着转录的起始频率,而不影响转录的起始点。当这段顺序被改变后,mRNA的形成量会明显减少。③在5′端转录起始点上游约100个核苷酸以远的位置,有些顺序可以起到增强转录活性的作用,它能使转录活性增强上百倍,因此被称为增强子。当这些顺序不存在时,可大大降低转录水平。研究表明,增强子通常有组织特异性,这是因为不同细胞核有不同的特异因子与增强子结合,从而对不同组织、器官的基因表达有不同的调控作用。例如,人类胰岛素基因5′末端上游约250个核苷酸处有一组织特异性增强子,在胰岛素β细胞中有一种特异性蛋白因子,可以作用于这个区域以增强胰岛素基因的转录。在其他组织细胞中没有这种蛋白因子,所以也就没有此作用。这就是为什么胰岛素基因只有在胰岛素β细胞中才能很好表达的重要原因。④在3′端终止密码的下游有一个核苷酸顺序为AATAAA,这一顺序可能对mRNA的加尾(mRNA尾部添加多聚A)有重要作用。这个顺序的下游是一个反向重复顺序。这个顺序经转录后可形成一个发卡结构(图3-4)。发卡结构阻碍了RNA聚合酶的移动。发卡结构末尾的一串U与转录模板DNA中的一串A之间,因形成的氢键结合力较弱,使mRNA与DNA杂交部分的结合不稳定,mRNA就会从模板上脱落下来,同时,RNA聚合酶也从DNA上解离下来,转录终止。AATAAA顺序和它下游的反向重复顺序合称为终止子,是转录终止的信号。

现在割裂基因的原始形式是怎样的呢? 目前有两种模型,“内含子占先(Introns early)”模型支持内含子总是基因的整体部分。认为基因起始于割裂的结构,没有内含子的基因是在进化过程中丢失的。“内含子滞后(Introns late)”模型认为原始蛋白质编码单位由非割裂的DNA 序列组成,内含子是随后插入进去的。

检验这些模型的方法是明确真核和原核基因的区别,是否等同于真核基因中内含子的获得或者原核基因中内含子的丢失。

内含子占先模型表明,基因的镶嵌结构是基因重组从而产生新蛋白质的一种原始方法。试想,早期细胞有许多不同的蛋白质编码区域,其进化的一个方面很可能是不同多肽链单位重新组合和并列,从而产生新的蛋白质

如果蛋白质编码单位必须是连续的密码子序列,重新创造这种序列将需要精确的DNA重组,从而使两个蛋白质编码单位并列,以同样的读码框头尾相接。并且,如果这种重组没有成功,却失去了原始的蛋白质编码单位,细胞必然受到破坏。

但是如果DNA 重组能将两个蛋白质编码单元置于一个转录单位中,剪接模式将在RNA水平上获得突破,从而将两种蛋白质放在一条多肽链中。而且如果重组并不成功,原始的蛋白质编码单位仍能被应用。这种方法必然使细胞尝试限制RNA 删除,而不至于在此过程中引起DNA 稳定性破坏。

如果现在的蛋白质通过组合本来就分离的原始蛋白质来进化,单元增长很可能在随后的一段时间内发生,每次增加一个外显子。放置在一起的基因,可以从它们的结构中判断其不同功能吗?换言之,我们能够将当前蛋白质与个别外显子等同起来吗?

某些情况下,基因结构与蛋白质之间有明显的关系。一个很好的例子是免疫球蛋白,它是由每一个外显子与已知的蛋白功能区域相对应的基因编码的。免疫球蛋白是两条轻链和两条重链组成的四聚体,它们一起产生了具有几个不同区域的蛋白质。轻链和重链的结构不同,并且有几种类型的重链。每一类型的链都是由一系列的外显子表达的,外显子与蛋白质的结构域相一致。

有很多基因的外显子能够被确认有特定的功能。在分泌蛋白质中,第一个外显子编码多肽的N 端结构域,能够识别跨膜分泌中涉及的信号序列,如胰岛素基因。

有时基因进化涉及外显子的复制,从而在蛋白质中产生整体复制的序列。例如,鸡胶原蛋白质的54bp 外显子被多次复制,产生一系列54bp 或其整数倍的外显子。

只有少部分相关基因间相同的序列可能代表外显子,这些外显子可在基因间转移或重新集结(Recruit)。例如人类膜低浓度脂蛋白(Plasma low density liproptein,LDL)受体和其他蛋白质的关系(图2.30)。LDL 受体基因中有一系列的外显子,它们与表皮生长因子(Epidermal growth factor,EGF)前体基因外显子相关。在蛋白质的N端,一系列外显子编码与血液中C9 补体(Complement factor)相关的序列。因此LDL 受体基因是由广泛的功能单元重组而获得,这些单元也在其它蛋白质中使用。

在已知基因中,外显子和蛋白质的关系有时是不稳定的。有些情况下具有明确的1:1关系,但在其他情况下则未发现固定的模式。一种可能是内含子移除是与两端相邻的外显子是融合的。这就意味着这些内含子必须精确地移开,不改变编码区的完整性。另一种方式是某些内含子由插入连续的区域产生,但是携带的内含子还具有被剪切掉的能力。

外显子一般都很小,能够形成稳定折叠结构的最小多肽大约是20-40 个氨基酸残基。很有可能蛋白质原本就是由这样小的结构单元组合而成。每个单元不需要与当前功能相关,或许几个单元一起产生一种功能。一般而言,基因中外显子的数量随着蛋白质长度的增加而增加,这与蛋白质通过连续增加适当的单元获得多种功能的观点一致。这个观点能够说明蛋白质结构的另一个特点:代表外显子-内含子边界的位点通常位于蛋白质的表面。随着编码单元被加入到蛋白质中,连接物,至少是最新加入的单元,很可能位于蛋白质表面。

保守进化的一个有趣例子是珠蛋白,每个基因有三个外显子。两个内含子位于与编码区相邻的稳定位点上。中间的外显子代表珠蛋白链的血红素-结合域,α-和β-珠蛋白具有相似的结构。

解释这种结构的另一种观点可由与珠蛋白相关的其他两种蛋白质提供。肌球蛋白(Myoglobin)是动物中结合氧的蛋白质单体,它的氨基酸序列揭示了珠蛋白亚基的一个普遍(但是古老)的起源。豆血红蛋白(Leghemoglobin)是豆科植物中氧-结合蛋白质,同肌球蛋白一样也是单体。它们与其他血红素结合蛋白具有共同的起源。珠蛋白、肌球蛋白和豆血红蛋白一起组成了珠蛋白超家族(Super family)从同一个远古祖先遗传下来的基因家族。肌球蛋白由人类基因组中单个基因编码,其结构与珠蛋白基因是一致的。三外显子结构说明了肌球蛋白和珠蛋白功能分离的进化。

词语大全 8944.net

copyright ©right 2010-2021。
词语大全内容来自网络,如有侵犯请联系客服。zhit325@126.com