基因结构

2025年03月17日 | 阅读 9 分钟

引言

要理解基因结构的细节,需要彻底掌握基因、DNA和染色体这三个概念及其相互关系。让我们从基因开始,详细了解它们。

简单来说基因是DNA的一个小片段或一段,是遗传的基本单位,包含使每个人独一无二的身体特征。 每个基因都包含一组用于特定功能或蛋白质编码的特定指令。基因基本上负责将蛋白质编码形式的信息从亲代传递给子代。它们的大小因它们形成的密码或蛋白质而异。

1905年,William Bateson引入了“遗传学”一词,四年后,植物学家Wilhelm Johannes引入了“基因”一词来表示遗传性状。一个人的每个细胞中大约有30,000个基因。它们位于细胞核内,以染色质网络的形式约束在染色体中(染色质网络是一种DNA缠绕在组蛋白分子上的网络,形成“串珠”结构)。

DNA和染色体

DNA(脱氧核糖核酸)是由脱氧核苷酸组成的长聚合物,其长度取决于DNA中存在的核苷酸数量(一对核苷酸指一个碱基对,A与T配对,G与C配对)。DNA也指生物体中存在的特征。有些生物体使用RNA而不是DNA作为其遗传物质,例如病毒。

在人体每个细胞的细胞核内,存在着由DNA分子组成的染色体,这些DNA分子以线状结构盘绕形成染色质网络。DNA盘绕在称为组蛋白的蛋白质结构上,组蛋白支撑着DNA。一组八个组蛋白结构连接在一起,称为组蛋白八聚体,而这些八聚体长链构成了染色质网络,染色质网络进一步盘绕形成染色体。

理解基因、DNA和染色体之间的关系非常重要。染色体是细胞核中的结构,其中DNA以盘绕的形式包裹在称为组蛋白的蛋白质结构上。基因结构只不过是DNA螺旋在未盘绕形式下的一个片段。该结构非常微小,只能在高功率电子显微镜下看到。

DNA的结构

DNA的结构看起来像一个扭曲的梯子,因为它由两条链组成,这两条链相互连接并缠绕在一起——这种结构称为双螺旋。DNA主要由核苷酸单体组成,并以双螺旋形式存在,双链沿相反方向运行,通过氢键结合。

每条链都由骨架支撑,骨架基本上包含交替的糖(脱氧核糖或核糖)和磷酸基团。每个糖连接到DNA结构中四种碱基(也称为核苷酸)之一,即:腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)或胸腺嘧啶(T)。DNA的两条链通过这四种碱基之间的化学键连接在一起——腺嘌呤与胸腺嘧啶配对(A-T),而胞嘧啶与鸟嘌呤配对(C-G)。腺嘌呤与胸腺嘧啶形成2个氢键,而胞嘧啶与鸟嘌呤形成3个氢键。

生物信息,例如制造RNA分子或蛋白质所需的指令,根据DNA骨架上碱基对的序列进行编码。

染色体内的基因组织

如上所述,染色体由由DNA和蛋白质组成的长的盘绕染色质结构组成,包含大量基因(甚至数百到数千个)。基因在每条染色体上以特定序列完美排列,每个基因在染色体上都有其特定的位置,称为基因座。除了DNA,染色体内部还存在其他化学成分,例如影响基因功能的蛋白质结构和其他成分。

基因与转录

转录基本上是指重写给定信息。每当我们重写某些信息时,它的结构或多或少都会改变。我们的细胞也会发生类似的情况。转录过程包括复制基因的DNA序列以形成RNA分子它是基因表达的第一步,涉及复制基因的DNA序列,以便可以以RNA分子的形式创建其副本。对于蛋白质编码基因,称为转录本的RNA副本包含了构建多肽(蛋白质亚基或蛋白质)所需的信息。然而,对于真核转录本,在翻译成蛋白质之前需要遵循几个步骤。

RNA聚合酶

转录过程并非易事,因为它涉及许多复杂的步骤。一种称为RNA聚合酶的酶用于执行转录,它通过以现有DNA链为模板来连接核苷酸以形成RNA链。单条DNA链以3'到5'方向读取,并用作合成5'到3'方向互补RNA链的模板,同时将新核苷酸添加到新链的3'端。两条链,模板链和新RNA链,彼此反向平行。

转录阶段

转录过程通常分为三个重要步骤:起始、延伸和终止。以下是这些过程的详细解释:

1. 起始: 起始是转录过程的第一步。在此步骤中,RNA聚合酶酶与称为启动子的DNA序列结合。启动子位于基因开头附近,每个基因都有自己的启动子。酶与DNA结合后,它会分离DNA链,以获得继续转录过程所需的单条DNA链。

启动子区域位于转录区域(其指定的区域)之前(并略微重叠)。启动子区域通过提供识别位点和辅助蛋白来帮助RNA聚合酶与其结合。闭合的DNA双螺旋打开,以便RNA聚合酶可以开始转录。

2. 延伸: 在RNA聚合酶分离的两条链中,一条DNA链,即模板链,正如其名称所示。它充当RNA聚合酶的模板,并一次“读取”一个碱基。该酶构建一条互补的RNA分子,该分子由与编码链相同的核苷酸组成,并与模板链互补,形成一条从5'到3'延伸的链。RNA转录本包含与DNA的非编码链相同的信息,只是其中胸腺嘧啶(T)被尿嘧啶(U)取代,因为RNA中不存在胸腺嘧啶。

随着酶沿3'到5'方向继续打开双螺旋。在延伸过程中转录的RNA仅与模板链短暂结合,很快就会作为悬垂的细线从DNA中脱离,使模板链和非编码链再次闭合形成双螺旋。

3. 终止: DNA双螺旋中有称为终止子的序列,它们负责结束转录过程。它们是表明RNA转录本已完成的片段。在RNA聚合酶转录完转录本后,它们会触发转录本从RNA聚合酶酶中释放。

终止子DNA编码一部分RNA,该RNA形成一个发夹结构,后面跟着一系列U核苷酸。由于转录本的发夹状结构,RNA聚合酶会停滞。发夹前的U核苷酸与DNA模板的A核苷酸形成弱键,导致转录本从DNA链中脱落,从而结束转录。

真核RNA修饰

在细菌等原始生物中,转录的RNA链在转录后立即充当信使RNA(mRNA)。这在真核生物等复杂生物中则不然,在真核生物中,转录的RNA称为前体mRNA,在翻译过程之前需要一些额外的加工。

在真核生物中,前体mRNA必须在两端进行修饰。在转录RNA的开头必须添加一个5'帽子,在末尾必须添加一个3'多聚A尾巴。许多真核生物会经历一个称为剪接的过程。剪接发生在许多真核前体mRNA上,在此过程中会去除前体mRNA的内含子(非编码序列),然后将剩余的外显子(编码序列)重新连接起来。

剪接过程为mRNA提供了其正确的序列,而末端修饰提高了mRNA的稳定性。(如果内含子留在原位且未被移除,它们将与外显子一起翻译,从而产生“荒谬”的多肽。)

内含子和外显子

基因序列的大部分由重复和未翻译的区域组成,这些区域有助于调节基因表达。这些类型的重复序列称为内含子,基因序列只有一小部分是蛋白质编码的,称为外显子。内含子是转录RNA链或编码它的DNA的非编码部分。在RNA转录本被进一步用于翻译过程之前,这些部分会通过剪接过程被切除。另一方面,DNA(或RNA)的编码部分是外显子,它们在翻译过程中保持完整,以便能够编码蛋白质。

基因类型

Genes Structure

i) 真核基因

真核基因具有原核生物所没有的特殊特征,主要与前体mRNA的转录后修饰有关。它们还具有更多的调控元件来调控基因表达,特别是在多细胞真核生物(如人类)中,不同组织间的基因表达差异很大。

真核基因的转录本被分为外显子和内含子区域。外显子保留在最终的mRNA分子中,而内含子在转录后加工过程中被剪接掉,尽管它们可能比外显子长。外显子之间的剪接边界在拼接成连续的蛋白质编码区域后就无法检测到。

此外,值得注意的是,真核生物的转录后加工会在mRNA的开头添加一个5'帽子,在其3'端添加一个多聚腺苷酸尾巴。这有助于稳定mRNA并指导其从细胞核运输到细胞质,而无需编码在基因结构中。

ii) 原核基因

原核基因的排列方式与真核生物不同,通常将ORF(开放阅读框)分组到一个多顺反子操纵子中,由共享的调控序列控制。这些ORF被转录到相同的mRNA上,因此被共同调控,经常服务于相关功能。

每个ORF都有其独立的核糖体结合位点(RBS),允许在相同的mRNA上同时进行翻译。一些操纵子表现出翻译偶联,即操纵子内多个ORF的翻译速率是相互关联的。这仅在原核生物中可能,因为它们的转录和翻译同时发生并在相同的亚细胞位置进行。

结论

基因被称为遗传的基本发育和功能单位,由识别基因功能的特殊序列元件组成。这些序列组织在基因的结构中,其中包含了细胞生存和繁殖所需的大部分信息。基因由DNA组成,DNA携带细胞繁殖所需的信息,基因的功能由其特定的DNA序列确定。基因结构的研究非常重要,不仅在遗传学中,而且在分子生物学和医学等其他生物学分支中也非常重要。


下一个主题超级基因