基因定义

2025年3月17日 | 阅读 15 分钟

DNA决定了生物体的特征,包括它的外观、生活方式以及与环境的互动方式,是由基因组成的。基因存在于所有生物中,并且可以在一生中影响一个人的健康。

不同的生物体具有不同数量的基因。人类基因组(包含所有人类基因)的总基因数量约为 30,000 个。

只有微小的基因变异表现为外在差异,导致 99.9% 的人拥有相同的基因组(来源:Trusted Source)。

这些变异,可能是遗传的,也可能是个体基因与环境相互作用的结果,也解释了为什么有些人易患某些疾病,而有些人则不易。

研究基因及其如何被靶向以改善生活各个方面的人被称为遗传学家。人们可以从基因工程中获益,包括通过预防人类疾病。

Gene Definition

基因到底是什么?

基因是由脱氧核糖核酸(DNA)构成的。DNA 编码了生命体生长、发育和繁殖所需的生物指令。

基因储存在每个细胞核内的染色体中。构成每个基因的 DNA 链是产生特定蛋白质的蓝图。这些蛋白质实现了某些身体特征的表达,例如眼睛颜色、身高和头发颜色。它们还可以决定一个人患上或罹患遗传疾病的可能性。

在繁殖过程中,DNA 会在成年生物体与其后代之间传递。这意味着染色体上的基因是从父母那里遗传下来的。染色体是成对的?人类染色体有 46 条。一个人从父母双方各获得两套 23 条染色体:一套来自母亲,另一套来自父亲。

基因的分子定义

Lodish 等人将基因定义为产生功能性基因产物(可以是多肽或任何 RNA)所需的整个核酸序列。它还包含所有调控序列、非编码内含子和结构基因(编码基因)。

大多数真核基因产生单顺反子 mRNA,而大多数原核基因产生多顺反子 mRNA。

它们是如何形成的?

基因由四种不同的核苷酸碱基组成的长链构成,核苷酸碱基是 DNA 的基本单位。有无数种组合。

核苷酸中有四种不同的碱基(来源:Trusted Source):

  • A(腺嘌呤)
  • C(胞嘧啶)
  • G(鸟嘌呤)
  • T(胸腺嘧啶)

基因由两条相互缠绕的链组成。碱基之间的连接将每条链固定在一起。几种碱基的组合如下:

  • 胸腺嘧啶与腺嘌呤配对。
  • 鸟嘌呤与胞嘧啶配对。

这些核苷酸在 DNA 链上的位置决定了存在的指令类型。例如,序列 ATCGTT 会告诉(来源:Trusted Source)使用棕色眼睛,但 ATCGCT 可能告诉使用蓝色眼睛。

根据可信来源,人类染色体大约由 5000 万到 3 亿个碱基对组成。人类基因组包含大约 30 亿个核苷酸和 20,000 个基因,分布在 23 对染色体上。

基因在健康中扮演什么角色?

一个人生活中的许多内在和外在因素,包括继承某种眼睛颜色或罹患某种疾病的可能性,都受到其基因的影响。

基因的改变也可能导致蛋白质产生不当,无法发挥其预期功能。这些基因突变可能导致遗传疾病(来源:Reliable Source)。

基因突变导致一些疾病,包括镰状细胞性贫血和亨廷顿舞蹈病。由于基因从父母传给子女,一些疾病常常在家族中遗传。

此外,暴露于环境污染物,如香烟烟雾,也可能导致基因改变。

基因起源于何处?

当一个生物体的细胞每个都有两套完整的染色体时,该生物体就被称为二倍体。人类是二倍体。大多数体细胞中有 23 对染色体。

雄性亲本提供一套染色体对,雌性亲本提供另一套。

X 和 Y 染色体是决定胚胎性别(雄性或雌性)的两种染色体。

Gene Definition
  • 女性有两个 X 染色体。
  • 男性有一个 X 染色体和一个 Y 染色体。

孩子从雌性亲本那里接收一个 X 染色体。父亲可以提供 X 或 Y 染色体。其余 22 条染色体是常染色体。科学家将它们称为 1 到 22 号染色体。

单一染色体上的基因

不同生物体在单个染色体上的总基因数量不同。噬菌体病毒 R17 仅包含三个基因,而 SV40 病毒包含 5 到 10 个基因。大肠杆菌细菌在一个 1 毫米长的染色体上拥有超过 3000 个基因。

基因大小

大肠杆菌的核苷酸对数超过四百万(4638858 对碱基)。大肠杆菌大约有 3000 个基因。

由于多肽链中的每个氨基酸都由 DNA 单链上连续的三个核苷酸序列表示,因此可以直接估算编码蛋白质的基因的最小尺寸。因此,可以通过测量多肽链的长度直接评估基因的大小。

一千三百五十个核苷酸编码了平均多肽链的 450 个氨基酸。因此,大肠杆菌中将有大约 3000 个基因(4000000/1350 = 3000)。根据国际人类基因组测序项目的估计(该项目位于美国,由美国国家人类基因组研究所 (NHGRI) 牵头),人类蛋白质编码基因的数量预计少于 30,000 个。秀丽隐杆线虫(一种简单的线虫)大约有 20,000 个基因。染色体单拷贝包含超过 30 亿对碱基。这些基因的编码区域仅占基因组的 3%。

Gene Definition

基因的精细结构

基因由一个 DNA 双螺旋组成,仅包含这一个 DNA 双螺旋。基因由许多不同的区域组成。主要部分是编码序列,它包含关于多肽氨基酸序列的数据。调控序列可以位于编码序列的左侧和右侧的相对固定的位置,上游或在左侧的负区域,下游或在右侧的正区域。

启动子是调控序列的一部分,在原核生物和真核生物之间有所不同。

不同类型的基因

Gene Definition

基本基因:简单基因的一条 DNA 链包含编码特定氨基酸的碱基序列。终止区位于下游。启动子位于编码区的下游。

1. 分裂基因

大多数真核生物在编码序列之间有大量的非编码序列。外显子是基因中包含基因编码的 DNA 片段。内含子是位于外显子之间的非编码序列。内含子和外显子交替出现。内含子通常不被翻译,也不包含任何遗传信息。这些基因被称为分裂基因或断裂基因。

从该 DNA 产生的 mRNA 被称为前体 mRNA 或 pre-mRNA。pre-mRNA 包含外显子和内含子。通过剪切技术,去除内含子。这个过程称为剪接。剩余的片段,称为外显子,被连接起来形成参与翻译的成熟 mRNA。例如,在成熟 mRNA 中,球蛋白有两个内含子,卵白蛋白有七个,胶原蛋白有 52 个,其尺寸远小于 pre-mRNA。

2. 重叠基因

许多病毒的基因会相互重叠。编码单个蛋白质的 DNA 序列构成了大多数基因。然而,某些序列可以产生多个蛋白质。Fredrick Sanger 在噬菌体 x174 中首次发现了这种行为。在这里,利用病毒 DNA 的短长度产生多个蛋白质。

这通过多种方式实现。有时一个基因会产生两个蛋白质,因为它们的起始位置不同。同样,通过在两个不同位置停止表达相同的基因来产生两个蛋白质。

在其他情况下,DNA 序列不区分外显子和内含子。在其他时候,这个 DNA 序列使用相邻的内含子进行表达,而其他情况下它只使用外显子。通过对单一长度的 mRNA 进行不均匀剪接,产生不同的蛋白质。这样,一个 DNA 链可以产生多个蛋白质。

3. 转座子或跳跃基因

过去人们认为基因具有明确的、固定的位置并且是静态的。然而,最近的研究表明,DNA 片段可以移动到同一染色体或不同染色体的新位置。根据 Barbara Mc Clintock 的说法,她首次在印度玉米中发现了这一点。玉米穗上有彩色玉米粒。进入编码有色玉米粒的基因并使其失活的 DNA 片段导致浅色玉米粒的产生。

转座子是这些可移动基因的技术术语。它们可以在基因组中跳跃,改变基因的表达方式。转座子是 DNA 中中度重复 DNA 类别的一个子集。转座子有明确的端点。它有一个非常长的中心部分。每个转座子在末端都有独特的碱基序列,由反向重复或在相反链上的回文结构组成。转座子可以通过其末端重复序列识别。目标位点,即受体位点,是转座子被插入的位置。

基因的表达可以因转座子的存在而改变。它们也可能导致突变。它们存在于细菌的质粒上。

4. 可修饰基因

在某些情况下,同一条或不同染色体上的多个基因协同工作,而不是仅由一个基因编码特定的多肽。

遗传分析

人类基因组计划还实现了 2,000 项遗传测试,这些测试有助于医生诊断遗传疾病。基因检测可以揭示一个人是否携带被认为负责遗传性疾病的基因。

在基因检测中,可以检查一个人的 DNA,看看是否有任何可能增加其患某种疾病风险的改变或突变。这些结果可以帮助医疗专业人员诊断疾病。

医生可能出于多种原因使用基因检测,包括:

  1. 识别未出生婴儿的遗传疾病。
  2. 筛查新生儿是否存在可治疗的特定疾病。
  3. 降低通过辅助生殖技术产生的胚胎携带遗传疾病的风险。
  4. 确定一个人是否携带可能遗传给子女的疾病基因。
  5. 确定一个人是否患某种疾病的风险更高。
  6. 帮助医生选择患者的最佳药物和剂量(药物基因组学测试)。

2005 年,研究人员编制了一份人类基因组中常见遗传变异(或单倍型)的列表。它被称为“单倍型图”或“HapMap”。这些信息有助于加速寻找导致常见人类疾病的基因。

最新发现

遗传学家最近发现了一个额外的可遗传遗传信息层,它不存储在基因组中,而是存储在“表观基因组”中,表观基因组是一组化学分子,可以指导基因组如何运作。

DNA 中存储着构建体内蛋白质所需的指令。这些蛋白质执行许多细胞过程。

表观基因组的蛋白质和化学元素可以与 DNA 结合并控制广泛的生物过程。这些过程包括激活和去激活基因。这可以改变基因的表达并调节特定细胞中蛋白质的合成。

基因开关可以在不同时间和不同持续时间内激活和去激活基因。不同细胞中不同基因组激活或失活的方式和时间决定了细胞之间的差异。

基因标记

当表观基因组物质结合到细胞中的 DNA 并改变其功能时,它们就“标记”了基因组。

尽管标记不会改变 DNA 的序列,但它们确实会改变细胞如何使用 DNA 的指令。这些标记可以在细胞分裂时从细胞传递到细胞,甚至可以从一代传递到下一代。

许多身体过程由特化细胞控制。例如,在红细胞中,特化细胞产生将氧气从空气输送到身体其他部位的蛋白质。许多这些基因组的改变由表观基因组调控。

随着特化细胞和表观基因组在人的一生中发生变化,DNA 和组蛋白(支持染色体形状的蛋白质)上的化学标签会重新组织。

吸烟、不良饮食和病毒性疾病是影响表观基因组的生活方式和环境因素。它们可能使人暴露于引起身体反应的力量之下。

这些反应可能导致表观基因组的直接改变,其中一些可能是破坏性的。一些人类疾病是由“读取”和“写入”表观基因组标记的蛋白质缺陷引起的。

表观基因组的变化可以开启或关闭参与细胞发育或免疫反应的基因。这些变化可能导致不受控制的癌症发展,或免疫系统无法清除的肿瘤。例如,基因组、表观基因组或两者兼有的改变可能导致癌症。

表观基因组学研究人员正专注于此主题,以绘制基因组的化学标记的位置并理解其功能。从这些材料中获得的知识可能有助于人们更好地了解人体并找到更健康的生活方式。

基因疗法

Gene Definition

基因疗法是一种医疗程序,它使用来自可信来源的 DNA 片段来治疗或预防疾病或医疗问题。为了治疗疾病,基因被注入患者的细胞和组织中。

在基因疗法中,通常会修复受损的基因或用健康的基因副本替换它。

基因疗法仍处于早期阶段。然而,医疗专业人员也正在使用它来治疗获得性疾病,如白血病,以及遗传性疾病,如血友病和镰状细胞病。

基因检测预测癌症

预测谁最容易患上早期阿尔茨海默病和乳腺癌等疾病的能力是基因信息的另一种用途。

例如,携带 BRCA1 基因的女性患乳腺癌的风险显著增加。一名女性可以进行检测,以确定她是否携带该基因。

BRCA1 携带者的孩子有 50% 的几率遗传这种异常(来源:Trusted Source)。

基于基因的个体化治疗

Gene Definition

根据患者的基因构成,基因检测可以帮助医生为他们选择合适的药物。这被称为药物基因组学测试。

它会寻找可能表明哪种治疗方法或剂量最适合患者的基因改变。医生可以使用它来预测患者是否会对药物产生严重的副作用。

基因的化学成分

除了某些病毒(其中基因由一种化学上相关的物质核糖核酸 (RNA) 组成)之外,基因由脱氧核糖核酸 (DNA) 构成。DNA 分子由两条核苷酸链组成,像扭曲的梯子一样相互缠绕。构成梯子侧面的糖和磷酸与成对的氮碱基连接,而构成梯子横档的糖和磷酸。这些碱基是胸腺嘧啶 (T)、腺嘌呤 (A)、鸟嘌呤 (G) 和胞嘧啶 (C)。当一条链上的 A 与另一条链上的 T 相互作用时,会形成 A-T 梯子横档;一条链上的 C 与另一条链上的 G 相互作用。

如果碱基之间的连接被切断,两条链会解开,细胞中未配对的核苷酸会附着在链的暴露碱基上。碱基配对规则决定了游离核苷酸如何沿着每条链排列:A 与 T 配对,C 与 G 配对。这种机制通过将遗传信息从一代细胞传递到下一代细胞,从一个原始分子产生两个相同的 DNA 分子。

基因的转录和翻译

DNA 链上碱基的排列方式决定了遗传密码。当需要某个特定基因的产物时,它会从所在的 DNA 分子中分离出来。细胞中的游离核苷酸在转录过程中转化为一条含有与该基因兼容的碱基的 RNA 链。(在生成 RNA 时,A 与 U 配对,因为 DNA 含有胸腺嘧啶 [T] 核苷酸,而 RNA 含有尿嘧啶 [U] 碱基)。称为信使 RNA (mRNA) 的单链 RNA 被核糖体接收,执行翻译或蛋白质合成过程。

另一种称为转运 RNA (tRNA) 的 RNA 在翻译过程中将 mRNA 上的核苷酸与特定的氨基酸连接起来。所有蛋白质都包含一个或多个相互连接的多肽链,这些链由氨基酸的排列组成,氨基酸的排列由核苷酸的排列组成——每三个核苷酸编码一个氨基酸。

1940 年代的实验表明,单个酶或多肽链的组装由单个基因控制。然而,这一发现表明并非所有基因都产生酶,并且某些酶由两个或多个不同基因产生的几个小多肽组成。这被称为“一个基因,一个酶”理论。

基因的调控

调控基因和操纵子在模型中有所描绘。

原核生物和真核生物在调控基因的机制上有很大差异。根据实验,生物体细胞中的许多基因经常(如果不是总是)不活跃。因此,在原核生物和真核生物中,基因可以随时开启或关闭。

细菌中基因的激活和失活已被广泛研究。细菌的基因分为三个类别:结构基因、操纵基因和调控基因。结构基因产生特定类型的多肽。操纵基因包含从一个或多个结构基因转录 DNA 信息到 mRNA 的起始代码。因此,结构基因和操纵基因连接在一起形成一个称为操纵子的功能单元。调控基因产生一种称为阻遏物的微小蛋白质分子,它最终调控操纵子的活性。阻遏物与操纵基因结合,阻止其启动操纵子所需的蛋白质合成。操纵子是开启还是关闭取决于特定阻遏物分子的存在或不存在。如前所述,微生物适用于这种方法。

尽管真核生物没有操纵子,但它们的基因仍然是自主调控的。多层调控涉及导致高等生物基因表达的一系列活动。转录因子(一种称为转录因子的分子)的存在或缺失经常影响这些活动。这些变量,可能充当激活剂或增强剂,影响转录率,这是基因调控的基本水平。在特定时间和特定细胞类型中,特定的转录因子控制基因产生的 RNA。位于高等生物基因中的启动子或调控区域是转录因子结合的常见位点。

转录后,编辑和剪接过程会去除初级转录物中的内含子(非编码核苷酸序列)。这些操作的最终产物是功能性 mRNA 链。虽然大多数基因作为 mRNA 合成过程的一部分例行执行此操作,但某些基因具有多个初级转录物,这些转录物可以通过不同的方式剪接以产生不同的 mRNA,从而产生不同的蛋白质。在翻译和翻译后阶段,许多基因也受到调控。

基因突变

Gene Definition

当基因的碱基序列改变时,就会发生突变。核苷酸可能会被删除、加倍、重排或替换。每个核苷酸的变化都有不同的结果。大多数情况下,突变几乎没有影响,但当它确实产生影响时,它对生物体造成的改变可能是有害的,甚至是致命的。有利的突变会变得越来越普遍,直到它在种群中成为常态。

结论

基因是一组指令集,从一代传递到下一代。它们包含识别个人独特身体和生物学特征所需的数据,例如血型、眼睛颜色和头发颜色。

大多数基因会产生一种特定蛋白质,这种蛋白质对人类的生存、生长和繁殖至关重要。这些蛋白质在全身发挥各种作用。

基因由 DNA 片段组成。基因由四种不同的核苷酸碱基组成,并且有无数种序列排列方式。构成 DNA 的核苷酸是化学构件。

不同的碱基序列导致不同的指令,这些指令负责不同的身体特征,例如拥有蓝色或棕色的眼睛。改变编码蛋白质的基因可能会损害蛋白质正常运作的能力。它们可能导致遗传问题,这被称为基因突变。

研究人员正在研究基因检测的潜在用途,即检测一个人 DNA 中可能表明其患病风险或将其传染给后代的改变。


下一主题青光眼定义