医学遗传学概述

作者:Quasar S. Padiath, MBBS, PhD, University of Pittsburgh
已审核/已修订 6月 2023
看法 进行患者培训

基因是遗传的基本单位,是DNA的一个片段,包含合成多肽(蛋白质)或功能性RNA分子所需的所有信息。蛋白质的合成、折叠、及三级四级结构最终决定了机体的主要结构和功能。

结构

根据基因的定义,人类有大约20,000到23 000个基因。存在于细胞核内的染色体和线粒体中。人体正常的体细胞(非生殖细胞),有46条染色体,分为23对。每对染色体中,一条来自父亲,一条来自母亲。22对染色体中,1号至22号染色体,即常染色体,通常是同源的(即染色体的大小、形状和基因的位置、数目一样)。第23对性染色体(X和Y),决定人的性别,同时包含其他功能基因。女性在每个体细胞核中有两条X染色体(同源),男性则有一条X染色体和一条Y染色体(异源染色体)。

X染色体携带着许多决定遗传性状的基因,而小的Y染色体则携带着启动男性性别分化的基因及其他少部分基因。由于X染色体含有的基因比Y染色体多,男性的许多X染色体基因是不配对的;为了保持男女之间遗传物质的平衡,女性每个细胞的一条X染色体在胎儿早期被随机灭活(里昂化)。在某些细胞中,来自母亲的 X 是失活的,而在其他细胞中,则是来自父亲的 X。一旦染色体失活在细胞中发生,这些细胞的子代都会延续相同的X染色体失活。核型显示了一个人细胞中的全套染色体组成。

生殖细胞(卵和精原细胞)通过减数分裂进行分裂,染色体数目减为23,是体细胞中数目的一半。减数分裂期来自于父亲和母亲的遗传信息可通过同源染色体之间交换进行重组。当卵子和精子结合时,染色体数又恢复至正常的46条。

基因在染色体的DNA分子中呈线状排列。每一个基因在染色体上有其特定的位置(位点),在同源染色体上,基因的位点是一致的。在同一对的两条染色体上占据两个等同位点的基因(一个来自父亲,另—个来自母亲)称为等位基因。每个基因由特定的序列构成。两个等位基因可有相同的或略有不同的核苷酸序列。某个基因的两个等位基因相同,是纯合子;两个等位基因不同,则为杂合子。某些基因发生在可能彼此相邻或在同一或不同染色体的不同位置上的多拷贝。

DNA的结构

DNA是细胞的遗传物质,存在于细胞核内的染色体和线粒体中。

除了某些细胞(例如,精子和卵细胞以及红细胞)外,细胞核包含 23 对染色体。 一条染色体含有许多基因。基因是DNA的一个片段,它提供了构建蛋白质或RNA分子的代码。

DNA 分子是一个长而卷曲的双螺旋,类似于螺旋楼梯。其中,由糖(脱氧核糖)和磷酸分子组成的两条链通过称为碱基的四个分子对连接,形成楼梯的台阶。在这些步骤中,腺嘌呤与胸腺嘧啶配对,鸟嘌呤与胞嘧啶配对。每对碱基通过氢键连接在一起。一个基因由一系列碱基组成。三个碱基的序列编码氨基酸(氨基酸是蛋白质的组成部分)或其他信息。

基因功能

基因由DNA组成。基因的长度决定了由基因编码合成的蛋白质或RNA的长度。DNA是核苷酸(碱基)互补配对的双螺旋结构。

  • 腺嘌呤(A)与胸腺嘧啶(T)配对

  • 鸟嘌呤(G)与胞嘧啶(C)配对

DNA通过转录合成蛋白,DNA的一条链作为模板合成信使RNA(mRNA)。除了尿嘧啶(U)由胸腺嘧啶(T)替代而外,RNA和DNA有着相同的碱基对。mRNA分子从细胞核进入细胞质,然后进入核糖体,在核糖体中合成蛋白质。转运RNA(tRNA)根据mRNA上的编码顺序将每一种氨基酸携带至核糖体,并将氨基酸加至延伸的多肽链上。当一条氨基酸链合成完毕,在附近分子伴侣的影响下自我折叠,形成复杂的三维结构。

DNA的编码由四种核苷酸的其中三种组成三联密码子构成。特定的氨基酸由特定的三联密码子编码。由于有四种核苷酸,可能的三联密码子数目为43(64)。因为仅有20种氨基酸,因此可有多余的三联密码子组合。同一种氨基酸可由不同的三联密码子编码。其余密码子可编码蛋白质合成的起始或终止密码子,它的顺序决定了氨基酸的结合和组装。

基因包含外显子和内含子。对于蛋白质编码基因,外显子编码最终蛋白质的氨基酸成分。内含子包含调节蛋白质产生速度和产生的蛋白质类型的其他信息。外显子和内含子共同转录至mRNA,但内含子部分最终将被剪接掉。转录过程受到很多因素的调控,包括反义RNA,该链由DNA上未转录成mRNA的链为模板合成。除DNA之外,染色体包含组蛋白和其他影响基因表达的蛋白(哪些蛋白和多少蛋白由给定的基因合成)。

基因型指特定的基因组成序列,由它决定编码合成何种蛋白。

基因组是指一组完整的单倍体染色体(单链)组成,包括它们所包含的所有基因。

基因表型指由其控制的个体(细胞甚或机体)的生化和生理构成性状和功能。表型是由多种因素的复杂相互作用决定的,包括基因型、环境因素以及实际合成的蛋白质的类型和数量,即基因的实际表达方式。特定的基因型可能与表型相关,也可能没有相关性。

表达 是指某个基因所编码的信息被用来控制某个分子组成(通常为蛋白质或RNA)的过程。基因表达取决于多种因素,如性状是显性还是隐性,基因的外显率和表达率(见影响基因表达的因素), 组织分化程度(由组织类型和年龄决定)、环境因素、表达是否受性别限制或染色体失活或基因组印记的影响,以及其他未知因素。

表观遗传因素

影响基因表达但不改变基因组序列的因素称为表观遗传因素。

许多介导基因表达的生化机制的认知正在迅速增长。变异(也称之为选择性剪接)是内含子剪接的机制之一。在剪接过程中,内含子被剪出,剩余的外显子可能以多种组合组装,产生许多能够编码相似但不同蛋白质的不同 mRNA。人类可合成蛋白的数量> 100,000,即使在人类基因组仅包含约2万多个基因。

其他调节基因表达的机制包括DNA甲基化和组蛋白修饰,涉及甲基化和乙酰化。DNA甲基化趋于沉默基因功能。组蛋白类似于DNA缠绕的线轴。组蛋白修饰如乙酰化或甲基化可以增加或减少特定基因的表达。DNA上的非转录链亦可作为合成RNA的模板,来调控另一条链的转录。

另一个重要的机制涉及微小RNAs(miRNAs)。miRNA是由发夹衍生的短RNA,在转录后抑制靶基因表达(发夹指RNA序列结合在一起时呈现的形状)。miRNA可能参与多达60%的转录蛋白的调节。

性状和遗传模式

所谓性状,可以如眼睛的颜色那样简单,也可以如对糖尿病的易感性那么复杂。一个性状的表达可涉及一个基因或多个基因。一些 单基因缺陷可引起多组织的异常,这种效应称为基因多效性。例如,成骨不全症 (由单个胶原基因异常引起的结缔组病)可导致脆骨病、耳聋、蓝巩膜、牙齿发育不良、关节活动度过大和心瓣膜异常)。

绘制家系图谱

家系图(家族树)用于表示遗传的模式。系谱通常用于遗传咨询。家系图运用规定的符号代表家族成员及他们的健康情况(见图 构建家谱谱系的符号)。某些表型一样的家族性疾病可以有多种遗传模式。

构建家谱谱系的符号

在家谱系谱中,各代以罗马数字标记,最老的一代在顶部,最年轻的在底部。在同一代中,各人以阿拉伯数字从左到右标记。同胞按年龄大小排列,最年长者在左边。 因此,系谱中每一成员可用两个数字来确定(如Ⅱ,4)。配偶同样有一个标记数字。

关键点

  • 表型是由包括基因型、基因表达和环境因素在内的多种因素的复杂相互作用决定的。

  • 基因表达调节机制正在被阐明,包括内含子剪接、DNA 甲基化、组蛋白修饰、microRNA 和 3D 基因组组织。

quizzes_lightbulb_red
Test your KnowledgeTake a Quiz!
下载默沙东 诊疗手册应用程序!ANDROID iOS APPS in CHINA
下载默沙东 诊疗手册应用程序!ANDROID iOS APPS in CHINA
下载默沙东 诊疗手册应用程序!ANDROID iOS APPS in CHINA