脱氧核糖核酸


脱氧核糖核酸 (正體)

Free Web Hosting with Website Builder
DNA双股螺旋。

脱氧核糖核酸英语Deoxyribonucleic acid,缩写为DNA)又称去氧核糖核酸,是一种分子,可组成遗传指令,以引导生物发育生命机能运作。主要功能是长期性的资讯储存,可比喻为“蓝图”或“食谱”[1]。其中包含的指令,是建构细胞内其他的化合物,如蛋白质RNA所需。带有遗传讯息的DNA片段称为基因,其他的DNA序列,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。

DNA是一种长链聚合物,组成单位称为核苷酸,而糖类磷酸分子借由键相连,组成其长链骨架。每个糖分子都与四种碱基里的其中一种相接,这些碱基沿着DNA长链所排列而成的序列,可组成遗传密码,是蛋白质氨基酸序列合成的依据。读取密码的过程称为转录,是根据DNA序列复制出一段称为RNA的核酸分子。多数RNA带有合成蛋白质的讯息,另有一些本身就拥有特殊功能,例如rRNAsnRNAsiRNA

在细胞内,DNA能组织成染色体结构,整组染色体则统称为基因组。染色体在细胞分裂之前会先行复制,此过程称为DNA复制。对真核生物,如动物植物真菌而言,染色体是存放于细胞核内;对于原核生物而言,如细菌,则是存放在细胞质中的类核里。染色体上的染色质蛋白,如组织蛋白,能够将DNA组织并压缩,以帮助DNA与其他蛋白质进行交互作用,进而调节基因的转录。

目录

历史

佛朗西斯·克里克所绘,最早的DNA双螺旋草图。

最早分离出DNA的弗雷德里希·米歇尔是一名瑞士医生,他在1869年,从废弃绷带里所残留的脓液中,发现一些只有显微镜可观察的物质。由于这些物质位于细胞核中,因此米歇尔称之为“核素”(nuclein)[2]。到了1919年,菲巴斯·利文进一步辨识出组成DNA的碱基、糖类以及磷酸核苷酸单元[3],他认为DNA可能是许多核苷酸经由磷酸基团的联结,而串联在一起。不过他所提出概念中,DNA长链较短,且其中的碱基是以固定顺序重复排列。1937年,威廉·阿斯特伯里完成了第一张X光衍射图,阐明了DNA结构的规律性[4]

1928年,弗雷德里克·格里菲斯格里菲斯实验中发现,平滑型的肺炎球菌,能转变成为粗糙型的同种细菌,方法是将已死的平滑型与粗糙型活体混合在一起。这种现象称为“转型”。但造成此现象的因子,也就是DNA,是直到1943年,才由奥斯瓦尔德·埃弗里等人所辨识出来[5]。1953年,阿弗雷德·赫希玛莎·蔡斯确认了DNA的遗传功能,他们在赫希-蔡斯实验中发现,DNA是T2噬菌体遗传物质[6]

剑桥大学里一面纪念克里克与DNA结构的彩绘窗。

到了1953年,当时在卡文迪许实验室詹姆斯·沃森佛朗西斯·克里克,依据伦敦国王学院罗莎琳·富兰克林所拍摄的X光衍射图[7]及相关资料,提出了[7]最早的DNA结构精确模型,并发表于《自然》期刊[8]。五篇关于此模型的实验证据论文,也同时以同一主题发表于《自然》[9]。其中包括富兰克林与雷蒙·葛斯林的论文[10],此文所附带的X光衍射图[11],是沃森与克里克阐明DNA结构的关键证据。此外莫里斯·威尔金斯团队也是同期论文的发表者之一[12]。富兰克林与葛斯林随后又提出了A型与B型DNA双螺旋结构之间的差异[13]。1962年,沃森、克里克以及威尔金斯共同获得了诺贝尔生理学或医学奖[14]

克里克在1957年的一场演说中,提出了分子生物学的中心法则,预测了DNA、RNA以及蛋白质之间的关系,并阐述了“转接子假说”(即后来的tRNA)[15]。1958年,马修·梅瑟生富兰克林·史达梅瑟生-史达实验中,确认了DNA的复制机制[16]。后来克里克团队的研究显示,遗传密码是由三个碱基以不重复的方式所组成,称为密码子。这些密码子所构成的遗传密码,最后是由哈尔·葛宾·科拉纳罗伯特·W·霍利以及马歇尔·沃伦·尼伦伯格解出[17]。为了测出所有人类的DNA序列,人类基因组计划于1990年代展开。到了2001年,多国合作的国际团队与私人企业塞雷拉基因组公司,分别将人类基因组序列草图发表于《自然》[18]与《科学》[19]两份期刊。

物理与化学性质

DNA的化学结构。

DNA是一种由核苷酸重复排列组成的长链聚合物[20][21],宽度约22到24(2.2到2.4纳米),每一个核苷酸单位则大约长3.3埃(0.33纳米)[22]。在整个DNA聚合物中,可能含有数百万个相连的核苷酸。例如人类细胞中最大的1号染色体中,就有2亿2千万个碱基对[23]。通常在生物体内,DNA并非单一分子,而是形成两条互相配对并紧密结合[8][24],且如蔓藤般地缠绕成双螺旋结构的分子。每个核苷酸分子的其中一部分会相互连结,组成长链骨架;另一部分称为碱基,可使成对的两条DNA相互结合。所谓核苷酸,是指一个核苷加上一个或多个磷酸基团,核苷则是指一个碱基加上一个糖类分子[25]

DNA骨架是由磷酸糖类基团交互排列而成[26]。组成DNA的糖类分子为环状的2-脱氧核糖,属于五碳糖的一种。磷酸基团上的两个原子分别接在五碳糖的3号及5号碳原子上,形成磷酸双酯键。这种两侧不对称的共价键位置,使每一条DNA长链皆具方向性。双螺旋中的两股核苷酸互以相反方向排列,这种排列方式称为反平行。DNA链上互不对称的两末端一边叫做5'端,另一边则称3'端。DNA与RNA最主要的差异之一,在于组成糖分子的不同,DNA为2-脱氧核糖,RNA则为核糖[24]

两股DNA长链上的碱基以氢键相互吸引,使双螺旋形态得以维持。这些碱基可分为两大类,以5角及6角杂环化合物组合而成的一类称为嘌呤;只有一个6角杂环的则称为嘧啶[25]。组成DNA的碱基,分别是腺嘌呤(缩写A)、胞嘧啶(C)、鸟嘌呤(G)与胸腺嘧啶(T)。碱基、糖类分子与磷酸三者结合之后,便成为完整的核苷酸。还有一种碱基称为尿嘧啶(U),此种碱基比胸腺嘧啶少了一个位于环上的甲基,一般出现在RNA分子中,角色相当于DNA里的胸腺嘧啶。通常在DNA中,它会作为胞嘧啶的分解产物,或是CpG岛中未经甲基化的胞嘧啶突变产物。少见的例外发现于一种称为PBS1的细菌病毒,此类病毒的DNA中含有尿嘧啶[27]。在某些特定RNA分子的合成过程中,会有许多尿嘧啶在酵素的作用下失去一个甲基,因而转变成胸腺嘧啶,这种情形大多出现于一些在构造上具有功能,或者具有酵素能力的RNA上,例如转运RNA核糖体RNA[28]

DNA片段结构动画,各种碱基水平排列于两条螺旋长链之间。放大观看[29]

两股DNA长链会以右旋方式相互缠绕成双螺旋结构,由于以磷酸联结而成的骨架位于外部,且两股之间会留下一些空隙,因此位于螺旋内部的碱基,即使从螺旋外侧依然可见(如右方动画)。双螺旋的表面有两种凹槽(或称“沟”):较大的宽22;较小的宽12埃[30]。由于各个碱基靠近大凹槽的一面较容易与外界接触,因此如转录因子等能够与特定序列结合的蛋白质与碱基接触时,通常是作用在靠近大凹槽的一面[31]

上图可见GC碱基对由三个氢键相连;下图可见AT碱基对是由两个氢键相连。图中的氢键皆以虚线表示。

碱基配对

参见:碱基对

一股DNA上所具有的各类型碱基,都只会与另一股上的一个特定类型碱基产生键结。此种情形称为互补性碱基配对。嘌呤与嘧啶之间会形成氢键,在一般情况下,A只与T相连,而C只与G相连。因此排列于双螺旋上的核苷酸,便以这种称为碱基对的方式相互联结。除此之外,与DNA序列无关的疏水性效应,以及π重叠效应所产生的,也是两股DNA能维持结合状态的原因[32]。由于氢键比共价键更容易断裂,这使双股DNA可能会因为机械力或高作用,而有如拉链一般地解开[33],这种现象被称为DNA变性。由于互补的特性,使位于双股序列上的讯息,皆以双倍的形式存在,这种特性对于DNA复制过程来说相当重要。互补碱基之间可逆且具专一性的交互作用,是生物DNA所共同拥有的关键功能[20]

两种不同的碱基对分别是以不同数目的氢键结合:AT之间有两条;GC之间则有三条(见左图)。多一条氢键使GC配对的稳定性高于AT配对,也因此两股DNA的结合强度,是由GC配对所占比例,以及双螺旋的总长度来决定。当DNA双螺旋较长且GC含量较高时,其双股之间的结合能力较强;长度较短且AT含量较高时,结合能力则较弱[34]。双螺旋上有某些部位必须能够轻易解开,这些部位通常含有有较多的AT配对,例如细菌启动子上一段含有TATAAT序列的普里布诺盒[35]。在实验室中,若找出解开氢键所需的温度,也就是所谓熔点Tm),便能计算出两股之间的结合强度。当DNA双螺旋上所有的碱基配对都解开之后,溶液中的两股DNA将分裂成独立的分子。单股DNA分子并无固定的形体,但仍有某些形状较为稳定且常见[36]

正意与反意

一般来说,当一段DNA序列为合成信使RNA(mRNA,可转译成蛋白质)所需时,称为“正意”。而相对并互补的另一股序列,则称为“反意”。由于RNA聚合酶的作用方式,是根据模板上的讯息来合成一段与模板互补的RNA片段,因此正意mRNA的序列实际上与DNA上的反意股相同。在同一股DNA上,可能同时会有属于正意和反意的片段。此外,反意RNA在原核生物或真核生物体内皆存在,但是其功能尚未明了[37]。有研究认为,反意RNA可利用RNA与RNA之间的碱基配对,来调控基因的表现[38]

少数属于原核生物、真核生物、质体病毒的DNA序列(后两者较前两者多),会由于正意股与反意股之间的差异难以区分,而产生重叠基因[39],这类DNA序列具有双重功能,一方面能以5'往3'的方向合成蛋白质,另一方面也能以相反方向合成另一个蛋白质。这种重叠现象一方面在细菌体内参与调控基因的转录[40],一方面则在较小的病毒基因组中,扮演增加讯息量的角色[41]。为了缩减基因组的大小,也有某些病毒以线状或环状的单股DNA作为遗传物质[42][43]

超螺旋

参见:DNA超螺旋

DNA链在双螺旋基础上如绳索般扭转的现象与过程称为DNA超螺旋。当DNA处于“松弛”状态时,双螺旋的两股通常会延着中轴,以每10.4个碱基对旋转一圈的方式扭转。但如果DNA受到扭转,其两股的缠绕方式将变得更紧或更松[44]。当DNA扭转方向与双股螺旋的旋转方向相同时,称为正超螺旋,此时碱基将更加紧密地结合。反之若扭转方向与双股螺旋相反,则称为负超螺旋,碱基之间的结合度会降低。自然界中大多数的DNA,会因为拓扑异构酶的作用,而形成轻微的负超螺旋状态[45]。拓扑异构酶同时也在转录作用或DNA复制过程中,负责纾解DNA链所受的扭转压力[46]

由左到右分别为A型、B型与Z型三种DNA结构。

各种类型的双螺旋结构

DNA有多种不同的构象,其中有些构象之间在构造上的差异并不大。目前已辨识出来的构象包括:A-DNA、B-DNA、C-DNA、D-DNA[47]、E-DNA[48]、H-DNA[49]、L-DNA[47]、P-DNA[50]Z-DNA[26][51]。不过以现有的生物系统来说,自然界中可见的只有A-DNA、B-DNA与Z-DNA。DNA所具有的构象可根据DNA序列、超螺旋的程度与方向、碱基上的化学修饰,以及溶液状态,如金属离子多胺浓度来分类[52]。三种主要构象中以B型为细胞中最常见的类型[53],与另两种DNA双螺旋的差异,在于其几何形态与尺寸。

其中A型拥有较大的宽度与右旋结构,小凹槽较浅且较宽,大凹槽则较深较窄。A型一般存在于非生理状态的脱水样本中,在细胞中则可能为DNA与RNA混合而成的产物(类似酵素及DNA的复合物)[54][55]。若一段DNA上的碱基受到一种称为甲基化的化学修饰,将使其构型转变成Z型。此时螺旋形式转为左旋,与较常见的右旋B型相反[56]。某些专门与Z-DNA结合的蛋白质可辨识出这种少见的结构,此外Z型DNA可能参与了转录作用的调控[57]

由重复排列的端粒构成的DNA四联体结构形态。DNA骨架的构形与一般的螺旋结构显着地有所不同[58]

四联体结构

线状染色体的末端有一段称为端粒的特殊区域,由于一般参与复制DNA的酵素无法作用于染色体的3'端,因此这些端粒的主要功能,是使细胞能利用一种称为端粒酶的酵素来复制端粒[59]。如果端粒消失,那么复制过程将使染色体长度缩小。因此这些特化的端帽能保护染色体结尾不被外切酶破坏,并阻止细胞中的DNA修复系统将其视为需修正的损毁位置[60]。在人类细胞中,端粒是由重复出现数千次TTAGGG序列的单股DNA所组成[61]

这些序列富含鸟嘌呤,可形成一种由四个碱基重叠而成的特殊结构,使染色体末端较为稳定。四个鸟嘌呤可构成一个平面,并且重叠于其他平面之上,产生稳定的G-四联体结构[62]。碱基与位在四个碱基中心的金属离子螯合物之间,是经由氢键结合以稳定结构。左图显示由上方观看人类端粒中的四联体,图中可见每四个碱基为一组,共三层碱基重叠而成的单股DNA环状物。在碱基环绕的中心,可见三个螯合在一起的离子[63]。也有其他类型的结构存在,例如中心的四个碱基,除了可以是属于单一的一股DNA之外,也可能是由多条平行的DNA各自贡献一个碱基而形成。

端粒另外还可形成一种大型环状结构,称为端粒环或T环(T-loop)。是由单股DNA经过端粒结合蛋白的作用之后,卷曲而成的一个大循环[64]。在T环长链最前端的地方,单股的DNA会附着在双股DNA之上,破坏双螺旋DNA与另一股的碱基配对,形成一种称为替代环或D环的三股结构[62]

化学修饰

碱基修饰

胞嘧啶 5-甲基胞嘧啶 胸腺嘧啶
正常与附加一个5-甲基的胞嘧啶。经过脱氨作用之后,5-甲基胞嘧碇会转变成胸腺嘧啶。
参见:DNA甲基化

基因的表现,受染色体上的染色质结构与异染色质(基因无表现或低表现)区域里的胞嘧啶甲基化所影响。举例而言,当胞嘧啶受到甲基化时,会转变成5-甲基胞嘧啶,此作用对于X染色体的去活化铭印和保护DNA分子不被内切酶所切断(存在例外)而言相当重要[65]。甲基化的程度在不同生物之间有所差异,如秀丽隐杆线虫便缺乏胞嘧啶甲基化,而在脊椎动物体内则较常出现,大约有1%的DNA为5-甲基胞嘧啶[66]。5-甲基胞嘧啶容易因自然发生的脱氨作用而变成胸腺嘧啶,也因此使甲基化的胞嘧啶成为突变热点[67],这也解释了为什么胞嘧啶和鸟嘌呤会集中出现在CpG岛里,因为那里的甲基化作用被压制,没有甲基化的胞嘧啶所产生的突变产物并非胸腺嘧啶,而是尿嘧啶。因为尿嘧啶会相对容易地被更正过来,所以CpG岛内胞嘧啶不易形成突变而会被保留下来。其他的碱基修饰还包括细菌的腺嘌呤甲基化,以及使动质体(一种生物)的尿嘧啶转变成“J-碱基”的糖基化[68][69]

苯并芘是一种突变原,可于烟叶燃烧生成的中发现,图为苯并芘与DNA的加合物[70]

DNA损害

参见:突变

有许多不同种类的突变原可对DNA造成损害,其中包括氧化剂烷化剂,以及高能电磁辐射,如紫外线X射线。不同的突变原对DNA造成不同类型的损害,举例而言,紫外线会造成胸腺嘧啶二聚体的形成,并与相邻的碱基产生交叉,进而使DNA发生损害[71]。另一方面,氧化剂如自由基过氧化氢,可造成多种不同形态的损害,尤其可对鸟苷进行碱基修饰,并且使双股分解[72]。根据估计,在一个人类细胞中,每天大约有500个碱基遭受氧化损害[73][74]。在各种氧化损害当中,以双股分解最为危险,此种损害难以修复,且可造成DNA序列的点突变插入删除,以及染色体易位[75]

许多突变原可嵌入相邻的两个碱基对之间,这些嵌入剂大多是芳香性分子及平面分子,包括乙锭道诺霉素阿霉素沙利窦迈。必须先使碱基之间的空隙变大,才能使嵌入剂置入碱基对之间,整体而言,DNA会因为双螺旋解开而扭曲变形。结构改变会使转录作用与DNA复制过程受到抑制,进而导致毒害与突变。因此DNA嵌入剂通常也是致癌物,常见的例子有二醇环氧苯并芘吖啶黄麴毒素溴化乙锭[76][77][78]。但是这些物质也因为能够抑制DNA的转录与复制,而可应用于化学治疗中,用以抑制癌症细胞的快速生长情形[79]

生物机能摡观

DNA于真核生物细胞内,通常是以长条状染色体形式存在;在原核生物细胞内则是环状染色体。细胞内的所有染色体合称基因组人类基因组中大约有30亿个碱基对,共组成了46个染色体[80]。DNA所携带的讯息,是以序列形式,保存于一些称为基因的片段中。基因中的遗传讯息是经由互补的碱基配对来传递,例如在转录作用中,细胞里的RNA核苷酸会与互补的DNA结合,复制出一段与DNA序列互补的RNA序列。一般来说,这段RNA序列将会在转译作用中,经由RNA之间的互补配对,合成出相对应的蛋白质序列。另一方面,细胞也可以在称为DNA复制的过程中,单纯地复制其自身的遗传讯息。

基因组结构

真核生物的基因组DNA主要存放于细胞核中,此外也有少量位于粒线体叶绿体内。原核生物的DNA则是保存在形状不规则的类核(nucloid)当中[81]。基因是DNA的一段区域,保存了基因组里的遗传讯息,是遗传的单位,影响了生物个体的特定表征。基因中含有可转录的开放阅读框架,以及一些可调节开放阅读框架表现的调控序列,如启动子强化子

许多物种的基因组都只有一小部分可编译成蛋白质。以人类为例,在人类的基因组中只有1.5%属于含有蛋白质编码的外显子,另有超过50%属于无编码的重复序列[82]。真核生物基因组中如此大量的非编码DNA,以及物种之间不寻常的基因组大小C值差异,长久以来一直是个难题,人们称之为“C值谜[83]。不过这些不含蛋白质编码的DNA序列,仍可能合成出具有功能的非编码RNA分子,用以调控基因表现[84]

T7RNA聚合酶(蓝色)以DNA模板(橙色)为依据,合成mRNA(绿色)[85]

染色体中的某些非编码DNA序列,本身具有结构上的功能。例如一般只带有少量基因的端粒着丝粒,对于染色体的稳定性及机能而言显得相当重要[60][86]。人类体内有一类大量存在的非编码DNA,称为伪基因,是一些因突变累积而变得残缺无用的基因复制品[87]。这些序列通常只可算是分子化石,不过有时候也会因为基因重复趋异演化,而成为新基因里的新遗传物质[88]

转录与转译

基因是指一段含有遗传讯息,且可影响生物体表现型的DNA序列。基因里的DNA碱基序列决定了信使RNA的序列,而信使RNA的序列又决定了蛋白质的序列。转译作用可依据基因所含有的核苷酸序列,以及遗传密码规则,生产出对应的蛋白质氨基酸序列。遗传密码的组成单位称为密码子,是含有三个字母的“指令”,这些单位则由三个核苷酸组成,例如ACT、CAG或TTT。

在转录作用中,基因里的密码子会在RNA聚合酶的作用下,复制成为信使RNA。之后核糖体会帮助带着氨基酸的转移RNA与信使RNA进行碱基配对,进而将信使RNA解码。由于组成密码子的碱基共有四种,且以三字母为一单位,因此可能存在的密码子一共有64种(43)。与这些密码子对应的标准氨基酸有20种,因此大多数氨基酸对应了一种以上的密码子。另外有三个密码子称为“终止密码子”或“无义密码子”,是编码区域的末端,分别是TAA、TGA与TAG。

图为DNA复制,首先螺旋酶拓扑异构酶将双螺旋解开,接着一个DNA聚合酶负责合成前进股;另一个则与延迟股结合,制造一些不连续的冈崎片段,再由DNA连接酶将其黏合。

复制

参见:DNA复制

生物个体成长需要经历细胞分裂,当细胞进行分裂时,必须将自身基因组中的DNA复制,才能使子细胞拥有和亲代相同的遗传讯息。DNA的双股结构可供DNA复制机制进行,在此复制过程中,两条长链会先分离,之后一种称为DNA聚合酶的酵素,会分别以两条长链为依据,合成出互补的DNA序列。酵素可找出正确的外来互补碱基,并将其结合到模板长链上,进而制造出新的互补长链。由于DNA聚合酶只能以5'到3'的方向合成DNA链,因此双螺旋中平行但方向相反的两股,具有不同的合成机制[89]。旧长链上的碱基序列决定了新长链上的碱基序列,使细胞得以获得完整的DNA复制品。

与蛋白质的交互作用

DNA若要发挥其功用,必须仰赖与蛋白质之间的交互作用,有些蛋白质的作用不具专一性,有些则只专门与个别的DNA序列结合。聚合酶在各类酵素中尤其重要,此种蛋白质可与DNA结合,并作用于转录或DNA复制过程。

DNA结合蛋白

DNA与组织蛋白(上图白色部分)的交互作用,这种蛋白质中的碱性氨基酸(左下蓝色),可与DNA上的酸性磷酸基团结合(右下红色)。

结构蛋白可与DNA结合,是非专一性DNA-蛋白质交互作用的常见例子。染色体中的结构蛋白与DNA组合成复合物,使DNA组织成紧密结实的染色质构造。对真核生物来说,染色质是由DNA与一种称为组织蛋白的小型碱性蛋白质所组合而成;而原核生物体内的此种结构,则掺杂了多种类型的蛋白质[90][91]。双股DNA可在组织蛋白的表面上附着并缠绕整整两圈,以形成一种称为核小体的盘状复合物。组织蛋白里的碱性残基,与DNA上的酸性糖磷酸骨架之间可形成离子键,使两者发生非专一性交互作用,也使复合物中的碱基序列相互分离[92]。在碱性氨基酸残基上所发生的化学修饰有甲基化磷酸化乙酰化[93],这些化学作用可使DNA与组织蛋白之间的作用强度发生变化,进而使DNA与转录因子接触的难易度改变,影响转录作用的速率[94]。其他位于染色体内的非专一性DNA结合蛋白,还包括一种能优先与DNA结合,并使其扭曲的高移动性群蛋白[95]。这类蛋白质可以改变核小体的排列方式,产生更复杂的染色质结构[96]

DNA结合蛋白中有一种专门与单股DNA结合的类型,称为单股DNA结合蛋白。人类的复制蛋白A是此类蛋白中获得较多研究的成员,作用于多数与解开双螺旋有关的过程,包括DNA复制、重组以及DNA修复[97]。这类结合蛋白可固定单股DNA,使其变得较为稳定,以避免形成茎环(stem-loop),或是因为核酸酶的作用而水解。

λ抑制子是一类具螺旋-转角-螺旋结构的转录因子,可与DNA目标结合[98]

相对而言,其他的蛋白质则只能与特定的DNA序列进行专一性结合。大多数关于此类蛋白质的研究集中于各种可调控转录作用的转录因子。这类蛋白质中的每一种,都能与特定的DNA序列结合,进而活化或抑制位于启动子附近序列的基因转录作用。转录因子有两种作用方式,第一种可以直接或经由其他中介蛋白质的作用,而与负责转录的RNA聚合酶结合,再使聚合酶与启动子结合,并开启转录作用[99]。第二种则与专门修饰组织蛋白的酵素结合于启动子上,使DNA模板与聚合酶发生接触的难度改变[100]

由于目标DNA可能散布在生物体中的整个基因组中,因此改变一种转录因子的活性可能会影响许多基因的运作[101]。这些转录因子也因此经常成为信号传递过程中的作用目标,也就是作为细胞反映环境改变,或是进行分化和发育时的媒介。具专一性的转录因子会与DNA发生交互作用,使DNA碱基的周围产生许多接触点,让其他蛋白质得以“读取”这些DNA序列。多数的碱基交互作用发生在大凹槽,也就是最容易从外界接触碱基的部位[102]

限制酶EcoRV(绿色)与其受质DNA形成复合物[103]

DNA修饰酵素

核酸酶与连接酶

核酸酶是一种可经由催化磷酸双酯键水解,而将DNA链切断的酵素。其中一种称为外切酶,可水解位于DNA长链末端的核苷酸;另一种则是内切酶,作用于DNA两个端点之间的位置。在分子生物学领域中使用频率最高的核酸酶为限制内切酶,可切割特定的DNA序列。例如左图中的EcoRV可辨识出具有6个碱基的5′-GAT|ATC-3′序列,并从GAT与ATC之间那条垂直线所在的位置将其切断。此类酵素在自然界中能消化噬菌体DNA,以保护遭受噬菌体感染的细菌,此作用属于限制修饰系统的一部分[104]。在技术上,对序列具专一性的核酸酶可应用于分子选殖DNA指纹分析

另一种酵素DNA连接酶,则可利用来自腺苷三磷酸烟酰胺腺嘌呤二核苷酸的能量,将断裂的DNA长链重新接合[105]。连接酶对于DNA复制过程中产生的延迟股而言尤其重要,这些位于复制叉上的短小片段,可在此酵素作用下黏合成为DNA模板的完整复制品。此外连接酶也参与了DNA修复遗传重组作用[105]

拓扑异构酶与螺旋酶

拓扑异构酶是一种同时具有核酸酶与连接酶效用的酵素,可改变DNA的超螺旋程度。其中有些是先使DNA双螺旋的其中一股切开以形成缺口,让另一股能穿过此缺口,进而减低超螺旋程度,最后再将切开的部位黏合[45]。其他类型则是将两股DNA同时切开,使另一条双股DNA得以通过此缺口,之后再将缺口黏合[106]。拓扑异构酶参与了许多DNA相关作用,例如DNA复制与转录[46]

螺旋酶分子马达的一种类型,可利用来自各种核苷三磷酸,尤其是腺苷三磷酸的化学能量,破坏碱基之间的氢键,使DNA双螺旋解开成单股形式[107]。此类酵素参与了大多数关于DNA的作用,且必须接触碱基才能发挥功用。

聚合酶

聚合酶是一种利用核苷三磷酸来合成聚合苷酸链的酵素,方法是将一个核苷酸连接到另一个核苷酸的3'羟基位置,因此所有的聚合酶都是以5'往3'的方向进行合成作用[108]。在此类酵素的活化位置上,核苷三磷酸受质会与单股聚合苷酸模板发生碱基配对,因而使聚合酶能够精确地依据模板,合成出互补的另一股聚合苷酸。聚合酶可依据所能利用的模板类型来做分类。

DNA复制过程中,依赖DNA模板的DNA聚合酶可合成出DNA序列的复制品。由于此复制过程的精确性是生命维持所必需,因此许多这类聚合酶拥有校正功能,可辨识出合成反应中偶然发生的配置错误,也就是一些无法与另一股配对的碱基。检测出错误之后,其3'到5'方向的外切酶活性会发生作用,并将错误的碱基移除[109]。大多数生物体内的DNA聚合酶,是以称为复制体的大型复合物形式来发生作用,此复合物中含有许多附加的次单位,如DNA夹螺旋酶[110]

依赖RNA作为模板的DNA聚合酶是一种较特别的聚合酶,可将RNA长链的序列复制成DNA版本。其中包括一种称为逆转录酶病毒酵素,此种酵素参与了逆转录病毒对细胞的感染过程;另外还有复制端粒所需的端粒酶[111][59],本身结构中含有RNA模板[60]

转录作用是由依赖DNA作为合成模板的RNA聚合酶来进行,此类酵素可将DNA长链上的序列复制成RNA版本。为了起始一个基因的转录,RNA聚合酶会先与一段称为启动子的DNA序列结合,并使两股DNA分离,再将基因序列复制成信使RNA,直到到达能使转录结束的终止子序列为止。如同人类体内依赖DNA模板的DNA聚合酶,负责转录人类基因组中大多数基因的RNA聚合酶II,也是大型蛋白质复合物的一部分,此复合物受到多重调控,也含有许多附加的次单位[112]

遗传重组

遗传重组过程中产生的Holliday交叉结构,图中的红色、蓝色、绿色与黄色分别表示四条不同的DNA长链[113]
参见:遗传重组
重组过程中,两条染色体(M与F)断裂之后又重新接合,产生两条重新排列过的染色体(C1与C2)。

各条DNA螺旋间的交互作用不常发生,在人类细胞核里的每个染色体,各自拥有一块称作“染色体领域”的区域[114]。染色体之间在物理上的分离,对于维持DNA资讯储藏功能的稳定性而言相当重要。

不过染色体之间有时也会发生重组,在重组的过程中,会进行染色体互换:首先两条DNA螺旋会先断裂,之后交换其片段,最后再重新黏合。重组作用使染色体得以互相交换遗传讯息,并产生新的基因组合,进而增加自然选择的效果,且可能对蛋白质的演化产生重要影响[115]。遗传重组也参与DNA修复作用,尤其是当细胞中的DNA发生断裂的时候[116]

同源重组是最常见的染色体互换方式,可发生于两条序列相类似的染色体上。而非同源重组则对细胞具有伤害性,会造成染色体易位与遗传异常。可催化重组反应的酵素,如RAD51[117],称为“重组酶”。重组作用的第一个步骤,是内切酶作用,或是DNA的损坏所造成的DNA双股断裂[118]。重组酶可催化一系列步骤,使两条螺旋结合产生Holliday交叉。其中每条螺旋中的单股DNA,皆与另一条螺旋上与之互补的DNA连结在一起,进而形成一种可于染色体内移动的交叉形构造,造成DNA链的互换。重组反应最后会因为交叉结构的断裂,以及DNA的重新黏合而停止[119]

DNA生物代谢的演化

DNA所包含的遗传讯息,是所有现代生命机能,以及生物生长与繁殖的基础。不过目前尚未明了在长达四十亿年的生命史中,DNA究竟是何时出现并开始发生作用。有一些科学家认为,早期的生命形态有可能是以RNA作为遗传物质[108][120]。RNA可能在早期细胞代谢中扮演主要角色,一方面可传递遗传讯息;另一方面也可作为核糖酶的一部分,进行催化作用[121]。在古代RNA世界里,核酸同时具有催化与遗传上的功能,而这些分子后来可能演化成为目前以四种核苷酸组成遗传密码的形式,这是因为当碱基种类较少时,复制的精确性会增加;而碱基种类较多时,增加的则是核酸的催化效能。两种可达成不同目的功能最后在四种碱基的情形下达到最合适数量[122]

不过关于这种古代遗传系统并没有直接证据,且由于DNA在环境中无法存留超过一百万年,在溶液中又会逐渐降解成短小的片段,因此大多数化石中并无DNA可供研究[123]。即使如此,仍有一些声称表示已经获得更古老的DNA,其中一项研究表示,已从存活于2亿5千万年古老的盐类晶体中的细菌分离出DNA[124],但此宣布引起了讨论与争议[125][126]

技术应用

遗传工程

重组DNA技术在现代生物学生物化学中受到广泛应用,所谓重组DNA,是指集合其他DNA序列所制成的人造DNA,可以质体或以病毒载体搭载所想要的格式,将DNA转型到生物个体中[127]。经过遗传改造处里之后的生物体,可用来生产重组蛋白质,以供医学研究使用[128],或是于农业上栽种[129][130]

法医鉴识

法医可利用犯罪现场遗留的血液精液皮肤唾液毛发中的DNA,来辨识可能的加害人。此过程称为遗传指纹分析或DNA特征测定,此分析方法比较不同人类个体中许多的重复DNA片段的长度,这些DNA片段包括短串联重复序列与小卫星序列等,一般来说是最为可靠的罪犯辨识技术[131]。不过如果犯罪现场遭受多人的DNA污染,那么将会变得较为复杂难解[132]。首先于1984年发展DNA特征测定的人是一名英国遗传学家阿莱克·杰弗里斯[133]。到了1988年,英国的谋杀案嫌犯科林·皮奇福克,成为第一位因DNA特征测定证据而遭定罪者[134]。利用特定类型犯罪者的DNA样本,可建立出数据库,帮助调查者解决一些只从现场采集到DNA样本的旧案件。此外,DNA特征测定也可用来辨识重大灾害中的罹难者[135]

历史学与人类学

由于DNA在经历一段时间后会积聚一些具有遗传能力突变,因此其中所包含的历史讯息,可经由DNA序列的比较,使遗传学家了解生物体的演化历史,也就是种系[136]。这些研究是种系发生学的一部分,也是演化生物学上的有利工具。假如对物种以内范围的DNA序列进行比较,那么群体遗传学家就可得知特定族群的历史。此方法的应用范围可从生态遗传学人类学,举例而言,DNA证据已被试图用来寻找失踪的以色列十支派[137][138]。DNA也可以用来调查现代家族的亲戚关系,例如建构莎丽·海明斯托马斯·杰斐逊的后代之间的家族关系,研究方式则与上述的犯罪调查相当类似,因此有时候某些犯罪调查案件之所以能解决,是因为犯罪现场的DNA与犯罪者亲属的DNA相符[139]

生物资讯学

参见:生物资讯学

生物资讯学影响了DNA序列资料的运用、搜寻与资料挖掘工作,并发展出各种用于储存并搜寻DNA序列的技术,可进一步应用于计算机科学,尤其是字串搜寻算法机器学习以及数据库理论[140]。字串搜寻或比对算法是从较大的序列或较多的字母中,寻找单一序列或少数字母的出现位置,可发展用来搜寻特定的核苷酸序列[141]。在其他如文本编辑器的应用里,通常可用简单的算法来解决问题,但只有少量可辨识特征的DNA序列,却造成这些算法的运作不良。序列比对则试图辨识出同源序列,并定位出使这些序列产生差异的特定突变位置,其中的多重序列比对技术可用来研究种系发生关系及蛋白质的功能[142]。由整个基因组所构成的资料含有的大量DNA序列,例如人类基因组计划的研究对象。若要将每个染色体上的每个基因,以及负责调控基因的位置都标示出来,会相当困难。DNA序列上具有蛋白质或RNA编码特征的区域,可利用基因识别算法辨识出来,使研究者得以在进行实验以前,就预测出生物体内可能表现出来的特殊基因产物[143]

DNA与电脑

参见:DNA运算

DNA最早在运算上应用,是解决了一个属于NP完全的小型直接汉弥尔顿路径问题[144]。DNA可作为“软件”,将讯息写成核苷酸序列;并以酵素或其他分子作为“硬件”进行读取或修饰。举例来说,作为硬件的限制酶FokI可以搭载一段具有软件功能的GGATG序列DNA,再以其他的DNA片段进行输入,并与软硬件复合物产生反应,最后输出另一段DNA[145]。这种类似图灵机的装置可应用于药物治疗。此外DNA运算在能源消耗、空间需求以及效率上优于电子电脑,且DNA运算为具有高度平行(见平行运算)的计算方式。许多其他问题,包括多种抽象机器的模拟、布尔可满足性问题,以及有界形式的旅行推销员问题,皆曾利用DNA运算做过分析[146]。由于小巧紧密的特性,DNA也成为密码学理论的一部分,尤其在于能够利用DNA有效地建构并使用无法破解的一次性密码本[147]

自我组装产生的DNA纳米结构。左方为电脑绘图,可见4条由DNA双螺旋产生的交叉。右方为原子力显微镜测得的影像。

DNA与纳米科技

参见:DNA纳米科技

DNA的分子性质,例如自我组装特性,使其可用于某些纳米尺度的建构技术,例如利用DNA作为模板,可导引半导体晶体的生长[148]。或是利用DNA本身,来制成一些特殊结构,例如由DNA长链交叉形成的DNA“瓦片”(tile)[149]或是多面体[150]。此外也可以做出一些可活动的元件,例如纳米机械开关,此机械可经由使DNA在不同的光学异构物(B型与Z型)之间进行转变,而使构形发生变化,导致开关的开启或关闭[151]。还有一种DNA机械含有类似镊子的构造,可加入外来DNA使镊子开合,并排出废物DNA,此时DNA的作用类似“燃料”[152]。DNA所建构出来的装置,也可用来作为上述的DNA运算工具。

参见

参考文献

  1. ^ Matt Ridley。蔡承志、许优优译。《23对染色体》(Genome)。商周出版。2000年。ISBN 957-667-678-9
  2. ^ Dahm R (2005). "Friedrich Miescher and the discovery of DNA". Dev Biol 278 (2): 274–88. PMID 15680349. 
  3. ^ Levene P, (1919). "The structure of yeast nucleic acid". J Biol Chem 40 (2): 415–24. 
  4. ^ Astbury W, (1947). "Nucleic acid". Symp. SOC. Exp. Bbl 1 (66). 
  5. ^ Avery O, MacLeod C, McCarty M (1944). "Studies on the chemical nature of the substance inducing transformation of pneumococcal types. Inductions of transformation by a desoxyribonucleic acid fraction isolated from pneumococcus type III". J Exp Med 79 (2): 137–158. 
  6. ^ Hershey A, Chase M (1952). "Independent functions of viral protein and nucleic acid in growth of bacteriophage". J Gen Physiol 36 (1): 39–56. PMID 12981234. 
  7. ^ 7.0 7.1 Watson J.D. and Crick F.H.C. "A Structure for Deoxyribose Nucleic Acid". (PDF) Nature 171, 737–738 (1953). Accessed 13 Feb 2007.
  8. ^ 8.0 8.1 Watson J, Crick F (1953). "Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid". Nature 171 (4356): 737 – 8. PMID 13054692. 
  9. ^ Nature Archives Double Helix of DNA: 50 Years
  10. ^ Molecular Configuration in Sodium Thymonucleate. Franklin R. and Gosling R.G.Nature 171, 740–741 (1953)Nature Archives Full Text (PDF)
  11. ^ Original X-ray diffraction image
  12. ^ Molecular Structure of Deoxypentose Nucleic Acids. Wilkins M.H.F., A.R. Stokes A.R. & Wilson, H.R. Nature 171, 738–740 (1953)Nature Archives (PDF)
  13. ^ Evidence for 2-Chain Helix in Crystalline Structure of Sodium Deoxyribonucleate. Franklin R. and Gosling R.G. Nature 172, 156–157 (1953)Nature Archives, full text (PDF)
  14. ^ The Nobel Prize in Physiology or Medicine 1962 Nobelprize .org Accessed 22 Dec 06
  15. ^ Crick, F.H.C. On degenerate templates and the adaptor hypothesis (PDF). genome.wellcome.ac.uk (Lecture, 1955). Accessed 22 Dec 2006
  16. ^ Meselson M, Stahl F (1958). "The replication of DNA in Escherichia coli". Proc Natl Acad Sci U S A 44 (7): 671–82. PMID 16590258. 
  17. ^ The Nobel Prize in Physiology or Medicine 1968 Nobelprize.org Accessed 22 Dec 06
  18. ^ International Human Genome Sequencing Consortium (2001). "Initial sequencing and analysis of the human genome.". Nature 409: 860−921. 
  19. ^ Venter, JC, et al (2001). "The sequence of the human genome.". Science 291: 1304−1351. 
  20. ^ 20.0 20.1 Alberts, Bruce; Alexander Johnson, Julian Lewis, Martin Raff, Keith Roberts, and Peter Walters (2002). Molecular Biology of the Cell; Fourth Edition. New York and London: Garland Science. ISBN 0-8153-3218-1.
  21. ^ Butler, John M. (2001) Forensic DNA Typing "Elsevier". pp. 14 – 15. ISBN 978-0-12-147951-0.
  22. ^ Mandelkern M, Elias J, Eden D, Crothers D (1981). "The dimensions of DNA in solution". J Mol Biol 152 (1): 153 – 61. PMID 7338906.