在构成人类基因组的大约30亿个碱基对中,只需大约2%的碱基对编码蛋白质,剩下的98%的碱基对功用不太明显。 实践上,被一些人视为无用的“渣滓DNA”,它的来源、作用以及在生命进化中的潜在用处,自20世纪60年代初次被发现搅乱我们的染色体以来,就不时吸收着生物学家的关注。 往常,来自以色列特拉维夫大学的研讨人员对非编码DNA持续存在的缘由,又添加了一些重要的见解,这有助于我们更好天文解整个生物世界中基因组大小的丰厚多样性。 1977年,理查德·罗伯茨(Richard Roberts)和菲尔·夏普(Phil Sharp)两位科学家分别留意到,这些杂乱的DNA中有很大一部分不只分散在我们的基因之间,而且经常在基因序列中间中缀,这一发现后来为他们赢得了诺贝尔奖。 它们被称为“内含子”,似乎给像我们这样的复杂细胞增加了担负,而对像细菌这样的简单细胞却没有影响。他们还在将DNA转化为物质的过程中增加了大量的劳动力。 每一次新制造的蛋白质,这些中缀都必须从基因模板中删除,需求将编码指令重新拼凑在一同,然后才干解释为蛋白质。这种日常的比较,就像为了读一个句子而不得不删除成千上万个无意义的单词。 这种看似糜费的操作方式在整个自然界都是必要的,那些侥幸的细菌和其他原核生物是例外。 不同物种的内含子数量也有很大差别;人类有近14万个内含子,老鼠大约有3.3万个,普通果蝇有近3.8万个,酵母(酿酒酵母)只需286个,单细胞真菌兔脑原虫只需15个。 为什么进化没有经过自然选择来清算这种紊乱,让我们变得更有效率呢? 而且,当基因组随着时间的推移,有一种删除DNA而不是添加DNA的已知自然成见时,即便经过数百万年的进化,“渣滓DNA”似乎历来没有变得更短? 上图:当DNA转录成mRNA时,内含子被去除,只留下外显子编码区。 这项针对内含子的最新研讨的科学家们表示:“有趣的是,事实恰恰相反,由于与原核生物相比,真核生物具有更大的基因组、更长的蛋白质和更大的基因距离区。” 研讨人员提出,删除编码区域周围的任何侵入性DNA片段可能会损伤动物的生存,由于编码部分也可能同时被剪掉。他们表示:“发作在边疆左近的缺失偶尔会突出到激进区域,因而遭到激烈的净化选择。” 这种“边疆诱导选择”,即一个中性序列位于编码区域之间,因而会对短的非编码DNA序列产生插入倾向。 从实质上讲,“渣滓DNA”就像一个突变缓冲器,维护包含编码蛋白质所需的更敏感序列的区域。 为此,研讨人员创建了一个数学模型来展示这些动态的作用。 该团队解释说,此前有人提出,“缺失成见会招致基因组随着进化时间的推移而减少”。 “即便在激烈的缺失倾向下,也能呈现长的中性进化序列,这一违背直觉的结果是由于对侵入中性序列高度激进边疆的缺失的排斥。” 固然,他们的模型为一个物种内内含子长度的变更提供了一个合理的解释,但它不能解释为什么不同物种之间存在差别。 他们写道:“一个微缺乏道的解释是,模型参数自身是进化的。因而,不同物种的插入/缺失比率不同,在内含子中呈现激进区的倾向可能也不同。” 了解其中的倾向,可能有助于解释我们在自然界中看到的各种内含子,以及为什么有些生物在基因上似乎比其他生物更“紊乱”。 这些干扰的来源也是一个正在中止的研讨范畴,有很长一段历史的病毒和过时的基因被以为是来源。 究竟,它以至可能不是非编码的,它的任务只是我们还没有认识到的功用。近年来,随着更多可能的功用被发现,包含内含子被转录成监视蛋白质消费的RNA链,科学界越来越不再将一切内含子描画为“渣滓DNA”。 随着时间的推移,我们曾经以为是渣滓的东西,可能会被视为基因宝藏。这似乎是一种复杂的构建生物体的方式,但经过数十亿年的进化,似乎只需大自然知道自己在做什么。 这篇论文发表在《开放生物学》杂志上。 假如朋友们喜欢,敬请关注“知新了了”! |