生命密码,想懂你多一点
近期发布的几组研究报告显示,科学家们正以前所未有的力度考察人类的遗传变异。其中在一项关于人类基因组外显子组(蛋白质编码区)的深度分析中,研究人员提供了迄今为止有关该区域最全面的遗传变异记录;而在另一项研究中,科学家们改进了对基因变体的解读。
基因组分析 外显子组领先
简单来说,外显子组就是遗传代码中蛋白质编码的组分,占整个基因组的1%到2%。对于基因测序仪来说,每测一次只能读取一定数量的碱基,而通过外显子组测序,科学家就能以更快的速度生成更多碱基。因此与全基因组相比,它也可以用更低的成本获得更好分辨率的结果。
除效率因素之外,还有一个重要原因是,现在人们对外显子组的解读能力明显强于对全基因组的解读。全基因组测序产生的海量数据包括了非编码碱基、结构和单倍型相位信息,但目前大多数核苷酸的作用仍然成谜。换句话说,外显子组所不具备的,恰恰是现在掌控力不足的部分。
因此,当全基因组分析的成本、效率、难易程度都赶不上外显子组时,后者在解读“生命密码”领域仍然魅力非凡。
最全面记录 前所未有精细
此次,美国哈佛—麻省理工博德研究所丹尼尔·麦克阿瑟参与了人类外显子组整合数据库(ExAC)的项目,他与同事们分析了60706位被试者的外显子组测序数据,这些被试者来自包括欧洲、非洲、南亚、东亚和拉美在内的不同地理人口系谱。研究中发现了约740万个遗传子多态,对人类低频蛋白质编码多态的分析,其分辨率达到前所未有的程度。
麦克阿瑟团队通过分析该数据集来表征全球遗传变异的模式,在较小的遗传变异数据集上达到了此前无法实现的分辨率,遗传变异密度令他们得以在同一位点分辨多重序列多态,而数据集的规模则令团队首次获得一些有关疾病复发突变的发现,这篇论文发表在最新一期《自然》杂志上,其研究结果有助于从临床上发现与人类疾病相关的遗传变异。
人类外显子组整合数据库项目提供了一个可公开获取的参照数据库,事实已证明这是一个有用的临床工具,可用于评估潜在的孟德尔遗传病(单基因病)的致病基因多态,其中一些多态在人口中的普遍程度令人难以置信。论文作者们分析了过往研究所报告的192个此类多态,结果发现,仅9个有充足的数据表明其与疾病相关。
是技术成就 也是政治成就
与此同时,在一篇发表于《医学遗传学》杂志的论文中,英国帝国理工学院罗迪·沃什与同事们评估了一种最常见的严重孟德尔病——心肌病的遗传变异情况。心肌病表现为心肌损害引起心脏扩大,最终发展成心力衰竭,但发病原因一直以来都不是十分清楚。此次研究发现,之前认为与特定心肌病相关的许多基因和基因多态,可能并没有关系。不过,现在利用ExAC项目已可以显著改进对基因变体的解读。
在发表于《自然·遗传学》杂志上的另外一篇论文中,美国西奈山伊坎医学院道格拉斯·鲁德夫与同事们也分析了ExAC项目数据集内罕见的拷贝数变异(CNV)。这是一种基因组结构变异,通常由基因组发生重排而导致,是人类疾病的重要致病因素之一,对其展开研究分析,将加深人们对符合孟德尔遗传规律的单基因病与罕见疾病的了解。
一直以来都有研究设法记录外显子组内的遗传变异,而人类外显子组整合数据库是其中规模最大最全面的一个项目。在本期《自然》杂志伴随的新闻与观点文章中,华盛顿大学杰·森德鲁总结道,ExAC项目主要针对的是各种常见疾病的遗传问题,其既是一项技术成就,也是一项政治成就,不仅曾面临数据争议,也是研究者、审批许可和14余项研究之间的角力。