生物资讯结合大数据 中研院找到有害突变演化机制

中研院基因研究中心研究员庄树谆(着黄外套者)及其研究团队,右二为中研院基因体研究中心博士后研究员麦德伦。(中研院提供/李侑台北传真)

DNA是由四种核苷酸A、C、G、T所组成,机制正常与否和自闭症癫痫阿兹海默症神经疾病相关,中央研究院基因体研究中心研究员庄树谆团队,将生物资讯结合大数据分析,精确评估DNA序列,可望减少探讨基因突变时,误判相关致病及危害程度,甚至解释了为何某些有害突变能演化保存至今,研究成果已发表于国际期刊《基因体研究》(Genome Research)。

组成DNA的四种核苷酸A、C、G、T四个「密码」,排列顺序蕴藏遗传讯息。这些讯息需先转录成核糖核酸(RNA),再编辑转译成蛋白质,才能运作生命机制。过去相关研究在讨论基因突变的致病性时,未曾考虑过RNA编辑机制的影响

庄树谆研究员团队将生物资讯结合大数据分析,首先整合447位不同人类个体的DNA及RNA序列资料,进行大数据统计与演化分析,接着再深入分析「千人基因体计划」(1000 Genomes Project),并搜集到逾2000人的DNA序列资料后证实,「A-to-G RNA编辑(RNA editing)机制」与基因突变的关系

庄树谆表示,A-to-G RNA编辑机制的正常与否,和自闭症、癫痫及阿兹海默症等复杂的神经疾病密切相关,此研究结果将有助于了解相关疾病,盼能协助诊断,可望减少探讨基因突变时,对其致病及危害程度的误判,同时也解释了病理基因体学的一大谜题,为何某些有害突变能在演化中保存至今。

庄树谆提到,A-to-G RNA编辑事件常见于多细胞生物,其功能造成的影响好坏,在学界仍有争议,不过这起机制,一方面有机会让蛋白质产生新功能,另一方面也可能使蛋白质功能受损而导致「错义突变」,许多研究显示,这个机制的失调,和自闭症、肌萎缩侧索硬化症颠痫、阿兹海默症等神经疾病有关

庄树谆表示,本次研究成果有赖大数据、生物资讯与坚实的演算逻辑推导。在人类DNA序列上30亿个碱基解码之后,科学家得以探索人体内各种生命机制变化与DNA的关系。近年来,个人化全基因定序分析日益普遍,大量且多样的定序资料,若经大数据处理,可协助医疗诊断判读,生物资讯分析愈形重要。