全基因组测序

一次性确定生物体基因组的全部或几乎全部DNA序列的过程
基因组测序(Whole Genome Sequencing,WGS)是一种快速、低成本获取生物体全基因组的方法。[1]基因组测序技术始于20世纪70年代初,最初是使用二维层析的方法获得DNA序列,随着测序技术的快速发展,测序通量大幅上升,测序成本大幅下降,测序技术已更新到第三代,已完成测序的物种也越来越多。[2]1995年,第一个生命体流感嗜血杆菌的全基因组测序完成,1996年第一个单细胞真核生物酿酒酵母全基因组测序被解析,到2004年,人类基因计划完成了人类基因组的初期测序,2014年全基因组测序被应用于临床用途。[2][3]
全基因组测序经历了三代技术革新,分别为一代、二代、三代测序,其中二代测序和三代测序的结合已成为目前最广泛的杂交测序方法。[1]第一代测序技术准确率高达99.99%,可靠性高;[4]第二代测序技术保持了高准确度,大大降低了测序成本并极大地提高了测序速度;而以单分子测序技术为基础的新一代测序方式被称为第三代测序技术,[5]与第二代测序技术相比,读长更长,后续拼接工作更为简单。[4]
基因组测序技术能够全面、精确地分析基因组的碱基序列,从而破解其所包含的信息,揭示基因组的复杂性、多样性。[5]将全基因组重测序结果与已有参考基因组序列进行比对可获得个体或群体分子遗传和突变特征,[4][5]进而加深对各种疾病发生、发展的了解,从而发现解决方法,使人类对自然界生物及自身的了解更加深入并给人类的健康带来实际利益。[5]

历史和发展

1944年,美国细菌学家奥斯瓦尔德·艾弗里(Oswald Avery)及其同事发现从父母传给后代的遗传物质是DNA。随后其他科学家对病毒、细菌、酵母、果蝇和线虫进行遗传分析表明,有意诱导破坏遗传密码的突变,结合对此类突变产生的可观察性状(表型)的分析。研究基因功能的方法。然而,此类研究只能查询基因组中的一小部分基因。[6]1949年,英国分子生物学家桑格(Sanger)测定了胰岛素的两条肽链氨基末端序列。美国生物学家埃尔德曼(Edman)同年报道了蛋白质的氨基端测序技术。1965年,桑格(Sanger)完成了大肠杆菌120个核苷酸的测定。[5]