基因组学的目的是对一个生物体所有基因进行集体表征和量化,并研究它们之间的相互关系及对生物体的影响[1] 。基因组学还包括基因组测序和分析,通过使用高通量DNA测序和生物信息学来组装和分析整个基因组的功能和结构。基因组学同时也研究基因组内的一些现象如上位性(一个基因对另一个基因的影响)、多效性(一个基因影响多个性状)、杂种优势(杂交活力)以及基因组内基因座和等位基因之间的相互作用等。
基因组学的进步引发了以发现为基础的研究和系统生物学领域的一场革命,促进了对大脑等最复杂生物系统的理解[2] 。基因组学与转录组学、蛋白组学和代谢组学一起构成了系统生物学的组学(omics)基础[3] 。
基因组学的主要工具和方法包括: 生物信息学,遗传分析,基因表达测量和基因功能鉴定[4] 。
基因组学与遗传学发展里程碑
基因组学出现于20世纪80年代,随着几个物种基因组计划的启动,基因组学在20世纪90年代取得长足发展。
1977年,噬菌体Φ-X174单链(5,386 碱基对)完全测序,成为第一个测定的基因组;
1981年,第一个完整真核细胞器人类线粒体(16568 bp,约16.6 kb [kb])的基因组序列测序完成;
1992年,第一个真核细胞酿酒酵母III染色体(315 kb)测序完成;
1995年,第一个活体物种嗜血流感菌(Haemophilus influenzae,1.8Mb)的基因组测序完成;
1996年,第一个真核生物酿酒酵母的完整基因组序列(12.1 Mb)测序完成;
2001年,人类基因组计划公布了人类基因组草图,为基因组学研究揭开新的一页。到2012年10月,研究完成了1092个个体的基因组测序。
功能基因组学是分子生物学的一个领域,它试图利用基因组项目(如基因组测序项目)产生的大量数据来描述基因(和蛋白质)的功能和相互作用[5] 。功能基因组学侧重于基因转录、翻译和蛋白质-蛋白质相互作用的动态变化,与基因组提供的DNA序列或结构等静态信息截然相反。功能基因组学试图从基因、RNA转录本和蛋白质产品三个水平上回答有关DNA功能的问题。功能基因组学研究的一个关键特征是它们对这些问题的全基因组方法,通常涉及高通量方法,而不是传统的“个案基因”方法。
基因组学的一个主要分支仍然关注于对各种生物体基因组的测序,但全基因组的知识为功能基因组学关注各种条件下基因表达的模式创造了可能。涉及到的最重要的工具是芯片技术和生物信息学[5] 。
结构基因组学试图描述由给定基因组编码的每个蛋白质的三维结构[6] 。这种基于基因组的方法允许通过实验和建模相结合方法高通量进行蛋白结构鉴定。结构基因组学与传统结构预测的主要区别在于,结构基因组学试图确定基因组编码的每一种蛋白质的结构,而不是专注于一种特定的蛋白质。随着全基因组序列的公开,通过实验和建模相结合的方法可以更快完成蛋白质结构预测,特别是由于大量测序基因组和以前解析蛋白质结构的公开,使得科学家可以根据已有同源物的结构对蛋白质结构进行建模。