在分子生物学和遗传学领域,基因组指生物体所有遗传物质的总和。这些遗传物质包括DNA或RNA(病毒RNA)。
基因组DNA包括编码DNA和非编码DNA、线粒体DNA和叶绿体DNA。
基因组这个术语由德国汉堡大学植物学教授Hans Winkler于1920年创建。
研究基因组的科学称为基因组学。
病毒基因组可以由RNA或DNA组成。 RNA病毒的基因组包含单链或双链RNA,也包含一种或多种单独的RNA分子。 DNA病毒基因组可以是单链或双链DNA。大多数DNA病毒基因组由单个线性DNA分子组成,但有些由DNA病毒基因组由环状DNA分子组成[1] 。
原核生物和真核生物基因组由DNA组成。古细菌有一个环状染色体组成的DNA基因组[2] 。大多数细菌也有一个环状染色体,然而,一些细菌物种含有线性染色体[3] 或多个染色体。大多数原核生物基因组中不含有重复DNA[4] 。一些共生细菌基因组中含有高比例的假基因,例如Serratia symbiotica基因组种只有约40%的DNA编码蛋白质[5] 。 一些细菌基因组还含有辅助遗传物质,它们在质粒中存在。为此,基因组这个词不应该用作染色体的同义词。
真核基因组由一条或多条线性DNA染色体组成。组成真核生物基因组的染色体的数量差异很大,杰克跳线蚂蚁和无性线虫的基因组每个只有一对染色体[6] ,而蕨类物种有720对染色体[7] 。人类细胞具有22对常染色体和1对性染色体。
除了细胞核中的染色体外,真核生物的细胞器如叶绿体和线粒体都有自己的DNA和染色体,因此,也有“线粒体基因组”和“质体基因组”的说法。与它们来源的细菌一样,线粒体和叶绿体都含有环状染色体。
与原核生物不同,真核生物具有蛋白质编码基因的外显子 -内含子组织和一定数量的重复DNA。哺乳动物和植物基因组的大多数由重复DNA组成[8] 。
编码序列
携带合成蛋白质遗传信息的DNA序列是编码序列。不同物种中编码序列占基因组的比例差异很大。较大的基因组不一定含有更多的基因,并且复杂真核生物中非重复DNA的比例随着基因组大小的增加而减少[8] 。简单的真核生物如秀丽隐杆线虫和果蝇中,编码DNA比例高于重复DNA[8] ,而更复杂真核生物基因组则往往主要由重复DNA组成。一些植物和两栖动物基因组中重复DNA的比例超过80%[8] 。同样,人类基因组中只有2%编码DNA。