文章插图
HapMap【HapMap】HapMap是人类基因组中常见遗传多态位点的目录,它描述了这些变异的形式、在DNA上存在的位置、在同一群体内部和不同人群间的分布状况 。HapMap计画并不是利用HapMap中的信息来建立特定的遗传变异与某一疾病之间的联繫,而是为其他研究者提供相关信息使之能够将遗传多态位点和特定疾病风险联繫起来,从而为预防、诊断和治疗疾病提供新的方法 。
基本介绍中文名:人类基因组单体型图
外文名:Haplotypemap
简称:HapMap
实质:染色体图谱
目的:主要族群基因组的遗传变异图谱
简介国际人类基因组单体型图计画(The International HapMap Project)是继国际人类基因组计画(The Human Genome Project,HGP)之后人类基因组研究领域的又一个重大研究计画 。HapMap计画是一个多国参与的合作项目,旨在确定和编目人类遗传的相似性和差异性 。利用HapMap获得的信息,研究人员将能够发现与人类健康、疾病以及对药物和环境因子的个体反应差异相关的基因 。项目由来自日本、英国、加拿大、中国、奈及利亚和美国的科学家和资助机构合作完成,所产生的全部数据将免费向公众开放 。发展HapMap计画起始于2002年,由美、加、中、日、英、奈及利亚等国研究机构发起、参与及完成 。中国科学家们由中科院北京基因组研究所牵头,承担3号、21号和8号染色体短臂单体型图的构建,约占总计画的10% 。项目共取样270个正常个体,其中欧洲30个三联家系,亚洲45箇中国人,45个日本人,非洲30个三联家系 。2005年10月26日,由国际协作组总负责人,现任美国NIH负责人Francis Collins向全世界宣布了一个拥有数亿数据的人类基因组单体型图的成功构建,以及一个更精细的遗传图谱即将完成 。至此hapmap一期计画证实宣告完成 。一期计画共成功分型100多万个多态性位点,也称单核苷酸多态性(SNP)位点,全基因组平均3kb一个SNP位点 。由于染色体块状结构,也即连锁不平衡的存在,一期数据可以捕获大部分基因组上的遗传差异信息 。HapMap计画的第一阶段任务完成后,国际协作组委託Perlegen Sciences 完成第二阶段扩大SNP分型密度的任务 。2007年10月18日,国际协作组在Nature上发表了根据第二阶段数据构建的人类基因组的第二代HapMap 。至HapMap 二期共发现了超过一千万的人类基因组的SNPs,完成了约310万SNPs(≥5%)在270个样品中的分型反应 。这些SNPs约占预测的遗传变异的25%~35%,并使第二代HapMap的解析度达到平均不到1kb一个SNP,比预定计画超过100%,準确度达到99.8% 。二期数据密度约为一期数据的3倍,构建起一张精度更高信息更完整的多人种遗传多态图谱 。可以说正是这些遗传多态位点的存在,在遗传体质上,你我之间有了个体差异,不同人种之间有了种群差异 。HapMap计画建立了人类全基因组遗传多态图谱,依据这张图谱我们可以进一步研究基因组的结构特点以及SNP位点在人群间的分布情况,为群体遗传学的研究提供数据,为遗传性疾病致病基因在基因组上的定位提供高密度的SNP位点 。HapMap的构建分为三个步骤:(a)在多个个体的DNA样品中鉴定单核苷酸多态性(SNPs);(b)将群体中频率大于1%的那些共同遗传的相邻SNPs组合成单体型;(c)在单体型中找出用于识别这些单体型的标籤SNPs 。通过对图中的三个标籤SNPs进行基因分型,可以确定每个个体拥有哪一个单体型 。二期数据的在密度上大大提高,给各种基因组精细研究提供了更大的支持 。结合群体遗传学的研究手段,我们可以更加深入地去观察和研究使我们之所以成为我们的基因组 。重组率推算提供了我们一张基因组进化痕迹图;连锁不平衡的计算给了我们一张基因组块状连锁结构图;种群差异FST的计算让我们看到一张种群间基因组结构差异图;SNP的杂合情况告诉我们人类基因组上受到选择的区域或区域内的基因;利用SNP位点向两边延伸的长度差异情况,我们可以观察到一些基因组上近期正在进行的选择事件,甚至是当前正在悄悄进行中的进化,因为新产生的突变位点传代较少,它和周围位点的连锁情况受重组事件的影响较小,另一方面优势突变也会因选择压力的存在使周围的重组受到影响…...当然这些不同的指标中也隐藏了人类成长过程中的一些信息,例如迁徙,战争,灾难,繁盛等各种对基因组遗传多态性产生影响的历史事件 。高密度的SNP位点,为全基因组相关性分析(GWA)提供了可能,以往遗传学上定位基因的使用较多的工具是微卫星,这一套新产生的SNP位点弥补了微卫星在基因组上分布不够均匀,以及密度不够高的缺点,SNP联合微卫星将使目的基因的精细定位更加可行 。目前已经有很多致病基因藉助SNP数据得到定位 。另外,根据SNP在基因的不同功能元件中的分布情况和基因在细胞中的表达情况,我们可以研究基因上的不同元件序列是如何控制蛋白表达进而影响个体表型的 。伴随着HapMap二期数据的产出和各种实验技术的进一步发展以及更加大量的基因组序列数据加入到人类的知识库中,我们将能更加完整更加深入和更加正确地认识我们自己,认识自然界的奥秘,揭示生命的本质 。