gnomAD 数据库: The Genome Aggregation Database

一,数据库简介

gnomAD是目前收录范围最广的基因组变异数据库之一,包含了全世界各人种的变异数据。gnomAD 与有较长历史的dbSNP的主要不同点在于,dbSNP包括了通过各种各样研究方法不同的项目而发现的基因组变异,dbSNP对这些变异加以整理,给予ID,但 gnomAD 为了能够正确的算出等位的频率,对所纳入样本的二代测序数据进行了统一标准的解析,这是 gnomAD 的一大特点。另外,对于50bp以上的基因组结构变异, gnomAD 也有着较高质量的数据。

目前版本 gnomAD v3.1 所包含数据汇总如下:

PopulationDescriptionGenomes
afrAfrican/African-American20,744
amiAmish456
amrLatino/Admixed American7,647
asjAshkenazi Jewish1,736
easEast Asian2,604
finFinnish5,316
nfeNon-Finnish European34,029
midMiddle Eastern158
sasSouth Asian2,419
othOther (population not assigned)1,047

gnomAD 的前身是ExAC (Exome Aggregation Consortium), ExAC 只包含外显子组数据,目前已经被 gnomAD 取代。 gnomAD 的主要资助者是 the Broad Institute。

gnomAD的主页:

二,搜索基因

以ALDH1A1为例,页面最上端显示了基因的基本信息,右边Dataset处可以选择不同的subset(例如 non-cancer, non-neuro等等),Constraint处显示了synonymous,missense 以及 pLoF(基因丧失功能的可能性)的统计值,接下来的图标显示了每个部分的测序深度。

点击 show transcript 或者 show tissue也可以看到不同的transcript 或是在不同组织中的表达。

接下来是ClinVAr中收录的变异位点,与gnomAD中收录的位点的位置信息。

最后则是对变异位点的功能注释:

三,搜索变异

以ALDH2上的rs671为例,

我们可以找到该变异在数据库中的基本信息,包括频数,频率等,之后紧跟着对该变异的注释:

之后是该变异在ClinVar数据库中的信息:

然后是该变异在各群体中的详细的频率信息,以及年龄分布信息。

gnomAD还提供了该变异的质量信息。

最后还提供了便捷的浏览器,可以直观地在基因组中浏览该变异。

gnomAD内所有的信息均提供免费的下载服务,如果有需要也可以按需下载。

参考:

https://gnomad.broadinstitute.org/about

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

您正在使用您的 WordPress.com 账号评论。 注销 /  更改 )

Twitter picture

您正在使用您的 Twitter 账号评论。 注销 /  更改 )

Facebook photo

您正在使用您的 Facebook 账号评论。 注销 /  更改 )

Connecting to %s