GWAS入门文章与书籍推荐

对于统计遗传学(全基因组关联分析)的初学者来说,最难得莫过于入门,

好在GWAS问世以来已经过了十多年,该研究领域也形成了一定规模,基础内容逐渐充实,2020年出版的 An Introduction to Statistical Genetic Data Analysis 网罗该领域内研究背景,基础知识,常用工具介绍,代码实操等。

本书第一部分主要介绍相关基础内容,涵盖群体遗传学的基本概念,统计学基础,人类进化(Human evolution),GWAS,风险评分(PRS)等等基础内容。

第二部分介绍遗传数据的处理与使用,质控(QC),人群分层,PCA,等等GWAS的操作步骤。

第三部分则是介绍GWAS下游的分析方法,包括基因环境相互作用,PRS,数据可视化,MTAG,孟德尔随机化等。

图1: An Introduction to Statistical Genetic Data Analysis 封面

原书链接: https://mitpress.mit.edu/books/introduction-statistical-genetic-data-analysis

这本书难度适中,适合初学者入门,对于理解基础概念会有很大帮助,但深度不够,个人建议可以快速阅读这本书,掌握群体遗传学研究的大致框架后,针对感兴趣的领域查找文献原文来了解细节。也可以阅读Nature Reviews Genetics上关于GWAS的综述文章,对本领域入门很有帮助。


对于希望尝试更硬核内容的同学们,我还强烈推荐这本书,Handbook of statistical genomics,本书更偏向数理原理,有大量的公式推导等,非常刺激,对于无数理基础的初学者则不太推荐此书。

图2: Handbook of statistical genomics 封面

除了书籍以外,其他适合入门的资料还包括:

密西根大学的开设的biostats 666这门课的slides(听着这课的名字是不是就很6)(请记住这个这位大佬的网站Genome Analysis Wiki 以后你会用到无数次的),

Biostatistics 666: Main Page

该课程也涵盖了统计遗传学中重要的概念知识点,包括了基础概念以及部分统计原理,适合快速浏览:

图3 :Biostatistics 666: slides 截图

华盛顿大学遗传统计学夏季学校 SISG 讲义:

除了理论基础,还有代码实操等。可以跟着代码一起练习,非常适合初学者。

GWAS and Sequencing Data

图4 : SISG slides 截图

另外就是大阪大学遗传统计学夏季学校的讲义分享, 我最喜欢的零基础入门其实是这个,图文并茂, 概念细节比较到位(但是是日语的,有机会了给大家翻译):

https://www.slideshare.net/YukinoriOkada/presentations

最后,当然,还有GWASLab的主页:GWASLab

博客连接:GWAS文章索引 – Article index

以及GWAS相关文章汇总:GWASLab:全基因组关联分析GWAS文章汇总(持续更新)

我会持续更新统计遗传学,生物信息学等相关中文内容,感谢大家的关注!

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

您正在使用您的 WordPress.com 账号评论。 注销 /  更改 )

Twitter picture

您正在使用您的 Twitter 账号评论。 注销 /  更改 )

Facebook photo

您正在使用您的 Facebook 账号评论。 注销 /  更改 )

Connecting to %s