LiftOver 基因组坐标变换

本文内容:

  1. liftover 简介与网页版工具
  2. liftover 命令行工具使用方法
  3. 基于0的坐标系统与基于1的坐标系统之间的转换

人类参考基因组不同版本之间基因坐标不同,进行研究时我们需要统一基因组坐标系,从一个版本的坐标系向另一个坐标系转换的过程就称之为liftover,UCSC,ensembl等为我们提供了便捷的工具,本文以 UCSC 的liftOver工具为例:

首先UCSC liftOver工具提供了即开即用的网页版:http://genome.ucsc.edu/cgi-bin/hgLiftOver

选择目标物种,新旧基因组版本,粘贴或上传原文件就可以开始liftover。


但更多时候我们需要使用命令行的工具,以下,本文主要介绍liftOver的命令行版本,下载地址:http://hgdownload.soe.ucsc.edu/downloads.html

liftover的url: http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/liftOver

下载完成后添加到环境路径中,并通过chmod +x 添加执行权限,然后在命令行中输入liftOver验证是否安装成功:(如果成功会有如下界面)

liftOver主要语法如下:

liftOver <输入文件> <chain文件> <输出文件> <unmapped文件>

input/output 可以使用bed格式文件chain file 则需要我们根据转化前后的数据库在ucsc上下载,无法转换的条目则输出到unmapped文件里。

这里以hg19->hg38为例,进行liftover,首先下载hg19tohg38的chain文件,下载地址为: http://hgdownload.soe.ucsc.edu/downloads.html#source_downloads

点击hg19的liftover files后下载对应文件:

下载完成后不需解压即可开始使用:

liftOver input.bed hg19ToHg38.over.chain output.bed unmapped.txt

input.bed

就转换成了: output.bed


在进行LiftOver时,有一点需要我们注意,那就是文件中变异位点起始的编号,是基于0还是基于1的。

因为 UCSC 使用基于0的坐标系统,而 Ensembl 等使用基于1的坐标系统 ,不同工具切换时应该注意这一不同。

除此以外,一些文件格式是基于1的(GFF, SAM , VCF),而另一些是基于0的(BED,BAM),不同文件间转换时也需要注意。

基于0和基于1的坐标系统示可以理解为:

基于1的坐标系:对核苷酸直接编号。

基于0的坐标系:对两个核苷酸之间的间隙编号。

enter image description here

在表示单核苷酸或多个核苷酸变异时,

基于1的坐标系:直接使用变异位点的编号。

基于0的坐标系:变异两边的位置作为起止。

enter image description here

表示insert或deletion时,

基于1的坐标系:Deletion直接使用相应位点编号,insertion则是插入位置两边的核苷酸编号。

基于0的坐标系: Deletion 是插入位置两边的间隙编号表示, Insertions 则直接由插入间隙的编号表示。

基于1的坐标系 与 基于0的坐标系 互相转换时,伪代码如下:

从 基于0的坐标系 向 基于1的坐标系 转换:

if (type=SNV){start=start+1; end=end;}
if (type=DEL){start=start+1; end=end;}
if (type=INS){start=start; end=end+1;}

从 基于1的坐标系 向 基于0的坐标系 转换:

if (type=SNV){start=start-1; end=end;}
if (type=DEL){start=start-1; end=end;}
if (type=INS){start=start; end=end-1;}

参考:

https://www.biostars.org/p/84686/

https://genome.ucsc.edu/cgi-bin/hgLiftOver

http://hgdownload.soe.ucsc.edu/downloads.html#liftover

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

您正在使用您的 WordPress.com 账号评论。 注销 /  更改 )

Twitter picture

您正在使用您的 Twitter 账号评论。 注销 /  更改 )

Facebook photo

您正在使用您的 Facebook 账号评论。 注销 /  更改 )

Connecting to %s