일요일, 9월 19, 2021

liftOver

liftover는 여러버전의 reference간의 위치를 정렬/보정해주는 작업을 뜻합니다.


Liftover작업하는 참고하는 site로 개인적으로 ucsc사이트를 가장 빈번히 사용하고있고 ucsc에서 사용하는 liftover 명령어는 여기서 다운받을 수 있으니 로컬에서 사용하시면되겠습니다.


다만 로컬에서 사용하려는 경우 변환하고자 하는 reference간 정보를 가지고 있는 chain 파일이 별도로 필요합니다. (아래 링크가 바로 그 chain 파일)

hg19>hg38

hg38>hg19

모든 genome이 가능한것은 아니고 일단 human과 mouse는 가능하고 chain 파일있다면 가능합니다. ucsc사이트를 보니 다른 기타 reference를 Human(hg38), Mm10과 비교할 수 있도록 chain 파일을 제공하고 있긴하네요..

cat같은 경우 Cat9toCat5, Cat9toCat8은 있는데 Cat5toCat8 또는 Cat8toCat5이 없는거 보니 5버전과 8버전은 좀 많이 다른 genome인가 봅니다.


여튼 liftover는 (별일 없으면 동일종이나 assembly 버전이 좀 다른) genome끼리 position을 정렬/보정해주는 작업이라고 생각하면되고 liftover라는 프로그램을 사용하시면 편안하고 안전하게 정렬/보정할 수 있습니다. (물론 이따금씩 잘 안되는 부위도 존재합니다.

사용법:

>liftOver oldFile map.chain newFile unMapped

oldFile: 원본 파일
map.chain: 위에서 언급한 chain 파일
newFile: 내가 원하는 버전의 genome으로 변환된 위치를 가지고 있는 파일
unMapped: 변환 중에 newFile로 변환되지 않은 부위를 저장하는 파일


@jihoa_f
출처: @jihoa_f


댓글 없음: