레이블이 WES인 게시물을 표시합니다. 모든 게시물 표시
레이블이 WES인 게시물을 표시합니다. 모든 게시물 표시

수요일, 10월 04, 2023

WES를 하는데 Capture가 좋을까 Amplicon이 좋을까?

Evaluation of Hybridization Capture Versus Amplicon-Based Methods for Whole-Exome Sequencing 라는 제목의 WES(Whole Exome Sequencing)를 하는데 Hybridization Capture가 좋은지 Amplicon이 좋은지 비교해본 논문이 있어 한번 들여다 보았습니다.

doi: 10.1002/humu.22825

사실 2023년 현재 WES를 하는데 Amplicon을 한다고 저는 말리지는 않겠지만, WES를 Amplicon으로? 라고 왜 Amplicon으로 하는지 궁금한 눈빛으로 바라보긴 할 것 같습니다.

이 논문은 당연히 2015년에 출판된 논문으로, 그 때 당시에는 한번 짚고 넘어가야 할 수 밖에 없는 내용이었고, 당시에 이런 벤치마킹 연구를 해주었기 때문에 현재 우리가 큰 의심없이 WES할 때는 Capture지를 외칠 수 있지 않나 합니다.

물론 가까운 시일내에 고성능의 간섭 없는 Amplicon 방법이 개발되면, 2025년에는 WES는 Amplicon이지! 할지 누가 또 알겠습니까 :)

여튼 논문에서는 2015년 당시 대표적으로 사용되던 Capture 방법 2가지(SureSelect, SeqCap)와 Amplicon 방법 2가지(HaloPlex, AmpliSeq) 를 상호 비교해보았습니다.

아직도 SeqCpa과 HaloPlex로 생성된 데이터를 한번도 만져보지를 못해서 얼마나 데이터가 깨끗한지, 쓸만한지는 모르겠습니다. 다만 SureSelect와 AmpliSeq은 지금도 사용하고 있으니 그 기술을 꼭 알아야 할까 하는 의문이 있습니다.

그리고 시료로는 변이들이 잘 정의된 것들을 사용하지 않았나 싶네요

BT-20, MCF-7, HCC-2218, HCC-2218BL 4개 셀라인을 사용한듯 싶습니다.

그리고 결과 비교 중에 SNP말고도 copy number를 확인하는데 copy number 확인을 위해  Affy사의 SNP Array 6.0도 함께 진행하여 HCC-2218, HCC-2218BL의 copy number를 확인 하였습니다. 굳이 NGS를 하는데 microarray도 해야돼? 라는 생각이 드셨다면, 이 논문이 발표된 시점이 2015년이란것을 잊지 않으셨으면 합니다. :)

그래서 이런저런 당시 일반적으로 사용되었던 정렬 툴과 각 Library에 적합한 정렬 툴을 사용하여 정렬하고, 다음에는 각각 SNV와 InDel, Copy Number 관련된 분석 툴을 사용하여 비교해보았고,

지금의 우리가 알고있는것과 동일하게 Capture방식이 Amplicon 방식보다 시쿼싱 복잡성(? 이건 어떤의미인지 잘 모르겠습니다.)과 균일성 (Uniformity)관련해서 더 좋은것을 확인했고, 위양성 변이가 탐지될 가능성도 적음을 확인했다고 합니다.

그러니 WES 할 때는 안심하고 Capture 방식 사용하세요 되겠습니다.



 출처: @ye._.vely618



화요일, 9월 14, 2021

Long-read sequencing identified a causal structural variant in an exome-negative case and enabled preimplantation genetic diagnosis

아니.. 2018년도에 이런 논문을 블로그에 keep놓고 그냥 놀고 있었다니..
여하튼 눈에 띄어서 한편 사브작 하나 올려봅니다.
역시 일이 많을때 딴짓은 국룰이라는 명제를 증명하듯......


WGS(Whole Genome Sequencing)이 아무리 저렴해졌다고하나 내 genome에 이상이 있는지 진단을 위해서 시퀀싱하는 비용이 억대에서 천만원 정도로 떨어진거지 아직은 WGS가지고 일반인이 무엇을 하기에는.... 물론 Private Premium Platinum Gold Special Society 같은 수식어의 멤버 라면... 할려면 할수는 있겠다만..

여튼 현재 아직까지는 유전체 진단에서 가장 현실적이고 합리적인 방법은 WES이나.. 짧은 read들을 가지고는 structural variant를 탐지하기에는 무리가 좀 있으니 long read로 해야하지 않겠냐라고 얘기하는 2018년도 논문되겠습니다.

해당 논문에서 언급하는 환자는 G6PC 유전자에 돌연변이가 생겨 간비대, 신장비대를 초래하는 recessive inheritance 질환으로 긴 지역에 deletion이 있었으나 WES만으로 진단하였을 때는 확인하지 못했고 nanopore (long read seq)를 사용하여 확인하였을 때에는 정확히 긴 길이의 SV를 확인 할 수 있어다 라는게 주제되겠습니다. 지금까지 short read만으로 시퀀싱하여 진단되지 않거나 오진되는 환자들의 돌연변이를 정확하게 확인 할 수 있는 도구가 임상 진단에서 하나더 생겼고 그로 인해 정확한 진단을 할 수 있게 되었다는 자화자찬의 평을 내면서 논문을 마무리하였습니다.

사례를 통해 short read만으로는 진단에 한계가 있다는것을 확인하였고 long read 방법이 이제 진단에 슬슬 자리 잡아야 하지 않나 싶은 생각이 드는....

(근데 길게 뽑으려면 나노포어 실험이 그렇게 쉽지 않은듯하던데.... )





출처: @ye._.vely618
출처: @ye._.vely618


화요일, 9월 22, 2020

8개의 variant caller 통합 도구

2018년 WGS이나 WES 혹은 Target Seq을 한 후 변이를 확인 할 때 으레 GATK를 사용하는 우리들에게 감사하게도 여러개(정확히는 8개)의 변이 caller 결과를 통합해서 확인 할 수 있는 논문이 발표되었습니다.

진짜 감사할지 이름만 appreci할지...

(구글 검색결과 글쎄요... 이유가 무엇인지는 모르겠지만 오늘이 2020년 9월 12일인데 인용 횟수가 4개네요..)

목적은 NGS를 임상에 사용하려면 유효한 variant를 call해야 하는데 분석 tool마다 어떤 variant는 call하고 어떤 variant는 call하지 못하는 경우가 발생해서 그럼 여기서 나온 결과와 저기서 나온 결과 합치자!!

근데 이 작업을 할 하는데?? 이게 그렇게 쉽다고?

그렇죠 이런저런 허들이 있고 동일한 위치에 A변이와 B변이가 있다고 나왔을 때 어떤 변이를 call했다고 인정할것인가?

모 변이를 call하고 변이들을 merge하고 필터링하는 파이프라인을 개발했다는 것이 이 논문의 결론이고 민감도는 0.93-1.0, PPV는 0.65-1.0사이, 8개의 도구를 combine하였는데 caller를 줄이면 appreci8의 성능은 떨어지니깐 그러지 마세요 라고 얘기하고 있습니다.

여기서 사용하는 8개 caller들은 다들 많이들 사용하고 있는 GATK, Platypus, VarScan, LoFreq, FreeBayes, SNVer, samtools, VarDict되겠습니다.

appreci8은 여기서 docker로 제공되고 있고 분석을 한 일루미나 데이터는 여기에 위치하고 있습니다.


출처: @ye._.vely618