화요일, 9월 14, 2021

Long-read sequencing identified a causal structural variant in an exome-negative case and enabled preimplantation genetic diagnosis

아니.. 2018년도에 이런 논문을 블로그에 keep놓고 그냥 놀고 있었다니..
여하튼 눈에 띄어서 한편 사브작 하나 올려봅니다.
역시 일이 많을때 딴짓은 국룰이라는 명제를 증명하듯......


WGS(Whole Genome Sequencing)이 아무리 저렴해졌다고하나 내 genome에 이상이 있는지 진단을 위해서 시퀀싱하는 비용이 억대에서 천만원 정도로 떨어진거지 아직은 WGS가지고 일반인이 무엇을 하기에는.... 물론 Private Premium Platinum Gold Special Society 같은 수식어의 멤버 라면... 할려면 할수는 있겠다만..

여튼 현재 아직까지는 유전체 진단에서 가장 현실적이고 합리적인 방법은 WES이나.. 짧은 read들을 가지고는 structural variant를 탐지하기에는 무리가 좀 있으니 long read로 해야하지 않겠냐라고 얘기하는 2018년도 논문되겠습니다.

해당 논문에서 언급하는 환자는 G6PC 유전자에 돌연변이가 생겨 간비대, 신장비대를 초래하는 recessive inheritance 질환으로 긴 지역에 deletion이 있었으나 WES만으로 진단하였을 때는 확인하지 못했고 nanopore (long read seq)를 사용하여 확인하였을 때에는 정확히 긴 길이의 SV를 확인 할 수 있어다 라는게 주제되겠습니다. 지금까지 short read만으로 시퀀싱하여 진단되지 않거나 오진되는 환자들의 돌연변이를 정확하게 확인 할 수 있는 도구가 임상 진단에서 하나더 생겼고 그로 인해 정확한 진단을 할 수 있게 되었다는 자화자찬의 평을 내면서 논문을 마무리하였습니다.

사례를 통해 short read만으로는 진단에 한계가 있다는것을 확인하였고 long read 방법이 이제 진단에 슬슬 자리 잡아야 하지 않나 싶은 생각이 드는....

(근데 길게 뽑으려면 나노포어 실험이 그렇게 쉽지 않은듯하던데.... )





출처: @ye._.vely618
출처: @ye._.vely618









화요일, 8월 03, 2021

NIPT는 왜 false negative에서 자유로울 수 없는가

NIPT는 데니스 로훃아께서 산모 혈액속에서 태아의 cell free DNA가 소량 존재하고, 탐지할 수 있는 것을 알게 된후 시퀀싱을 사용하여 태아의 DNA를 탐지하는 기술을 개발하면서부터 사용되었다. (그와 함께 온갖 특허로 돈방석에 올랐는지는 모르겠지만 일단 특허는 가지고 있으시다능 ㅜㅅㅜ, 관련기사는 >여기< 일루미나,Lo,시쿼놈 이 IP pool을 만들어서 세계여행중)


여튼 NIPT대한 서술은 이쯤하고..


NIPT가 침습적검사를 대체할 수 있었던 큰 이유는 바로 비침습이라는..

침습의 경우 높은 확률(몇인지 가물가물..)로 유산 가능성이 있으나 정확한 진단을 내릴 수 있기 때문에 꼭 필요한 산모들에게만 하는게 좋은데... 그 꼭 필요한 산모들을 어떻게 선정하느냐가....

그래서 NIPT로 스크리닝하고 고위험군의 산모들에게서 스크리닝결과 부정적인 의견이 나오면 침습검사를 권장하는것으로 이제 체계가 잡혀가는데..


이 NIPT가 갱장히 혁신적인 기술임인 반면에 치명적인 단점이 있었는데 위음성의 문제가 좀 있다

근데 산모 혈액속에 떠돌아 다니는 태아의 DNA(그냥 DNA는 아니고 cell-free된 fetal DNA)를 탐지해서 스크리닝하는건데 왜 위음성이 나타나는걸까?

엄밀히 말하면 산모 혈액속에 있는 태아의 DNA는 아니고 태아의 DNA와 시작을 함께하는 조직의 DNA(chorionic villi라는 한국말로 하자면 융모막융모에서 유래된 DNA)라서 위음성이 나타난다는...


from zygote to blastocyst.
from zygote to blastocyst



False Negative NIPT Results: Risk Figures for Chromosomes 13, 18 and 21 Based on Chorionic Villi Results in 5967 Cases and Literature Review

바로 이 논문이 NIPT에서 위음성이 왜 나타나는지 얼마나 나타나는지 알아보는 논문 되겠습니다.

NIPT에서 사용되는 태아의 cell free DNA의 기원에 대해서 이해를 해야지 NIPT의 위음성과 위양성에 대해서 이해 할 수 있습니다.

위의 그림과 이유를 표로 정리하면 다음과 같다.



자세한 NIPT의 정확도 수치같은 내용은 논문을 탐독하면 알 수 있을 것이고

오늘의 논문에서 NIPT의 위음성의 이유와 왜 그러는지에 대해서 알면 충분히 보람찬 하루가 되지 않을까합니다. 




일요일, 7월 25, 2021

Omniome 넌 누구냐

광고?뉴스?기사?글이 하나 포착되어 보는데

Pacific Biosciences signs a definitive agreement to acquire Omniome

Omniome이라는 처음보는 회사가 보여서 잠깐 검색 하는데 캐서린 우드의 ARK가 여기서 나오네.. ㄷㄷㄷ

여하튼 PacBio의 Long Read와 Omniome의 (길이는 언급하지 않겠다) 정확도가 만나 일루미나의 SBS(sequencing-by-synthesis)대항하여 SBB(sequencing-by-binding)라는 기술로 PacBio랑 잘 해보겠다? 정도인듯한데..

SBB가 무엇인지 한번 찾아보는것에 의의를 두도록 하겠습니다.

Omniome에서 SBB에 대한 논문과 특허는 이미 등록되었고 논문은 요기에 특허는 요기에 등록되어 있어보이고...


아.. 일단 갱장히 본인들을 잘 설명해놓았다고 생각하겠지만.. (아니면 본인들도 어떻게 설명해야 할지 잘 모르고 있다는것에 한표.. 이과놈들이란...)

여튼.. 한개 base를 읽기 위해 4개의 염기가 모두 필요하고..
올바른 base면 감지 가능한 신호(복합체)가 생기고...

이거... 복합체와 센서를 이온으로 변경하면 Ion Proton이랑 좀 비슷한듯....

여튼 SBB기술을 이해하려고 내가 알고있는 기술로 단순화하해서 접근해보니.. ion proton이랑 비슷한듯하네요..


처음에 미지의 서열에 A,C,G,T가 binding하고 이 서열이 올바른지 아닌지는 binding하여 만들어진 복합체의 양?에 따라 올바른 서열인지 아닌지 확인하는.. 모 그런 기술로 보여지는데..


추후에 더 이 기술에 알게 되면...
물론 나는 SBS, SBB같은 SRS(Short Read Sequencing이라고하는..)들은 별로 관심안가지지 않을까하는 생각이....


근데 ARK 실망..... 관심있어하는게 PacBio와 Omniome이라니.. 

옥스포드의 나노포어가 있는데....


출처: @ye._.vely618
출처: @ye._.vely618




수요일, 1월 06, 2021

너도 AB1파일가지고 pdf 만들수 있어 (1)

국내 회사에서 일반 시퀀싱 즉 Sanger Sequencing을 맡기시면
시퀀싱되어 바이너리 정보로 저장되어 있는 ab1파일, 서열정보가 들어있는 fasta파일과 함께 Applied Biosystems 로고가 찍혀있는 pdf파일 혹은 시퀀싱을 요청한 회사의 로고가 찍혀있는 pdf파일을 받아 보실 수 있으실겁니다. 

자세히 보다보시면 서열과 plot의 위치가 맞는거 같으면서도 안맞는거 같기도하고..
대놓고 틀린건 아닌데 그렇다고 안대놓고 맞는건 아닌거같고..

그러면 이 파일은 대체 어떻게 만들어지는걸까?
그럼 나는 저런거 못만드나?

그럴리가 있겠습니까?
그래서 이 글의 제목이 "너도 AB1파일로 pdf 만들 수 있어" 아니겠습니까?

예전에는 ab1.py? ab1_parse.py? 어떤 용자께서 제작하신 3rd party파일을 python에 import하여 사용하였었는데

이번에는 biopython에서 제공되는 ab1파일을 핸들링 하는 기능을 사용해서 작업해보려고 합니다.


ab1파일을 parsing하려면 ab1파일이 어떻게 생겼는지 알아야 하겠죠?
그래서 ab1파일에 어떤 항목에 어떤 내용들이 담겨져 있는지 확인을 해보시기 바랍니다.


다음번에는 ab1파일안에 들어있는 내용들을 확인해보는 시간을 가지도록 하겠습니다.

진짜로~
제발~




출처: @sana_twice.09


토요일, 1월 02, 2021

High Heterozygosity genome 어셈블리 할 때 해결사로 자처하고 나온 어셈블러

2021년 첫 포스팅 시작합니다. :)

오늘은 de novo assembly관련된 tools 소개 글입니다.

모델 생물 혹은 그외의 생명체에 대해서 genome을 알고 싶다면...
그냥 절래절래 하거나 아니면 필요하거나 알고 싶은 부분만 클로닝해서 슬쩍 슬쩍 알아내던 시절... 

돈없는 연구자들은 손가락이나 빨고 눈물이나 흘리던지 어딘가에 끼어서 연구를 진행했었어야 했으나...

이제는 바야흐로 2021년!! (사실 글의 초안을 작성하고 있었던 때는 2020년 11월;;;)

454 따위 역사속으로 사라지고 킹왕짱 long read인 PacBio와 나노포어가 활발히 사용되는 시대에 살고 있습니다.

(물론 de novo는 454와 일루미나로 이어 붙여야 제맛이지 하는 라떼들도 있지만...)

저는 박테리아에서 PacBio 써본 후 박테리아 연구에서 PacBio 사용하지 않고 일루미나 플랫폼을 사용한다고하면 일루미나 주식을 가지고 있나 생각하게 되었고, 그외에 genome을 de novo작업은 nanopore를 추천하고 있는데 굳이 나노포어를 사용하지 않겠다라고 한다면... 굳이? 라는 궁금증으로 가지게 되었다능.. ㅋㅋ
(당연히 무조건 저걸 써야하는건 아니쥬 ㅎㅎ 연구 목적에 따라 봐야 하는 결과물에 따라 플랫폼을 잘 선택하시면되겠습니다.)

※ 여기서 나노포어 base의 quality는 굳이 논할 이유는 없고 제대로된 데이터 만져보면 나노포어 쓰지 않을 이유가 없으실 겁니다.


이제는 PacBio나 나노포어를 굳이 사용하지 않을 이유가 없는 것이 예전이라면 PacBio나 나노포어를 지원해주는 프로그램이 많지 않아서 좀 꺼려질수 있었지만.. 지금은 반대로 너무 많아셔져서 어떤 tools을 사용해야 하나 할 정도니...

그중에서 어셈블리를 하면서 문제가 되는 부분이 High heterozygous region들이 있는데 (그 와 함께 저세상 텐션을 보여주는 polyploidy;; ) 이런 문제들을 해결에 주겠다는 해결사로 자처하고 나온 tools이 있어서 한번 끄적여 보았습니다.

Purge Haplotigs: allelic contig reassignment for third-gen diploid genome assemblies

물론 이전에도 heterozygous 문제를 해결하는 tools이 없지는 않았습니다.
이전 글에서도 잠시 소개했었던 HaploMerger2 도 있고 저는 잘 몰랐지만 Redundans라는 도구도 있었다고 합니다. 다만 이전에 나온 tools의 단점은 사용자가 수동으로 contig를 재 할당해야한다는 문제가 있다고 합니다.
(음.. 저도 이전에 한두번 HaploMerge2를 사용해었는데;;; 여기서 얘기하는 contig 재할당에 대한 얘기가 정확히 어떤 의미인지는 정확하게 모르겠네요;; 여튼... 좀 단계 단계를 수동으로 작업을 하기는 했었습니다만 여기서 얘기하는 "수동"이 이 얘기가 아닌거 같은데...)

여튼... purge의 분석 pipeline은 다음과 같은 단계들로 진행됩니다.
purge의 분석 Flow chart >Figure1<


음... 확실히 장점으로는 draft로 조립된 genome에서 중복되는 contig들을 제거해서 draft assembly 서열의 크기를 줄여서 실제 genome size에 가깝게 된다는 것 이긴 합니다.

그리고 이 tool을 사용할 시 참고할 점으로는 일루미나 데이터를 가지고 purge를 진행할때는 지양했으면 합니다.
제가 해봤을때에 nanopore-raw 서열가지고는 분석이 가능했는데 일루미나 데이터로 작업하였을 때 purge_haplotigs의 hist 명령어를 사용하여 cov의 input 값이 -l, -m, -h 값을 구하는 작업을 할때 -l, -m, -h 값을 특정 할 수 있는 문제가 좀 있었습니다. 너무 값들이 낮아서 어떤 값을 low, mid, high을 사용할지가 모호하더라구요..

여튼..

de novo  작업을 하시다가 생각보다 genome 크기가 큰 경우 내 genome 중간에 heterozygous한 지역이 있구나 생각하시고 이 tools한번 돌려보시면 좋을것 같습니다. :)



출처: @ye._.vely618





토요일, 12월 26, 2020

Long read는 Long read alignment로....

간만에 글 투척합니다.

오늘은 Long read align관련된 내용 투척 하도록 하겠습니다.

시퀀싱 기술이 좋아져서 PacBio와 함께 nanopore가 (최근 covid도 있었고) 함께 많이 이용되고 있는데 질좋은 long read를 생산하셨다면 bwa/bowtie와 같은 short read alignment보다는 long read에 최적화된 long read alignment인 minimap2같은 tool를 사용하시는게 정신건강에 좋을 것 같습니다.

최근 제가 별생각없이 long read서열을 human genome에 aling할때 bwa mem의 -x ont2d옵션을 사용하여 진행했었는데...

통수를 후려 갈기는... (원래 통수는 후려 갈기는 맛이 좋다능)


bwa mem -x ont2d를 사용하는 경우 원래 생산된 read(raw read 개수)보다 더 많은 read 들이 aligned되는 것 처럼 보인다는... (?? 생산된게 100개 read인데 align된 read는 200개라고?)

근데 minimap2를 사용하였을 때에는 reference에 align된 read의 개수와 생산된 read 개수(raw 리드 개수)가 유사한(aka 생산된 read 개수보다 적은) read 개수를 확인 할 수 있었습니다.

개발자도 같고(Heng Li), 같은 align하는 tool인데 왜 이렇게 차이가 나느냐 

음... bwa와 minimap2를 자세히 까보지는 않았지만(못하지만) bwa의 경우 mem -x ont2d를 사용한다고 하더라도 태생부터가 short read를 위해서 만들어진 alginment이고 nanopore의 경우 마음먹고 시퀀싱이 된다면 수십 kb의 길이가 나오는 관계로 bwa mem에서 seed를 기준으로  align할때 mismatch나 error에 대해서 관대하게 조건을 잡으면서 확장을 한다로 하더라도 수십 kb까지 확장하지 못하는 경우가 발생 하고 그 경우 split이 되어 다른 reference에 align되는 경우가 발생하는것으로 보였습니다.

대신 minimap2의 경우 long read를 고려해서 만들다 보니 확장이 비상식적으로 read가 길더라도 확장을 하지 split하지 않아서 bwa의 경우와 같이 생산된 read보다 많은 read가 align된 것 처럼 보이는 이상한 문제는 발생하지 않는 것 처럼 보였습니다.

결론은 내 데이터에 맞는 mapper를 사용해서 분석하자 되겠습니다. ㅠ.ㅜ


추신: 2018년도 이런 글(Minimap2 and the future of BWA)도 있었군요;; 



출처: @ye._.vely618


금요일, 12월 18, 2020

ClinVar XML파일을 Tab 구분자 파일로 변환해서 사용하기

Clinvar안에 있는 정보를 활용하기 위해서는 대부분 다음과 같이 ncbi ftp에 들어가서 clinvar의 xml파일을 사용하게 됩니다.

https://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/clinvar_variation/ClinVarVariationRelease_00-latest.xml.gz


근데 이 xml 파일이...


솔찬히 번거롭고 귀찮쥬?

xml과 함께 json도 만만치 않쥬...

그래서 clinvar xml을 parsing해서 조금 더 핸들링하기 쉽게 tab으로 구분된 파일을 만들어 보겠습니다.

이 xml을 받을 때 처럼 ncbi의 ftp인

https://ftp.ncbi.nlm.nih.gov/pub/clinvar/tab_delimited/에 접근합니다.

그리고 variant_summary.txt.gz을 찾으시면되겠습니다.


parsing script가 아닌 그냥 파일을 새로 받으면 되는것이었습니다. :)



출처: @ye._.vely618





토요일, 12월 05, 2020

WGS는 과연 의료비용을 낮출수 있을까

Rapid whole-genome sequencing decreases infant morbidity and cost of hospitalization

본 논문은 WGS이 의료 비용 절감과 환우의 치료에 대해 긍정적인 결과에 대한 내용을 담고 있는데 솔까말 시퀀싱 가격이 NovaSeq이 나오면서 값싸졌다고는 하지만 의료 현장에서 WGS가격이 수십만원대로 서비스할 수 있는 것은 아니지만...

환자에게 들어가는 의료 비용을 생애 전주기에 걸쳐있다는 관점으로 바라보면, 초기에 WGS를 수행해서 병의 정확한 이유를 가려내어서 알맞은 치료나 관리를 해주면 초기에 다소 비싸보이는 WGS를 하는것이 WGS를 하지 않아 적시에 필요한 치료과 관리를 하지 못했을 때 보다 전체적인 의료비용도 낮추고 환우들이나 그의 가족들에게도 물심양면적으로 긍정적인 효과가 된다는 내용 되겠습니다.


San Diego의 Rady Children 's Hospital에서 진행되고 있는 연구로 WGS데이터를 바탕으로 질병 예측과 이유의 정확도를 높여 더 나은 치료 결과를 기대 할 수 있는지를 보고자 하는 임상실험 결과 중 초기 단계의 결과입니다. 

무슨 임상실험을 2050년까지 한다는건지.. 그러나 그정도로 데이터를 쌓아놓고 확인해봐야 NGS를 의료계에서 인정하겠다라는 철저한 준비를 하겠다는 의지라고 볼 수도 있겠지만.. 30년동안 데이터 모으는 동안 또다른 혁신적인 실험기법/방법이 나오면 도루묵일수도... 여튼.. 
그래도 의료에 직접적으로 영향을 끼칠 수 있는 방법이다보니.. 

그리고 이러쿵 저러쿵 하더라도 중요한 점은 FDA 승인하에 의뤄지는 WGS기반의 진단 방법 실험 결과이고 그 결과가 "가치 있음" 이라는데에 의의가 있겠습니다.

2016년/2017년 이유를 알지 못하는 유전 질환을 앓고 있는 영아 48명 중 유전자 검사에 대해서 동의한 42명의 영아들에 대해서 (필요시 영아와 함께 부모또는 형제자매들도 검사) 유전자 검사를 진행하였습니다.

rWGS의 임상적 효과를 확인하기위해 standard test인 염색체 마이크로어레이(CMA)와 함께 진행하여 비교 한 결과, CMA방법으로는 42명 환자중 4명에 대해서 병인에 대해서 진단 할 수 있었으나, rWGS의 경우 18명(?19명?)에 대해서 병인 진단을 받았고 위양진단은 없었음을 확인하였다고 합니다. 

그리고 유전질 환을 진단받은 18명의 영아중 13명에 대해서 소위 이야기하는 정밀/ 맞춤의학이 도입되었을 때 볼수 있는 효과는 Table 2,3에 설명되어 있습니다. 물론 재현성이 있는 반복실험 결과도 없고 코호트내 인종이 caucasian, Hispanic/Latino로 편중되어 있고, n수 도 수십명으로 적어서 rWGS를 적극적으로 의료보험으로 적용시키기에는 제한적이긴 하나 rWGS가 현재 적용되고 있는 기준 방법인 CMA방법보다는 더 나은 선택지를 제공할 수 있고 그 효과는 무시할 수 없다는 근거가 이 논문을 시작으로 속속 뒷받침 해줄 것이고 원인을 명확하게 판단 할 수 없는 영유아의 유전질환 진단에서 rWGS가 조만간 단계적으로 도입되는 날이 얼마 남지 않은것 같아보입니다.

사실 이 논문의 배경은 미국이라 우리나라에는 적용하기 어려운 부분이 많아보이는데 국민건강보험기금이 화수분도 아니고 이제는 조금더 효율적으로 사용하려면 신기술에 대해서 적극적으로 검토하고 도입을 주도적으로 진행해야 적은 기금으로 효과를 극대화하고 필요한 많은 이들에게 보장을 해 줄 수 있지 않을까하는 생각을 들게하는 연구였습니다.


출처: @sana_twice.09

토요일, 11월 21, 2020

Uterine Microbiota의 이해

읽는다 읽는다 하면서 이제서야 정리하는 내용...



microbiota라고 하면 대부문 gut microbiota를 떠올리지만 인체에는 다양한 외부 기관들이 있는바 거기에 각각 독특한 microbiota를 가지고 있다는 사실!!

그중에서도 오늘은 글쓴이가 한때 업무를 보았던 NIPS와 밀접한 자궁내 미생물총에 대해서 리뷰된 논문이 있어서 한번 읽어 보았습니다.

설마 재미가 있을리는.... 
업무와 관련있는 내용을 논문이 나온지 2년이나 지난 지금에서야 읽고 정리하는 역설적인 상황!! 

어쨌거나 논문을 들여다보자면...

일단 리뷰지인만큼 미생물총, 그중에 자궁 미생물 총에 대해서 배경을 설명해주고 있습니다. 1세기 전만해도 자궁은 무균지대라는 가설이 지배적이었다고... 질은 외부세균으로부터 자궁을 보호하는 역할을..  (아니 무슨 말을 하는건지.. 밁칡짉안곩섥는... 사실 먼 훗날 현재는 사실로 받아들이는것들이 헛소리라고 밝혀지는것도 있을테니....)

그래도 최근에는 culture방법을 통해서 저 말도안되는 가설을 밀어내고 있고 현재는 NGS로 다양한 연구를 통해 자궁내 미생물총에 대한 기능에 대해서 알아가고 있습니다.

다양한 연구라 함은 자궁내 미생물총의 차이가 반복적인 유산과 조산등에 대한 원인이라는 연구가 있어 자궁내 미생물총이 host인 여성의 건강, 그리고 직접적으로는 태아의 건강과도 연관되지 않을까 하는 연구입니다.

본 리뷰지에는 10개의 자궁내 미생물총 연구 결과 논문을 소개하고 있는데 개별 연구에서 일관성있는 결과들이 나오지 않아서 본 리뷰 논문 제목처럼 자궁내 미생물총은 우리와 함께하는 파트너(거주자)인지, 어떠한 이유로 자궁으로 들어와서 잠시 머무르는 존재(여행자)인지, 악의적인 목적을 가진 존재(침입자)인지 질문을 하고 있습니다.

일관성이 보이지 않는 개별 연구의 내용들은 IVF 시술을 받은 여성들 사이에서 차이를 본 연구, 별도의 자궁이상이 없다고 판단되나 반복적인 유산 및 착상 실패를 보이는 여성들의 미생물총 차이, 자궁내막증이나 기타 다른 질환으로 자궁 수술을 받아 건강한 삶을 살고 있는 여성과 자궁내막증과 같은 질환을 가지고 있으나 아직 수술전인 여성들과의 미생물총 차이 등등등... 

얼핏보면 좀 차이가 있어보일만한 그룹을 비교를 했는데도 왜 연구마다 결과가 상이 혹은 반대의 결과를 보이는것은 실험방법의 한계, 즉 피험자의 코호트 크기(피험자 수, 논문을 보시면 아시겠지만 30명전후라서..), 시퀀싱의 한계, 먹거리와 같은 차이로 인한 환경의 차이, 샘플링방법... (물론 멋지다고 생각한 연구 디자인도 빠질수 없겠죠)

여튼 그래서 논문저자들은 각 연구의 결과들을 취합하여 다음과 같은 자궁내 미생물에 대해서 설명하고 있습니다.

1. 파트너(거주자)로써의 자궁내 미생물의 역할
 호르몬에따라(월경주기/폐경기전후) 비슷한 미생물 프로파일을 보이는 경향이 존재.

2. 잠시 거쳐가거나(여행자) 기회를 봐서 문제를 일으키는 존재(틈을봐서 돌변하는 침입자)
 수정을 위해 잠시 들어오게되는 미생물들이 있을 수 있음을 확인. 그러나 일부 인과관계는 확인되지 않았으나. 자궁 내막증을 가진 여성의 자궁 미생물 프로파일은 그렇지 않은 여성의 자궁 미생물 프로파일과 차이를 보였음.

3. 이도저도아니고 걍 백해무익한 존재(침입자)
 특정 질병을 가지고 있거나 특정 문제가 있을때 자궁/질에서 우점하고 있는것처럼 보이는 미생물 프로파일 결과가 있음.


결과는 그렇다고 쳐도 다양한 방법과 피험자들을 대상으로 pilot연구가 되어 있으니
우리는 이것을 보고 한걸음 더 나아가면 되지 않을까 합니다.

그리고 gut-brain을 시작으로 다양한 axis가 있는데 이번기회에 gut-organome 중 하나로 gut-vagina axis을 주창하는 기회를...


부록으로 논문에서 언급된 논문들을 SRA에서 확인해 봤는데, 혹시 사용하시려면 한번더 확인해보고 사용하시면 되겠습니다.



논문 SRA번호
Fang et al. (49) PRJEB9626
Moreno et al. (47) PRJNA329174
Walther-Antonio et al. (35) SRP064295
Chen et al. (27) PRJEB16013, PRJEB21098

저자 뒤에 표시된 괄호안 숫자는 논문내 에서 표시되는 reference 번호입니다.







출처: @sana_twice.09


화요일, 9월 22, 2020

8개의 variant caller 통합 도구

2018년 WGS이나 WES 혹은 Target Seq을 한 후 변이를 확인 할 때 으레 GATK를 사용하는 우리들에게 감사하게도 여러개(정확히는 8개)의 변이 caller 결과를 통합해서 확인 할 수 있는 논문이 발표되었습니다.

진짜 감사할지 이름만 appreci할지...

(구글 검색결과 글쎄요... 이유가 무엇인지는 모르겠지만 오늘이 2020년 9월 12일인데 인용 횟수가 4개네요..)

목적은 NGS를 임상에 사용하려면 유효한 variant를 call해야 하는데 분석 tool마다 어떤 variant는 call하고 어떤 variant는 call하지 못하는 경우가 발생해서 그럼 여기서 나온 결과와 저기서 나온 결과 합치자!!

근데 이 작업을 할 하는데?? 이게 그렇게 쉽다고?

그렇죠 이런저런 허들이 있고 동일한 위치에 A변이와 B변이가 있다고 나왔을 때 어떤 변이를 call했다고 인정할것인가?

모 변이를 call하고 변이들을 merge하고 필터링하는 파이프라인을 개발했다는 것이 이 논문의 결론이고 민감도는 0.93-1.0, PPV는 0.65-1.0사이, 8개의 도구를 combine하였는데 caller를 줄이면 appreci8의 성능은 떨어지니깐 그러지 마세요 라고 얘기하고 있습니다.

여기서 사용하는 8개 caller들은 다들 많이들 사용하고 있는 GATK, Platypus, VarScan, LoFreq, FreeBayes, SNVer, samtools, VarDict되겠습니다.

appreci8은 여기서 docker로 제공되고 있고 분석을 한 일루미나 데이터는 여기에 위치하고 있습니다.


출처: @ye._.vely618