중국에서 비 침습성 산전 검사(NIPT)를 활용해서 흥미진진한 연구를 진행해서 2018년도에 투고한 논문을 한번 훑어봤습니다.
Genomic Analyses from Non-invasive Prenatal Testing Reveal Genetic Associations, Patterns of Viral Infections, and Chinese Population History
>논문은 여기로<
NGS시대에 유전학연구를 할 때 가장 문제되는게 표본 크기가 제일 문제되고 있죠, 시퀀싱을 하자니 기본적인 depth가 필요한데 적절한 depth로 하자니 비용때문에 표본 크기를 줄여야 되고.. 표본 크기를 줄이자니 그정도 시퀀싱해서 얻어진 결과가 잘 될까?
그래서 중국 연구진(물론 미국과 덴마크 연구진도 합세했습니다.)이 NIPT 데이터를 이용해서 유전체 연구를 진행해 보았답니다.
NIPT는 shallow sequencing의 대명사죠, 그럼에도 불구하고 전세계적으로 스크리닝방법으로 정착을해서 현재도 굳이 침습적 산전진단을 받지 않아도 되는 산모들에게 대안이 되어 주고 있습니다.
(오늘은 NIPT 성능과 위음성과 같은 것은 논외로 하겠습니다.)
산모들의 NIPT 데이터를 사용해서 유전학 연구를?
이게 될까? 저도 될줄은 몰랐는데 이분들 일단 했으니 논문이 나왔겠죠..
대한민국에도 엄청 많은 NIPT 데이터가 쌓여 있을텐데.. 한번 해봐도 나쁘지않을 것 같습니다. (물론 동의서가... ㄷㄷㄷ )
결론적으로 슬쩍 읽는 NIPT 가지고 거기다가 두명혹은 그 이상의 정보가 섞여 있는데 그거가지고 모 뭐할꺼야? 라고 하신다면 큰 오산!
슬쩍 읽는가지고도 집단유전학, Association mapping study 그리고 (아놔 이거 모야?인데 진짜 나온다는.. ㅋㅋ ) 인간 혈장내 바이러스 연구를 할 수 있다고 합니다.
일단 NIPT로 얻어진 allele 정보가.. 진짜 쓸만한가 알아보았슴다.
NIPT 데이터(CMDB)에서 call된 SNP들이 기존의 1KG CHN,EAS 및 전체에서 얼마나 확인되었는지, CMDB에서 novel variant들이 있는지 확인했고
non-reference allele freq를 가지고 1K genome의 CHN allele과 CMDB의 allele를 비교해보았습니다.
물론 Novel은 적게, gnomAD, 1KG 데이터와 많이 공유하고, 상관관계는 높습니다.
변이에 대한 결과를 확인 했으니 이제 중국의 유전학 썰을 한번 풀어보는걸로..
분석에 걸림돌이 되는 오류같은것들은 적절히 제외해주고 한족에 대해서 한번 확인해봤습니다.
31개 행정구역의 4만5천명 한족이라고 확인된 샘플들을 PCA분석을 해보 았는데 위도에 따라 차이가 많이 보였습니다(이 결과는 이전 연구 결과와 동일한.., 동서에 의한 차이는 별로.. ,논문내에서는 이주정책에 의해 설명되는것 같다고 하는데 정확히 무슨 말인지는.. 1996년 논문을 봐야할듯 하네요. ). 그러나 그 외 소수민족에서는 걍 경도, 위도 상관없이 다 차이가 있었다고 하네요. 그래야 소수민족이지 않을까하는 생각이기도 합니다.
가장 차이가 나는 집단은 신장지방의 Kazakh, Uyghur, 내몽골 지역의 Mongol이었습니다.
(일단 언어가 다르다고 하네요)
그리고 키와 BMI와 같은 Multiple Complex Traits의 Phenotype - Genotype Association을 확인해봤슴다.
지금까지 연구된것들과 비슷한 SNP들이 확인되었고 CBK, GIANT, UK BioBank 대규모 set들과 비교해봤을 때도 크게 다른 값을 보이지 않았습니다. 그리고 NIPT라는 특별한 샘플이라는 점을 고안하여 쌍태아와 관련된것도 한번 확인해 보았답니다.
(산모 연령에 대한 것도 확인했다고 했는데... 이건 유전적이라기 보다는... 사회학적인 부분이지 않을까했는데.. 모 연관성이 높은 SNP를 찾긴 찾았는데 저는 패스 하도록 하겠습니다.)
중국의 NIPT 샘플중 470여명의 쌍둥이들이 있었는데(초음파로 확인) NRG1의 rs12056727d이 꽤나 흥미로운 좌위로 확인되었습니다. 이 SNP는 UK BioBank에서 갑상선 항진증과 관련이 있는것으로 확인되었습니다. 그리고 갑산성 기능은 불임과 관련이 있습니다. NRG1유전자에 대한 내용은 일단 넘어가더라도 쌍둥이를 임신한 산모는 갑상선 자극 호르몬 수준이 낮아지는 경향이 있습니다.
그리고 오늘 포스팅 제목에 부합하는 내용인, 산모 혈장에서 보이는 circulating viral DNA!
왜왜왜 나오냐고
일단 NIPT에서 수행된 시퀀싱 결과에서 human에 mapping되지 않는 read들을 따로 모아서 NCBI 바이러스 DB에 확인해봤고 그 결과를 Figure5의 A,B에 정리했습니다. 그렇지만 우리가 잘못 분류하거나 샘플이 오염 되었을 수도 있기에 검토하였다. 대부분은 특정 지역에 국한되었고, 이미 인체내 genome에 내재화 되어 있는 HCV서열이 있는것을 확인했지만... 그 대상 숫자가.. 고작 3명..
근데 중국에서만 그런건 아니고 유럽쪽 연구에서도 바이러스가 나왔었다능
-물론 바이러스 종류가 좀 다른 것으로보입니다.
실험 디자인이 달라서 그런것인지 진짜 지리적으로 차이가 있는것인지 모 좀더 확인해봐야 하겠지만... 크.. 인구도 많고 땅덩어리도 작지 않은 중국 아니겠습니까.
HBV관련해서 민감도도 계산했고 지리적 분포를 확인해서 지리적으로 확인되는 바이러스 종류들이 다르다는 것을 확인했습니다.
그래서 NIPT 데이터를 잘 활용한다면 공중보건에도 꽤나 유용할것 같다는게
저자들의 논지였고 현재 NIPT 서비스를 하고 있는(그러나... 내년에도 하고 있을거라는 보장은... 어느 이유로든지 밝지 않은) 본인에게도 걍 헛소리로 보이지는 않고 진짜 유용할것같다능...
ps. 근데 일주일에 논문하나 읽기가 이렇게 어려웠나;;;
|
출처: @sana_twice.09 |