레이블이 Genome인 게시물을 표시합니다. 모든 게시물 표시
레이블이 Genome인 게시물을 표시합니다. 모든 게시물 표시

화요일, 6월 11, 2024

Towards the era of cat precision medicine

오늘은 수 많은 동물 중 고양이의 유전체를 연구한 논문을 하나 가져와봤습니다. 

물론 저는 고양이를 키우지 않지만 (물론 개도 키우지 않습니다. 이유는 제 한 몸 간수하기 힘든데 다른 생명체를 어떻게 보살피겠습니까 ㅎㅎ ) 유전체 연구는 흥미진진하니깐 한번 훑어보려고 합니다.

물론 제가 할게 아니니깐 일단 골라봤습니다. :)

제목은 "Genetic epidemiology of blood type, disease and trait variants, and genome-wide genetic diversity in over 11,000 domestic cats" 으로 만여마리 이상의 국내 고양이(여기서 국내는 USA입니다.)를 대상으로 시퀀싱을 하여 질병과 혈액형 그리고 표현 특징들에 대한 변이들에 대해서 한번 분석했다고 합니다.

DOI: 10.1371/journal.pgen.1009804


gemini

## 고양이 유전체 연구: 고양이의 건강과 복지 개선을 위한 새로운 희망

고양이는 인류 역사상 가장 오랫동안 가까이 지내온 동물 중 하나입니다. 우리는 그들의 귀여운 모습, 장난스러운 성격, 그리고 따뜻한 애정에 매료되어 왔습니다. 하지만 고양이 또한 질병, 행동 문제 및 기타 건강 문제에 취약합니다. 

최근 몇 년 동안 과학자들은 고양이 유전체 연구에 대한 투자를 늘려왔습니다. 이 연구는 고양이의 유전자가 건강, 질병, 행동 및 진화에 어떻게 영향을 미치는지 이해하는 것을 목표로 합니다. 연구 결과는 고양이의 건강과 복지를 개선하고 인간 건강에 대한 새로운 통찰력을 제공하며 생물 다양성 보존 노력을 지원하는 데 사용될 수 있습니다.

**고양이 유전체 연구의 주요 발견:**

* 연구원들은 암, 심장병 및 당뇨병과 같은 복잡한 질병의 유전적 기초를 밝히고 있습니다.

* 과학자들은 공격성, 불안 및 강박 장애와 같은 행동 문제의 유전적 기초를 연구하고 있습니다.

* 고양이 유전체 연구는 고양이의 기원과 다양한 품종의 발달에 대한 새로운 통찰력을 제공하고 있습니다.

**고양이 유전체 연구의 잠재적 이점:**

* 유전 질환의 원인을 식별하고 새로운 치료법을 개발하는 데 도움이 됩니다.

* 개인 맞춤형 의료 및 예방 전략 개발을 가능하게 합니다.

* 번식 프로그램을 개선하고 건강한 고양이를 촉진합니다.

* 질병에 대한 진단 및 예후 예측을 개선합니다.

* 새로운 치료법 및 예방 조치 개발을 위한 토대를 마련합니다.

* 고양이와 인간 간의 관계를 개선합니다.

* 고양이의 기원과 다양한 품종의 발달을 연구하는 데 도움이 됩니다.

* 인간과 고양이가 공유하는 질병에 대한 새로운 치료법 개발을 위한 토대를 마련합니다.

* 인간 유전학 및 질병에 대한 새로운 통찰력을 제공합니다.

* 개인 맞춤형 의학 발전에 기여합니다.

**고양이 유전체 연구의 윤리적 고려:**

* 고양이 유전체 연구는 윤리적 원칙에 따라 수행되어야 합니다.

* 연구에 참여하는 고양이의 복지가 보호되어야 합니다.

* 연구 결과는 책임감 있게 사용되어야 합니다.

**결론:**

고양이 유전체 연구는 고양이와 인간 모두에게 다양한 잠재적 이점을 제공하는 강력한 도구입니다. 연구 결과는 고양이의 건강과 복지를 개선하고 인간 건강에 대한 새로운 통찰력을 제공하며 생물 다양성 보존 노력을 지원하는 데 사용될 수 있습니다. 연구는 윤리적 원칙에 따라 수행되어야 하며 연구에 참여하는 고양이의 복지가 보호되어야 합니다.

**이 블로그 게시물이 고양이 유전체 연구에 대한 귀하의 이해를 높이는 데 도움이 되었기를 바랍니다. 궁금한 점이 있으면 언제든지 의견을 남겨주세요.**

**#고양이 #유전체 #연구 #건강 #복지 #질병 #행동 #진화 #윤리 #과학**


clova-x

 고양이의 유전체 연구는 고양이의 생물학적 특성과 유전적 질병을 이해하고, 이를 예방하고 치료하는 데 중요한 역할을 합니다. 고양이의 유전체 연구는 고양이의 생물학적 진화와 국내화를 설명하고, 고양이의 유전적 변이를 설명하는 데에도 유용합니다.

고양이의 유전체 연구는 고양이의 건강과 번식에 대한 정보를 제공합니다. 예를 들어, 유전학적 검사는 유전적 질병을 예방하기 위해 사용되며, 환자에게 맞춤형 치료를 제공하기 위해 사용됩니다. 또한, 고양이의 유전체 연구는 인간, 개, 고양이의 유전학적 연구를 통해 유전학적 질병과 유전적 변이를 식별하는 데 사용됩니다.

고양이의 유전체 연구는 고양이의 생물학적 특성과 유전적 질병을 이해하고, 이를 예방하고 치료하는 데 중요한 역할을 합니다. 또한, 고양이의 건강과 번식에 대한 정보를 제공하여 고양이의 건강과 복지를 증진하는 데에도 기여할 수 있습니다. 고양이의 유전체 연구는 고양이의 건강과 복지를 증진하는 데 매우 중요한 역할을 합니다.


chatGPT

## 고양이 유전체 연구의 중요성과 그 의의

### 고양이 유전체 연구란?

최근 2022년 6월 16일에 발표된 연구는 11,000마리가 넘는 국내 고양이의 유전적 역학에 관한 중요한 내용을 다루고 있습니다. 이 연구는 다양한 고양이 품종을 대상으로 포괄적인 유전자 분석을 수행하여, 고양이의 유전적 다양성과 질병 연관 변이를 체계적으로 조사하고 있습니다.

### 왜 고양이 유전체 연구를 하게 되었을까요?

고양이 유전체 연구의 목적은 여러 가지입니다. 먼저, 고양이 품종 간의 유전적 다양성을 이해하고, 이를 통해 특정 품종에서 발생하는 질병과 관련된 유전 변이를 파악하고자 했습니다. 유전적 다양성을 평가함으로써 품종 간 유전적 취약성을 줄이고 건강을 개선할 수 있는 방안을 찾는 것이 중요했습니다.

또한, 유전자 검사를 통해 질병과 관련된 변이를 조기에 발견하고, 이를 통해 질병의 예방 및 관리에 도움을 주기 위해서입니다. 특히, 족보 있는 고양이의 경우 특정 유전 질병에 취약할 수 있으므로, 이러한 질병을 조기에 발견하고 관리하는 것이 중요합니다.

### 연구의 주요 발견

이 연구는 다음과 같은 주요 결과를 도출했습니다:

1. **질병 연관 변이**: 47개의 품종 또는 품종 유형에서 13개의 질병 연관 변이가 새롭게 발견되었습니다. 이는 고양이의 건강 관리 및 예방에 중요한 정보를 제공합니다.

2. **혈액형 변이**: A, B, AB 혈액형을 결정하는 유전 변이도 조사되었습니다. 이는 수혈이나 의료 상황에서 중요한 역할을 합니다.

3. **외모 관련 유전자 변이**: 다양한 외모를 결정하는 유전자 변이도 다루어져, 고양이의 품종별 특성을 이해하는 데 도움이 됩니다.

4. **유전자 다양성**: 각 고양이 품종의 유전자 다양성을 평가하여 이종 교배의 필요성을 제기하였습니다. 이는 품종의 건강과 생존을 위한 중요한 정보입니다.

### 고양이 유전체 연구의 의의

고양이 유전체 연구는 여러 가지 중요한 의의를 가지고 있습니다:

1. **질병 진단과 치료**: 유전적 질병의 조기 발견과 맞춤형 치료 계획 수립이 가능합니다.

2. **혈통 및 번식 관리**: 유전적 다양성을 유지하고 유전적 결함을 최소화하는 번식 전략을 수립할 수 있습니다.

3. **과학적 연구와 교육**: 유전학의 기초 연구에 기여하며, 교육 자료로 활용될 수 있습니다.

4. **인간 건강 연구와의 연관성**: 고양이는 인간과 유사한 질병을 겪는 경우가 많아, 인간 질병 연구에도 기여할 수 있습니다.

5. **보존과 생물 다양성**: 멸종 위기 종의 보존 전략 수립과 생물 다양성 유지에 도움이 됩니다.

### 결론

고양이 유전체 연구는 고양이의 건강과 복지를 향상시키고, 품종 육성 프로그램과 연구 공동체에 중요한 정보를 제공합니다. 또한, 이 연구는 고양이와 인간 모두의 건강 연구에 중요한 기초 자료를 제공하여, 반려동물 주인과 수의사에게 유용한 정보를 제공할 것입니다. 앞으로도 지속적인 연구를 통해 고양이와 인간의 건강과 행복을 증진시키기를 기대합니다.

이 글을 통해 고양이 유전체 연구의 중요성과 그 의의를 이해하는 데 도움이 되셨기를 바랍니다. 고양이와 함께 행복하고 건강한 삶을 누리시길 바랍니다!


최근 요 몇일 gemini의 센스가 부쩍 늘었습니다. 블로그 게시글 하단에 해시태그까지!! 우리의 clova-x는 살짝 분량이 좀 아쉽네요. 이전에는 이런저런 내용도 덧붙여줬던 것 같은데 말입니다. 요즘에는 어딘가 살짝... 귀차니즘이 들어 앉은 느낌? chatGPT는 역시나 잘 정리해준것 같습니다. 이번에 claude가 빠진 이유는 당연히 무료 분량을 넘어 섰기 때문입니다. :)

그럼 또 다음에 흥미로운 논문을 가져와보도록 하겠습니다.



출처: @ye._.vely618


금요일, 10월 27, 2023

롱리드 시퀀싱을 쓰지 않을 이유가 있는가?

이번 논문은 제가 참여한 논문입니다.. 흠흠..

이름하여 Two long read-based genome assembly and annotation of polyploidy woody plants, Hibiscus syriacus L. using PacBio and Nanopore platforms

DOI: 10.1038/s41597-023-02631-z

Hibiscus syriacus, 쉽게말해 무궁화 genome을 assembly하는데 어떤 데이터를 어떤 assembly 도구로하면 그래도 가성비가 좋은지에 대해서 확인한 논문 되겠습니다.

무궁화는 full genome은 이미 몇해전에 나와있는 상태고요, 아마 무궁화가 2배체가 아니라 4,6배체로 기억됩니다. 그래서 숏리드가지고 assembly가 만만치 않았는데 그 데이터를 바탕으로 이전에는 short리드로 어렵싸리 했었는데 이번에는 롱리드 시퀀싱으로 하면 어떻게 되는지 확인 해보자 입니다.

이전 무궁화 genome project 논문에서 핸들링하는 데이터 양을 정확히는 모르겠으나 어마무시했던것으로 알고 있습니다. 거기다가 숏리드라서 양쪽 로우 퀄리티 좀 정리해주고, scaffold용 mate-paired 데이터 정리작업하는데도 아마 꽤나 시간이 걸릴겁니다.

나노포어 데이터(ONT)와 PacBio data가 있었는데, 솔까말 ONT 데이터로만 해도... 사실 갠춘합니다.

그런데 여기서 중요한것은 ONT가 중요하기도 하지만 ONT의 장점을 십분 발휘할 수 있게 해주는 DNA 뽑는게 ART되겠습니다. ONT가 길게 읽을 수 있는거지 template가 짧으면 ONT도 길게 읽고 싶어도 못읽습니다.

결국 실험자의 손이 중요합니다. 손 똥손이면 ONT도 해결 못해줍니다.

그 똥손도 가능하게 해주는게 commercial prep kit이긴한데 현재 기준으로 그런 kit이 있는지는 저는 모르겠습니다. 


여튼 그래서 ONT 데이터를 앞뒤없이 다 때려박고 assembly하지 않았습니다.

cell 하나, cell 2개, 결과가 어떻게 달라지는지 확인해고, assembly tool마다 결과는 어떻게 나오는지 확인하면서 테스트 하였고, 이거쓰세요는 하지 못했지만 그럭적럭 요정도 생산해서 이 tool쓰면 평타 칩니다 라고 가이드는 해드릴 수 있는 논문되겠습니다.

다음에는 테스트하는 code를 간지나게 git에 올려놓고 논문에 url하나 올려둘 수 있도록 해봐야겠습니다. :)


그럼 또 쓸만한 논문을 찾아 돌아오도록 하겠습니다.




수요일, 7월 20, 2022

Long Read 조립은 누가누가 잘하나

Piroplasm를 나노포어를 사용하여 genome project를 진행했고 나노포어를 활용한 assembler들에 대한 성능 비교 논문 되겠습니다.


제목은 Systematic Comparison of the Performances of De Novo Genome Assemblers for Oxford Nanopore Technology Reads From Piroplasm

doi는 https://doi.org/10.3389/fcimb.2021.696669


piroplasm이 몬지는 모르겠으나 일단 그렇게 엄청나게 복잡하지는 않은 원생동물이나 사람이나 동물들에게 질병을 일으키는 녀석 되는 것 같습니다. funding중에 동물 전염병 및 인수공통전염병 관련 프로그램이 있는것으로 보아하니...


여튼 중요한건 nanopore로 읽어낸 서열을 사용하여 genome 조립할때 어떤 어떤 조립 프로그램이 제일 좋은지를 검토해본 것이니 OLC (Over-Layout-Consensus)나 전통적인 de-Brujin graph, string graph-based 방법 등등의 NECAT, Canu, wtdbg2, Miniasm, Smartdenovo, FlyeNextDenovo, Shasta와 같이 일반적으로 long-read에 사용하는 assembler들을 비교 테스트 하였다고 합니다.

대신 여기서는 assembly의 정확도와 함께 CPU 사용량, 메모리 사용량, 분석시간 사용방법 등등에 대해서도 함께 평가했다고 합니다. 참 바람직한 태도라고 봅니다. 모든 연구팀들이 그래픽카드 4개꼽히고 6T 메모리의 4U 서버를 가지고있는것은 아니니 말입니다.


실험 방법은 prioplasm free한 양 2마리(??)에게 prioplasm을 감염시켜 잘 배양(??)시킨 다음 Qiagen 사용 prep kit을 가지고 DNA 추출하고 PromethION으로 시퀀싱하였고 데이터 셋트에 따른 assembly 결과 평가를 위해 6가지 생산량 (약 15x, 30x, 50x, 70x, 100x, 120x)의 셋트를 만들었다고 합니다. 그리고 추가적(aka error correction)으로 (일루미나와 특허 소송에서 승리한) MGI로도 시퀀싱을 하였다고 합니다.


여튼 결과적으로

N50과 contig개수(적을수록 좋음)는 생산량과 밀접하고,
분석 시간은 생산량이 많으면 어떤 assembler를 사용하던 길어졌고,
polishing은 안하는것보다 하는것이 좋은것 같고 각 tool의 장단점은 Figure3에 방사형 그래프로 이쁘게 표현하였으니 한번 참고하시면 좋을것 같습니다.

그래서 Miniasm, Flye, wtdbg2는 그닥 좋은 선택지는 아닌것 같고 평균 커버리지가 30x 이상 확보된다면 NECAT, Canu, NextDenovo, Smartdenovo가 더 나은것 같다 정도 되겠습니다.

(사실 위의 tool들을 실행시키려면 평균 30x 이상은 있어야 작동을 합니다. 안그러면 작동안하던지 말도안되는 결과들을 뱉어내곤 합니다.)


그리고 시간이 충분했는지 각 assembler 결과들을 병합/후처리하는 작업을 하여 더 나은 assembly 결과를 보여주는지 테스트 했고 몇몇 조합에서 결과물이 향상된것을 확인했다는데... dramatically 좋은 결과는 보여주지 않은것 같았습니다. 

만약 병합/후처리하는 결과가 좋았다면 논문 결과가 single assembler 쓰지말고 ensemble방법을 추천드립니다라고 했었을테니 말이죠.. 



출처: @candyz_hyojung


일요일, 11월 10, 2019

저쪽집이 좋지만 우리집도 잘해요, 시퀀싱

가능하면 일주일에 하나씩은 업데이트 하려고 했는데 여윽시..
그건 어려운것 같네요 ㅎㅎ
그래도 되는대로 논문읽고 일주일에 한번씩 업데이트 하는걸로 :)


오늘은 금년 6월달에 남중국과학대학에서 Scientific reports에 투고한 논문 되겠습니다.

제목은 Systematic comparison of germline variant calling pipelines cross multiple next-generation sequencers >여기를 방문하세요<

현존하는 1빠 시퀀서대비 가격도 저렴 시약도 저렴한  BGISEQ과 MGISEQ 성능 비교 테스트인데 결론은 왜 Strelka2가 적절한 분석 파이프라인으로 권장한다인지..

-일단 BGISEQ과 MGISEQ의 라이브러리 제작 및 시퀀서 방식을 뒤로하고 성능만 봅니다.
덤으로 Tianhe-2라는 슈퍼컴퓨터 자랑도 -


3개 콜러(GATK4, Strelka2, Samtools-Varscan2)를 가지고 WES, WGS를 비교해보니 WES데이터는 시퀀서 및 콜러별로 높은 일치성을 보이는 반면 WGS는 그러지 못했습니다(니들도 WGS가 WES처럼 높은 일치성을 보일거라고 생각안했잖아ㅋㅋ 어디서 약을.. 그래도 논문은 나왔기에 괜찮습니다 Orz )




Figure 1. 우리는 여러분이 가장 많이 사용하고 권장하는 콜러를 지금 있는 그대로 분석을 돌려봤습니다.


Sequencing Samples Bases(Gbp) Read(x106) Clean rare >Q20 >Q30 GC Mean coverage
BGISEQ500-WES 29.41 294.3 0.41% 96.72% 89.14% 49.75%  328.49X
MGISEQ2000-WES 16.34 163.55 0.25% 98.18% 92.08% 49.71%  129.40X
HiSeq4000-WES 41.93 283.7 4.46% 97.36% 93.01% 50.63%  395.17X
NovaSeq-WES 25.88 178.87 2.25% 95.33% 92.67% 49.73%  241.52X
BGISEQ500-WGS 126.86 1270.02 1.76% 93.73% 83.33% 41.76%  41.03X
MGISEQ2000-WGS 137.36 1374.87 0.21% 96.17% 88.19% 41.76%  45.13X
HiSeq4000-WGS 191 1276.1 8.25% 95.90% 90.11% 41.69%  58.00X
NovaSeq-WGS 98.3 657.45 1.28% 95.89% 93.86% 41.61%  28.96X
HiSeq Xten-WGS 134 894.58 7.29% 94.50% 87.63% 40.71%  38.93X
Table 1. 우리 필요한 만큼 시퀀싱 잘 했어요

Figure 4,5 WES관련 작업 시간 및 결과 정리
Figure 6,7 WGS관련 작업 시간 및 결과 정리
(이미지 생략)

그래서 WES와 WGS를 각각 콜러의 조합에서 분석한 결과 SNP는 일관적으로 잘 call하였고 InDel은 일관적이지 못했다.
플랫폼별로 보면 SNP는 BGI플랫폼이 InDel은 일루미나 플랫폼이 더 나았다.
이거슨 시퀀싱할때 read 길이를 BGI 플랫폼과 illumina 플랫폼의 길이를 각각 100PE, 150PE로 해서 그렇다는 이유를... (그럼 왜 BGI플랫폼은 150PE로 안하고..??)

그리고 시퀀싱 뎁스 운운하는데.. 결론은 추가테스트 및 다른 분들이 더 해줬으면 하는걸로..
그리고 각 플랫폼에서 분석 툴의 성능 비교는 Strelka2가 다른 2개 분석 방법도나 나은걸로
순위를 따지자면 Strelka2 > GATK > Samtools-VarScan(SV) (모 다들 예상하셨다 싶이..)
InDel을 call하는 결과가 좀 차이가 있었는데 NovaSeq-SV에서 23개의 small variant를 call했는데반해 X-Ten-SV에서는861개의 small variant을 call했.. (BGI플랫폼은 갑자기 사라지고..)
그리고 마무리는 germline의 SNP, InDel call 능력은 높은 일치성이 있는 걸로 마무으리~

종합적으로 Strelka2가 최적의 분석 파이프 라인
응? 이거 시퀀서 비교 아니었어?
응 아니야, Strelka2 좋아요 꾹! 구독아니 github 꾹!
결국 이렇다고합니다.

이 논문의 의의는 테스트 해볼 비교 set이 생겼다는것에 ...  :)


출처: @sana_twice.09