레이블이 Telomere to Telomere.인 게시물을 표시합니다. 모든 게시물 표시
레이블이 Telomere to Telomere.인 게시물을 표시합니다. 모든 게시물 표시

월요일, 12월 30, 2024

인간 유전체의 새로운 지평을 열다: 더 완벽하고 다양한 인간 게놈 지도를 향하여

오늘은 조금 더 진일보한 인간 유전체에 대한 논문을 가져와봤습니다. 제목은 Complex genetic variation in nearly complete human genomes 입니다.

DOI: 10.1101/2024.09.24.614721

아직 biorxiv에 있는 논문이긴 한데 아마 조만간 다른 저널지에 공개되거나, 공개되었을 수도 있을듯합니다. ㅎㅎ 

T2T 버전이 세상에 나온지 시간이 흘렀지만 아직 많이 사용하고 있지 않는것은 아마 GRCh38이 나왔을때도 있지않았나 싶습니다.

이번 논문은 T2T로 끝나는 것이 아닌 haplotype기준으로 T2T 수준의 genome 품질을 가진 reference를 구축했다는 것이 차별점이지 않나 싶네요


gemini

## 인간 게놈 프로젝트의 새로운 도약: 더 완벽하고 다양한 인간 게놈 지도를 향하여

**인간 게놈 프로젝트**는 인간의 모든 유전 정보를 해독하여 지도로 만드는 거대한 과학 프로젝트입니다. 이 프로젝트는 2003년에 완료되었지만, 당시 기술의 한계로 인해 완벽한 인간 게놈 지도를 얻는 데는 실패했습니다. 

하지만 기술의 발전과 함께, 과학자들은 끊임없이 더 완벽한 인간 게놈 지도를 만들기 위해 노력해왔습니다. 그리고 이번 논문에서 그 노력의 결실을 확인할 수 있습니다. 이 논문은 **가장 완벽에 가까운 인간 게놈 지도**를 제시하며, 인간 유전체의 복잡성을 이해하는 데 새로운 지평을 열었습니다.

### 기존 인간 게놈과의 차이점

1. **더 완벽한 지도**: 기존의 인간 게놈 지도에는 기술적인 한계로 인해 많은 공백과 오류가 존재했습니다. 이번 논문에서는 65개의 다양한 인간 게놈을 분석하고 130개의 반수체 분해 조립을 구축하여 이전 지도의 **92%의 공백을 채우고**, 염색체의 39%에 대해 **텔로미어-투-텔로미어(T2T) 상태**에 도달했습니다. 즉, 염색체의 양 끝단까지 완벽하게 해독했다는 의미입니다.

2. **복잡한 유전자좌의 완전한 서열**: MHC, SMN1/SMN2, NBPF8, AMY1/AMY2 등 복잡한 유전자좌의 **완전한 서열 연속성**을 확보했습니다. 이는 질병과 관련된 유전자 연구에 매우 중요한 정보를 제공합니다.

3. **구조적 변이의 해결**: 1,852개의 복잡한 구조 변형(SV)을 완전히 해결했습니다. 구조적 변이는 유전체의 큰 부분이 뒤집히거나, 중복되거나, 삭제되는 등의 변화를 의미하며, 암, 자폐증 등 다양한 질병과 관련이 있습니다.

4. **인간 중심체의 조립**: 1,246개의 인간 중심체를 완전히 조립하고 검증했습니다. 중심체는 세포 분열에 필수적인 역할을 하며, 염색체의 구조와 기능을 이해하는 데 중요합니다.

### 새로운 게놈 지도의 장점

1. **질병 연구의 발전**: 새로운 게놈 지도는 질병과 관련된 유전적 변이를 더욱 정확하게 파악할 수 있게 해줍니다. 이는 질병의 예측, 진단, 치료에 혁신적인 발전을 가져올 수 있습니다.

2. **개인 맞춤형 의료**: 개인의 유전 정보에 기반한 맞춤형 의료 시대를 앞당길 수 있습니다. 개인별 유전적 특징을 고려하여 약물 처방, 질병 예방 등을 맞춤형으로 제공할 수 있습니다.

3. **인간 진화 연구**: 인간 게놈의 다양성을 더욱 심층적으로 이해하고, 인간 진화의 역사를 밝히는 데 기여할 수 있습니다.

4. **유전체 연구의 새로운 도구**: 짧은 판독 데이터에서 유전자형 분석의 정확도를 높이고 전체 게놈 추론을 가능하게 합니다. 이는 유전체 연구의 효율성을 높이고 새로운 발견을 가속화할 수 있습니다.

### 결론

이 논문에서 제시된 새로운 인간 게놈 지도는 인간 유전체학 분야의 중요한 발전입니다. 이는 인간 게놈의 복잡한 구조적 변이에 대한 이해를 높이고 질병과의 연관성을 밝히는 데 도움이 될 뿐만 아니라, 개인 맞춤형 의료 시대를 열고 인간 진화 연구에 새로운 가능성을 제시할 것입니다.



clova-x

이번에 저희 연구팀에서 발표한 논문은 인간 유전체의 복잡함에 대한 내용을 담고 있습니다. 인간 유전체는 약 30억 개의 염기쌍으로 이루어져 있으며, 이는 지구상에서 가장 복잡한 생명체의 유전체 중 하나입니다.

이번 연구에서는 65개의 다양한 인간 게놈을 시퀀싱하고, 130개의 haplotype-resolved 어셈블리를 구축했습니다. 이는 기존의 Human Genome과는 몇 가지 면에서 차이가 있습니다.

첫째, 이번에 구축한 어셈블리는 기존의 Human Genome보다 더 높은 품질의 유전체 데이터를 제공합니다. 기존의 Human Genome은 일부 구간에서 불완전한 정보를 가지고 있었지만, 이번에 구축한 어셈블리는 거의 모든 구간에서 완전한 정보를 제공합니다.

둘째, 이번 어셈블리는 기존의 Human Genome보다 더 정확한 변이 정보를 제공합니다. 변이 정보는 유전체 연구에서 매우 중요한 역할을 하는데, 이번 어셈블리를 통해 더 정확한 변이 정보를 얻을 수 있게 되었습니다.

셋째, 이번 어셈블리를 통해 기존에는 파악하기 어려웠던 복잡한 구조적 변이를 완전히 밝힐 수 있었습니다. 예를 들어, MHC, SMN1/SMN2, NBPF8, AMY1/AMY2 등의 복잡한 위치를 포함한 많은 구조적 변이를 밝혀냈습니다.

이러한 고품질의 유전체 데이터를 사용하면 다양한 분야에서 많은 이점을 얻을 수 있습니다. 예를 들어, 의학 분야에서는 질병의 원인을 더 정확하게 파악할 수 있고, 치료법 개발에도 큰 도움이 될 수 있습니다. 또한, 생물학 분야에서는 생명체의 진화와 발달 과정을 더 깊이 이해할 수 있고, 환경과의 상호작용을 파악하는 데에도 큰 도움이 될 수 있습니다.

저희 연구팀은 이번 연구를 통해 인간 유전체의 복잡함을 더욱 깊이 이해하게 되었으며, 앞으로도 지속적인 연구를 통해 더 많은 지식을 쌓아 나갈 것입니다. 이를 통해 인류의 건강과 복지에 기여할 수 있기를 기대합니다.



chatGPT

### 블로그 포스트: 새로운 인간 유전체 데이터로 무엇을 알 수 있을까요?  

인간 유전체(Human Genome)는 우리가 생명과 질병에 대해 이해할 수 있는 가장 기본적인 정보입니다. 기존의 인간 유전체 연구들은 많은 성과를 냈지만, 여전히 복잡한 구조적 변이를 완벽히 다루지 못하거나, 특정 어려운 영역에 대한 정보가 부족하다는 한계가 있었습니다. 이번에 발표된 연구에서는 기존 유전체보다 훨씬 더 정밀하고 완전한 데이터를 통해 이러한 문제를 해결하고자 했습니다.

---

#### **1. 기존 인간 유전체와 무엇이 다른가요?**  

기존 인간 유전체는 주로 단일 기술 기반으로 조립되었으며, 일부 복잡한 영역에서는 데이터가 불완전했습니다. 이번 연구에서 사용한 유전체는 다음과 같은 점에서 다릅니다:

1. **두 가지 기술의 결합**:

   - PacBio HiFi 기술: 짧지만 정확도가 높은 DNA 읽기(read)를 제공합니다.

   - Oxford Nanopore 기술: 길이는 길지만 정확도가 낮은 DNA 읽기를 제공합니다.

   - 두 기술을 결합하여 기존보다 훨씬 완전한 데이터로 유전체를 조립할 수 있었습니다.

2. **유전체의 공백 해결**:

   - 기존 유전체에서 데이터가 없었던 92%의 영역을 채웠으며, 염색체의 약 39%를 끝에서 끝까지(telomere-to-telomere) 완전히 조립했습니다.

3. **복잡한 변이 분석**:

   - 구조적 변이(예: 삽입, 결실, 역위 등)를 26,000개 이상 탐지했습니다.

   - 주요 복잡한 영역(예: 면역과 관련된 MHC, SMN1/SMN2, AMY1/AMY2 등)의 완전한 유전체 데이터를 확보했습니다.

---

#### **2. 새로운 유전체 데이터를 사용하면 어떤 점이 좋을까요?**

1. **질병 연구 및 진단 개선**:

   - 기존에 탐지되지 않았던 변이를 새롭게 찾아냄으로써 질병과 관련된 유전적 요인을 더 정확히 파악할 수 있습니다.

   - 예를 들어, 유전적으로 손상되기 쉬운 센트로미어와 같은 영역이 더 잘 이해되며, 이 데이터는 희귀 질환 연구에 특히 유용합니다.

2. **더 나은 유전자 변이 탐지**:

   - 기존 데이터와 비교해 35% 이상 더 많은 변이를 탐지했습니다.

   - 이러한 데이터는 희귀 변이나 인구별로 특이한 유전적 특징을 연구하는 데 도움이 됩니다.

3. **개인 맞춤형 의학**:

   - 유전 정보를 기반으로 개인 맞춤형 질병 예측 및 치료가 가능해집니다.

   - 특히, 아프리카, 유럽, 아시아 등 다양한 인구 그룹에서 데이터를 확보해 다양한 유전적 배경을 반영할 수 있습니다.

4. **더 나은 참조 유전체 제공**:

   - 기존의 GRCh38 유전체 참조보다 완전한 데이터로 연구자들에게 더 정확한 기준을 제공합니다.

   - 이 데이터를 활용하면 질병 관련 연구와 약물 개발 속도를 높일 수 있습니다.

---

#### **3. 우리가 알아야 할 점**  

이 연구는 유전체 연구의 새로운 기준을 세웠습니다. 기존의 인간 유전체는 여러 한계가 있었지만, 이번 연구를 통해 유전체의 복잡한 구조적 변이를 이해하고, 공백을 메우며, 질병과 유전적 요인 간의 관계를 명확히 할 수 있게 되었습니다.  

새로운 데이터는 질병 예측, 유전자 편집, 개인 맞춤형 치료 등 다양한 분야에서 큰 발전을 가져올 것입니다. 앞으로 이러한 연구가 일반인의 건강과 삶의 질 향상에 어떤 영향을 미칠지 기대가 됩니다.

---

이 새로운 인간 유전체 데이터는 연구자들에게는 도구를, 일반인들에게는 희망을 제공하는 중요한 성과입니다. 지금은 과학 기술이 우리의 건강과 미래를 어떻게 바꾸고 있는지 지켜보기에 가장 좋은 시기입니다.



NotebookLM

## 인간 유전체의 새로운 지평을 열다: 더욱 완벽해진 인간 유전체 데이터

**인간 유전체 프로젝트는 생명체의 설계도를 이해하기 위한 웅장한 과학적 여정입니다. 과학자들은 수십 년간 인간 DNA의 30억 개가 넘는 염기쌍 서열을 밝혀내기 위해 노력해 왔습니다.** 이러한 노력의 결과로 인간 유전체의 초기 지도가 만들어졌지만, 기술적인 한계로 인해 완벽하지 못했습니다. **최근 롱리드 시퀀싱 기술의 발전은 이전에는 접근할 수 없었던 인간 유전체 영역을 탐험할 수 있는 새로운 가능성을 열었습니다.**

**이 논문에서는 65개의 다양한 인간 샘플에서 130개의 haplotype-resolved 유전체를 생성하기 위해 PacBio HiFi 및 ONT 롱리드 시퀀싱 기술을 결합한 최첨단 연구를 소개합니다.** **이 연구의 핵심은 기존 인간 유전체 데이터와 비교하여 훨씬 향상된 품질과 완성도를 자랑하는 새로운 유전체 데이터를 제공한다는 것입니다.**

### 기존 인간 유전체 데이터의 한계

초기 인간 유전체 데이터는 쇼트리드 시퀀싱 기술을 기반으로 제작되었습니다. 이 기술은 짧은 DNA 조각을 읽어내는 데 효과적이지만, 반복적인 서열이나 복잡한 구조 변이가 많은 영역을 정확하게 조립하는 데 어려움을 겪었습니다. **결과적으로 초기 유전체 데이터는 수많은 갭과 오류를 포함하고 있었으며, 이는 유전체의 완전한 이해를 방해하는 요소로 작용했습니다.**

### 새로운 유전체 데이터의 혁신

**이 연구에서 제시된 새로운 유전체 데이터는 롱리드 시퀀싱 기술을 사용하여 이러한 한계를 극복했습니다.** 롱리드 시퀀싱은 훨씬 긴 DNA 조각을 읽어낼 수 있어, 반복적인 서열이 많은 영역도 정확하게 조립할 수 있습니다. 또한, **연구진은 Strand-seq와 같은 다양한 기술을 활용하여 유전체의 haplotype을 정확하게 구분하고 phasing하는 데 성공했습니다.**

**그 결과, 새로운 유전체 데이터는 기존 데이터보다 92% 이상의 갭을 줄였으며, 이전에는 완전히 해결되지 않았던 유전체 영역, 즉 centromere, SMN1/SMN2, MHC와 같은 복잡한 영역을 완벽하게 밝혀냈습니다.** 특히 centromere는 염색체 분열에 필수적인 역할을 하지만, 반복적인 서열이 매우 많아 분석이 어려웠던 영역입니다. **이 연구에서는 1,246개의 centromere를 완전히 조립하여 인간 유전체 다양성에 대한 이해를 넓혔습니다.**

### 새로운 유전체 데이터의 활용

**더욱 완벽해진 새로운 유전체 데이터는 인간 유전체 연구에 광범위한 영향을 미칠 것으로 기대됩니다.** 

* **첫째, 질병과 관련된 유전적 변이를 더욱 정확하게 식별할 수 있습니다.** 이는 개인 맞춤형 의료, 질병 예측 및 새로운 치료법 개발에 기여할 수 있습니다.

* **둘째, 인간 진화와 집단 유전학 연구에 새로운 통찰력을 제공할 수 있습니다.** 예를 들어, 이 연구에서는 아프리카 계통의 유전체가 비 아프리카 계통의 유전체보다 더 많은 segmental duplication을 가지고 있음을 밝혀냈습니다. 이는 인간 집단의 유전적 다양성을 이해하는 데 중요한 정보입니다.

* **셋째, 단편 서열 데이터에서도 더 많은 유전적 변이를 효율적으로 분석할 수 있습니다.** 이 연구에서는 PanGenie라는 새로운 도구를 사용하여 쇼트리드 시퀀싱 데이터에서도 26,115개의 구조적 변이를 검출할 수 있음을 보여주었습니다. 이는 대규모 유전체 연구를 더욱 효율적으로 수행할 수 있게 해 줄 것입니다.

### 결론

**이 논문에서 제시된 새로운 유전체 데이터는 인간 유전체 프로젝트의 중요한 진전입니다.** 더욱 완벽하고 정확한 유전체 데이터는 인간 유전체에 대한 이해를 넓히고, 질병 연구, 진화 연구, 집단 유전학 연구 등 다양한 분야에 새로운 가능성을 열어줄 것입니다.


기존에는 GRCh37, GRCh38과 같이 한개 reference를 사용해서 분석을 했는데, 이제는 130개의 haplotype 서열들을 reference를 사용해서 좀 더 정확한 분석 결과를 얻을 수 있게 되지 않나 싶습니다. 대신 여러개의 reference 결과를 어떻게 merge하는지는 저도 아직 잘 모르겠네요 :)

조만간 시간이 되면 기술적인 내용도 한번 다뤄보도록 하겠습니다.

오늘 글로 24년도를 마무리하려고 합니다.

25년에도 좋은 논문들로 또 봐요~ 제발~ :)



출처: @ye._.vely618