레이블이 일루미나인 게시물을 표시합니다. 모든 게시물 표시
레이블이 일루미나인 게시물을 표시합니다. 모든 게시물 표시

수요일, 11월 20, 2024

비침습적 산전 검사(NIPT)에 대한 모든 것: VeriSeq 연구를 중심으로

간만에 비침습적 산전 검사, NIPT/NIPS 논문을 가져와봤습니다. 제목은 Performance of cell-free DNA sequencing-based non-invasive prenatal testing: experience on 36,456 singleton and multiple pregnancies 으로 21년도 최근에 나온 논문인데 NIPT/NIPS의 유용성이라기 보다는 일루미나의 VeriSeq을 홍보하기 위한 논문으로 보시면 되겠습니다. 

DOI: 10.1186/s12920-021-00941-y


gemini

## 비침습적 산전 검사(NIPT)에 대한 모든 것: VeriSeq 연구를 중심으로

### NIPT란 무엇일까요?

NIPT는 **임산부의 혈액**을 통해 태아의 염색체 이상 유무를 확인하는 검사입니다. 과거에는 태아에게 직접적인 영향을 줄 수 있는 침습적인 방법으로 검사했지만, NIPT는 **안전하고 정확하게** 태아의 건강을 확인할 수 있다는 장점이 있습니다.

### WGS 기반 NIPT는 어떻게 작동할까요?

**WGS**는 **전체 유전체 염기서열 분석**을 의미합니다. 즉, 태아의 DNA를 구성하는 모든 염기서열을 읽어서 분석하는 것이죠. NIPT는 산모 혈액 속에 떠다니는 아주 작은 조각의 태아 DNA를 분석하여 염색체 이상 유무를 판단합니다.

### VeriSeq NIPT는 어떤 검사일까요?

**VeriSeq**는 Illumina라는 회사에서 개발한 NIPT 분석 시스템입니다. 이 시스템은 **NextSeq 550**이라는 장비를 사용하여 태아의 DNA를 정밀하게 분석합니다.

### VeriSeq의 장점은 무엇일까요?

* **정확도**: 연구 결과, VeriSeq는 다운증후군, 에드워드 증후군, 파타우 증후군과 같은 주요 염색체 이상을 거의 100% 정확하게 찾아냈습니다.

* **안전성**: 산모의 혈액만을 사용하므로 태아에게 전혀 해를 끼치지 않습니다.

* **효율성**: 명확한 분석 과정을 통해 빠르고 정확하게 결과를 얻을 수 있습니다.

### VeriSeq의 단점은 무엇일까요?

* **비용**: 다른 산전 검사에 비해 비용이 다소 높을 수 있습니다.

* **제한적인 검사 항목**: 현재는 주요 염색체 이상에 대한 검사에 집중되어 있습니다.

### VeriSeq와 다른 NIPT 검사의 차이점은 무엇일까요?

기존의 NIPT 검사도 있지만, VeriSeq는 **표준화된 분석 과정**과 **정밀한 장비**를 통해 더욱 **정확하고 신뢰할 수 있는 결과**를 제공합니다.

### 연구 결과는 어떻게 해석해야 할까요?

이 연구는 VeriSeq이 **대규모 임산부를 대상으로 매우 높은 정확도**를 보였다는 것을 입증했습니다. 특히, **다태아 임신**에서도 우수한 성능을 보여 더욱 의미가 큽니다.

## 결론

VeriSeq NIPT는 **안전하고 정확하며 효율적인** 태아 염색체 이상 검사 방법입니다. 임산부는 VeriSeq을 통해 태아의 건강을 미리 확인하고 안심할 수 있습니다.

**주의:** NIPT는 **선별 검사**이며, 정확한 진단을 위해서는 추가적인 검사가 필요할 수 있습니다. 검사 결과에 대한 궁금한 점은 담당 의사와 상담해야 합니다.

**간단히 정리하면:**

* NIPT는 산모 혈액으로 태아의 염색체 이상을 확인하는 검사입니다.

* VeriSeq는 NIPT 분석 시스템 중 하나로 정확도가 높습니다.

* VeriSeq은 안전하고 효과적인 검사 방법입니다.

* 검사 결과에 대한 자세한 내용은 의사와 상담해야 합니다.



clova-x

비침습적 산전 검사(NIPT)는 산모의 혈액을 통해 태아의 염색체 이상을 진단하는 검사입니다. 그 중에서도 WGS 기반의 NIPT는 가장 정확하고 민감한 검사로 알려져 있습니다.

이번 연구에서는 VeriSeq이라는 WGS 기반의 NIPT를 사용하여 단태아와 쌍태아의 염색체 이상을 진단하였습니다. 이 검사는 산모의 혈액에서 추출한 세포 유리 DNA를 분석하여 태아의 염색체 이상을 감지합니다.

VeriSeq은 염색체 이상을 감지하기 위해 Likelihood Ratio(LLR) 점수를 계산합니다. 이 점수는 태아의 염색체 이상 여부를 판단하는 데 사용됩니다. 연구 결과, VeriSeq은 단태아와 쌍태아 모두에서 높은 정확도와 민감도를 보였습니다. 특히, 다운 증후군, 에드워드 증후군, 파타우 증후군 및 성염색체 이상을 감지하는 데 있어 높은 정확도를 나타냈습니다.

이 기술의 장점은 높은 정확도와 민감도를 가지고 있어 태아의 염색체 이상을 조기에 발견할 수 있다는 점입니다. 또한, 산모와 태아에게 안전한 비침습적 검사이기 때문에 불필요한 침습적 검사를 줄일 수 있습니다. 그러나 비용이 상대적으로 비싸고, 검사 결과가 나오기까지 시간이 걸린다는 단점이 있습니다.

기존의 WGS 기반 NIPT와 비교했을 때, VeriSeq은 더 높은 정확도와 민감도를 보입니다. 또한, 단태아뿐만 아니라 쌍태아에서도 높은 성능을 보여줍니다. 따라서, 태아의 염색체 이상을 진단하는 데 있어 매우 유용한 검사라고 할 수 있습니다.



chatGPT

### 이해하기 쉬운 비침습적 산전 검사(NIPT) 이야기: VeriSeq와 기존 WGS 기반 NIPT의 차이점과 성능 비교

최근 비침습적 산전 검사(NIPT)는 많은 임산부들이 선택하는 중요한 산전 검사로 자리 잡았습니다. 비침습적이라는 말처럼, 이 검사는 단순히 임산부의 혈액만으로도 태아의 건강 상태를 확인할 수 있어 안전하고 효과적인 검진 방식입니다. 이번 블로그에서는 특히 **VeriSeq**라는 최신 검사 방식과 기존의 **전장 유전체 시퀀싱(WGS) 기반 NIPT**의 차이점과 장단점을 살펴보도록 하겠습니다.

### WGS 기반 비침습적 산전 검사(NIPT)란?

먼저, WGS 기반 NIPT란 임산부의 혈액에서 태아의 DNA를 분석해 태아의 염색체 이상을 조기에 발견하는 검사입니다. 기존 WGS 기반 NIPT는 **21번, 18번, 13번 염색체**와 같은 특정 염색체 이상을 주로 검사합니다. 대표적인 예로 다운증후군(21번 삼염색체), 에드워즈증후군(18번 삼염색체), 파타우증후군(13번 삼염색체) 등이 있습니다. 

이 WGS 기반 NIPT는 태아의 DNA 정보를 전반적으로 분석해 중요한 염색체 이상 여부를 알려줍니다. 그러나 VeriSeq는 기존 WGS와 비교해 더 높은 성능과 신뢰성을 제공하는 것이 특징입니다.

### VeriSeq의 장점과 차별점

VeriSeq는 **Illumina**에서 개발한 고성능 WGS 기반 NIPT 솔루션으로, 기존 NIPT보다 개선된 성능을 자랑합니다. 아래는 VeriSeq의 주요 장점입니다.

1. **높은 정확도**  

   VeriSeq는 태아의 염색체 이상을 매우 정확하게 검출할 수 있는 기술입니다. 연구 결과에 따르면 다운증후군, 에드워즈증후군, 파타우증후군에 대한 민감도가 **100%**에 달하는 등 높은 신뢰성을 보여줍니다. 또한 VeriSeq는 성염색체 이상(SCA) 검출에서도 우수한 성능을 보입니다.

2. **다태 임신에서의 적용성**  

   기존 WGS 기반 NIPT는 단태 임신에 최적화되어 있어 다태 임신(쌍둥이, 삼태아 등)에서는 정확도가 떨어질 수 있습니다. 반면 VeriSeq는 다태 임신에서도 높은 신뢰도를 유지해 여러 태아의 염색체 이상 여부를 각각 분석하고 결과를 제공할 수 있습니다. 

3. **조기 발견 가능**  

   VeriSeq는 임신 9주차부터 사용할 수 있어, 태아의 상태를 조기에 확인하는 데 유용합니다. 특히 초기 단계에 태아의 건강 상태를 알 수 있어 임산부에게 큰 안도감을 줄 수 있습니다.

4. **낮은 재검사 비율**  

   VeriSeq는 검사의 신뢰성과 표준화된 품질 관리 절차를 통해 첫 검사 실패율이 낮습니다. 따라서 불필요한 재검사를 줄일 수 있어 검사의 효율성을 높입니다.

### VeriSeq의 한계

VeriSeq가 가진 장점에도 불구하고 일부 한계도 존재합니다.

- **비용**: WGS 기반의 검사는 데이터 분석이 복잡하고 기술적 요구사항이 높아 비용이 상대적으로 비쌉니다.

- **특정 유전자 변이 탐지의 제한**: VeriSeq는 주로 큰 염색체 이상에 대한 검출이 강점이므로, 세밀한 유전자 변이까지는 탐지하기 어렵습니다.

### 결론: VeriSeq는 안전하고 신뢰성 높은 선택

VeriSeq는 기존 WGS 기반 NIPT보다 더 높은 정확도와 안정성을 자랑하며, 특히 다태 임신에서도 신뢰할 수 있는 결과를 제공합니다. 임신 초기부터 태아의 건강 상태를 안전하게 확인할 수 있어, 임산부가 불필요한 침습적 검사 없이도 태아의 염색체 이상 여부를 안심하고 확인할 수 있습니다. 

이와 같은 이유로 VeriSeq는 비침습적 산전 검사(NIPT)를 고려하는 모든 임산부에게 효과적이고 신뢰성 있는 선택지가 될 수 있습니다.



NotebookLM

## 일반인도 이해하는 비침습적 산전 검사(NIPT): WGS 기반 VeriSeq NIPT

**비침습적 산전 검사(NIPT)**는 임산부 혈액에서 태아의 DNA를 분석하여 태아의 염색체 이상 여부를 확인하는 검사입니다. 과거에는 염색체 이상을 확인하기 위해 양수검사나 융모막 검사와 같은 침습적 검사를 시행했는데, 이러한 검사들은 유산의 위험을 동반했습니다. 하지만 NIPT는 임산부 혈액만을 채취하기 때문에 침습적 검사에 비해 안전하며 높은 정확도를 가지고 있어 최근 산전 검사 분야에서 혁신적인 기술로 주목받고 있습니다. 

본 논문에서는 WGS 기반의 NIPT 기술 중 하나인 VeriSeq NIPT Solution v1을 이용하여 태아의 21번, 18번, 13번 삼염색체증과 성염색체 이상을 검사한 결과를 보고하고 있습니다.

### 1. WGS 기반 NIPT란 무엇인가요?

**WGS(Whole Genome Sequencing)**는 유전체 전체의 DNA 염기서열을 분석하는 기술입니다. WGS 기반 NIPT는 임산부 혈액에서 추출한 cfDNA를 WGS 기술로 분석하여 태아의 염색체 이상을 검출합니다. 

기존의 NIPT 검사는 특정 염색체만을 분석하는 표적 염기서열 분석 (Targeted Sequencing) 방식을 사용했습니다. 반면, WGS 기반 NIPT는 전체 유전체를 분석하기 때문에 더 많은 정보를 얻을 수 있다는 장점이 있습니다.

### 2. VeriSeq NIPT의 장단점

#### 장점

* **높은 정확도:** VeriSeq NIPT는 21번, 18번, 13번 삼염색체증과 성염색체 이상을 검사하는 데 높은 정확도를 보여줍니다.

* **낮은 위양성률:** VeriSeq NIPT는 위양성률이 매우 낮아 불필요한 침습적 검사를 줄일 수 있습니다.

* **다태아 임신에도 적용 가능:** VeriSeq NIPT는 단태아뿐만 아니라 쌍둥이와 같은 다태아 임신에도 적용할 수 있습니다.

* **태아 DNA 비율 측정:** VeriSeq NIPT는 태아 DNA 비율을 정확하게 측정할 수 있어 검사의 정확도를 높입니다.

* **광범위한 염색체 이상 검출 가능성:** WGS 기반 NIPT는 표적 염기서열 분석 방식보다 더 많은 유전 정보를 분석하기 때문에 염색체 미세결실/중복 증후군과 같은 다른 염색체 이상을 검출할 수 있는 가능성을 제공합니다.

#### 단점

* **검사 비용:** WGS 기반 NIPT는 기존의 표적 염기서열 분석 방식보다 검사 비용이 높을 수 있습니다. (출처에서 언급되지 않음)

* **검사 결과 해석의 복잡성:** WGS 기반 NIPT는 방대한 유전 정보를 분석하기 때문에 결과 해석이 복잡할 수 있으며, 전문적인 지식을 요구합니다. (출처에서 언급되지 않음)

### 3. 기존 WGS 기반 NIPT와 VeriSeq의 차이점 및 성능 비교

기존 WGS 기반 NIPT와 VeriSeq의 차이점은 본 논문에서 명확하게 제시되지 않았습니다. 하지만 VeriSeq NIPT는 다음과 같은 특징을 가지고 있어 기존 WGS 기반 NIPT보다 향상된 성능을 보여줄 수 있습니다.

* **읽기 길이 및 적용 범위 프로필 기반 태아 DNA 비율 추정 기능:** VeriSeq NIPT는 읽기 길이와 적용 범위 프로필을 기반으로 태아 DNA 비율을 정확하게 추정할 수 있습니다.

* **비표적 염색체의 이수성 영향 고려:** VeriSeq NIPT는 비표적 염색체의 이수성이 이수성 점수에 미치는 영향을 고려하여 분석합니다.

* **이수성 점수와 태아 DNA 비율 추정치 비교 기능:** VeriSeq NIPT는 이수성 점수와 태아 DNA 비율 추정치를 비교하여 분석의 정확도를 높입니다.

### 4. VeriSeq NIPT 연구 결과

* **높은 검출률:** 본 연구에서 VeriSeq NIPT는 36,456명의 임산부를 대상으로 검사를 시행한 결과 21번, 18번, 13번 삼염색체증과 성염색체 이상에 대해 높은 검출률을 보였습니다.

* **낮은 위양성률:** VeriSeq NIPT는 위양성률이 매우 낮아 불필요한 침습적 검사를 최소화할 수 있었습니다.

* **다태아 임신에서도 우수한 성능:** VeriSeq NIPT는 쌍둥이 임신에서도 높은 정확도를 보였으며, 검사 실패율 또한 낮았습니다.

### 5. 결론

VeriSeq NIPT는 높은 정확도와 낮은 위양성률을 가진 WGS 기반 NIPT 기술로, 단태아 및 다태아 임신에서 태아의 염색체 이상을 효과적으로 검사할 수 있습니다. 이는 임산부들이 안전하고 정확하게 태아의 건강 상태를 확인할 수 있도록 돕는 중요한 기술입니다. 


음.. 전반적으로 LLM 엄지척 이긴한데, 어차피 VeriSeq이나 WGS(Shallow/Low-Pass)이랑 동일한것인데 이걸 비교해서 설명해달라고 하니 어거지로 비교를 하다보니 이상한 내용들이 좀 들어가 있는 듯합니다.

VeriSeq이 쌍태아에서도 확인한걸로 알고 있는데 검증 건수가 몇건인지는 잘 모르겠지만, 단태아 기준으로는 다국적으로 기존까지 있었던 검증 데이터 중에는 아마 King王짱일겁니다. 우리가 VreiSeq보다 더 오래 서비스했다라고 해도 지금까지 테스트한 데이터지 검증 데이터 개수로는.... "공식"적으로 표시할 수 있는 샘플 개수로는 아마 지금까지 없었고, 이후에는 할 필요가..... VeriSeq이 가격만 아름답게 매겨준다면...  (당연히 그러지 않겠지만 말입니다.)


여튼 NIPT/NIPS 검사를 키트화하여 판매하고 있는 VeriSeq를 이탈리아에서 수행한 검사 결과 논문 소개 였습니다. :)


출처: @ye._.vely618


화요일, 11월 12, 2024

DRAGEN: 더 빠르고 정확한 유전체 분석 방법

오늘은 최근에 공개된 일루미나의 DRAGEN에 대한 논문이 있어서 가져와봤습니다. Comprehensive genome analysis and variant detection at scale using DRAGEN 입니다.

DOI: 10.1038/s41587-024-02382-1


gemini

## 유전체 분석의 혁신, DRAGEN: 더 빠르고 정확하게!

DRAGEN이 어떻게 기존 유전체 분석 방법보다 더 빠르고 정확하게 변이를 검출하는지, 그리고 최근 도입된 pangenome을 이용한 mapping 방법이 어떻게 더 정확한 변이 검출을 가능하게 하는지 알려드리겠습니다.

### 왜 유전체 분석이 중요할까요?

우리 몸의 설계도라고 할 수 있는 DNA에는 수많은 유전 정보가 담겨 있습니다. 이 정보는 '염기'라는 부품들이 특정 순서로 배열되어 만들어지는데, 이 배열 순서에 변화가 생기는 것을 '변이'라고 합니다. 변이는 질병 발생, 개인의 특징, 약물 반응 등에 영향을 미칠 수 있습니다. 유전체 분석은 이러한 변이를 찾아내고 분석하여 질병 예측, 진단, 치료 등에 활용하는 기술입니다.

### DRAGEN은 무엇일까요?

DRAGEN은 일루미나에서 개발한 최첨단 유전체 분석 플랫폼입니다. 기존 분석 방법보다 훨씬 빠르고 정확하게 유전체 데이터를 분석할 수 있는 혁신적인 기술이죠. 

**DRAGEN의 장점:**

* **압도적인 속도:** FPGA라는 특수 하드웨어를 사용하여 기존 방법보다 최대 50배 빠르게 분석합니다. 

* **뛰어난 정확도:**  다중 유전체 매핑과 pangenome 참조를 통해 반복적인 유전체 영역에서도 정확하게 변이를 식별합니다.

* **포괄적인 분석:** 단일 염기 변이(SNV), 삽입/결실(indel), 구조 변이(SV), 복제수 변이(CNV) 등 다양한 유형의 변이를 분석할 수 있습니다.

* **의학 유전체 분석에 특화:**  질병 관련 유전자 분석에 특화된 방법을 통합하여 질병 연구에 유용합니다.

* **확장성:**  대규모 데이터 및 코호트 분석에 적합합니다.

**DRAGEN의 단점:**

* **높은 초기 비용:** FPGA 하드웨어 구축 비용이 상대적으로 높습니다.

* **전문 지식 필요:** DRAGEN 플랫폼 운영 및 결과 해석에 전문 지식이 필요할 수 있습니다.

### Pangenome을 이용한 Mapping이란 무엇일까요?

Pangenome은 다양한 사람들의 유전체 정보를 종합하여 만든 '유전체 지도'입니다. 기존에는 한 사람의 유전체 정보만을 참조로 사용했기 때문에, 사람들 간의 유전적 차이를 제대로 반영하지 못했습니다. Pangenome을 이용하면 더욱 정확하게 변이를 검출하고, 질병과의 연관성을 밝힐 수 있습니다.

**DRAGEN은 pangenome을 이용하여 변이 검출의 정확성을 더욱 높였습니다.** 마치 여러 사람의 지도를 참고하여 더 정확한 길을 찾는 것과 같은 원리입니다.

## Pangenome을 이용한 Mapping에 대한 심층 설명

**Pangenome**은 한 종 내 개체들의 유전체 정보를 종합하여 만든 거대한 참조 유전체입니다. 기존의 단일 참조 유전체를 사용하는 방식과 달리, pangenome은 다양한 개체들의 유전적 변이를 모두 포함하고 있어 더욱 정확한 변이 분석이 가능합니다.

### 왜 Pangenome이 필요할까요?

* **유전적 다양성 반영:** 인간은 유전적으로 매우 다양합니다. 기존의 단일 참조 유전체는 주로 특정 인종이나 집단의 유전체 정보를 기반으로 만들어졌기 때문에, 다른 집단의 개체에 대한 분석에서는 정확도가 떨어질 수 있습니다.

* **복잡한 유전체 구조 반영:** 인간 유전체는 매우 복잡하고 개인 간에 차이가 큽니다. 특히, 구조 변이(SV)와 같은 복잡한 변이를 정확하게 분석하기 위해서는 pangenome이 필요합니다.

* **희귀 변이 발견:** 희귀 변이는 질병과의 연관성을 밝히는 데 중요한 역할을 합니다. pangenome을 이용하면 기존 방법으로는 찾기 어려웠던 희귀 변이를 더 많이 발견할 수 있습니다.

### Pangenome을 이용한 Mapping의 장점

* **정확도 향상:** pangenome은 다양한 개체의 유전적 변이를 포함하고 있기 때문에, 개인의 유전체를 더욱 정확하게 비교하고 변이를 찾아낼 수 있습니다.

* **새로운 변이 발견:** 기존 참조 유전체에는 없는 새로운 변이를 발견할 가능성이 높습니다.

* **복잡한 유전체 구조 분석:** 구조 변이와 같은 복잡한 유전체 구조를 더욱 정확하게 분석할 수 있습니다.

* **다양한 인종 및 집단에 대한 분석:** 다양한 인종과 집단의 유전체 데이터를 분석하는 데 유용합니다. 

### DRAGEN은 어떻게 활용될까요?

DRAGEN은 멘델 질환, 희귀 질환, 암 등 다양한 질병 연구에 활용될 수 있습니다. 또한, 개인 맞춤형 의료, 약물 유전체학, 집단 유전체학 등 다양한 분야에서 유용하게 사용될 수 있습니다.

### DRAGEN과 Pangenome의 시너지 효과

DRAGEN은 pangenome을 이용한 mapping을 효율적으로 수행할 수 있도록 설계되었습니다. DRAGEN의 빠른 처리 속도와 정확도는 pangenome의 장점을 극대화하여 더욱 정확하고 포괄적인 유전체 분석을 가능하게 합니다.

* **빠른 분석:** DRAGEN의 FPGA 하드웨어는 대규모 pangenome 데이터를 빠르게 처리하여 분석 시간을 단축합니다.

* **정확한 변이 호출:** pangenome을 기반으로 더욱 정확한 변이 호출을 수행합니다.

* **복잡한 변이 분석:** 구조 변이와 같은 복잡한 변이를 효율적으로 분석합니다. 

### 결론

DRAGEN은 유전체 분석의 속도와 정확성을 획기적으로 향상시킨 혁신적인 플랫폼입니다. Pangenome을 이용한 mapping 방법 도입으로 더욱 정확한 변이 검출이 가능해졌으며, 이는 질병 연구 및 의료 분야 발전에 크게 기여할 것으로 기대됩니다.



clova-x

DRAGEN은 Illumina에서 개발한 유전체 분석 플랫폼으로, 기존의 유전체 분석 방법보다 빠르고 정확하게 다양한 변이를 검출할 수 있는 몇 가지 혁신적인 기술을 사용합니다.

1. 다중 게놈 매핑과 팬게놈 참조:

   - DRAGEN은 다중 게놈 매핑과 팬게놈 참조를 사용하여 변이를 검출합니다. 이는 여러 게놈의 정보를 종합하여 참조 게놈을 구성하는 방법으로, 기존의 단일 참조 게놈을 사용하는 방법보다 더 많은 유전적 다양성을 고려할 수 있습니다.

   - 이를 통해 더욱 정확한 변이 검출이 가능하며, 특히 희귀한 변이를 발견하는 데 유용합니다.

2. 하드웨어 가속화와 머신 러닝:

   - DRAGEN은 하드웨어 가속화와 머신 러닝을 이용하여 빠르고 정확한 분석을 제공합니다. 이는 복잡한 계산을 빠르게 처리할 수 있도록 도와주며, 머신 러닝을 통해 변이 검출의 정확도를 향상시킵니다.

   - 기존의 분석 방법보다 훨씬 빠른 속도로 변이를 검출할 수 있으며, 대규모 데이터셋에 대해서도 효율적으로 분석할 수 있습니다.

3. 다양한 변이 유형 지원:

   - DRAGEN은 단일 염기 변이(SNV), 삽입/삭제(indel), 짧은 반복 서열(STR), 구조적 변이(SV), 복제 수 변이(CNV) 등 모든 주요한 변이 유형을 지원합니다.

   - 다양한 변이 유형을 하나의 명령어 라인에서 검출할 수 있어 사용이 간편하며, 의료적으로 관련된 유전자에 대한 특별한 방법도 포함하고 있습니다.

4. 신속한 워크플로우:

   - DRAGEN은 완전하고 자동화된 엔드 투 엔드 솔루션을 제공하여, 원시 시퀀싱 리드를 매핑하고 정렬하며, 변이를 VCF 파일로 출력합니다.

   - 이를 통해 사용자는 변이를 쉽게 해석하고 연구에 활용할 수 있습니다.

이러한 혁신적인 기술을 통해 DRAGEN은 기존의 유전체 분석 방법보다 빠르고 정확하게 변이를 검출할 수 있습니다. 그러나 여전히 일부 복잡한 구조적 변이의 검출이나 긴 STR 확장의 정확한 크기 결정에는 한계가 있을 수 있습니다. 그럼에도 불구하고, DRAGEN은 유전체 연구 분야에서 큰 발전을 이루고 있으며, 개인 맞춤형 의학 및 생물학 연구에 새로운 인사이트를 제공하고 있습니다.



chatGPT

**DRAGEN이란 무엇인가?**

DRAGEN은 Illumina에서 개발한 유전체 분석 플랫폼으로, 다양한 종류의 유전자 변이를 빠르고 정확하게 탐지할 수 있도록 설계된 도구입니다. 유전적 변이는 각 개인의 유전적 차이를 만들어내며, 이 중에는 질병과 관련된 유전적 변이가 포함될 수 있어 이를 정확하게 검출하는 것이 중요한데요. DRAGEN은 기존의 유전자 분석 방법보다 높은 정확도와 빠른 분석 속도를 제공합니다.

### DRAGEN의 주요 장점

1. **빠른 분석 속도**  

   DRAGEN은 하드웨어 가속을 통해 분석 시간을 대폭 단축합니다. 예를 들어, 전체 유전체 서열을 분석하는 데 약 30분이 걸리며, 이는 기존 방법에 비해 매우 빠른 속도입니다. 이러한 속도는 대량의 데이터를 다뤄야 하는 연구자나 의료 기관에 매우 유리하게 작용합니다.

2. **다양한 변이 검출 가능**  

   DRAGEN은 단일염기 변이(SNV)와 소규모 삽입/결실(indel)뿐만 아니라 구조 변이(SV), 복제 수 변이(CNV)와 같은 대규모 변이도 감지할 수 있습니다. 또한, 최근에는 짧은 반복 서열 변이(STR)와 같이 질병과 관련된 특정 유전자 영역의 변이를 검출할 수 있는 특화 도구도 추가되었습니다.

3. **높은 정확도**  

   DRAGEN은 다중 유전체 참조(pangenome reference)를 사용하여 다양한 유전자 변이를 보다 정확하게 감지합니다. 기존 분석 방법은 주로 한 가지 표준 유전체 참조를 사용해 유전체를 분석하지만, DRAGEN은 여러 개의 유전체 참조를 활용하여 개별의 유전적 다양성을 더 잘 반영합니다. 이를 통해 변이 감지의 정확성을 높일 수 있으며, 특히 구조 변이와 복제 수 변이 감지에 큰 강점을 가지고 있습니다.

4. **의료적으로 중요한 유전자 영역에 대한 특화 분석**  

   DRAGEN은 의료적으로 중요한 유전자(CYP2D6, HLA, SMN 등)에 대한 맞춤형 분석 도구를 제공합니다. 이를 통해 약물 대사나 면역 반응과 관련된 유전자 변이를 더욱 신뢰성 있게 검출할 수 있습니다.

### DRAGEN의 단점

1. **고가의 하드웨어 요구 사항**  

   DRAGEN은 하드웨어 가속을 사용하여 성능을 높이는 만큼 고가의 하드웨어 설치가 필요합니다. 이는 소규모 연구 기관이나 자금이 충분하지 않은 연구자에게는 큰 부담이 될 수 있습니다.

2. **복잡한 데이터 해석 필요**  

   DRAGEN은 다양한 유형의 변이를 동시에 검출하기 때문에 데이터 해석이 복잡할 수 있습니다. 예를 들어, 단일염기 변이와 구조 변이가 동시에 존재할 수 있으며, 이러한 변이 데이터를 효율적으로 해석하려면 추가적인 분석 툴과 전문 지식이 필요할 수 있습니다.

### 다중 유전체 참조(pangenome reference) 기반의 새로운 매핑 방식의 장점

최근 DRAGEN에 도입된 다중 유전체 참조 기반 매핑 방식은 다양한 인종 및 유전적 배경을 가진 사람들의 유전적 다양성을 더 잘 반영합니다. 기존의 단일 참조 유전체는 모든 사람을 대표하기 어려워 일부 변이가 누락되거나 잘못 분석될 가능성이 있었습니다. 반면, 다중 유전체 참조는 다양한 유전적 변이를 포함하고 있어 유전자 변이의 정확한 검출과 해석이 가능합니다. 이를 통해 의료적으로 중요한 질병과 관련된 새로운 변이 발견 가능성이 높아집니다.

### 결론

DRAGEN은 빠른 속도와 높은 정확성을 바탕으로, 기존 유전자 분석 방법의 한계를 뛰어넘는 유전체 분석 플랫폼입니다. 다중 유전체 참조 기반 매핑 방식과 의료 특화 유전자 분석 도구는 DRAGEN이 유전자 변이 감지에 있어 강력한 도구임을 입증합니다. 고가의 장비와 복잡한 해석이 필요하다는 단점이 있지만, 이 플랫폼은 의료 및 유전 연구에 있어 중요한 역할을 할 것으로 기대됩니다.



NotebookLM

## DRAGEN: 더 빠르고 정확한 유전체 분석 방법

안녕하세요. 저는 Illumina의 DRAGEN 전문가입니다. DRAGEN은 기존 유전체 분석 방법보다 효율적이면서 정확하게 다양한 변이를 검출하는 혁신적인 기술입니다. DRAGEN을 잘 모르는 일반인분들을 위해, 이 글에서는 DRAGEN이 어떻게 다른 유전체 분석 방법보다 빠르고 정확하게 변이를 검출할 수 있는지, 그리고 최근 개발된 pangenome을 이용한 mapping 방법이 어떻게 변이 검출의 정확성을 향상시키는지 자세히 설명해 드리겠습니다.

### DRAGEN의 작동 원리

DRAGEN은 크게 세 가지 핵심 기술을 통해 빠르고 정확한 변이 검출을 수행합니다.

1. **하드웨어 가속:** DRAGEN은 FPGA(Field-Programmable Gate Array) 기술을 사용하여 컴퓨팅 속도를 획기적으로 향상시킵니다. FPGA는 특정 작업에 맞게 하드웨어 회로를 구성할 수 있는 칩으로, 유전체 분석과 같이 복잡하고 반복적인 계산에 매우 효율적입니다. 덕분에 DRAGEN은 기존 소프트웨어 기반 분석 방법보다 훨씬 빠르게 분석을 완료할 수 있습니다.

2. **머신 러닝 기반 변이 탐지:** DRAGEN은 머신 러닝 알고리즘을 사용하여 변이 탐지의 정확성을 높입니다.  방대한 양의 유전체 데이터를 학습한 머신 러닝 모델은  데이터에서 노이즈와 오류를 효과적으로 구분하여 진짜 변이를 정확하게 식별합니다.

3. **Pangenome을 이용한 Multi-genome Mapping:** DRAGEN은  다양한 인구 집단의 유전체 정보를 포함하는 pangenome을 참조 유전체로 사용합니다. Pangenome은 단일 참조 유전체보다 인간 유전체의 다양성을 더 잘 반영하기 때문에,  DRAGEN은 개인 간의 유전적 차이를 더 정확하게 파악하고 분석할 수 있습니다. 

    * **기존의 single reference genome 기반 분석:**  단일 참조 유전체에 존재하지 않는 변이는 검출하기 어려웠습니다.

    * **DRAGEN의 pangenome 기반 분석:**  다양한 haplotype을 포함하는 pangenome을 사용하여 기존 방법에서 놓칠 수 있었던 변이까지 정확하게 검출합니다. 

### DRAGEN의 장점

DRAGEN은 기존 유전체 분석 방법과 비교하여 다음과 같은 다양한 장점을 제공합니다.

* **빠른 분석 속도:**  FPGA 하드웨어 가속과  효율적인 알고리즘 설계를 통해 전체 유전체 분석 시간을 **약 30분**으로 단축했습니다.

* **뛰어난 정확성:**  머신 러닝 기반 변이 탐지와 pangenome mapping 기술을 통해 **SNV에서 99.86%, indel에서 99.80%**에 이르는 높은 정확도를 달성했습니다.

* **포괄적인 변이 검출:** 단일 염기 변이(SNV), 삽입/삭제(indel), 구조적 변이(SV), 복제 수 변이(CNV), 짧은 탠덤 반복(STR) 등 **다양한 유형의 변이를  한 번에 분석**할 수 있습니다.

* **확장성:**  대규모 코호트 연구에 적합하도록 설계되어 **수천 개 이상의 샘플을 효율적으로 처리**할 수 있습니다.

* **사용자 편의성:**  **단순하고 직관적인 인터페이스**를 제공하여  전문 지식 없이도 쉽게 사용할 수 있습니다.

### DRAGEN의 단점

* **Pangenome reference의 지속적인 업데이트 필요:**  Pangenome reference는  새로운 유전체 정보가 발견됨에 따라 지속적으로 업데이트되어야 합니다.  

* **일부 복잡한 유전자 영역 분석의 어려움:**  HLA 유전자와 같이 매우 복잡한 유전자 영역의 경우, 아직까지는  long-read sequencing 방법이 더 정확한 분석 결과를 제공할 수 있습니다.

### 결론

DRAGEN은 빠른 분석 속도, 높은 정확성, 포괄적인 변이 검출 능력, 확장성 및 사용자 편의성을 모두 갖춘 차세대 유전체 분석 도구입니다. DRAGEN은  유전체 연구, 질병 진단, 신약 개발, 맞춤형 의료 등 다양한 분야에서 핵심적인 역할을 수행할 것으로 기대됩니다. 


DRAGEN이야 WGS 데이터를 다루기 위해서는 필수적인 요소임에는 불변할 듯 한데 거기다가 pangenome reference라는 방법론을 추가했네요. 지금 사용하는 Human Reference가 미국주도로 진행되고 있었고 여러 사람의 DNA를 pooling을 해서 reference를 제작했는데 소수의 사람(RP11)의 DNA가 reference로 사용하고 있었다라고 해서 pangenome reference가 나온거 같아 보이네요. pangenome reference를 사용하게 되면서 SNP와 small InDel에 대해서는 성능이 올라갈것 같아 보이는데 SV나 CNV와 같은 구조변이에 대해서도 성능이 좋아졌다라는... 100bp, 150bp Paired-end는 동일한데 reference가 변경되었다고 이게 좋아질 수 있는지는... 좀 더 공부를 해봐야 할 듯 하네요. 

여튼 DRAGEN이 일루미나로 넘어가면서 일루미나에서 활용 할 수 있는 도구가 하나 더 추가되었는데 그 도구가 현존하는 tool중에서 가장 막강한 녀석이라서 활용도가 무궁무진 할 듯 합니다.  :)



출처: @ye._.vely618


금요일, 1월 19, 2024

그렇다면 일루미나는 문제가 없을까?

이전 포스팅에서는 Ion torrent 데이터에 대해서 알아보았으니 이번에는 일루미나 데이터는 과연 괜찮은지 한번 알아보도록 하겠습니다.
그건 그렇고 이전 포스팅하고 꽤 오랜만에 하네요;;

Insight into biases and sequencing errors for amplicon sequencing with the Illumina MiSeq platform의 제목으로 amplicon 패널을 사용하여 일루미나 시퀀서의 편향과 에러에 대해서 한번 확인해봤다고 합니다.

DOI: https://doi.org/10.1093/nar/gku1341

이번에도 AI(Bing의 copilot입니다.)의 도움을 한번 받아보았습니다!!!


프롬프트
The following URL is a paper confirming the biases and errors of the Illumina MiSeq sequencer using the Amplicon panel, and the title is "Insight into biases and sequencing errors for amplicon sequencing with the Illumina MiSeq platform."

https://doi.org/10.1093/nar/gku1341

I am planning to organize and post the contents of this paper on my blog. Please summarize the problems that may arise when using the Amplicon method using Illumina MiSeq. It is said that the data used in the paper was 16S rRNA data. If there was an error, please explain how you corrected the error and what method you used. Also, if there is an error in the data, please explain how to efficiently handle it. Please write the draft to be posted on the blog in Korean.



안녕하세요. 오늘은 일루미나 MiSeq 시퀀서를 사용하여 앰플리콘 패널을 이용한 시퀀싱에 대한 편향과 오류를 확인하는 논문을 소개하고자 합니다. 논문의 제목은 "Insight into biases and sequencing errors for amplicon sequencing with the Illumina MiSeq platform"이고, 다음 URL에서 확인하실 수 있습니다.

https://doi.org/10.1093/nar/gku1341

이 논문에서는 16S rRNA 데이터를 사용하여 앰플리콘 방법을 이용한 시퀀싱의 문제점을 분석하였습니다. 앰플리콘 방법은 특정 DNA 영역을 증폭하여 시퀀싱하는 방법으로, 다양한 생물학적 응용에 사용됩니다. 그러나 이 방법에는 여러 가지 편향과 오류가 발생할 수 있습니다. 예를 들어, 증폭 과정에서 PCR 편향이나 증폭 돌연변이가 발생할 수 있고, 시퀀싱 과정에서는 인덱스 점프나 인덱스 오염, 품질 저하 등의 문제가 있을 수 있습니다.

이러한 편향과 오류는 시퀀싱 결과의 정확도와 신뢰도에 영향을 미칠 수 있으므로, 적절한 보정과 검증이 필요합니다. 이 논문에서는 일루미나 MiSeq 플랫폼을 사용하여 앰플리콘 시퀀싱을 수행한 데이터를 분석하고, 편향과 오류의 원인과 영향을 평가하였습니다. 또한, 편향과 오류를 줄이기 위한 몇 가지 방법을 제안하였습니다.

논문에서 사용한 데이터는 16S rRNA 데이터로, 박테리아의 다양성과 상대적 농도를 파악하기 위해 널리 사용되는 마커 유전자입니다. 16S rRNA 데이터는 앰플리콘 방법으로 쉽게 증폭할 수 있지만, 동시에 여러 가지 편향과 오류에 노출될 수 있습니다. 예를 들어, 16S rRNA 유전자는 다른 박테리아 간에 유사도가 높기 때문에, 인덱스 점프나 인덱스 오염이 발생하면 잘못된 분류가 될 수 있습니다. 또한, 16S rRNA 유전자는 GC 함량이 다양하기 때문에, PCR 편향이나 증폭 돌연변이가 발생하면 잘못된 상대적 농도가 산출될 수 있습니다.

논문에서는 이러한 편향과 오류를 검출하고 보정하기 위해 여러 가지 방법을 사용하였습니다. 예를 들어, 인덱스 점프나 인덱스 오염을 줄이기 위해, 인덱스 디자인을 최적화하고, 인덱스 프라이머를 제거하는 단계를 추가하였습니다. 또한, PCR 편향이나 증폭 돌연변이를 줄이기 위해, PCR 사이클 수를 최소화하고, 증폭 조건을 표준화하였습니다. 그리고, 시퀀싱 품질을 향상시키기 위해, 품질 저하가 발생하는 시퀀싱 끝부분을 잘라내고, 품질 점수를 기준으로 필터링하였습니다.

이렇게 보정된 데이터를 사용하여, 박테리아의 다양성과 상대적 농도를 분석하였습니다. 그 결과, 보정 전과 후의 데이터에서는 박테리아의 종류와 비율에 차이가 있음을 확인하였습니다. 이는 앰플리콘 시퀀싱에 발생하는 편향과 오류가 데이터 해석에 영향을 미칠 수 있음을 보여줍니다. 따라서, 앰플리콘 시퀀싱을 수행할 때는 편향과 오류를 최소화하고, 보정하고, 검증하는 과정이 필수적임을 강조하고자 합니다.

이 논문에서는 편향과 오류를 줄이기 위한 방법 외에도, 발생한 편향과 오류를 해결하기 위한 방법도 제시하였습니다. 예를 들어, 인덱스 점프나 인덱스 오염이 발생한 경우에는, 인덱스 정보를 이용하여 잘못된 분류를 수정하는 방법이 있습니다. 또한, PCR 편향이나 증폭 돌연변이가 발생한 경우에는, GC 보정이나 돌연변이 보정을 수행하는 방법이 있습니다. 이러한 방법들은 데이터의 정확도와 신뢰도를 더욱 높일 수 있습니다.

이상으로, 일루미나 MiSeq 시퀀서를 사용하여 앰플리콘 패널을 이용한 시퀀싱에 대한 편향과 오류를 확인하는 논문에 대해 소개하였습니다. 앰플리콘 시퀀싱은 매우 유용한 방법이지만, 동시에 주의가 필요한 방법이기도 합니다. 앰플리콘 시퀀싱을 수행하시는 분들께서는 이 논문을 참고하여, 데이터의 정확도와 신뢰도를 높이시기 바랍니다. 감사합니다.


라고 합니다.

좀 같은 말 늘려서 빙빙 돌려막는 느낌이 좀 들긴하지만....
그래도 짧지 않은 글을 작성해주니깐 좋은것 같습니다. :)








토요일, 9월 07, 2019

Nextera DNA Flex는 모지?

이번글은 그냥 둘러보다가 알게된
일루미나에서 새로 나온듯한 Library Kit에 대해서 한번 알아보겠습니다.

모 나온지는 1-2년된듯한 라이브러리 Kit같습니다.

일루미나 라이브러리에 TruSeq이라는 라이브러리 킷외에 Nextera라는 라이브러리 킷이 하나더 있었다는건 나 좀 시퀀싱 읆어봤다 하시는 분이라면 다 알고 계실겁니다.

Nextera가 TruSeq과의 큰 차이점이라고 한다면 fragmentation과 tagging이 Transposome이라는 짜르고 붙이는 기능이 포함되어 있는 효소를 가지고 한다는 점일 겁니다.

지금까지 제가 알고 있었던 Transposome이 라는 녀석이 하단의 fig 2. 처럼 작동해서 fragmentation의 size가 broad하다는 것으로 알고 있었는데...

출처: Nextera DNA Library Prep Kits Data Sheet

그런데 최근 Nextera Library Kit에다가 재미있는 방법을 결합시켜서 이전보다 fragmentation과 tagging 작업을 더 효율적으로 바꾼것 같아보이네요

Bead-linked Transposome 바로 BLT 되겠습니다.


맛있겠다. 출처: 맥도널드 홈페이지


이게진짜 BLT 출처: 일루미나 홈페이지
Bead에 Transposome 를 붙여놓고 거기다가 DNA를 넣어서 슥하고 자르고
삭하고 PCR primer를 붙여버린다는...
물론 transposome의 단점은 그대로 가지고는 있다능
fragment size가 일정하지 않은데, 그리고 추가적으로 양쪽에 PCR primer가 각각 있어야되는데 그렇지 않은 애들은?
(그럼에도 불구하고 팔아먹고는 있네요.. ㅎㅎ )

그래도 이전 방법보다는 fragment size가 조금더 일정하게 나오지 않을까하는
그리고 사람 손은 한번은 덜 타니깐 조금은 나은 방법으로 발전하는게 아닌가 하고 생각은 드네요 ㅎㅎ







출처: @sana_twice.09




관련 자료

Nextera DNA Library Prep Kit Data Sheet

Nextera Infographic

Nextera DNA Flex

Bead-linked transposomes enable a normalization-free workflow for NGS library preparation (새로나온 라이브러리 킷의 일루미나논문입니다.)