Lee Gir-Won (Lee Gil-Won): WES

레이블이 WES인 게시물을 표시합니다. 모든 게시물 표시

월요일, 2월 09, 2026

유전자 검사, 한 번으로 끝이 아닙니다!

오늘 논문은 기존에 시퀀싱했었던 데이터를 재활용하자 라는 The importance and clinical utility of reanalysis of exome and genome sequencing data 제목의 논문으로 유전질환이나 희귀질환환자분들의 경우 기존에 시퀀싱 데이터가 있으니 다시 또 시퀀싱 할 필요 없이 주기적으로 재분석 하면 임상적으로 좋다라는 내용되겠습니다. 물론 너무 낮은 depth나 Low quality라면 다시 하면 좋겠지만 재사용할 수 있는 데이터가 있다면 재분석을 하면 되지 굳이 또 시퀀싱을 할 필요가 있겠냐입니다.

물론 요즘 시퀀싱비용이 많이 낮아져서 read길이 100bp~150bp 30x~45x 로 시퀀싱하려면 부가세포함해도 500만원을 넘을려나? 흠.. 잘모르겠네요 (가격은 병원과 회사들마다 편차가 큽니다. ).

근데 굳이 왜 다시 시퀀싱하지 말고 재분석을 하라고하는지.. 가장 큰 이유는 ClinVar와 같은 임상과 관련된 변이 정보 데이터베이스들이 계속 업데이트 되고 있기 때문입니다. 기존에는 질병과 의미 없다고 알려졌던 변이라도 지속적인 연구를 통해서 특정 인종에서는, 혹은 특정 변이를 가지고 있는 경우 예후가 않좋다 라고 알게되었다면 이 정보들을 계속 데이터베이스에 업데이트되고 있기에 작년에 분석 했을 때는 문제가 없다고 나왔더라도 금년에는 의심을 해봐야한다는 분석 결과가 나올 수 있습니다. 그리고 운이 좋으면 지지부진했던 기존의 치료방법에서 차도가 있는 치료방법으로 변경할 수 있는 근거를 얻을 수 있지 않을까 합니다.

만약에 그래도 나는 재분석에 만족못하겠어! 시퀀싱을 다시 해서 레포트 받고 싶어 하는 분들이 있다면 일루미나 기반의 short-read 대신에 PacBio나 ONT로 시퀀싱을 하시는것을 추천드립니다.

아.. 시중이나 건강검진에서 접하시는 DTC 기반의 유전자 검사는 재분석 안해도됩니다. :)

DOI: 10.23876/j.krcp.25.210

clova-x

Exome sequencing (ES)과 genome sequencing (GS) 데이터의 재분석은 희귀 유전 질환의 진단을 개선하고 임상 관리를 최적화하는 데 필수적인 요소로 자리 잡고 있습니다. 재분석은 새로운 유전자-질환 연관성 발견, 생물정보학 파이프라인의 개선, 고급 분석 기법의 적용을 통해 추가적인 진단 성과를 제공합니다.
1. **Exome 및 Genome Sequencing의 중요성**
- ES는 단백질 코딩 영역에 집중하여 유전적 변이를 식별하며, GS는 전체 게놈을 분석하여 더 넓은 범위의 변이를 확인합니다.
- 두 방법 모두 유전적 진단에 중요한 도구로 자리 잡았으며, 각각의 장점을 살려 다양한 유전 질환을 진단합니다.
2. **재분석의 임상적 유용성**
- 재분석은 초기 분석에서 명확한 진단을 받지 못한 환자들에게 추가적인 진단 기회를 제공합니다.
- 연구에 따르면, 재분석을 통해 3~15%의 추가 진단 성과를 얻을 수 있으며, 이는 신경발달장애, 신장 질환, 심혈관 질환 등 다양한 질병군에서 나타납니다.
3. **재분석의 도전 과제와 해결책**
- 재분석은 비용, 물류, 윤리적 장벽을 극복하기 위한 표준화된 지침의 개발이 필요합니다.
- 체계적이고 정기적인 재분석을 통해 진단의 정확성을 높이고, 환자 치료를 최적화할 수 있습니다.
4. **기술 발전과 재분석의 통합**
- 차세대 염기서열 분석 기술의 발전으로 인해 재분석의 효율성과 정확성이 크게 향상되었습니다.
- Bioinformatics 툴과 데이터 분석 파이프라인의 지속적인 개선으로 인해 재분석의 중요성이 더욱 커지고 있습니다.
5. **미래 전망**
- LRGS와 같은 고급 기술의 도입과 다중 오믹스 데이터의 활용으로 재분석의 잠재력이 극대화될 것입니다.
- AI와 ML 알고리즘을 통한 Variant 해석의 정교화가 이루어질 것이며, 국제 협력 네트워크를 통한 데이터 공유가 강화될 것입니다.

gemini

## 🧬 유전병 진단의 새로운 희망: 엑솜/게놈 시퀀싱 데이터 '재분석'의 중요성
### 💡 연구 배경 및 목적
[cite_start]엑솜 시퀀싱(ES)과 게놈 시퀀싱(GS)은 희귀 유전 질환을 진단하는 데 필수적인 기술이 되었지만, 초기 분석만으로는 **상당수의 환자가 확정적인 진단을 받지 못하는** 한계가 있습니다[cite: 7, 30]. 이는 유전체 지식과 기술이 **끊임없이 발전**하고 있기 때문입니다. [cite_start]오늘 진단하지 못한 질환도 새로운 연구 결과와 분석 기술이 나오면 진단할 수 있게 되는 것이죠[cite: 8, 32].
[cite_start]이 리뷰 논문은 이러한 배경 하에 **기존 ES 및 GS 데이터를 재분석**하는 것의 **점점 커지는 중요성과 임상적 유용성**을 종합적으로 다루고, 재분석의 방법론과 과제들을 탐구하는 것을 목적으로 합니다[cite: 9, 37].
---
### 🔬 연구 방법 및 동인 (재분석의 효과가 나타나는 이유)
[cite_start]재분석은 단순한 보조 활동이 아니라 **현대 유전체 의학의 근본적인 요소**로 자리 잡고 있으며 [cite: 13, 149][cite_start], 진단 과정을 일회성 이벤트에서 **지속적인 진단 프로세스**로 변화시키고 있습니다[cite: 13, 151].
재분석을 통해 진단율이 향상되는 주된 요인들은 다음과 같습니다:
1. [cite_start]**새로운 유전자-질환 연관성의 지속적인 발견:** 매년 수백 개의 새로운 유전자-질환 상호작용과 수천 개의 새로운 변이-질환 연관성이 과학 문헌에 기록되고, 재분석은 이러한 최신 지식을 통합합니다[cite: 10, 46, 47].
2. [cite_start]**임상 및 인구 유전체 데이터베이스의 업데이트:** ClinVar, gnomAD와 같은 데이터베이스가 지속적으로 업데이트되어 변이의 임상적 중요성에 대한 이해를 높입니다[cite: 10, 52, 53].
3. [cite_start]**생물정보학 파이프라인의 정제:** 변이 판독의 정확도를 높이고, 복제수 변이(CNV), 구조적 변이(SV) 등의 다양한 변이 유형을 더 민감하게 검출하는 알고리즘이 지속적으로 개선됩니다[cite: 10, 44, 55, 56].
4. **고급 분석 기술의 적용:**
* [cite_start]**장독 게놈 시퀀싱(IrGS):** 표준 단독 시퀀싱으로는 어려웠던 복잡한 유전체 영역이나 변이 유형(예: SVs, 반복 서열 확장)을 해결하는 데 강력한 접근법을 제공합니다[cite: 79, 80].
* [cite_start]**AI/머신러닝(ML) 알고리즘:** Moon, 3ASC, Franklin과 같은 AI 기반 도구들은 다양한 데이터 소스를 통합하여 변이의 병원성을 예측하며, 재분석 과정을 능률화하는 데 기여합니다[cite: 99, 100, 101].
### 📊 주요 연구 결과
[cite_start]재분석은 다양한 질환 코호트에서 **3%에서 15%에 이르는 추가적인 진단율 향상**을 가져오는 것으로 나타났습니다[cite: 11].
| 질환군 | 재분석을 통한 추가 진단율 (%) | 주요 증가 원인 |
| :--- | :--- | :--- |
| **신경발달 장애** | 7.3–12.6 | [cite_start]새로운 유전자-질환 연관성, 파이프라인/도구 업데이트, 임상 정보 업데이트, IrGS와 같은 분석 방법 [cite: 118] |
| **신장 질환** | 5–15 | [cite_start]파이프라인/도구 업데이트, 분석 방법(ES, GS), 임상 정보 업데이트 [cite: 118] |
| **심혈관 질환** | 6–8.5 | [cite_start]파이프라인/도구 업데이트 [cite: 118] |
| **미토콘드리아 질환** | 15 | [cite_start]파이프라인/도구 업데이트 [cite: 118] |
**변이 재분류의 중요성:**
* [cite_start]새로운 진단 사례의 상당 부분은 초기 분석 시 **'임상적 중요성이 불확실한 변이(VUS)'**로 분류되었던 것들이 재분류되면서 발생합니다[cite: 12, 63].
* [cite_start]신장 유전 검사 재분석 연구에서는 재분류된 변이의 **79%가 초기 VUS**였으며, **63.2%가 병원성이 더 높은 분류로 상향 조정**되었습니다[cite: 122, 123].
* [cite_start]이러한 재분류는 환자의 **임상 관리**에 직접적이고 의미 있는 변화(예: 맞춤형 감시, 맞춤형 치료)를 가져옵니다[cite: 12, 109]. [cite_start]신장 질환 연구에서는 재분류로 인해 새롭거나 변경된 진단을 받은 환자의 **67%가 임상 관리의 중대한 변화**를 경험했습니다[cite: 125].
---
### ⏳ 재분석의 최적 시기
[cite_start]재분석의 최적 시기는 다양하지만, 일반적으로 **1~2년마다** 또는 환자의 표현형이 진화하거나 관련 신규 유전자-질환 연관성이 발표될 경우 더 빨리 수행하는 것이 권장됩니다[cite: 68, 69].
* [cite_start]과거 분석 이후 시간이 길어질수록 새로운 임상적으로 관련성 있는 변이를 찾을 가능성이 높아지는 것으로 나타났습니다 (1년 이내 약 1% $\to$ 3년 이상 경과 시 약 22%)[cite: 72].
* [cite_start]비용 및 인력 문제를 극복할 수 있다면, 신경발달 장애 환자를 대상으로 한 대규모 연구에서처럼 **자동화된 일일 재분석 시스템**은 진단율을 추가로 3% 높이는 것으로 나타나, **지속적인 재분석**이 가장 이상적인 접근법임을 시사합니다[cite: 70, 71].
---
### 🌟 의의와 시사점: 이 연구가 왜 중요한가?
[cite_start]**엑솜/게놈 시퀀싱 데이터의 재분석은 더 이상 선택 사항이 아니라, 미진단 희귀 유전 질환 환자들을 위한 '필수적인 임상 관행'입니다[cite: 135, 149].**
* [cite_start]**진단 오디세이의 단축:** 오랜 기간 진단 없이 고통받는 환자와 가족들에게 분자 진단을 제공하여, 길고 불확실한 **'진단 오디세이'**를 끝낼 수 있습니다[cite: 108, 138].
* [cite_start]**실질적인 환자 치료 개선:** 재분석을 통해 얻은 진단은 표적 감시, 예방 프로토콜, 맞춤형 치료 전략을 포함한 **행동 가능한 임상 개입**으로 이어져 환자 결과를 최적화합니다[cite: 109, 130].
* [cite_start]**유전체 정보의 지속적인 가치 증대:** 환자의 유전 정보는 **영구적인 자산**이며 [cite: 150, 153][cite_start], 재분석을 통해 과학이 발전함에 따라 그 가치를 지속적으로 개선하고 활용할 수 있음을 보여줍니다[cite: 152].
* [cite_start]**표준화된 지침의 필요성:** 재분석의 잠재력을 완전히 실현하기 위해서는 재정적, 물류적, 윤리적 장벽(예: 비용, 동의 문제)을 극복하고, 재분석을 일상적인 임상 진료에 통합하기 위한 **표준화된 지침 개발**이 시급합니다[cite: 14, 133, 146].
[cite_start]이 연구는 유전체 테스트를 한 번의 사건이 아닌, **시간에 따라 진화하는 동적이고 반복적인 해석 과정**으로 전환해야 함을 강조하며, 미진단 환자에게 진단적 잠재력을 극대화하고 **정밀 의학의 발전을 가속화**하는 데 핵심적인 역할을 합니다[cite: 151, 152].

chatGPT

아래 글은 **업로드하신 논문(j-krcp-25-210.pdf)** 내용을 바탕으로,
**일반 성인 독자도 이해하기 쉬운 블로그용 요약본**입니다.
(A4 두 장 분량에 해당하도록 구성하였습니다.)
---
# 🔍 유전체 검사, 한 번으로 충분하지 않은 이유
### — 엑솜·전장유전체 재분석(Reanalysis)의 중요성과 미래
## 1. 연구 배경: 왜 재분석이 필요할까?
rare disease diagnosis, genomic sequencing
유전 질환을 진단할 때 가장 많이 사용하는 최신 기술은 **엑솜 시퀀싱(ES)** 과 **전장유전체 시퀀싱(GS)** 입니다.
이 검사는 한 번의 채혈만으로 평생 변하지 않는 유전체 정보를 얻을 수 있고, 실제로 많은 희귀질환 환자들의 진단에 큰 도움이 되고 있습니다.
하지만 **처음 검사에서 진단을 못 받는 환자가 여전히 많습니다.**
왜 그럴까요?
* 의학이 빠르게 발전하면서 **새로운 질병 유전자**가 계속 발견됨
* 기존에는 “잘 모르겠다(VUS)”고 분류되던 유전 변이가 시간이 지나면 **병을 일으키는 변이로 재해석**되기도 함
* 분석 소프트웨어, 데이터베이스가 해마다 업데이트
* 더 정교한 기술(예: long-read sequencing, 더 좋은 CNV 탐지)이 등장
이처럼 유전체 분석은 ‘찍고 끝’이 아니라,
**“과학이 발전함에 따라 계속 다시 볼 필요가 있는 데이터”**입니다.
이 논문은 바로 이 **재분석(Reanalysis)**이 얼마나 중요한지, 어떤 영향을 미치는지 종합적으로 정리한 리뷰 연구입니다.
---
## 2. 연구 목적: 재분석이 실제로 어떤 가치를 주는가?
논문은 다음을 목표로 합니다.
* ES/GS **재분석의 필요성과 의의** 설명
* 재분석 과정에서 사용되는 **방법·기술·도구** 소개
* 재분석이 환자 진단에 **얼마나 도움이 되는지** 정량적으로 제시
* 재분석이 널리 쓰이지 못하게 하는 **장벽과 해결과제** 논의
---
## 3. 연구에서 다룬 방법: 재분석은 어떻게 이루어질까?
논문에서는 다양한 재분석 방식과 기술을 정리합니다.
### ✔ 1) 최신 분석 파이프라인으로 다시 분석
* 새 버전의 분석 소프트웨어(BWA, GATK, DRAGEN 등)로 재정렬·재해석
* 더 정확한 변이 탐지가 가능
### ✔ 2) 최신 데이터베이스 업데이트 반영
* ClinVar, gnomAD 등에서 최신 변이 정보를 가져와 다시 해석
* 예: 과거엔 “잘 모르겠다(VUS)” → 현재는 “병을 일으킴(병적)”으로 바뀌는 경우 많음
### ✔ 3) 새로운 유형의 변이를 찾아봄
* CNV(결실/중복), 구조변이(SV), 비코딩 영역 변이, 깊은 인트론 변이 등
* 초기 검사에서는 잡히지 않던 변이가 재분석에서는 발견됨
### ✔ 4) Long-read Genome Sequencing(장읽기 시퀀싱) 활용
* 기존 short-read 분석으로는 어려웠던
* 반복 서열
* 복잡한 구조변이
* 유사 유전자 영역
을 정확히 파악하여 **추가 진단율 7~17%** 향상 보고
### ✔ 5) AI 기반 해석 도구 활용
* Moon, 3ASC(3billion), Franklin 등
* 임상정보 + 유전정보를 함께 고려하여 변이의 의미를 더 정교하게 예측
---
## 4. 주요 결과: 재분석을 하면 얼마나 더 진단이 되는가?
### 📌 평균적으로 **3%~15%**의 추가 진단이 가능
(질환군에 따라 더 높아지기도 함)
다양한 질환군에서 얻어진 진단 증가율은 다음과 같습니다:
(논문 Table1 요약)
| 질환군 | 추가 진단율 | 주요 원인 |
| --------- | --------- | ------------------------ |
| 신경발달장애 | 7.3–12.6% | 새 유전자 발견, 분석업데이트, 장읽기 GS |
| 신장질환 | 5–15% | 변이 재분류, 신규 변이 탐지 |
| 안질환 | 8.3–11.8% | 임상정보 업데이트 |
| 심혈관질환 | 6–8.5% | 분석 도구 업데이트 |
| 미토콘드리아 질환 | 15% | 재분석 확대 |
| 면역질환 | 3% | 유전자 패널 확장 |
### 🔎 실제 사례 — 신장질환 환자 413가족
* 변이 재분류율: **4.6%**
* 그중 79%가 원래 “VUS(잘 모름)”이었는데 재분석으로 판단이 바뀜
* 이로 인해 **60%는 새 진단 or 진단 변경**
* 그중 **67%는 실제 치료·관리 전략이 바뀜**
즉, 재분석은 단순한 진단의 문제가 아니라
**현실적인 치료 방향까지 바꾸는 임상적 의미**가 있습니다.
---
## 5. 고찰: 왜 재분석이 필수적인가?
논문에서는 여러 관점을 제시합니다.
### ✔ 유전체 정보는 “정적”이 아니라 “누적되는 지식으로 해석되는 정보”
검사 자체는 한 번이면 되지만,
**해석은 시간이 지나면서 더 정확해집니다.**
### ✔ 재분석은 의료비 절감에도 도움이 될 가능성
불필요한 검사 반복, 오진, 과잉 치료를 줄이기 때문
### ✔ 하지만 여전히 해결해야 할 문제도 존재
* 의료기관마다 재분석 빈도·방식이 제각각
* 보험/비용 문제
* 누가, 언제, 어떤 기준으로 재분석을 해야 하는지 명확하지 않음
* 환자의 재동의(consent) 문제
* 인력 및 시스템 부족
그래서 논문은 **표준화된 가이드라인의 필요성**을 강조합니다.
---
## 6. 의의와 시사점: 앞으로 유전체 의학은 어떻게 달라질까?
논문은 다음과 같은 미래를 제시합니다.
### 📌 1) 정기적·자동화된 재분석이 ‘표준 진료’가 될 것
현재는 “가끔 필요하면 하는 것”이지만
미래에는 “정기검진처럼 주기적으로 재분석”이 도입될 가능성이 높습니다.
### 📌 2) 장읽기 유전체, 다중오믹스(전사체·단백체), AI가 통합될 것
이런 기술들은 기존 데이터에서 찾지 못했던 변이를 더 많이 찾아냅니다.
### 📌 3) 환자와 의료진 모두 “유전체 정보는 갱신되는 자산”이라는 인식 필요
한 번의 검사로 평생 결과가 고정되는 것이 아니라,
**검사 데이터는 계속 재활용되며 가치가 높아진다**는 변화된 패러다임을 강조합니다.
---
# 🧩 이 연구가 중요한 이유
### ✔ 1) 진단을 못 받은 환자들에게 “두 번째 기회”를 준다
특히 희귀질환 환자에게 재분석은 삶의 질을 좌우할 수 있습니다.
### ✔ 2) 기존 검사 데이터를 재활용하여 효율성을 극대화한다
새로운 검사를 반복할 필요 없고, 비용도 절감됩니다.
### ✔ 3) 유전체 의학의 ‘지속적인 해석 시대’를 연다
이 논문은 “유전체 검사는 해석이 핵심이며, 해석은 시간이 지나며 더 정확해진다”는
현대 유전체 의학의 핵심 철학을 명확하게 보여줍니다.
### ✔ 4) 의료 정책·가이드라인 개발에 근거를 제공한다
재분석을 국가·병원 단위에서 어떻게 표준화할지 고민하는 데 중요한 자료입니다.

grok

### 엑솜과 게놈 시퀀싱 데이터 재분석의 중요성과 임상적 가치
#### 연구 배경
희귀 유전 질환을 진단하는 데 엑솜 시퀀싱(ES)과 게놈 시퀀싱(GS)은 핵심 도구입니다. ES는 유전자 중 단백질을 만드는 부분(엑솜)을 집중 분석하고, GS는 전체 유전자를 다룹니다. 하지만 초기 분석 후에도 많은 환자가 진단되지 못합니다. 이는 유전자 지식이 빠르게 업데이트되기 때문인데, 예를 들어 새로운 유전자-질환 연관성 발견이나 데이터베이스(ClinVar, gnomAD) 개선으로 인해 과거 데이터가 새롭게 해석될 수 있습니다. 이 논문은 이러한 재분석의 필요성을 강조합니다.
#### 연구 목적
이 리뷰 논문은 ES와 GS 데이터 재분석의 중요성과 임상적 유용성을 탐구합니다. 재분석이 어떻게 미진단 사례를 해결하고, 진단 수율을 높이는지, 그리고 이를 임상 현장에 통합하기 위한 방법과 도전을 논의합니다. 궁극적으로 유전 진단을 '한 번의 이벤트'가 아닌 '지속적인 과정'으로 바꾸는 데 초점을 맞춥니다.
#### 연구 방법
저자들은 기존 연구와 데이터를 종합적으로 검토했습니다. 재분석 방법으로는 바이오인포매틱스 파이프라인 업데이트(예: BWA, GATK, DRAGEN), 데이터베이스 재주석, 장기 판독 시퀀싱(lrGS) 같은 고급 기술을 사용합니다. 또한 AI 도구(예: Moon, 3ASC)와 협력 플랫폼(예: GeneMatcher)을 활용해 변이 재분류를 강조합니다. 재분석 주기는 1~2년마다, 또는 자동화된 일일 시스템으로 제안합니다.
#### 연구 결과
재분석으로 진단 수율이 3~15% 증가합니다. 신경발달 장애(7.3~12.6%), 신장 질환(5~15%), 심혈관 질환(6~8.5%) 등 다양한 코호트에서 효과적입니다. 예를 들어, 신장 유전 검사 413가족 중 4.6%가 변이 재분류되어 60%가 새 진단을 받았고, 67%가 치료 변화(예: 맞춤 감시)를 경험했습니다. 주요 이유는 새로운 유전자 발견(예: VUS에서 병원성으로 재분류), 파이프라인 개선, lrGS를 통한 복잡 변이 검출입니다.
#### 고찰
재분석은 미진단 환자의 '진단 오디세이'를 단축하고, 맞춤 치료를 가능하게 합니다. 하지만 비용, 인력 부족, 윤리적 문제(예: 동의, 책임)가 장애물입니다. 자동화와 표준 지침 개발이 필요하며, GS 데이터에서 시간이 지날수록(3년 이상 시 22%) 진단 가능성이 높아집니다. 미래에는 다중 오믹스(전사체, 단백질체) 통합과 AI가 더 큰 역할을 할 전망입니다.
#### 의의와 시사점
이 연구는 유전 데이터를 '영구 자산'으로 보고, 재분석을 정기적으로 통합하면 정밀 의학을 발전시킬 수 있음을 보여줍니다. 환자 관리를 개선하고, 가족 상담을 돕습니다. 시사점으로는 의료 시스템이 재분석을 표준화해 불평등을 줄여야 한다는 점입니다.
이 연구가 중요한 이유는 희귀 질환 환자들이 오랜 기다림 없이 정확한 진단과 치료를 받을 수 있게 해, 의학의 미래를 더 밝히기 때문입니다. 유전 지식이 빠르게 변하는 시대에 재분석은 필수적입니다.

NotebookLM

제공해 주신 논문은 **"엑솜 및 게놈 시퀀싱 데이터 재분석의 중요성과 임상적 유용성"**에 관한 종설(Review Article)입니다. 이 연구는 희귀 유전 질환 진단에 필수적인 유전체 시퀀싱 데이터(ES 및 GS)를 **재분석**하는 것이 왜 중요한지, 그리고 이를 통해 어떻게 진단율을 높이고 환자 치료를 개선할 수 있는지 포괄적으로 다루고 있습니다.
---
## 블로그 포스팅: 유전자 검사, 한 번으로 끝이 아닙니다! 희귀병 진단의 새 희망, '재분석'의 시대
### 1. 연구 배경: 풀리지 않은 희귀병 진단의 숙제
**엑솜 시퀀싱(ES)**과 **게놈 시퀀싱(GS)**은 희귀 유전 질환 진단에 필수적인 도구로 자리 잡았습니다. ES는 전체 게놈의 2% 미만이지만 병원성 유전 변이의 약 85%를 포함하는 단백질 코딩 영역(엑손)에 전략적으로 초점을 맞추며, GS는 코딩 영역과 비코딩 영역을 포함한 전체 게놈을 분석합니다.
이러한 기술 발전에도 불구하고, ES나 GS 검사를 받은 상당수의 환자들은 **초기 분석 후에도 확정적인 진단을 받지 못하고** 남아 있습니다. 이는 유전체 해석이 초기 시점의 과학적 이해 수준에 묶여 있기 때문입니다. 유전학 분야는 새로운 질병-유전자 연관성이 끊임없이 발견되고, 데이터베이스가 매년 수백, 수천 건씩 업데이트되는 **급변하는 영역**입니다. 따라서 한 번의 분석만으로는 ES 및 GS의 진단 잠재력을 완전히 활용하기 어렵습니다.
### 2. 연구 목적: 재분석의 중요성과 임상 통합 방안 제시
이 논문의 목적은 기존 ES 및 GS 데이터의 **재분석(Reanalysis)**이 가지는 **진화하는 중요성과 임상적 유용성**을 탐색하는 것입니다.
연구진은 재분석을 통해 희귀 유전 질환의 **진단율을 높이는 영향**을 다루고, 재분석에 사용되는 다양한 방법론과 도구를 검토하며, 궁극적으로 재분석을 일상적인 임상 진료에 통합함으로써 **진단 방황(Diagnostic Odyssey) 기간을 단축**하고 환자 치료를 최적화하는 광범위한 시사점을 제시하고자 합니다.
### 3. 연구 방법: 진단율 향상의 동인(Drivers) 분석 및 방법론 정리
이 종설은 재분석의 중요성을 뒷받침하는 주요 동인과 방법론을 포괄적으로 검토했습니다.
#### A. 진단율 향상의 핵심 요인
재분석을 통해 진단율이 높아지는 것은 다음 네 가지 핵심 요인 덕분입니다:
1. **새로운 질병-유전자 연관성의 지속적인 발견:** 매년 수백 개의 새로운 유전자-질병 상호작용이 문서화되며, 재분석은 이러한 새로운 유전적 연관성을 통합하는 메커니즘을 제공합니다.
2. **임상 및 인구 유전체 데이터베이스 업데이트:** ClinVar와 gnomAD 같은 데이터베이스가 지속적으로 확장되고 업데이트되어, 흔한 변이와 병원성 변이를 구별하는 데 필수적인 정보를 제공합니다.
3. **생물정보학 파이프라인의 정교화:** 변이 식별 정확도가 향상된 새로운 정렬 소프트웨어(BWA), 변이 판별 알고리즘(GATK, DRAGEN), 그리고 종합적인 주석 엔진(ANNOVAR, Ensembl VEP)이 지속적으로 개발되고 있습니다.
4. **첨단 분석 기법의 적용:** 복제수 변이(CNV) 및 구조적 변이(SV) 검출 알고리즘 개선, 그리고 **장거리 게놈 시퀀싱(lrGS)**과 같은 첨단 기술의 도입이 포함됩니다.
#### B. 재분석의 주요 방법론
재분석은 단지 데이터를 다시 보는 것을 넘어, 체계적인 전략을 필요로 합니다.
* **주기적 재분석:** 최적의 재분석 시기는 1~2년마다 권장되지만, 자동화 시스템을 통한 **매일의 지속적인 재분석**은 진단율을 추가로 높일 수 있음이 확인되었습니다. 시간이 지날수록 이전 분석에서 놓친 변이를 찾을 가능성이 증가합니다 (3년 경과 시 약 22%까지 증가).
* **새로운 기술 통합:** 기존 단일-리드 GS 데이터가 음성일 경우, 복잡한 게놈 영역이나 구조적 변이를 해결하기 위해 **lrGS 기술**을 도입하면 진단율이 7%에서 17%까지 추가로 향상될 수 있습니다.
* **AI 및 ML 활용:** 인공지능(AI)과 기계 학습(ML) 알고리즘은 표현형 정보와 복잡한 게놈 특징을 통합하여 변이의 병원성을 예측하는 데 사용되며, 대규모 데이터 세트의 재주석(re-annotation) 과정을 간소화합니다.
### 4. 주요 연구 결과: 3%~15%의 추가 진단율 증가와 임상 관리 변화
#### A. 획기적인 진단율 증가
재분석은 신경 발달 장애, 신장 장애, 심혈관 질환 등 다양한 질환 코호트에서 **3%에서 15%에 이르는 추가 진단율**을 제공하는 것으로 나타났습니다.
* **질환별 증가율:** 신경 발달 장애(7.3%–12.6%), 신장 질환(5%–15%), 안과 질환(8.3%–11.8%), 심혈관 질환(6%–8.5%) 등 다양한 질환군에서 유의미한 진단율 증가가 보고되었습니다.
* **VUS 재분류의 영향:** 새로운 진단의 상당 부분은 **'불확실한 임상적 중요성을 가진 변이(VUS, Variants of Uncertain Significance)'**를 **병원성 또는 병원성 추정 변이로 재분류**함으로써 발생합니다.
#### B. 임상 관리의 직접적인 변화
분자 진단에 도달하는 것은 단순한 진단을 넘어 환자에게 **실제적인 임상적 유용성**을 제공합니다.
* **실제 임상 개입:** 신장 질환 코호트에서, 재분석을 통해 재분류된 변이는 환자의 **60%에게 새로운 진단 또는 변경된 진단**을 제공했으며, 이 중 **67%가 임상 관리의 중대한 변화**를 경험했습니다. 예를 들어, 신경 발달 장애 진단을 받은 아동의 경우 75%가 맞춤형 검사 계획이 적용되는 등 직접적인 임상적 결과로 이어졌습니다.
* **진단 방황 종식:** 재분석은 환자와 가족에게 오랜 진단 방황을 끝내고 불확실성을 해소하는 **심리사회적 안정을 제공**합니다.
### 5. 고찰 및 의의와 시사점: 지속적인 진단 과정으로의 전환
이 종설은 ES 및 GS 데이터의 재분석이 더 이상 부수적인 활동이 아니라, **현대 유전체 의학의 근본적인 구성 요소**임을 강조합니다. 이는 유전체 검사를 **일회성 사건에서 지속적인 진단 프로세스**로 전환하는 것을 의미합니다.
**주요 의의 및 시사점:**
1. **지속적인 자산으로서의 유전체 정보:** 환자의 유전 정보는 **영구적인 자산**이며, 과학이 발전함에 따라 이에 대한 우리의 이해도 발전하고 개선될 수 있다는 점을 시사합니다.
2. **표준화된 가이드라인의 시급성:** 재분석의 잠재력을 완전히 실현하기 위해서는 **재정적, 물류적, 윤리적 장벽**을 해결하기 위한 **표준화된 가이드라인** 개발이 필수적입니다. 이러한 장벽에는 인력 부족, 불규칙한 자금 지원, 지속적인 데이터 검토에 대한 동의 문제가 포함됩니다.
3. **미래 기술 통합:** 향후 재분석은 lrGS, 전사체 및 단백질체와 같은 **다중 오믹스 데이터 통합**, 그리고 더욱 정교하고 효율적인 AI/ML 기술 사용으로 확장될 것입니다.
---
**이 연구가 중요한 이유:**
이 논문은 희귀 유전 질환 환자의 진단되지 않은 사례를 해결하기 위한 **가장 강력하고 발전적인 임상 전략**을 체계적으로 조명했다는 점에서 중요합니다.
재분석은 **진단율을 실질적으로 높이고** (최대 15%), 단순히 유전자 변이를 찾는 것을 넘어 **임상 관리, 표적 감시, 맞춤형 치료**로 이어지는 직접적인 이점을 제공합니다. 재분석을 임상 진료의 표준으로 정착시키는 것은 진단 방황으로 고통받는 수많은 환자들에게 시기 적절하고 적절한 임상 관리를 가능하게 하여 **정밀 의학의 발전을 가속화**하는 데 필수적인 과제임을 명확히 보여줍니다.

Perplexity.ai

이 논문은 “엑솜/유전체(ES/GS) 유전검사를 한 번만 보고 끝내지 말고, 주기적으로 다시 분석해야 한다”는 메시지를 담은 종합 리뷰입니다.[1]
## 연구 배경과 목적
- 희귀유전질환 환자들은 엑솜(ES)이나 유전체(견)검사를 받아도 상당수가 “원인 불명”으로 남습니다.[1]
- 하지만 유전학 지식과 분석 기술은 매년 빠르게 발전하고 있어, 예전에 해석하지 못했던 데이터에서 지금은 새로운 진단을 찾아낼 수 있습니다.[1]
- 이 논문은 “이미 가지고 있는 ES/GS 데이터를 다시 분석(reanalysis)했을 때 진단률이 얼마나 올라가는지, 어떤 도구와 전략이 쓰이는지, 실제 환자 진료에 어떤 도움이 되는지, 그리고 현실적인 한계는 무엇인지”를 정리·제시하는 것이 목적입니다.[1]
## ES와 GS, 그리고 ‘재분석’이 필요한 이유
- ES는 전체 유전체 중 단백질을 만드는 2% 이하 구간만 읽지만, 알려진 질병 관련 변이의 약 85%가 이 영역에 몰려 있어 효율적인 검사입니다.[1]
- GS는 코딩·비코딩 구역을 모두 포함해 훨씬 넓게 읽으므로, 조절부위나 구조적 변이 등 ES로 놓치기 쉬운 변이까지 포착할 수 있습니다.[1]
- 문제는, 검사 시점의 “당시 지식”을 기준으로 한 번 해석하고 끝내기 때문에, 이후 새로 밝혀진 유전자–질환 연관성이나 데이터베이스 업데이트가 반영되지 않는다는 점입니다.[1]
- 재분석은 예전 데이터에 최신 지식과 향상된 알고리즘을 다시 적용해 “그때는 모르고 지나쳤던 유전적 원인”을 찾아내는 과정입니다.[1]
## 재분석 방법과 도구
- 재분석은 보통 다음 요소를 포함하는 복합적인 과정으로 설명됩니다.[1]
- 최신 버전의 정렬·변이탐지 프로그램(BWA, GATK, DRAGEN 등)으로 원시 데이터를 다시 돌리는 과정
- 최신 공공 데이터베이스(dbSNP, ClinVar, gnomAD, HGMD 등)와 예측 도구(SIFT, PolyPhen-2, CADD, SpliceAI 등)로 변이를 다시 주석·해석하는 과정
- 인간 표현형 온톨로지(HPO) 같은 표준화된 임상 정보로 환자 증상을 더 정확히 정리한 뒤, 이를 반영해 후보 변이를 다시 선별하는 과정
- 또, 초기에 잘 잡기 어려웠던 변이를 찾기 위해 다음과 같은 기술이 점점 더 많이 활용됩니다.[1]
- 롱리드 유전체(lrGS): 구조 변이, 반복서열, 복잡한 영역 등 숏리드로 놓친 부분을 보완해 추가 7~17% 진단률 향상이 보고됨.[1]
- CNV(복제수 변이) 분석: ES/GS 데이터에서 삭제·중복을 분석해 소아 코호트에서 약 4~5% 추가 진단을 제공한 사례.[1]
- 비코딩·깊은 인트론 변이 탐지: 스플라이싱 예측 도구를 활용해 기존 필터로는 지나쳤던 스플라이스 이상 변이를 발굴.[1]
- 인공지능(AI)·머신러닝 기반 플랫폼(Moon, 3ASC, Franklin 등)은 유전자·변이·임상정보를 통합해 우선순위를 정리해 주며, 재분석 속도와 효율을 높이는 데 기여하지만 진단률을 떨어뜨리지는 않는 것으로 보고됩니다.[1]
## 재분석은 진단률을 얼마나 올려 주나?
- 여러 코호트를 종합하면, 재분석으로 추가로 얻는 진단률은 대략 3~15% 정도로 보고됩니다.[1]
- 질환군별로 보면, 논문이 정리한 표에서 다음과 같은 수치를 제시합니다.[1]
| 질환군 | 재분석으로 추가 진단률(%) | 주요 원인 요인 (예시) |
|---------------------------|---------------------------|--------------------------------------------------------|
| 신경발달장애(NDD) | 약 7.3–12.6 | 신규 유전자–질환 발견, 파이프라인·도구 업데이트, lrGS 도입 등[1] |
| 신장 질환 | 약 5–15 | 분석 파이프라인 개선, 임상정보 업데이트, 추가 분석 기법[1] |
| 안과(유전성 망막질환 등) | 약 8.3–11.8 | 파이프라인 업데이트, 표현형 재평가[1] |
| 심혈관 질환 | 약 6–8.5 | 변이 재분류, 도구 개선[1] |
| 미토콘드리아 질환 | 약 15 | 재분석 및 확장된 유전자 패널 적용[1] |
| 원발성 면역결핍 | 약 3 | ES/GS 재분석, 구조 변이 분석, 임상정보 업데이트[1] |
- 특히 “불명확 변이(VUS)”로 분류되었던 것들이 시간이 지나 새 증거가 쌓이면서 “가능성 있음/병적”으로 재분류되는 경우가 중요합니다.[1]
- 예를 들어, 413가족의 신장질환 유전검사를 재평가한 연구에서는 가족당 4.6% 수준의 변이 재분류가 있었고, 재분류된 변이의 약 63%가 더 심각한 등급으로 상향되었으며, 이로 인해 60%의 환자에서 진단이 새로이 확정되거나 변경되었습니다.[1]
- 그 결과, 진단이 바뀐 환자 중 약 67%는 추적·치료 계획이 실제로 바뀌는 등 임상 관리에 의미 있는 변화가 생겼습니다.[1]
## 재분석이 환자 진료에 미치는 실제 영향
- 재분석 덕분에 진단이 붙은 환자는 오랜 “원인 미상” 진단 여정을 끝내고, 특정 질환에 맞는 검진·모니터링·예방 전략을 세울 수 있습니다.[1]
- 한 신경발달장애 소아 연구에서는, 재분석으로 진단을 받은 아이들 중 75%에서 맞춤형 스크리닝 계획, 합병증 예방, 치료 전략 조정 등 직접적인 진료 변화가 보고되었습니다.[1]
- 또한 정확한 유전 진단은 가족에게도 의미가 큽니다.
- 재발 위험(다음 아이에게도 생길 가능성) 상담
- 가족 구성원 유전자 검사 여부 결정
- 향후 임신 계획, 생식 선택(착상전 유전진단 등)에 대한 정보 제공 등 다양한 의사결정에 객관적 근거를 제공합니다.[1]
- 심리적으로도 “왜 이런 일이 생겼는지”에 대한 답을 얻고, 잘못된 죄책감을 줄이며, 환자·가족이 질환을 받아들이고 대처하는 데 도움을 줍니다.[1]
## 언제, 어떻게 재분석해야 할까?
- 논문은 “재분석은 예외적인 ‘한 번 더 보기’가 아니라, 정기적으로 해야 하는 표준 진료의 일부”가 되어야 한다고 강조합니다.[1]
- 시점에 대해서는
- 1~2년에 한 번 재분석을 권장하는 의견이 많고,[1]
- 어떤 연구에서는 12개월 간격 재분석만으로도 진단률과 비용 효율성이 개선된다고 보고했습니다.[1]
- 또 다른 연구에서는 매일 자동으로 데이터베이스 업데이트를 반영하는 시스템을 도입했더니 약 3%의 추가 진단이 이루어졌다는 결과도 있습니다.[1]
- 실제로, 첫 분석 후 <1년일 때는 재분석으로 얻게 되는 추가 진단이 약 1% 수준이지만, 3년 이상 지나면 22%까지 올라간다는 보고도 있어, “시간이 지날수록 재분석의 가치가 커진다”는 점이 강조됩니다.[1]
## 현실적인 장애물과 윤리적·제도적 과제
- 그럼에도 불구하고, 많은 병원과 검사실에서 재분석이 일상적으로 이뤄지지 않는 이유는 다음과 같습니다.[1]
- 인력과 시간 부족: 같은 데이터를 다시 보는 작업이 반복·장기적으로 필요하지만, 인력은 한정적임.
- 비용과 보험: 재분석 비용을 누가, 몇 번까지 부담할 것인지에 대한 기준이 명확하지 않음.
- 동의와 책임:
- 환자가 과거에 동의한 범위 안에서 새로 발견된 중요한 유전 정보를 어디까지 알려야 하는지,
- 알리지 않았을 때의 법적·윤리적 책임은 어떻게 되는지에 대한 합의가 부족함.
- 이런 이유로 국가·학회 차원의 표준 가이드라인이 시급하며, 논문은 다음과 같은 내용을 포함해야 한다고 제안합니다.[1]
- 재분석 권장 주기와 우선순위 설정 기준
- 유전체 데이터를 장기 보관·관리하는 방법
- 새로 나온 중요한 결과를 언제, 어떻게 환자에게 알릴 것인지에 대한 프로토콜
- 지속적인 데이터 재검토에 대한 환자 동의 방식과 범위 등.[1]
## 이 연구의 의의와 시사점
- 이 논문은 “유전검사는 한 번 받고 끝나는 게 아니라, 평생 활용할 수 있는 데이터 자산”이라는 관점을 명확하게 제시합니다.[1]
- 재분석을 통해 희귀질환 환자에서 추가 3~15% 정도의 진단을 새로 얻을 수 있고, 이 중 상당수가 실제 치료·추적 전략 변경으로 이어진다는 근거를 다양한 질환군에 걸쳐 정리했습니다.[1]
- 또한 단순히 필터 조건만 조금 바꾸는 수준이 아니라,
- 롱리드 시퀀싱, CNV 분석, 비코딩 영역 분석, AI 기반 해석, 국제 데이터 공유 플랫폼(GeneMatcher, Matchmaker Exchange, RD-Connect 등)의 활용까지 포함한 “다층적인 재분석 체계”가 이미 형성되고 있음을 보여줍니다.[1]
- 동시에, 인력·비용·윤리·제도 문제로 인해 이러한 재분석이 모든 환자에게 공평하게 제공되지 못하고 있다는 점을 지적하며, 이를 해결할 수 있는 국가·국제적인 표준과 지원이 필요함을 강조합니다.[1]
## 왜 중요한 연구인가?
- 유전체 검사는 가격이 점점 내려가고, 시행 기관은 늘어나고 있지만, “처음 한 번의 해석”만 믿고 데이터를 방치한다면 거대한 잠재 가치를 버리는 것입니다.[1]
- 이 논문은 재분석이 실제로 추가 진단을 만들어내고, 환자 치료 방침을 바꾸며, 가족의 삶의 선택까지 영향을 미친다는 구체적 근거를 제시함으로써, 재분석을 “선택적인 연구 활동”이 아닌 “현대 의학의 필수 진료 과정”으로 격상시키는 논리적 기반을 제공합니다.[1]
- 앞으로 개인 맞춤의학과 정밀의학이 더 확산될수록, 개인이 한 번 남긴 유전체 데이터는 평생 동안 반복적으로 해석·업데이트되어야 하며, 이 연구는 그 방향성을 명확하게 제시한다는 점에서 임상의, 검사실, 정책입안자 모두에게 중요한 시사점을 주는 논문입니다.[1]

Kimi

# 유전자 검사를 다시 하면 왜 더 많은 진단이 나올까?
## 유전자 검사 데이터 ‘재분석’이 희귀질환 환자에게 주는 선물
---
### 1. 연구 배경 – “왜 아직도 답을 못 찾았을까?”
- 전체 유전자의 단 2%만 보는 **엑솜(Exome)**, 또는 100%를 보는 **지놈(Genome) 검사**는 이제 희귀질환 진단의 ‘1순위’ 도구입니다.
- 하만 1차 검사만으로 **확실한 유전자 변이를 찾는 비율(초진율)**은 30~40%에 머물렀습니다.
- 나머지 60~70%는 “원인 미상”이라는 채증만 받고 수년간 병원을 전전하는 **‘진단 오디세이’**를 겪습니다.
---
### 2. 연구 목적 – “옛 데이터를 다시 꺼내면 답이 보일까?”
논문은 1차 검사에서 **‘음성’ 또는 ‘미확정 변이(VUS)’로 끝난 데이터**를
- 새로운 과학 지식
- 업그레이드된 분석 프로그램
- 환자 증상의 추가 정보
등을 활용해 **‘재분석(reanalysis)’했을 때** 얼마나 많은 환자가 진단을 받고,
그 진단이 치료·관리에 어떤 변화를 주는지를 종합적으로 정리했습니다.
---
### 3. 어떻게 재분석했나 – ‘오래된 사진을 AI로 보정하듯’
1. **소프트웨어 업그레이드**
- 2015년판 → 2023년판 ‘변이 탐지 엔진’(GATK, DRAGEN 등)로 다시 돌리기
2. **지식 데이터베이스 누적치 반영**
- ClinVar, gnomAD 같은 공개DB가 1~2년마다 수만 건씩 새로 쌓임
- 한 번은 ‘베니그’라고 봤던 변이가 2년 뒤 ‘병원성’으로 둔갑하는 사례 多
3. **새로운 분석 기법 추가**
- **구조변이(SV)·복사수변이(CNV)** 찾기
- **롱리드(긴 DNA) 시퀀싱**으로 반복서열·유사유전자 구간 해결
- **인공지능(AI) 우선순위 알고리즘**(Moon, Franklin 등)으로 ‘핵심 변이 10개’만 추려줌
4. **환자 증상 재정리**
- 표준 용어(HPO)로 증상을 다시 입력하면 ‘같은 증상을 유발하는 새 유전자’가 자동 매칭
---
### 4. 핵심 결과 – “한 번 더 보면 3~15%가 추가 진단!”
| 질환군 | 추가 진단률(중간값) | 대표 사례 |
|---|---|---|
| 신장질환 | 5~15% | Alport·성신증후군 등 17개 유전자 VUS → 병원성 |
| 뇌신경발달장애 | 7~12% | 75%가 맞춤형 발달재활·뇌파 추적 프로그램 시작 |
| 심장리듬장애 | 6~8% | 돌연사 예방 위해 ICD(자동제세동기) 삽입 시점 당김 |
| 미토콘드리아 질환 | 최대 15% | ‘의심’ 단계에서 확정 진단 → 고용량 보조제 처방 |
| 전체 평균 | 3~15% | 3년이 지날수록 진단 확률 ↑ (1년차 1% → 3년차 22%) |
- **VUS 재분류 비율**: renal cohort 기준 4.6% → 79%가 VUS에서 ‘병원성/가능병원성’으로 상향
- **진단 변경 환자의 67%**는 약물·검사·수술 시기 등 **실제 치료 계획이 바뀜**
---
### 5. 고찰 – 왜 재분석이 ‘선택’이 아닌 ‘필수’가 되는가
1. **지식은 매일 업데이트**
- 매년 300~500개 새 유전자-질환 관계가 보고됨
- 2020년에는 “유전자 기능 미상”이던 KIF1A가 2023년 “유아 뇌위축 원인”으로 확정
2. **1차 검사는 ‘당시 기술 한계’를 벗어나지 못함**
- 짧은 독서(shot-read)로는 반복·유사 구간 오류 多 → 롱리드로 해결
- 구조변이·심층인트론 변이는 기본 파이프라인에 포함 안 됨
3. **비용 대비 효과**
- 재분석 비용 = 새로 검사하는 비용의 10~20%
- 조기 진단으로 수십만 원 재분석 비용이 수천만 원 진료비 절감
---
### 6. 의의 & 시사점 – “내(혹은 내 아이) 유전자 정보는 ‘일회용’이 아니다”
- 유전자 검사는 **단숨에 끝나는 ‘시험’이 아니라**, 평생 두고두고 들여다보는 **‘자산’**입니다.
- **“음성이니까 원인 없음”**이라는 말은 **지금 이 순간의 기술 기준**일 뿐, 1~2년 뒤엔 달라질 수 있습니다.
- 따라서
- 검사 병원·업체에 **“재분석은 언제, 어떻게 해 주나요?”**를 반드시 확인
- 증상이 새로 생기면 **‘업데이트된 증상 리스트’**를 보내 재분석 요청
- 국내외 **‘재분석 지원 네트워크’**(GeneMatcher, RD-Connect 등) 적극 활용
---
### 7. 이 연구가 왜 중요한가 – “희귀질환의 끝없는 터널에 불을 켜줬다”
희귀질환은 **‘드물어서’** 연구도, 신약도, 진단도 느립니다.
그러나 이미 뽑아 놓은 데이터를 **다시 보는 것만으로** 10명 중 1명은
- 이름 있는 병을 얻고,
- 곧바로 맞춤 치료·예방·가족 계획을 세울 수 있다는 사실은
**‘비싼 신기술’이 아닌 ‘지속적인 관심’이 진단을 완성한다는 희망**을 줍니다.
이 논문은 **“유전자 검사, 한 번만 하면 끝”이라는 오래된 관행에 종지부**를 찍고,
**‘재분석=표준 진료’** 시대를 열어야 한다는 과학계의 공식 선언서나 다름없습니다.

출처: @ye._.vely618

일요일, 11월 10, 2024

엑솜 시퀀싱 완벽 가이드!

엑솜 시퀀싱관련하여 정리한 논문을 한번 가져와봤습니다. 이름하여 Exome sequencing explained: a practical guide to its clinical application 입니다.

DOI: 10.1093/bfgp/elv054

엑솜 시퀀싱 관련하여 이런 저런 모든 것들에 대해서 한번 짚어본 논문 되겠습니다.

gemini

## 엑솜 시퀀싱 (WES) 완벽 가이드: 유전 질환 진단의 혁신
**엑솜 시퀀싱(WES)**은 차세대 염기서열 분석 기술로, 유전 질환의 진단에 혁신을 가져왔습니다. 이 기술은 게놈의 단백질 코딩 영역인 엑솜만을 선택적으로 분석하여 질병의 원인이 되는 유전자 변이를 찾아냅니다. 희귀 질환 진단 성공률이 25%에 달하며, 그 중요성이 점점 더 커지고 있습니다.
### WES란 무엇인가요?
우리 몸의 유전 정보는 DNA에 담겨 있으며, DNA는 약 30억 개의 염기쌍으로 이루어져 있습니다. 이 중 단백질을 만드는 정보를 담고 있는 부분을 **엑솜**이라고 하며, 전체 DNA의 약 1-2%를 차지합니다. 엑솜 시퀀싱은 이 엑솜 영역만을 집중적으로 분석하여 유전 질환의 원인이 되는 변이를 찾아내는 기술입니다.
### WES는 어떻게 진행되나요?
1. **DNA 추출**: 혈액, 침, 조직 등에서 DNA를 추출합니다.
2. **엑솜 캡쳐**: 엑솜 영역의 DNA를 선택적으로 분리합니다.
3. **시퀀싱**: 차세대 염기서열 분석 기술을 이용하여 엑솜 DNA의 염기서열을 분석합니다.
4. **데이터 분석**: 분석된 염기서열 데이터를 생물정보학 도구를 이용하여 분석하고, 유전자 변이를 찾아냅니다.
5. **변이 해석**: 발견된 변이가 질병과 관련이 있는지 판단합니다.
### WES의 품질 관리는 어떻게 이루어지나요?
WES 분석 과정에서 **품질 관리**는 매우 중요합니다. 분석의 정확도를 높이기 위해 다음과 같은 품질 관리 기준을 적용합니다.
* **시퀀싱 깊이**: 충분한 시퀀싱 깊이를 확보하여 변이를 정확하게 검출합니다.
* **정렬**: 염기서열을 정확하게 정렬하여 오류를 최소화합니다.
* **변이 검출**: 정확한 변이 검출 알고리즘을 사용합니다.
* **변이 해석**: 변이의 질병 관련성을 정확하게 해석합니다.
### 데이터 필터링 방법은 무엇인가요?
WES 분석으로 얻은 데이터는 방대하기 때문에 질병과 관련된 변이를 찾기 위해 **데이터 필터링** 과정이 필수적입니다.
* **1차 필터링**: 질병을 유발할 가능성이 낮은 변이를 제거합니다.
* 흔한 변이 제거
* 단백질 서열에 변화를 일으키지 않는 변이 제거
* **2차 필터링**: 질병을 유발할 가능성이 높은 변이를 선별합니다.
* 유전자 기능에 영향을 미치는 변이
* 질병 관련 유전자의 변이
* 가족력과 일치하는 변이
### WES는 어떻게 임상에 적용되나요?
WES는 다양한 유전 질환의 진단에 활용됩니다. 특히, 원인을 알 수 없는 희귀 질환, 유전성 암, 심장 질환 등의 진단에 효과적입니다. WES를 통해 질병의 원인 유전자를 찾아냄으로써 정확한 진단과 맞춤형 치료를 가능하게 합니다.
### WES의 윤리적 고려 사항은 무엇인가요?
WES는 개인의 유전 정보를 분석하는 기술이기 때문에 윤리적인 문제도 고려해야 합니다.
* **개인 정보 보호**: 유전 정보는 민감한 개인 정보이므로 유출되지 않도록 주의해야 합니다.
* **유전 정보 차별**: 유전 정보를 기반으로 한 차별을 금지해야 합니다.
* **심리적 영향**: 유전 질환 진단 결과가 환자와 가족에게 미칠 심리적 영향을 고려해야 합니다.
### 결론
WES는 유전 질환 진단에 혁신을 가져온 기술입니다. 정확한 진단과 맞춤형 치료를 가능하게 하며, 의학 발전에 크게 기여할 것으로 기대됩니다.

clova-x

Whole-exome sequencing(WES)은 유전자 연구와 의료 진단에 혁명을 일으키고 있는 최신 기술 중 하나입니다. 이 기술은 인간 게놈의 약 1~2%를 차지하는 단백질 코딩 영역(exome)을 정밀하게 분석하여 유전적 변이를 찾아내는 방법입니다.
WES의 방법론은 크게 세 단계로 나눌 수 있습니다. 첫 번째 단계는 DNA 샘플을 추출하고 정제하는 과정입니다. 이 과정에서는 세포에서 DNA를 분리하고, 불순물을 제거하여 고품질의 DNA를 얻습니다. 두 번째 단계는 exome을 선택적으로 캡처하는 과정입니다. 이 과정에서는 DNA를 작은 조각으로 자른 후, 특정 프로브를 사용하여 exome 영역만을 선택적으로 결합시킵니다. 마지막 단계는 시퀀싱 과정으로, 결합된 exome 조각들을 서열화하여 유전 정보를 해독합니다.
품질 관리는 WES의 정확성과 신뢰성을 보장하는 데 매우 중요합니다. DNA 추출 과정에서는 오염을 방지하고, DNA의 순도와 농도를 측정하여 최적의 조건에서 시퀀싱을 수행할 수 있도록 합니다. 라이브러리 준비 과정에서는 DNA 조각의 크기와 분포를 조절하고, 표지를 부착하여 시퀀싱 장비에서 인식할 수 있도록 합니다. 시퀀싱 과정에서는 장비의 성능을 모니터링하고, 데이터의 품질을 평가하여 오류를 최소화합니다.
데이터 필터링은 WES 데이터에서 유용한 정보를 추출하는 데 필수적인 과정입니다. 먼저, 시퀀싱 데이터에서 오류와 중복을 제거하고, 정렬하여 게놈 상의 위치를 파악합니다. 그런 다음, 변이를 검출하고, 특성을 분석하여 유전적 변이의 종류와 영향을 평가합니다. 이 과정에서는 다양한 생물정보학 도구와 알고리즘을 사용하여 데이터를 처리하고 분석합니다.
WES는 다양한 임상 분야에서 활용되고 있습니다. 희귀 질환의 진단과 치료에 큰 도움을 주고 있으며, 암, 심혈관 질환, 신경계 질환 등 다양한 질병의 원인을 규명하는 데에도 활용되고 있습니다. 또한, 개인 맞춤형 치료를 위한 약물 반응 예측에도 활용될 수 있습니다.
윤리적 고려 사항도 중요합니다. 개인의 유전 정보는 민감한 정보이므로, 수집, 저장, 분석 및 공개에 있어서 엄격한 규제와 보호 조치가 필요합니다. 또한, 유전 정보를 이용한 차별이나 오용을 방지하기 위한 제도적 장치도 마련되어야 합니다.
WES는 아직 초기 단계의 기술이지만, 그 잠재력은 매우 큽니다. 앞으로 기술의 발전과 함께 더욱 정확하고 효율적인 방법으로 유전적 변이를 찾아내고, 이를 활용하여 의료 발전에 기여할 것으로 기대됩니다.

chatGPT

### 1. 전장 엑솜 시퀀싱(WES)란?
전장 엑솜 시퀀싱(WES)은 유전자 전체 중에서 단백질을 만드는 데 중요한 역할을 하는 "엑솜"이라는 부분을 집중적으로 분석하는 유전자 검사 방법입니다. 엑솜은 유전자 전체의 약 1-2%에 불과하지만, 대부분의 질병 유발 변이가 엑솜에서 발생하므로, WES는 질병 원인을 밝히는 데 매우 효과적입니다.
### 2. WES의 방법론
WES 과정은 크게 세 단계로 나뉩니다:
- **DNA 추출**: 혈액이나 타액과 같은 샘플에서 DNA를 추출하여 분석에 적합한 상태로 준비합니다. 혈액은 높은 품질의 DNA를 제공하지만, 타액은 비침습적인 방법으로 얻을 수 있는 장점이 있습니다.
- **라이브러리 준비**: 추출한 DNA를 잘게 자른 후 엑솜에 해당하는 특정 부위만 선택적으로 모아서 DNA 라이브러리를 만듭니다. 이 과정에는 다양한 회사의 키트가 사용되며, 각각의 장단점이 있습니다.
- **시퀀싱**: 준비된 DNA 라이브러리를 첨단 시퀀싱 장비로 분석하여 엑솜의 염기서열을 읽어냅니다. 이 데이터를 통해 각 개인의 엑솜을 분석할 수 있습니다.
### 3. 품질 관리(Quality Control)
WES는 매우 방대한 양의 데이터를 다루므로, 분석 과정에서 철저한 품질 관리가 필수적입니다. 데이터의 품질을 높이기 위해 각 단계에서 다음과 같은 절차를 거칩니다:
- **데이터 정제**: 낮은 품질의 데이터를 걸러내고, 잘못된 변이 신호를 최소화하여 실제 질병 관련 변이만 남기도록 합니다.
- **데이터 일치**: 샘플이 잘못되지 않았는지, 외부 DNA로부터 오염이 없는지를 확인하여 신뢰할 수 있는 분석 결과를 얻습니다.
### 4. 데이터 필터링 방법
WES 데이터는 수십만 개의 변이를 포함하고 있어, 이를 필터링하여 질병과 관련된 변이를 추려내야 합니다.
- **1차 필터링**: 흔하고 무해한 변이를 제거하는 과정으로, 일반 인구에서 자주 나타나는 변이와 불확실한 품질의 변이를 걸러냅니다.
- **2차 필터링**: 남은 변이들 중에서 임상적으로 의미가 있을 가능성이 높은 변이를 우선순위로 두고 분석합니다. 생물학적 기능에 미치는 영향이나 유전적으로 중요한 부위에서 발생한 변이인지 등을 고려해 변이를 선정합니다.
### 5. 임상적 적용
WES는 특히 드문 유전병의 진단에 유용하게 활용되고 있습니다. 예를 들어, 기존 유전자 검사로 원인을 알 수 없던 희귀 유전 질환의 원인을 규명하고, 환자에게 맞는 치료 계획을 세우는 데 도움을 줍니다. WES는 암, 면역 질환과 같은 복잡한 질병에도 적용이 가능하며, 이를 통해 다양한 유전적 원인을 밝히고 환자의 예후를 예측하는 데 중요한 역할을 합니다.
### 6. 윤리적 고려사항
WES 분석은 예상치 못한 추가 정보를 얻을 수 있는 가능성을 가지고 있어, 윤리적인 문제가 발생할 수 있습니다. 예를 들어, 환자가 원하지 않는 질병 유전자 변이가 발견되었을 때, 이를 환자에게 알릴 것인지 여부가 문제가 됩니다. 미국 유전의학회는 환자의 건강에 영향을 줄 수 있는 특정 유전자 변이는 진단과 상관없이 제공할 것을 권고하고 있지만, 이는 환자의 동의와 개인정보 보호 등의 문제가 포함되어 있어 의료진의 신중한 판단이 필요합니다.
### 7. WES의 한계점
WES는 엑솜에 해당하는 1-2%의 유전자 영역만 분석하므로, 비암호화 부위에 존재하는 중요한 유전적 변이를 놓칠 수 있습니다. 또한, 분석 과정에서 다양한 해석 방법에 따라 결과가 달라질 수 있어 신뢰성을 유지하기 위한 표준화된 절차가 필요합니다.
---
WES는 빠르게 발전하고 있는 유전자 분석 기술로, 비용과 기술의 발전으로 인해 점차 의료 현장에서 널리 사용될 전망입니다. 이를 통해 개인의 유전자 정보를 바탕으로 맞춤형 진료를 받을 수 있는 시대가 열리고 있지만, 이 과정에서 발생할 수 있는 윤리적 문제와 데이터 해석의 한계는 지속적인 연구와 개선이 필요한 부분입니다.

NotebookLM

## 엑솜 시퀀싱 (WES) 완벽 가이드
엑솜 시퀀싱 (WES)은 유전 질환의 진단과 치료에 혁명을 일으킨 강력한 유전체 분석 기술입니다. 이 글에서는 WES에 익숙하지 않은 일반인을 위해 WES의 방법론, 품질 관리, 데이터 필터링, 임상 적용 및 윤리적 고려 사항에 대해 자세히 설명합니다.
### 1. WES란 무엇인가요?
**WES는 전체 게놈 시퀀싱과 달리 단백질을 코딩하는 DNA 영역인 엑솜만을 집중적으로 분석하는 기술입니다.** 인간 게놈의 약 1~2%를 차지하는 엑솜은 질병을 유발하는 변이의 대부분이 존재하는 중요한 영역입니다. WES는 전체 게놈 시퀀싱보다 비용 효율적이며 데이터 분석 및 해석이 용이하다는 장점이 있습니다.
### 2. WES는 어떻게 수행되나요?
WES는 여러 단계를 거쳐 수행됩니다.
* **DNA 추출**: WES의 첫 번째 단계는 혈액, 타액 또는 조직 샘플에서 DNA를 추출하는 것입니다. 가장 일반적으로 사용되는 샘플은 말초 혈액 백혈구입니다. 타액 샘플은 채취가 용이하지만, DNA의 품질과 양이 떨어질 수 있습니다.
* **라이브러리 준비**: 추출된 DNA는 시퀀싱을 위해 조각화하고 특정 어댑터를 연결하여 라이브러리를 준비합니다.
* **엑솜 캡처**: 엑솜 캡처는 라이브러리에서 엑솜 영역만 선택적으로 농축하는 과정입니다. 이는 엑솜 영역에 특이적으로 결합하는 프로브를 사용하여 수행됩니다.
* **시퀀싱**: 농축된 엑솜 라이브러리는 차세대 시퀀싱 (NGS) 기술을 사용하여 시퀀싱됩니다. NGS는 대량 병렬 시퀀싱을 통해 수백만 개의 DNA 조각을 동시에 읽을 수 있습니다.
* **데이터 분석**: 시퀀싱된 데이터는 인간 참조 게놈에 정렬되고 변이를 식별하기 위해 분석됩니다.
### 3. WES 데이터의 품질 관리는 어떻게 이루어지나요?
WES 데이터의 정확성과 신뢰성을 보장하기 위해 품질 관리가 중요합니다. 품질 관리는 다음과 같은 요소를 고려합니다.
* **시퀀싱 깊이**: 시퀀싱 깊이는 각 DNA 염기가 시퀀싱된 횟수를 나타냅니다. 충분한 시퀀싱 깊이는 변이를 정확하게 감지하기 위해 중요합니다.
* **정렬 품질**: 시퀀싱된 DNA 조각은 인간 참조 게놈에 정확하게 정렬되어야 합니다. 잘못된 정렬은 거짓 양성 변이를 생성할 수 있습니다.
* **변이 호출의 정확성**: 변이 호출 알고리즘은 시퀀싱 데이터에서 변이를 정확하게 식별해야 합니다.
* **샘플 오염**: 샘플 오염은 WES 결과에 영향을 미칠 수 있습니다. 오염을 확인하고 제거하기 위한 절차가 필요합니다.
### 4. WES 데이터는 어떻게 필터링되나요?
WES는 개인당 약 25,000개의 변이를 생성합니다. 이러한 방대한 양의 데이터에서 질병과 관련된 변이를 찾기 위해 데이터 필터링이 필수적입니다. 데이터 필터링은 다음과 같은 단계로 이루어집니다.
* **1차 필터링**: 1차 필터링은 양성 변이를 제거하는 데 중점을 둡니다.
* **품질 관리**: 낮은 품질의 변이를 제거합니다.
* **후보 유전자 분석**: 임상 표현형과 관련된 유전자의 변이만 선택합니다.
* **동의어 변이 제거**: 단백질 서열에 변화를 일으키지 않는 동의어 변이를 제거합니다. 하지만 동의어 변이도 드물게 질병을 유발할 수 있으므로 주의가 필요합니다.
* **낮은 대립유전자 빈도 (MAF) 필터링**: MAF는 집단에서 특정 변이의 빈도를 나타냅니다. 희귀 질환과 관련된 변이는 일반적으로 MAF가 낮습니다. 따라서 특정 MAF 이하의 변이만 선택합니다.
* **가계 내 변이 분리**: 가족 구성원의 변이 분리 패턴을 분석하여 질병과 관련된 변이를 식별합니다.
* **2차 필터링**: 2차 필터링은 남아 있는 후보 변이를 우선 순위를 매기는 데 사용됩니다.
* **In silico 예측**: 단백질 기능에 미치는 영향을 예측하는 컴퓨터 알고리즘을 사용합니다.
* **복제수 변이 (CNV) 분석**: CNV는 DNA의 특정 영역이 삭제되거나 중복된 것을 말합니다. WES는 CNV를 감지하는 데 제한적이지만, 최근 기술 발전으로 CNV 분석 능력이 향상되고 있습니다.
* **다중 대립 유전자**: 동일한 유전자에서 여러 개의 변이가 발생하는 경우 질병을 유발할 가능성이 더 높습니다.
* **우선 순위가 지정된 변이 보고**: 필터링 과정을 거친 후 남은 변이는 임상적 중요성을 평가하기 위해 검토됩니다. 이 과정에는 변이의 이전 보고, 단백질 기능에 미치는 영향, 유전자 발현 연구 등이 포함됩니다.
### 5. WES는 임상에서 어떻게 활용되나요?
WES는 다양한 임상 분야에서 희귀 질환의 진단에 성공적으로 적용되어 왔습니다.
* **진단율**: WES는 희귀 질환 진단에 있어 약 25%의 성공률을 보입니다. 이는 기존의 유전 검사 방법보다 훨씬 높은 수치입니다.
* **새로운 질병 유전자 발견**: WES는 이전에 알려지지 않았던 질병 유전자를 발견하는 데 기여했습니다.
* **개인 맞춤형 치료**: WES는 환자의 유전적 특징에 따라 맞춤형 치료법을 개발하는 데 도움이 될 수 있습니다.
### 6. WES의 윤리적 고려 사항은 무엇인가요?
WES의 임상 적용에는 다음과 같은 윤리적 고려 사항이 존재합니다.
* **사전 동의**: WES는 광범위한 유전 정보를 생성하므로, 환자는 WES의 잠재적 결과와 위험성에 대해 충분히 이해하고 동의해야 합니다. 특히 우발적 소견 (incidental findings)의 가능성에 대한 설명이 중요합니다. 우발적 소견은 원래 검사 목적과 관련 없는 유전적 변이를 말합니다.
* **데이터 공유**: WES 데이터는 연구 목적으로 공유될 수 있습니다. 데이터 공유는 과학적 발전에 기여하지만, 개인 정보 보호에 대한 우려도 제기됩니다.
* **우발적 소견 보고**: 우발적 소견을 환자에게 보고할지 여부는 윤리적으로 논란이 되는 문제입니다. 현재 미국 의학 유전체학회 (ACMG)는 56개 유전자의 병원성 변이를 우발적으로 발견할 경우 환자에게 보고할 것을 권고하고 있습니다 . 하지만 우발적 소견의 보고는 환자에게 불필요한 불안감을 유발하거나 과도한 의료 행위를 초래할 수 있다는 비판도 있습니다.
### 7. WES의 한계는 무엇인가요?
WES는 강력한 유전체 분석 기술이지만, 몇 가지 한계점이 있습니다.
* **제한된 범위**: WES는 엑솜 영역만 분석하기 때문에 엑솜 외부의 변이는 감지할 수 없습니다.
* **CNV 및 작은 indel의 검출**: WES는 CNV와 작은 indel을 검출하는 데 어려움이 있습니다.
* **데이터 해석의 복잡성**: WES 데이터 해석은 복잡하고 전문 지식이 필요합니다.
* **비용**: WES는 여전히 상당한 비용이 소요될 수 있습니다.
### 8. WES의 미래는 어떻게 될까요?
WES는 지속적으로 발전하고 있으며, 미래에는 더욱 광범위하게 활용될 것으로 예상됩니다.
* **비용 감소**: 시퀀싱 기술의 발전으로 WES 비용은 계속 감소하고 있습니다.
* **데이터 분석 기술 향상**: WES 데이터 분석 기술의 발전으로 더 정확하고 효율적인 변이 식별이 가능해질 것입니다.
* **임상 적용 확대**: WES는 희귀 질환뿐만 아니라 암, 심혈관 질환, 신경 질환 등 다양한 질환의 진단과 치료에 활용될 것으로 예상됩니다.
**결론적으로 WES는 유전 질환 연구 및 진단에 혁명을 일으킨 강력한 기술입니다. WES는 희귀 질환 환자에게 진단의 기회를 제공하고 개인 맞춤형 치료법 개발에 기여할 수 있습니다.** 하지만 WES의 한계와 윤리적 고려 사항을 인식하는 것이 중요합니다. WES 기술의 지속적인 발전과 함께 유전체 의학의 미래는 밝을 것으로 예상됩니다.

지금은 WGS을 언급하고 있지만 최근 몇년 전까지만 해도 엑솜 시퀀싱을 꽤 많이 하고 있었기에 지금 WES에 대해서 한번 돌아보는것도 크게 문제되어 보이지는 않아보이긴 합니다. :)

예전에는 아니 왜 굳이 불필요하게 WES, WGS 처럼 시퀀싱을 많이하냐! Targeted Panel 잘 디자인하면 되지 않냐!! 했지만 시퀀싱 가격이 급속도로 내려가면서 Targeted Panel과 비슷한 가격에 WES를 하게되면서 WES 만능자들이 나왔고 시퀀싱 가격이 더 내려가면서 이제 WGS가 고개를 들고 있죠 ㅎㅎ

좀 오래된 논문 들춰가면서 기술에 대해서 한번 돌아보면서 내가 놓치고 있는 것은 무엇인지 생각해보는 시간을 가져보는것도 좋을듯 합니다. :)

출처: @ye._.vely618

수요일, 10월 04, 2023

WES를 하는데 Capture가 좋을까 Amplicon이 좋을까?

Evaluation of Hybridization Capture Versus Amplicon-Based Methods for Whole-Exome Sequencing 라는 제목의 WES(Whole Exome Sequencing)를 하는데 Hybridization Capture가 좋은지 Amplicon이 좋은지 비교해본 논문이 있어 한번 들여다 보았습니다.

doi: 10.1002/humu.22825

사실 2023년 현재 WES를 하는데 Amplicon을 한다고 저는 말리지는 않겠지만, WES를 Amplicon으로? 라고 왜 Amplicon으로 하는지 궁금한 눈빛으로 바라보긴 할 것 같습니다.

이 논문은 당연히 2015년에 출판된 논문으로, 그 때 당시에는 한번 짚고 넘어가야 할 수 밖에 없는 내용이었고, 당시에 이런 벤치마킹 연구를 해주었기 때문에 현재 우리가 큰 의심없이 WES할 때는 Capture지를 외칠 수 있지 않나 합니다.

물론 가까운 시일내에 고성능의 간섭 없는 Amplicon 방법이 개발되면, 2025년에는 WES는 Amplicon이지! 할지 누가 또 알겠습니까 :)

여튼 논문에서는 2015년 당시 대표적으로 사용되던 Capture 방법 2가지(SureSelect, SeqCap)와 Amplicon 방법 2가지(HaloPlex, AmpliSeq) 를 상호 비교해보았습니다.

아직도 SeqCpa과 HaloPlex로 생성된 데이터를 한번도 만져보지를 못해서 얼마나 데이터가 깨끗한지, 쓸만한지는 모르겠습니다. 다만 SureSelect와 AmpliSeq은 지금도 사용하고 있으니 그 기술을 꼭 알아야 할까 하는 의문이 있습니다.

그리고 시료로는 변이들이 잘 정의된 것들을 사용하지 않았나 싶네요

BT-20, MCF-7, HCC-2218, HCC-2218BL 4개 셀라인을 사용한듯 싶습니다.

그리고 결과 비교 중에 SNP말고도 copy number를 확인하는데 copy number 확인을 위해 Affy사의 SNP Array 6.0도 함께 진행하여 HCC-2218, HCC-2218BL의 copy number를 확인 하였습니다. 굳이 NGS를 하는데 microarray도 해야돼? 라는 생각이 드셨다면, 이 논문이 발표된 시점이 2015년이란것을 잊지 않으셨으면 합니다. :)

그래서 이런저런 당시 일반적으로 사용되었던 정렬 툴과 각 Library에 적합한 정렬 툴을 사용하여 정렬하고, 다음에는 각각 SNV와 InDel, Copy Number 관련된 분석 툴을 사용하여 비교해보았고,

지금의 우리가 알고있는것과 동일하게 Capture방식이 Amplicon 방식보다 시쿼싱 복잡성(? 이건 어떤의미인지 잘 모르겠습니다.)과 균일성 (Uniformity)관련해서 더 좋은것을 확인했고, 위양성 변이가 탐지될 가능성도 적음을 확인했다고 합니다.

그러니 WES 할 때는 안심하고 Capture 방식 사용하세요 되겠습니다.

출처: @ye._.vely618

화요일, 9월 14, 2021

Long-read sequencing identified a causal structural variant in an exome-negative case and enabled preimplantation genetic diagnosis

아니.. 2018년도에 이런 논문을 블로그에 keep놓고 그냥 놀고 있었다니..

여하튼 눈에 띄어서 한편 사브작 하나 올려봅니다.

역시 일이 많을때 딴짓은 국룰이라는 명제를 증명하듯......

Long-read sequencing identified a causal structural variant in an exome-negative case and enabled preimplantation genetic diagnosis

https://doi.org/10.1186/s41065-018-0069-1

WGS(Whole Genome Sequencing)이 아무리 저렴해졌다고하나 내 genome에 이상이 있는지 진단을 위해서 시퀀싱하는 비용이 억대에서 천만원 정도로 떨어진거지 아직은 WGS가지고 일반인이 무엇을 하기에는.... 물론 Private Premium Platinum Gold Special Society 같은 수식어의 멤버 라면... 할려면 할수는 있겠다만..

여튼 현재 아직까지는 유전체 진단에서 가장 현실적이고 합리적인 방법은 WES이나.. 짧은 read들을 가지고는 structural variant를 탐지하기에는 무리가 좀 있으니 long read로 해야하지 않겠냐라고 얘기하는 2018년도 논문되겠습니다.

해당 논문에서 언급하는 환자는 G6PC 유전자에 돌연변이가 생겨 간비대, 신장비대를 초래하는 recessive inheritance 질환으로 긴 지역에 deletion이 있었으나 WES만으로 진단하였을 때는 확인하지 못했고 nanopore (long read seq)를 사용하여 확인하였을 때에는 정확히 긴 길이의 SV를 확인 할 수 있어다 라는게 주제되겠습니다. 지금까지 short read만으로 시퀀싱하여 진단되지 않거나 오진되는 환자들의 돌연변이를 정확하게 확인 할 수 있는 도구가 임상 진단에서 하나더 생겼고 그로 인해 정확한 진단을 할 수 있게 되었다는 자화자찬의 평을 내면서 논문을 마무리하였습니다.

사례를 통해 short read만으로는 진단에 한계가 있다는것을 확인하였고 long read 방법이 이제 진단에 슬슬 자리 잡아야 하지 않나 싶은 생각이 드는....

(근데 길게 뽑으려면 나노포어 실험이 그렇게 쉽지 않은듯하던데.... )

출처: @ye._.vely618

화요일, 9월 22, 2020

8개의 variant caller 통합 도구

2018년 WGS이나 WES 혹은 Target Seq을 한 후 변이를 확인 할 때 으레 GATK를 사용하는 우리들에게 감사하게도 여러개(정확히는 8개)의 변이 caller 결과를 통합해서 확인 할 수 있는 논문이 발표되었습니다.

진짜 감사할지 이름만 appreci할지...

(구글 검색결과 글쎄요... 이유가 무엇인지는 모르겠지만 오늘이 2020년 9월 12일인데 인용 횟수가 4개네요..)

목적은 NGS를 임상에 사용하려면 유효한 variant를 call해야 하는데 분석 tool마다 어떤 variant는 call하고 어떤 variant는 call하지 못하는 경우가 발생해서 그럼 여기서 나온 결과와 저기서 나온 결과 합치자!!

근데 이 작업을 할 하는데?? 이게 그렇게 쉽다고?

그렇죠 이런저런 허들이 있고 동일한 위치에 A변이와 B변이가 있다고 나왔을 때 어떤 변이를 call했다고 인정할것인가?

모 변이를 call하고 변이들을 merge하고 필터링하는 파이프라인을 개발했다는 것이 이 논문의 결론이고 민감도는 0.93-1.0, PPV는 0.65-1.0사이, 8개의 도구를 combine하였는데 caller를 줄이면 appreci8의 성능은 떨어지니깐 그러지 마세요 라고 얘기하고 있습니다.

여기서 사용하는 8개 caller들은 다들 많이들 사용하고 있는 GATK, Platypus, VarScan, LoFreq, FreeBayes, SNVer, samtools, VarDict되겠습니다.

appreci8은 여기서 docker로 제공되고 있고 분석을 한 일루미나 데이터는 여기에 위치하고 있습니다.

출처: @ye._.vely618

Pages

월요일, 2월 09, 2026

유전자 검사, 한 번으로 끝이 아닙니다!

일요일, 11월 10, 2024

엑솜 시퀀싱 완벽 가이드!

수요일, 10월 04, 2023

WES를 하는데 Capture가 좋을까 Amplicon이 좋을까?

화요일, 9월 14, 2021

Long-read sequencing identified a causal structural variant in an exome-negative case and enabled preimplantation genetic diagnosis

화요일, 9월 22, 2020

8개의 variant caller 통합 도구