레이블이 NGS인 게시물을 표시합니다. 모든 게시물 표시
레이블이 NGS인 게시물을 표시합니다. 모든 게시물 표시

월요일, 12월 16, 2024

정밀의학을 위한 NGS 기술의 표준을 만들어가는 MAQC/SEQC2 프로젝트

오늘은 NGS의 정확도와 신뢰성 확보에 방점을 두고 있는 프로젝트에 대한 논문의 내용을 가져와봤습니다. The Sequencing Quality Control 2 study: establishing community standards for sequencing in precision medicine 라는 제목으로 NGS 데이터의 QC 기준에 대한 내용을 담고 있는 논문되겠습니다.

DOI: 10.1186/s13059-021-02528-3



gemini

## 정밀의학을 위한 유전체 분석의 정확성을 높이다: MAQC/SEQC2 프로젝트 이야기

안녕하세요. 오늘은 정밀의학의 핵심 기술인 차세대 염기서열 분석 (NGS)의 정확성을 높이기 위한 국제적인 노력인 MAQC/SEQC2 프로젝트에 대해 이야기해 보려고 합니다. NGS는 인간 게놈 전체의 염기서열을 빠르고 정확하게 읽어내는 기술로, 질병 진단, 신약 개발 등 다양한 분야에서 활용되고 있습니다. 하지만 NGS 데이터의 정확성과 신뢰성을 확보하는 것은 여전히 중요한 과제입니다.

### 왜 MAQC/SEQC2 프로젝트가 필요했을까요?

NGS 기술이 빠르게 발전하면서 전 세계적으로 다양한 연구 기관에서 NGS를 활용한 연구를 진행하고 있습니다. 하지만 각 연구 기관마다 사용하는 장비, 시약, 분석 방법이 달라 연구 결과의 비교가 어려웠고, 이는 정밀의학 발전의 큰 걸림돌이었습니다.

MAQC/SEQC2 프로젝트는 이러한 문제를 해결하기 위해 시작되었습니다. 다양한 연구 기관에서 동일한 샘플을 가지고 NGS 분석을 수행하고, 그 결과를 비교 분석하여 NGS 분석 과정에서 발생할 수 있는 오류를 찾아내고, 표준화된 분석 방법을 제시하는 것이 목표였습니다. 

### MAQC/SEQC2 프로젝트에서 다룬 NGS 분석 방법

MAQC/SEQC2 프로젝트에서는 다양한 NGS 분석 방법을 다루었습니다. 대표적인 분석 방법으로는 다음과 같은 것들이 있습니다.

* **생식세포 변이 분석:** 유전 질환과 관련된 유전체 변이를 찾는 분석

* **암 유전체 분석:** 암세포의 유전체 변이를 분석하여 암 진단 및 치료에 활용하는 분석

* **순환 종양 DNA 분석:** 혈액 속에 떠다니는 암세포 유래 DNA를 분석하여 암 진단 및 추적 관찰에 활용하는 분석

* **표적 RNA 시퀀싱:** 특정 유전자의 발현량을 정량적으로 분석하는 방법

* **DNA 메틸화 분석:** 유전자 발현을 조절하는 DNA 메틸화 현상을 분석하는 방법

* **단일 세포 시퀀싱:** 개별 세포 수준에서 유전체 정보를 분석하는 방법

### MAQC/SEQC2 프로젝트를 통해 얻은 결과와 장점

MAQC/SEQC2 프로젝트를 통해 우리는 NGS 분석의 정확성을 높이고, 표준화된 분석 방법을 확립할 수 있었습니다. 이를 통해 얻을 수 있는 장점은 다음과 같습니다.

* **NGS 분석 결과의 신뢰성 향상:** 다양한 연구 기관에서 얻은 NGS 데이터를 비교하고 분석하여, 분석 결과의 신뢰성을 높일 수 있습니다.

* **정밀의학 발전 가속화:** 정확하고 신뢰할 수 있는 NGS 분석 결과를 바탕으로 질병 진단, 신약 개발 등 정밀의학 분야의 발전을 가속화할 수 있습니다.

* **NGS 기술의 표준화:** NGS 분석 과정에서 발생할 수 있는 오류를 줄이고, 표준화된 분석 방법을 확립하여 다른 연구 기관에서도 동일한 결과를 얻을 수 있도록 합니다.

* **개인 맞춤형 치료의 실현:** 정확한 유전체 정보를 바탕으로 개인의 유전적 특성에 맞는 맞춤형 치료를 제공할 수 있습니다.

### 결론

MAQC/SEQC2 프로젝트는 NGS 기술의 정확성을 높이고, 정밀의학 발전에 기여한 중요한 연구입니다. 이 프로젝트를 통해 얻은 결과는 앞으로 NGS 기술이 더욱 발전하고, 정밀의학 시대가 더욱 가까워지는 데 큰 역할을 할 것입니다.



clova-x

안녕하세요, 정밀 의학에서 NGS와 Microarray에 대한 표준을 수립하는 전문가이자, 이들을 활용하여 연구하는 연구자입니다. 오늘은 MAQC/SEQC2 프로젝트에 대한 리뷰 논문을 바탕으로, NGS 기술의 정확성과 재현성에 대한 모범 사례 가이드라인에 대해 설명해 드리고자 합니다.

MAQC/SEQC2 프로젝트는 미국 식품의약국(FDA)이 주도하는 국제 컨소시엄인 MAQC가 진행한 프로젝트로, 차세대 염기서열 분석(NGS) 기술의 정확도와 재현성을 평가하고, 이를 바탕으로 임상 응용을 위한 최적의 방법을 제시하는 것을 목표로 삼았습니다. 이 프로젝트는 2005년에 시작되어 네 차례의 프로젝트를 진행했으며, SEQC2 프로젝트는 2016년부터 2021년까지 진행되었습니다.

SEQC2 프로젝트는 NGS 기술의 성능을 평가하고, 실험실 간 재현성을 검증하며, 바이오인포매틱스 도구의 개발을 촉진하는 것을 목표로 했으며, 150개 이상의 산업, 학계, 정부 기관에서 300명 이상의 과학자가 참여했습니다. 다양한 분야의 전문가들이 모여 NGS 기술의 표준화와 최적화를 위해 노력했습니다.

게놈 시퀀싱, 암 유전체학, 단일 세포 시퀀싱, 순환 종양 DNA, 후성 유전학(DNA 메틸화), 표적 RNA 시퀀싱 등 다양한 분야에서 연구를 진행했으며, 여러 NGS 기술의 성능을 비교하고, 표준화된 참조 물질을 개발하여 실험실 간의 재현성을 향상 시켰습니다.

이러한 성과는 임상 진단, 약물 개발, 질병 연구 등 다양한 분야에서 활용될 수 있으며, NGS 기술의 발전과 함께 의료 분야에서의 적용이 더욱 확대될 것으로 기대됩니다.



chatGPT

### 정밀의학을 위한 NGS 기술의 표준을 만들어가는 MAQC/SEQC2 프로젝트

유전체(Genome)라는 말은 어렵게 들릴 수 있지만, 쉽게 말하면 우리의 생물학적 설계도입니다. 모든 생물은 유전체라는 정보를 가지고 있고, 이 정보를 해독하여 생명활동을 유지합니다. 오늘날에는 유전체 정보를 활용하여 질병을 진단하고 치료법을 결정하는 **정밀의학**이 주목받고 있습니다. 이러한 정밀의학을 가능하게 만드는 중요한 기술 중 하나가 바로 **차세대 염기서열 분석(Next-Generation Sequencing, NGS)**입니다.

그러나 NGS 기술이 효과적으로 활용되기 위해서는 실험 결과가 정확하고 일관적이어야 합니다. 이를 위해 **MAQC/SEQC 프로젝트**가 시작되었습니다. 이번 글에서는 **MAQC/SEQC2** 프로젝트가 무엇인지, 그리고 이를 통해 얻어진 결과가 정밀의학에 어떤 영향을 미칠 수 있는지 살펴보겠습니다.

---

### MAQC/SEQC2 프로젝트의 배경과 목적

NGS 기술은 유전체 정보를 빠르게 해독할 수 있어 연구와 임상에서 널리 사용됩니다. 하지만 실험실마다 사용하는 방법이 다르거나 결과 해석 도구가 다르다면, 같은 샘플로 실험하더라도 다른 결과가 나올 수 있습니다. 이는 질병 진단과 치료 결정에 심각한 문제를 초래할 수 있습니다.

이 문제를 해결하기 위해 미국 식품의약국(FDA)이 주도한 **MAQC(MicroArray Quality Control)** 프로젝트가 시작되었습니다. MAQC의 첫 번째 단계는 유전체 분석의 초기 기술인 마이크로어레이(Microarray)를 표준화하는 것이었습니다. 이후 NGS 기술의 발전에 따라 MAQC의 세 번째 단계부터는 **SEQC(Sequencing Quality Control)** 프로젝트로 확장되었습니다. 최근 완료된 **SEQC2**는 NGS 기술의 정확성과 재현성을 높이기 위해 대규모 국제 연구 네트워크가 참여한 프로젝트입니다.

---

### NGS 분석 방법과 MAQC/SEQC2에서 다룬 내용

SEQC2는 다양한 NGS 분석 방법을 평가하여 각 기술의 강점과 약점을 파악하고, 이를 개선하기 위한 가이드라인을 제시했습니다. 주요 분석 방법은 다음과 같습니다.

#### 1. **전체 유전체 분석(Whole Genome Sequencing, WGS)**  

WGS는 유전체 전체를 분석하는 방법으로, 질병을 유발하는 돌연변이를 탐지하는 데 사용됩니다. 그러나 반복적이거나 복잡한 유전체 영역에서는 변이를 정확히 찾기 어렵습니다. SEQC2는 여러 실험실과 도구를 비교하여 WGS의 정확성을 평가하고, 분석 성능을 높이기 위한 표준을 마련했습니다.

#### 2. **암 유전체 분석(Cancer Genomics)**  

NGS는 암의 유전체 변이를 분석하여 암의 종류와 진행 상태를 판단하는 데 중요한 역할을 합니다. 특히 **표적 유전자 패널**과 **WGS**를 활용해 암과 관련된 변이를 분석하는 방법이 비교되었습니다. SEQC2는 이 과정에서 암 돌연변이 부담(Tumor Mutational Burden)을 평가하는 기준을 제시했습니다.

#### 3. **순환 종양 DNA(circulating tumor DNA, ctDNA)**  

혈액에서 발견되는 ctDNA는 암의 유래를 파악하고, 치료 효과를 모니터링하며 암 재발 여부를 예측할 수 있는 중요한 바이오마커입니다. 그러나 낮은 농도의 ctDNA에서 변이를 검출하는 것은 어렵습니다. SEQC2는 여러 실험실에서 ctDNA 분석 성능을 비교하고, 이를 개선하기 위한 기술적 제안을 했습니다.

#### 4. **표적 RNA 분석(Targeted RNA Sequencing)**  

RNA는 유전자 발현을 분석하는 데 중요한 역할을 합니다. SEQC2는 특정 유전자를 선별적으로 분석하는 **표적 RNA 분석**의 정확성과 민감도를 평가하여 복잡한 유전자 융합(fusion genes) 검출의 한계를 파악했습니다.

#### 5. **DNA 메틸화(DNA Methylation)**  

DNA 메틸화는 유전자의 발현을 조절하는 중요한 에피유전체 변형입니다. SEQC2는 다양한 메틸화 분석 기술을 비교해 임상 연구에서 사용할 표준화된 방법을 제시했습니다.

#### 6. **단일세포 분석(Single-cell Sequencing)**  

단일세포 분석은 개별 세포의 유전자 발현을 측정할 수 있어 세포 간 이질성을 이해하는 데 유용합니다. SEQC2는 다양한 단일세포 분석 방법을 평가하여 임상에서 신뢰할 수 있는 기술을 제안했습니다.

---

### MAQC/SEQC2가 가져올 결과와 이점

1. **정확하고 재현성 높은 NGS 데이터**  

   - SEQC2는 NGS 실험의 변동성을 최소화하고, 전 세계 연구소가 동일한 기준으로 분석할 수 있도록 표준화 자료와 가이드라인을 제공합니다.

2. **정밀의학의 발전**  

   - 정확한 유전체 분석은 암, 희귀질환 등 다양한 질병의 진단과 치료에 중요한 정보를 제공합니다. SEQC2는 이를 가능하게 하는 기반을 마련했습니다.

3. **연구와 임상의 연결**  

   - SEQC2는 연구실 수준의 실험이 임상 현장에서 활용되도록 실질적인 검증 절차를 제안했습니다.

---

### 마무리하며

MAQC/SEQC2 프로젝트는 NGS 기술의 신뢰성을 높여 정밀의학을 가능하게 하는 중요한 역할을 하고 있습니다. 이러한 표준화 노력은 더 많은 사람들이 자신의 유전체 정보를 기반으로 맞춤형 치료를 받을 수 있는 미래를 만들어갈 것입니다. NGS 기술이 우리 삶에 어떤 변화를 가져올지, 그 무궁무진한 가능성을 함께 기대해봅시다.



NotebookLM

## NGS 기술의 정확성과 재현성: MAQC/SEQC2 프로젝트

**정밀 의학 시대**에 접어들면서, 개인 맞춤형 질병 예측, 진단 및 치료가 점점 더 중요해지고 있습니다. 이러한 정밀 의학의 핵심 기술 중 하나가 바로 **차세대 염기서열 분석(NGS)**입니다. NGS는 DNA 또는 RNA 염기서열을 빠르고 저렴하게 분석하여 유전체 정보를 얻을 수 있는 혁신적인 기술입니다. 

하지만 NGS 기술의 정확성과 재현성은 **임상 적용**에 있어 매우 중요한 문제입니다. NGS 분석 과정에는 샘플 준비부터 데이터 분석까지 다양한 단계가 존재하며, 각 단계마다 결과에 영향을 미칠 수 있는 변수들이 존재하기 때문입니다. 따라서 NGS 기술을 임상적으로 안전하고 효과적으로 활용하기 위해서는 **표준화된 지침과 검증된 프로토콜**이 필수적입니다.

### MAQC/SEQC2 프로젝트: NGS 표준 확립을 위한 노력

MAQC/SEQC2 프로젝트는 NGS 기술의 정확성과 재현성을 평가하고, 임상 적용을 위한 **모범 사례 가이드라인**을 수립하기 위해 시작되었습니다. 이 프로젝트는 FDA 주도로 전 세계 150개 이상의 기관, 300명 이상의 과학자가 참여한 대규모 국제 협력 연구입니다. 

MAQC/SEQC2 프로젝트는 **NGS 기술의 다양한 임상 응용 분야**를 다루고 있으며, 각 분야별로 특화된 분석 방법과 평가 지표를 사용하여 NGS 기술의 성능을 엄격하게 검증했습니다.

### MAQC/SEQC2 프로젝트에서 다루는 NGS 분석 방법

**1. 생식세포 변이 분석 (Germline variant analysis):** 

* **목표:** 개인의 유전체 정보를 분석하여 질병 발생 위험을 예측하거나 유전 질환을 진단합니다.

* **방법:** 전체 유전체 염기서열 분석 (WGS) 또는 엑솜 염기서열 분석 (WES)을 통해 유전체 변이를 검출하고 분석합니다.

* **SEQC2 프로젝트의 성과:**  다양한 NGS 플랫폼과 생물정보학 도구를 사용하여 생식세포 변이 분석의 정확성과 재현성을 평가했습니다. 특히, 반복적인 유전체 영역이나 복잡한 구조 변이를 정확하게 검출하는 데 어려움이 있음을 밝혀내고, 이러한 문제를 해결하기 위한 개선된 생물정보학 워크플로우의 필요성을 강조했습니다.

**2. 암 유전체학 (Cancer genomics):**

* **목표:** 암 조직의 유전체 변이를 분석하여 암 발생 원인을 규명하고, 환자에게 최적화된 치료법을 제시합니다.

* **방법:** 암 조직과 정상 조직의 유전체 염기서열을 비교 분석하여 체세포 돌연변이, 유전자 발현 변화, DNA 메틸화 변화 등을 분석합니다.

* **SEQC2 프로젝트의 성과:**  암 유전체 분석에 사용되는 다양한 NGS 기반 패널 검사의 성능을 평가하고, 표준화된 지침을 제시했습니다. 또한, FFPE 샘플과 같은 다양한 샘플 유형에 대한 NGS 분석의 정확성과 재현성을 평가하고, 샘플 준비 과정의 중요성을 강조했습니다.

**3. 순환 종양 DNA 분석 (Circulating tumor DNA analysis):**

* **목표:** 혈액에 존재하는 암세포 유래 DNA 조각 (ctDNA)을 분석하여 암을 진단하고, 치료 효과를 모니터링합니다.

* **방법:** 혈액 샘플에서 ctDNA를 추출하고, NGS 기술을 이용하여 ctDNA의 유전체 변이를 분석합니다.

* **SEQC2 프로젝트의 성과:** 다양한 ctDNA 분석 방법의 민감도, 특이도, 재현성을 평가하고, ctDNA 분석의 한계점과 개선 방향을 제시했습니다.

**4. 표적 RNA 시퀀싱 (Targeted RNA sequencing):**

* **목표:** 특정 유전자들의 발현량을 정확하게 측정하고, 유전자 발현 변화를 분석하여 질병 진단 및 치료에 활용합니다.

* **방법:** 특정 유전자들을 선택적으로 증폭하여 염기서열 분석을 수행합니다.

* **SEQC2 프로젝트의 성과:**  다양한 표적 RNA 시퀀싱 패널의 성능을 평가하고, 융합 유전자와 같이 복잡한 유전자 변이를 검출하는 데 있어 기술적인 어려움과 개선 방향을 제시했습니다.

**5. DNA 메틸화 분석 (DNA methylation analysis):**

* **목표:** DNA 메틸화 패턴을 분석하여 유전자 발현 조절 기전을 밝히고, 질병 발생과의 연관성을 연구합니다.

* **방법:** DNA 메틸화를 검출하는 다양한 NGS 기반 방법을 사용하여 유전체 전체의 메틸화 패턴을 분석합니다.

* **SEQC2 프로젝트의 성과:**  다양한 DNA 메틸화 분석 방법의 성능을 비교 평가하고, 표준화된 프로토콜을 제시했습니다.

**6. 단일 세포 시퀀싱 (Single-cell sequencing):**

* **목표:** 개별 세포 수준에서 유전자 발현 및 유전체 변이를 분석하여 세포 다양성을 연구하고, 질병 발생 기전을 밝힙니다.

* **방법:** 개별 세포를 분리하고, 각 세포의 유전체 정보를 분석합니다.

* **SEQC2 프로젝트의 성과:**  다양한 단일 세포 시퀀싱 플랫폼과 생물정보학 도구의 성능을 평가하고, 단일 세포 시퀀싱 데이터 분석의 어려움과 개선 방향을 제시했습니다.

### MAQC/SEQC2 프로젝트의 결과와 장점

MAQC/SEQC2 프로젝트는 NGS 기술의 임상 적용을 위한 중요한 기반을 마련했습니다. 

* **표준화된 프로토콜 및 분석 방법 제시**:  프로젝트를 통해 개발된 표준화된 프로토콜과 분석 방법은 NGS 데이터의 정확성과 재현성을 향상시켜 임상 연구 및 진단에 대한 신뢰도를 높입니다. 

* **NGS 기술 검증 및 개선**: 다양한 NGS 플랫폼 및 생물정보학 도구의 성능을 객관적으로 평가하고, 기술적인 한계점과 개선 방향을 제시하여 NGS 기술 발전에 기여합니다. 

* **공개 데이터베이스 구축**:  프로젝트를 통해 생성된 대규모 NGS 데이터와 분석 결과는 공개 데이터베이스로 구축되어, 다른 연구자들이 활용할 수 있도록 제공됩니다. 

### 결론

MAQC/SEQC2 프로젝트는 NGS 기술의 정확성과 재현성을 향상시키고, 임상 적용을 위한 표준을 확립하는 데 크게 기여했습니다. 이러한 노력을 통해 NGS 기술은 정밀 의학 시대를 이끌어갈 핵심 기술로 자리매김하고 있으며, 앞으로 질병 예측, 진단, 치료 분야에서 더욱 중요한 역할을 수행할 것으로 기대됩니다.



초장기는 지난번 블로그에서 소개한 마이크로어레이의 QC/표준화에서 시작했던 프로젝트인데 이제 마이크로어레이보다 NGS 데이터를 임상에서 더 자주, 많이 사용하게되서 이제는 NGS 데이터에 대한 내용으로 진화하고 있다고 보면되겠습니다.

나중에 시간되면 NGS QC관련한 프로젝트에 대해서 정리하는 시간을 가지는 것도 꽤 괜찮을 듯 해보이네요. 조만간 NGS QC 관련 프로젝트를 통해서 나온 논문들을 수집해서 지난번 알파폴드 처럼 시리즈물을 한번 만들어서 올려보도록 하겠습니다. :)



출처: @ye._.vely618


월요일, 12월 09, 2024

FDA가 말하는 유전체 기술 이야기

오늘은 2016년 논문을 한번 가져와봤습니다. 제목은 The FDA’s Experience with Emerging Genomics Technologies—Past, Present, and Future 으로 미국 식품의약국인 FDA가 빠르게 발전하고 있는 유전체 기술에 대해서 어떻게 생각하고 있는지, 빠르게 발전하는 기술을 어떻게 다뤄야 하는지, 규제 당국이 어떻게 바라볼지, 어떻게 관리해야 하는 것에 대한 내용을 담고 있다고 보시면 되겠습니다. 

DOI: 10.1208/s12248-016-9917-y



gemini

## 유전자 검사, 안전하고 정확하게! FDA가 말하는 유전체 기술 이야기

안녕하세요. 오늘은 우리 몸속 유전 정보를 분석하는 유전자 검사에 대해 좀 더 깊이 알아보는 시간을 갖도록 하겠습니다. 최근 유전자 검사는 질병 예측, 맞춤형 치료 등 다양한 분야에서 활용되면서 우리 삶에 더욱 가까워지고 있습니다. 하지만 아직 생소한 분야인 만큼, 유전자 검사가 어떻게 이루어지고, 어떤 과정을 거쳐 안전하게 이용될 수 있는지 궁금해하시는 분들이 많을 거예요.

오늘은 미국 식품의약국(FDA)에서 발표한 연구 보고서를 바탕으로, 유전자 검사에 사용되는 다양한 기술과 FDA의 규제 과정에 대해 쉽고 자세하게 설명해 드리겠습니다.

### 유전자 검사, 무엇을 알 수 있을까요?

유전자 검사는 우리 몸속 DNA를 분석하여 질병에 대한 감수성, 약물 반응, 개인 특성 등 다양한 정보를 얻는 과정입니다. 마치 레고 블록을 조립하여 건물을 만드는 것처럼, 우리 몸은 수많은 유전자라는 블록으로 구성되어 있습니다. 유전자 검사는 이러한 블록 하나하나를 분석하여 우리 몸의 설계도를 읽는 것과 같습니다.

### 유전자 검사에 사용되는 기술들

유전자 검사에는 다양한 기술이 사용됩니다. 대표적인 기술로는 **마이크로어레이**와 **차세대 염기서열 분석(NGS)**이 있습니다.

* **마이크로어레이:** 마이크로어레이는 미세한 칩 위에 수천 개에서 수만 개의 유전자 조각을 배열하여 특정 유전자의 변이를 한꺼번에 검사하는 기술입니다. 마치 슬라이드에 여러 가지 색깔의 점을 찍어놓고 현미경으로 관찰하는 것과 비슷합니다.

* **차세대 염기서열 분석(NGS):** NGS는 DNA 염기서열을 빠르고 정확하게 읽어내는 기술입니다. 마치 책의 모든 글자를 하나하나 읽어내는 것과 같습니다. NGS는 마이크로어레이보다 더 많은 양의 유전 정보를 얻을 수 있어 더욱 정확한 분석이 가능합니다.

### FDA의 규제, 왜 필요할까요?

유전자 검사는 질병 진단과 치료에 매우 유용한 도구이지만, 그만큼 정확성과 안전성이 중요합니다. 잘못된 정보로 인해 불필요한 불안감을 느끼거나, 잘못된 치료를 받을 수 있기 때문입니다. FDA는 이러한 문제를 방지하기 위해 유전자 검사 기술의 안전성과 효능을 평가하고, 관련 제품을 규제합니다.

### MAQC, 유전자 검사의 신뢰성을 높이다

FDA는 유전자 검사의 정확성을 높이기 위해 **마이크로어레이 품질 관리 컨소시엄(MAQC)**을 운영하고 있습니다. MAQC는 전 세계 연구자들이 참여하여 마이크로어레이 기술의 표준을 정하고, 다양한 실험실에서 얻은 결과를 비교 분석하여 신뢰성을 높이는 작업을 수행합니다.

### 게놈 시퀀싱과 표적 시퀀싱, 무엇이 다를까요?

* **게놈 시퀀싱:** 개인의 전체 유전체를 해독하는 기술입니다. 

* **표적 시퀀싱:** 특정 질병과 관련된 유전자 부분만을 집중적으로 분석하는 기술입니다.

게놈 시퀀싱은 많은 양의 정보를 얻을 수 있지만, 비용이 비싸고 분석 시간이 오래 걸립니다. 반면 표적 시퀀싱은 특정 질병에 대한 정보를 빠르고 정확하게 얻을 수 있어 경제적입니다.

### 앞으로의 전망

유전체 기술은 빠르게 발전하고 있으며, 우리 삶에 더욱 깊숙이 들어올 것입니다. FDA는 앞으로도 유전체 기술의 발전을 지켜보면서, 안전하고 정확한 유전자 검사가 이루어질 수 있도록 노력할 것입니다.

**결론적으로, 유전자 검사는 질병 예방과 치료에 매우 유용한 도구입니다. 하지만 유전자 검사 결과를 해석하고 판단하는 것은 전문가의 도움이 필요합니다. 유전자 검사를 받기 전에 반드시 의료진과 충분히 상담하여 자신에게 맞는 검사를 선택하는 것이 중요합니다.**



clova-x

제목: FDA와 유전체 기술의 발전, 그리고 그 적용

안녕하세요, 여러분! 오늘은 미국 식품의약국(FDA)과 유전체 기술에 대한 이야기를 해보려고 합니다. 최근 유전체 기술의 발전으로 인해 의료 및 제약 분야에서 많은 혁신이 일어나고 있는데요, 이러한 혁신을 안전하게 활용하기 위해서는 규제 기관의 역할이 매우 중요합니다.

미국 식품의약국(FDA)은 유전체 기술의 발전에 발맞춰서 이 기술을 규제 과정에 적용하기 위해 많은 노력을 기울이고 있습니다. 그 중 하나가 바로 마이크로어레이 품질 제어 컨소시엄(MAQC)입니다.

MAQC는 FDA가 주도하는 국제적인 컨소시엄으로, 유전체 기술의 정확성과 재현성을 검증하는 프로젝트를 진행해왔습니다. 이 프로젝트를 통해 FDA는 유전체 기술을 규제 결정에 활용할 수 있는 신뢰성과 견고성을 높일 수 있었습니다. 또한, MAQC는 유전체 데이터 제출 프로그램인 VGDS를 도입하여, 업계와 학계가 자발적으로 유전체 데이터를 제출하고 FDA와 함께 과학적 논의를 진행할 수 있도록 했습니다.

이러한 노력의 일환으로, MAQC는 세 가지 프로젝트를 통해 유전체 기술을 평가했습니다. 첫 번째는 유전자 발현 마이크로어레이, 두 번째는 전체 게놈 genotyping 어레이, 그리고 세 번째는 전체 전사체 시퀀싱(RNA-seq)입니다. 특히, RNA-seq에 초점을 맞춘 SEQC 프로젝트는 차세대 시퀀싱 기술의 성능과 품질을 평가했습니다. 이 프로젝트는 RNA 시퀀싱이 임상 환경에서의 예측 성능과 안전성 평가에서 마이크로어레이와 유사하거나 더 나은 민감도를 가지고 있으며, 새로운 전사체 특성을 밝혀낼 수 있다는 것을 보여주었습니다.

FDA는 앞으로도 MAQC의 노력을 계속해서 이어나갈 계획입니다. 특히, 전체 게놈 시퀀싱과 표적 시퀀싱의 품질 관리에 집중할 예정이라고 합니다. 유전체 기술의 발전은 우리에게 많은 혁신을 가져다 줄 것이지만, 이러한 혁신이 안전하게 활용되기 위해서는 규제 기관과 산업계, 학계의 협력이 필수적입니다. FDA와 MAQC의 노력이 이러한 협력을 이끌어내는 데 큰 역할을 하고 있습니다.

블로그 글이 여러분께 유전체 기술과 FDA의 역할에 대한 이해를 높이는 데 도움이 되었기를 바랍니다. 더 궁금한 점이 있으시면 언제든지 댓글로 남겨주세요!



chatGPT

### 미국 식품의약국(FDA)과 유전체 기술: 우리의 건강을 지키는 첨단 과학의 이야기

우리는 병원에서 처방받는 약이나 질병 진단을 위한 검사들이 안전하고 신뢰할 수 있다는 믿음을 가지고 있습니다. 이러한 믿음 뒤에는 미국 식품의약국(FDA)의 철저한 연구와 검토 과정이 있습니다. 특히, 최근 몇 년 동안 유전체(genome) 기술이 의료와 약물 개발에 중요한 역할을 하면서 FDA는 이를 평가하고 규제하는 데 큰 노력을 기울이고 있습니다. 오늘은 FDA와 유전체 기술, 그리고 그 중심에 있는 **Microarray Quality Control(MAQC) 컨소시엄**에 대해 살펴보겠습니다.

---

### **미국 식품의약국(FDA)이란 무엇인가요?**

FDA는 미국 정부 기관으로, 우리의 건강과 안전을 보장하기 위해 의약품, 의료기기, 식품, 화장품 등을 관리합니다. 특히, 신약 개발 과정에서는 약물이 안전하고 효과적인지 검토하고 승인하는 역할을 합니다. 요즘처럼 유전체 기술이 발달하면서, FDA는 최신 기술을 규제 과정에 통합해 약물의 안전성과 효과를 더 정확히 평가하려는 노력을 기울이고 있습니다.

---

### **MAQC: 유전체 기술의 신뢰성을 높이는 프로젝트**

유전체 기술은 생물학의 새로운 문을 열었지만, 기술적 한계와 데이터의 재현성 문제로 신뢰성 있는 결과를 얻기가 쉽지 않았습니다. 이를 해결하기 위해 FDA는 **MAQC(MicroArray Quality Control) 컨소시엄**을 설립했습니다. 이 컨소시엄은 국제적인 연구자, 산업 관계자, 그리고 규제 기관들이 함께 참여하여 유전체 데이터를 분석하고 기술의 표준을 만드는 역할을 합니다.

1. **첫 번째 프로젝트(MAQC 1)**에서는 마이크로어레이 기술이 다양한 실험실과 플랫폼에서 일관성 있는 결과를 제공하는지 확인했습니다.

2. **두 번째 프로젝트(MAQC 2)**는 마이크로어레이 데이터를 사용한 예측 모델의 신뢰성을 평가했습니다.

3. **세 번째 프로젝트(SEQC)**는 차세대 시퀀싱(NGS)을 평가하고, 특히 RNA-seq 기술의 장단점을 분석했습니다.

---

### **유전체 시퀀싱이란 무엇인가요?**

유전체 시퀀싱은 생물의 DNA를 해독하는 기술입니다. 특히, **차세대 시퀀싱(NGS)** 기술은 방대한 양의 유전체 데이터를 빠르고 정확하게 해독할 수 있게 해주었습니다. 이를 통해 의약품 개발, 질병 진단, 개인 맞춤형 의료 등이 가능해졌습니다. 예를 들어, 특정 암 환자의 유전적 특성을 분석해 그에 맞는 치료제를 개발하거나, 병의 진행 상태를 예측하는 데 활용됩니다.

---

### **타겟 시퀀싱(Targeted Sequencing): 필요한 부분만 정밀하게**

전체 유전체 시퀀싱이 모든 DNA를 분석하는 것이라면, **타겟 시퀀싱**은 특정 관심 영역만 집중적으로 분석하는 방법입니다. 예를 들어, 유방암 환자의 경우 암 발생과 관련된 특정 유전자를 분석해 병의 원인을 찾을 수 있습니다. 이 기술은 비용 효율적이며, 특정 유전자를 정밀하게 분석할 수 있어 유전체 기반 맞춤 의료의 중요한 도구로 사용되고 있습니다.

---

### **FDA와 유전체 기술: 우리의 미래를 바꾸다**

FDA는 유전체 기술을 약물 개발 및 질병 진단에 적용하기 위해 데이터의 품질과 분석 방법의 표준을 정하고 있습니다. 예를 들어, RNA-seq 데이터를 분석할 때 다양한 분석 파이프라인 중 가장 적합한 방법을 찾기 위해 노력하며, 기술의 재현성과 정확성을 높이는 데 집중하고 있습니다.

---

### **우리의 삶에 미치는 영향**

FDA의 이러한 노력은 결국 우리의 건강과 직결됩니다. 신약이 더 빠르고 안전하게 개발되고, 질병을 더 정확히 진단하며, 개인 맞춤형 의료가 가능해지는 세상이 열리고 있습니다. 유전체 기술은 과학적 도전과제이지만, 동시에 우리의 삶을 더 나은 방향으로 이끌 중요한 도구입니다.

---

### **마무리하며**

유전체 기술은 복잡하지만, FDA와 같은 기관이 이를 규제하고 활용하는 방식 덕분에 우리의 삶은 점점 더 안전하고 건강한 방향으로 나아가고 있습니다. 앞으로도 FDA의 노력이 어떤 혁신을 이끌어낼지 기대해 봅시다!



NotebookLM

## 미국 식품의약국(FDA)과 유전체 기술: 마이크로어레이 품질 관리, 게놈 시퀀싱, 그리고 표적 시퀀싱

**미국 식품의약국(FDA)은 국민 건강을 보호하기 위해 의약품, 식품, 화장품 등의 안전성과 효능을 엄격하게 규제하는 기관입니다.** 과학 기술이 발전함에 따라 FDA는 새로운 기술을 규제 프로세스에 통합하는 데 끊임없이 노력하고 있습니다. 특히 유전체 기술의 발전은 의약품 개발과 질병 진단에 혁명을 일으키고 있으며, FDA는 이러한 혁신을 따라잡고 적절하게 규제하기 위해 노력하고 있습니다.

**FDA는 새로운 유전체 기술의 품질을 평가하고 신뢰성을 확보하기 위해 다양한 노력을 기울이고 있습니다. 그 중 하나가 바로 마이크로어레이 품질 제어 컨소시엄(MAQC)입니다.** MAQC는 FDA가 주도하는 국제 컨소시엄으로, 규제 기관, 학계, 제약 회사, 유전체 플랫폼 제공업체 등 다양한 이해 관계자가 참여하고 있습니다. MAQC의 목표는 유전자 발현 마이크로어레이, 전체 유전체 유전형 분석 어레이, 전체 전사체 시퀀싱(RNA-seq)과 같은 유전체 기술의 재현성, 정밀도, 특이성/민감도 및 데이터 해석과 같은 문제를 해결하는 것입니다.

**MAQC는 지금까지 세 가지 주요 프로젝트를 완료했습니다.** 첫 번째 프로젝트는 마이크로어레이 기술의 플랫폼 간 및 플랫폼 내 재현성을 입증했습니다. 두 번째 프로젝트는 마이크로어레이 기반 예측 모델의 개발 및 신뢰성을 연구했습니다. 세 번째 프로젝트인 SEQC(SEquencing Quality Control)는 RNA-seq 기술을 평가했습니다. SEQC 연구에서는 RNA-seq가 실험실 및 플랫폼 간에 정확하고 신뢰할 수 있는 상대적 유전자 발현 측정을 제공하며, 낮은 발현에 대한 민감도가 더 뛰어나고 새로운 전사체 특징을 밝혀낼 수 있음을 보여주었습니다.

**MAQC 프로젝트의 결과는 동료 심사를 거친 출판물을 통해 공개되었으며, FDA가 유전체 데이터를 규제 의사 결정에 활용하는 데 중요한 역할을 했습니다.** 예를 들어, MAQC 1 프로젝트의 결과는 FDA가 "산업 지침: 약물유전체 데이터 제출 – 동반 지침"을 개발하는 데 기여했습니다.

**유전체 기술은 크게 게놈 시퀀싱과 표적 시퀀싱으로 나눌 수 있습니다.** 게놈 시퀀싱은 유기체의 전체 DNA 서열을 분석하는 기술입니다. 표적 시퀀싱은 특정 유전자 또는 유전자 영역에 초점을 맞춰 시퀀싱하는 기술입니다.  

**FDA는 차세대 시퀀싱(NGS) 기술의 발전에 발맞춰 SEQC2 프로젝트를 진행하고 있습니다.** SEQC2는 전체 게놈 시퀀싱 및 표적 유전자 시퀀싱 데이터 분석을 위한 품질 관리 지표 및 벤치마크 생물 정보학적 접근 방식을 개발하는 것을 목표로 합니다. 이 프로젝트는 궁극적으로 FDA가 규제 환경에서 NGS 데이터를 사용하기 위한 표준을 개발하고 정밀 의학을 위한 정보를 제공하는 데 도움을 줄 것입니다.

**결론적으로 FDA는 유전체 기술의 혁신을 적극적으로 수용하고 이를 규제 프로세스에 통합하기 위해 노력하고 있습니다.** MAQC와 같은 컨소시엄을 통해 유전체 기술의 품질을 평가하고, 새로운 기술에 대한 표준을 개발하며, 궁극적으로는 국민 건강을 보호하는 데 기여하고 있습니다. 


당시에는 NGS는 연구에는 많이 사용하고 있었지만 실제 field에서는 Microarray가 많이 사용되고 있었던터라 MAQC라는 Microarray의 품질 관리 작업을 진행하고 있었고, 이 후에 NGS가 Microarray보다 더 빠르게 폭 넓게 사용되어서 SEQC2라는 품질관리 작업을 진행하고 있습니다. 

chatGPT가 좀더 많은 내용들을 얘기해줬지만, 그래도 NotebookLM이 좀 더 중요한 내용들을 잘 담은듯 해보입니다. 같은 구글인 gemini와 NotebookLM이 성능차이가 좀 나네요. 아마 target user가 달라서 그런것 같습니다.

그리고 FDA는 규제 당국임에도 단순히 근거자료를 요청하는 것이 아니라 어떤 근거자료가 더 효율적이면서 합리적이고 안전한 근거자료인지 끊임없이 함께 고민하고 연구하는 것 처럼 보이네요. 

아무래도 인력과 자금으로부터 오는 차이라고 생각되기는 합니다만... 

여튼 많은 분들의 노력으로 우리가 안전하고 정확한 진단을 받고 있고, 더 나은 진료 환경으로 나아간다는 것에는 의심이 없을 듯 합니다. :)



출처: @ye._.vely618


목요일, 10월 31, 2024

NGS에서 통계적 검정력과 표본 크기 계산의 중요성

오늘은 간만에 좀 지난 논문을 하나 가져와봤슴다. Power and sample size calculations for high-throughput sequencing-based experiments으로 high-throughput seq 실험을 할 떄 검정력과 샘플 개수를 어떻게 사용해야 하는지에 대한 내용되겠습니다. 


DOI: 10.1093/bib/bbx061


gemini

**NGS 기반의 실험의 통계적 Power와 표본 크기 계산**

NGS 기반의 실험은 빠르게 발전하는 기술로, 생명과학 분야에서 광범위하게 사용되고 있습니다. 이 기술은 DNA, RNA, 단백질 등의 고분자를 대상으로 하는 다양한 실험에 활용되며, 대량의 데이터를 생성합니다. 이러한 대량의 데이터를 분석하고 해석하기 위해서는 통계적 방법이 필수적입니다. 통계적 power와 표본 크기 계산은 NGS 기반의 실험을 설계하고 분석하는 데 있어서 매우 중요한 요소입니다.

Power는 통계적 검정에서 유의한 결과를 얻을 수 있는 확률을 나타냅니다. 즉, 1-β로 나타내며, β는 제1종 오류의 확률입니다. 제1종 오류는 귀무가설이 참인데도 거짓으로 기각하는 오류입니다. 표본 크기는 통계적 검정에서 유의한 결과를 얻기 위해 필요한 표본의 크기를 나타냅니다.

NGS 기반의 실험에서 통계적 power와 표본 크기 계산은 여러 가지 요인에 영향을 받습니다. 예를 들어, 실험 대상의 특성, 실험의 목적, 실험 방법, 분석 방법 등이 있습니다. 이러한 요인들을 고려하여 적절한 통계적 power와 표본 크기를 계산하는 것이 중요합니다.

이러한 요인들을 고려하여 적절한 통계적 power와 표본 크기를 계산하는 것이 중요합니다. 이를 위해서는 통계학 전문가의 도움을 받는 것이 좋습니다. 또한, 다양한 통계적 power와 표본 크기 계산 방법이 개발되어 있으므로, 자신의 연구에 가장 적합한 방법을 선택하는 것이 중요합니다.

**NGS 기반의 실험의 통계적 Power와 표본 크기 계산의 중요성**

NGS 기반의 실험에서 통계적 power와 표본 크기 계산을 올바르게 수행하지 않으면, 다음과 같은 문제가 발생할 수 있습니다.

* 유의한 결과를 얻지 못할 수 있습니다.

* 실험에 필요한 비용이 과도하게 발생할 수 있습니다.

* 실험 결과의 신뢰성이 떨어질 수 있습니다.

따라서, NGS 기반의 실험을 설계하고 분석할 때에는 통계적 power와 표본 크기 계산을 반드시 고려해야 합니다.



clova-x

최근 생명공학 분야에서는 차세대 염기서열 분석(NGS) 기술이 빠르게 발전하면서, 대규모의 유전 정보를 빠르고 정확하게 분석할 수 있게 되었습니다. 이에 따라 NGS 기술을 활용한 다양한 연구가 활발하게 이루어지고 있습니다.

NGS 기반의 실험에서는 많은 양의 데이터가 생성되기 때문에, 이를 효과적으로 분석하기 위해서는 적절한 통계적 방법이 필요합니다. 특히, 실험의 목적에 따라 적절한 표본 크기를 결정하고, 통계적 파워를 계산하는 것이 중요합니다.

통계적 파워란, 연구에서 설정한 가설을 검증할 수 있는 능력을 나타내는 지표입니다. 즉, 실험에서 얻은 결과가 우연에 의한 것이 아니라, 실제로 가설을 지지하는 것인지를 판단하는 데 도움을 줍니다.

표본 크기란, 연구에서 사용하는 데이터의 양을 말합니다. 표본 크기가 클수록 통계적 파워가 높아지기 때문에, 보다 정확한 결과를 얻을 수 있습니다. 하지만, 표본 크기가 너무 커지면 비용이 많이 들기 때문에, 적절한 균형을 유지하는 것이 중요합니다.

이번 연구에서는 NGS 기반의 실험에서 통계적 파워와 표본 크기를 계산하는 방법에 대해 다루었습니다. 이를 위해 다양한 통계적 모델과 알고리즘을 사용하였으며, 실제 데이터를 활용하여 검증하였습니다.

연구 결과, NGS 기반의 실험에서는 리드 깊이, 분산 등의 고유한 매개변수를 고려하여 통계적 파워와 표본 크기를 계산해야 한다는 것을 확인하였습니다. 또한, 여러 가지 통계적 모델 중에서 Negative Binomial 모델이 NGS 데이터의 특성을 잘 반영하는 것으로 나타났습니다.

이번 연구는 NGS 기반의 실험을 계획하는 연구자들에게 유용한 정보를 제공합니다. 실험의 목적에 따라 적절한 표본 크기를 결정하고, 통계적 파워를 계산함으로써 보다 정확한 결과를 얻을 수 있으며, 이를 통해 생명공학 분야의 발전에 기여할 수 있을 것으로 기대됩니다.

NGS 기술과 통계적 방법은 계속해서 발전하고 있기 때문에, 이에 대한 지속적인 연구와 업데이트가 필요합니다. 연구자들은 최신 기술과 방법을 적극적으로 활용하여, 보다 정확하고 효율적인 연구를 수행해야 합니다.



chatGPT

이 연구는 고처리량 시퀀싱(HTS) 기반 실험에서 통계적 파워와 샘플 크기 계산의 중요성을 설명하는 데 중점을 두고 있습니다. **통계적 파워**란, 실험에서 의미 있는 차이나 효과를 발견할 수 있는 능력을 의미하며, 실험의 성공 여부에 중요한 역할을 합니다. 샘플 크기 역시 실험 결과의 신뢰성을 결정하는 핵심 요소입니다. 따라서 실험을 설계할 때, 통계적 파워와 적절한 샘플 크기를 계산하는 것은 필수적입니다.

**연구 배경**  

고처리량 시퀀싱(HTS)은 DNA, RNA, 마이크로바이옴(미생물군집), 단백질-유전체 상호작용 연구 등에서 활용되는 최신 기술로, 한 번에 수백만 개의 데이터를 분석할 수 있습니다. HTS 기술은 생물학적 연구를 한 단계 더 발전시키는 데 기여했지만, 이러한 복잡한 데이터 분석에 맞는 통계적 방법을 적용하는 것이 매우 어렵습니다. 특히, HTS 실험에서는 데이터의 다양성과 복잡성으로 인해 **파워 분석**이 필수적입니다. 기존의 유전자 분석 방식과는 달리, HTS 데이터는 더 많은 변동성과 오류 가능성을 포함하고 있어 더욱 세밀한 분석이 요구됩니다.

**연구에서 사용된 방법**  

이 연구에서는 HTS 기반 실험에 필요한 파워와 샘플 크기 계산 방법을 다루고 있습니다. 연구진은 다양한 시퀀싱 방법에 따른 통계적 분석 도구를 사용했습니다. 예를 들어, DNA 시퀀싱에서는 변이(유전자 돌연변이)를 발견하고 이를 표현형(겉으로 드러나는 특성)과 연관 짓기 위한 파워 분석을 진행했습니다. RNA 시퀀싱에서는 유전자 발현 수준의 차이를 분석하기 위해 **Poisson 분포**와 **음이항 분포** 등의 통계 모델을 적용하여 샘플 크기를 계산했습니다. 또한, 마이크로바이옴 연구에서는 미생물 종의 다양성을 분석하기 위해 **다항 분포**를 사용한 파워 분석을 수행했습니다. 이 연구에서 사용된 통계적 방법들은 모두 HTS 실험의 목표와 데이터 유형에 맞게 조정되었습니다.

**연구 결과**  

연구진은 HTS 실험에서 실험 설계의 성공 여부를 판단하는 데 있어 파워 분석이 필수적이라는 결론을 내렸습니다. HTS 데이터는 기존의 유전자 분석 데이터보다 더 많은 변수를 포함하고 있어, 정확한 분석을 위해서는 실험의 목표에 맞춘 정교한 통계적 방법이 필요합니다. 연구는 각 시퀀싱 방법에 맞는 다양한 파워 분석 도구와 계산 방법을 제안했으며, 이를 통해 연구자들이 실험 설계 시 적절한 샘플 크기를 선택하고 신뢰성 있는 결과를 얻을 수 있도록 안내했습니다.

**연구의 의의**  

이 연구는 HTS 기반 실험의 성공을 위한 통계적 파워와 샘플 크기 계산의 중요성을 재조명했습니다. HTS 기술을 사용하는 연구자들에게는 실험 설계 시 데이터의 복잡성을 고려하여 적절한 통계적 방법을 적용하는 것이 필수적입니다. 이를 통해 과학적 연구의 신뢰성을 높이고, 더 나아가 생물학적 발견을 이루는 데 기여할 수 있습니다. 일반 대중에게는 HTS 기술이 얼마나 중요한 역할을 하는지, 그리고 이러한 실험에서 신뢰성 있는 결과를 얻기 위해서는 철저한 통계적 분석이 필요하다는 점을 알리는 중요한 계기가 될 것입니다.



NotebookLM

## 차세대 염기서열 분석(NGS) 기반 실험에서 통계적 검정력과 표본 크기 계산의 중요성

최근 생명 공학 분야에서는 차세대 염기서열 분석(NGS) 기술이 등장하면서 생명 현상을 분자 수준에서 이해하는 데 혁명적인 발전을 이루었습니다. NGS는 DNA나 RNA와 같은 유전 물질을 빠르게 해독하여 방대한 양의 유전 정보를 생성할 수 있는 기술입니다. 이러한 대규모 데이터를 기반으로 질병의 원인을 규명하고 개인 맞춤형 치료법을 개발하는 등 다양한 연구가 진행되고 있습니다. 하지만 NGS 기반 실험은 높은 비용과 복잡한 데이터 분석 과정 때문에 연구 설계 단계에서부터 신중한 고려가 필요합니다. 

특히, **통계적 검정력(Power)**과 **표본 크기**는 NGS 연구의 성공 여부를 결정하는 중요한 요소입니다. 통계적 검정력이란 실제로 효과가 존재할 때, 실험을 통해 해당 효과를 검출할 수 있는 확률을 의미합니다. 즉, 검정력이 높을수록 실험 결과의 신뢰성을 확보할 수 있습니다. 표본 크기는 연구 대상으로 삼는 개체 수를 의미하며, 통계적 검정력과 밀접한 관련이 있습니다. 일반적으로 표본 크기가 클수록 통계적 검정력이 높아지지만, NGS 실험의 경우 비용적인 제약으로 인해 무작정 표본 크기를 늘릴 수는 없습니다. 

제공해주신 자료 에 따르면, NGS 기반 실험의 전력 분석은 기존의 마이크로어레이 기반 실험보다 훨씬 복잡하다고 합니다. 그 이유는 NGS 데이터가 가지는 고유한 특징 때문입니다. 첫째, NGS 데이터는 **읽기 깊이(Read Depth)**와 **읽기 분산(Read Dispersion)**과 같은 요소들을 고려해야 합니다. 읽기 깊이는 특정 유전자 영역이 시퀀싱된 횟수를 의미하며, 읽기 분산은 각 유전자 영역에 대한 읽기 횟수의 변동을 나타냅니다. 둘째, NGS는 DNA 시퀀싱, RNA 시퀀싱, 메타게놈 시퀀싱 등 다양한 분야에 활용될 수 있으며, 각각의 적용 분야에 따라 데이터의 특성과 분석 목표가 달라지기 때문에 전력 분석 방법 또한 다르게 적용되어야 합니다.

NGS 기반 실험에서 통계적 검정력과 표본 크기를 정확하게 계산하기 위해서는 다양한 요소들을 종합적으로 고려해야 합니다. 예를 들어, 연구 목표, 데이터 유형, 분석 방법, 효과 크기, 유의 수준, 예산 등을 고려하여 최적의 표본 크기를 결정해야 합니다.  

**결론적으로, NGS 기반 실험의 성공을 위해서는 연구 설계 단계에서부터 통계적 검정력과 표본 크기에 대한 심층적인 고려가 필수적입니다.** NGS 데이터의 복잡성과 다양한 연구 목표를 고려하여 적절한 전력 분석 방법을 적용하고 최적의 표본 크기를 결정함으로써, 연구 결과의 신뢰성을 확보하고 효율적인 연구를 수행할 수 있습니다. 


결론적으로, NGS 기반 실험의 성공을 위해서는 연구 설계 단계에서부터 통계적 검정력과 표본 크기에 대한 심층적인 고려가 필수적입니다. 결국 잘 해야한다는 얘기 되겠습니다. 

샘플 개수가 작으면 유의미한 결과를 도출 할 수 없고, 샘플 개수가 너무 많이 필요하면 비용이 어마무시하게 많이 소요될 수 있으니깐요. 적절한 점을 잘 찾아야 할 듯 합니다.

우리들의 clova-x 曰 논문을 읽어보니 Negative Binomial 모델이 괜찮아 보인다고하네요.

모두들 10월의 마지막날을 잘 보내시기 바랍니다. :)


출처: @candyz_hyojung


수요일, 10월 30, 2024

멕시코 여성의 유방암, 유전자에 답이 있을까? - BRCA 유전자 변이 연구 이야기

오늘은 2019년도에 출판되었던 논문을 가져와봤습니다. 제목은 Analysis of the pathogenic variants of BRCA1 and BRCA2 using next-generation sequencing in women with familial breast cancer: a case–control study. 으로 멕시코 여성들의 BRCA1/2 변이에 대해서 연구한 내용입니다. 


DOI: 10.1186/s12885-019-5950-4


gemini

## 멕시코 여성의 유방암, 유전자에 답이 있을까? - BRCA 유전자 변이 연구 이야기

안녕하세요! 오늘은 좀 어려운 주제지만, 우리 건강과 밀접한 관련이 있는 유전자 이야기를 해볼까 합니다. 바로 **유방암 발병과 깊은 연관이 있는 BRCA 유전자**에 대한 연구인데요, 멕시코 북동부 지역 여성들을 대상으로 흥미로운 연구 결과가 나왔다고 해서 소개해드리려고 합니다.

### 왜 멕시코 여성을 대상으로 연구했을까요? 🤔

우리 몸의 세포에는 유전 정보를 담고 있는 DNA가 있고, DNA는 여러 개의 유전자로 이루어져 있습니다. 이 중 BRCA1, BRCA2 유전자는 **유방암을 억제하는 중요한 역할**을 하는데요, 이 유전자에 변이가 생기면 유방암에 걸릴 확률이 높아진다고 알려져 있습니다. 

그런데 이 BRCA 유전자 변이는 **인종이나 지역에 따라 그 빈도가 다르게 나타날 수 있습니다.** 멕시코는 다양한 인종이 섞여 있는 나라인데, 특히 북동부 지역은 유전적으로 독특한 특징을 가지고 있어 이 지역 여성들을 대상으로 연구를 진행하게 되었다고 합니다. 

### 연구 결과는 어땠을까요? 🔬

40세 이하의 유방암 환자, 50세 이상의 유방암 환자, 그리고 건강한 여성 그룹으로 나누어 BRCA 유전자 변이를 분석한 결과, 40세 이하 유방암 환자 그룹에서 **13.8%**의 여성이 BRCA 유전자 변이를 가지고 있는 것으로 나타났습니다. 특히 **삼중 음성 유방암**이라는 유형의 유방암을 가진 여성의 경우 변이 빈도가 **40%**까지 높아졌다고 하네요.

### 멕시코 여성에게만 나타나는 특이한 변이도 있었다고요? 😮

놀랍게도 이번 연구에서는 기존에 보고된 적 없는 새로운 BRCA1 유전자 변이가 발견되었습니다! 33세에 양측 유방암과 삼중 음성 유방암 진단을 받은 여성에게서 발견된 이 변이는 유전자의 기능을 손상시켜 유방암 발생 위험을 높이는 것으로 예측됩니다.

### 앞으로 더 연구해야 할 것은 무엇일까요? 🧐

이번 연구는 멕시코 북동부 지역 여성들의 유방암 예방 및 치료에 중요한 정보를 제공합니다. 특히 유전자 검사를 통해 BRCA 유전자 변이를 확인하고, **변이가 발견된 여성들에게는 정기적인 검진과 예방적 치료를 통해 유방암 발생 위험을 낮출 수 있는 방법을 제공**할 수 있습니다. 

하지만 아직까지 유전자 변이와 유방암 발생 사이의 정확한 메커니즘, 그리고 개인별 맞춤형 치료법 개발 등 더 많은 연구가 필요합니다. 앞으로 더 많은 연구를 통해 유방암으로부터 여성들을 보호할 수 있기를 기대해 봅니다!



chatGPT

**멕시코 북동부 지역에서 BRCA 유전자 변이를 조사한 이유와 결과**

유방암은 전 세계적으로 여성에게 가장 흔한 암 중 하나이며, 많은 여성의 건강을 위협하는 중요한 질환입니다. 특히 유전적 요인이 유방암 발생에 큰 영향을 미친다는 사실이 알려지면서, BRCA1과 BRCA2 유전자가 중요한 역할을 한다는 연구가 활발히 진행되고 있습니다. 최근 멕시코 북동부 지역을 대상으로 한 연구에서 이 유전자의 변이가 얼마나 자주 발생하는지, 그리고 이런 변이가 유방암 발병에 어떤 영향을 미치는지 조사되었습니다.

### 왜 BRCA 유전자를 조사했을까?

BRCA1과 BRCA2 유전자는 우리 몸의 세포가 제대로 작동하고, 손상된 DNA를 복구하는 데 중요한 역할을 합니다. 하지만 이 유전자에 변이가 생기면 유방암이나 난소암 같은 암이 발생할 위험이 매우 높아집니다. 특히 가족력이 있는 경우, 이 유전자 변이를 가진 여성은 평생 동안 50-85%의 확률로 유방암에 걸릴 수 있다고 알려져 있습니다.

이 연구는 멕시코 북동부 지역에서 유방암의 가족력이 있거나 유전적 요인이 의심되는 여성들을 대상으로 진행되었습니다. 그동안 많은 연구가 미국이나 유럽에서 진행되었지만, 라틴 아메리카, 특히 멕시코 지역에 대한 정보는 부족했습니다. 연구진은 이 지역의 여성들에게서 BRCA 유전자 변이가 얼마나 흔한지 알아보고, 이를 통해 해당 변이와 유방암의 관계를 명확히 하고자 했습니다.

### 연구에서 얻은 주요 결과는?

연구는 총 195명의 여성을 대상으로 진행되었습니다. 이 중 101명은 유전적 요인이 의심되는 고위험군에 속했고, 22명은 산발적으로 발생한 유방암 환자였으며, 72명은 건강한 여성이었습니다. 이들의 DNA를 분석한 결과, 고위험군의 13.8%가 BRCA1 또는 BRCA2 유전자 변이를 가지고 있는 것으로 확인되었습니다. 특히 삼중 음성 유방암(호르몬 수용체와 HER2 수용체가 모두 없는 유형) 환자에서는 변이 빈도가 40%로 매우 높게 나타났습니다.

연구 결과는 이 지역 여성들 사이에서 BRCA 유전자 변이 빈도가 다른 인구 집단과 유사하다는 것을 보여주었으며, 특히 삼중 음성 유방암 환자에서는 BRCA 유전자 검사의 필요성이 강조되었습니다. 즉, 특정 임상적 특성을 가진 환자들은 유전자 검사를 받아야 한다는 것을 확인한 것입니다.

### 앞으로 더 논의되어야 할 내용은?

이 연구는 멕시코 북동부 지역에서 BRCA1과 BRCA2 유전자 변이가 어느 정도 발생하는지 밝히는 중요한 첫걸음을 내딛었지만, 추가 연구가 필요합니다. 연구진은 변이 유형과 관련된 정보가 여전히 부족하다는 점을 강조하며, 멕시코와 같은 유전적 다양성이 높은 지역에서는 더 많은 연구가 필요하다고 지적했습니다.

또한, 이 연구는 유방암 위험이 높은 여성들이 유전자 검사를 받을 수 있도록 적극적으로 권장해야 한다는 메시지를 전달합니다. 유전자 검사 결과에 따라 개인 맞춤형 암 예방 및 치료 전략을 세우는 것이 가능하며, 이를 통해 암 발생 위험을 줄일 수 있을 것입니다.

### 결론

이 연구는 멕시코 북동부 지역의 BRCA1과 BRCA2 유전자 변이 빈도를 처음으로 체계적으로 조사한 중요한 연구입니다. 유전적 요인이 중요한 역할을 하는 유방암의 경우, 조기 검진과 유전자 검사를 통해 적절한 예방 조치를 취하는 것이 매우 중요합니다. 특히 가족력이 있거나 삼중 음성 유방암과 같은 특정 유형의 암에 걸린 환자라면 유전자 검사를 통해 변이 여부를 확인하고, 이를 통해 암 예방과 치료에 도움을 받을 수 있습니다.

이 연구는 멕시코뿐만 아니라 다른 지역에서도 유전적 특성을 이해하고, 이를 기반으로 한 맞춤형 치료의 필요성을 강조하는 중요한 자료로 활용될 수 있을 것입니다.



clova-x

제목: 멕시코 북동부 여성의 BRCA 유전자 변이 연구 결과

안녕하세요, 오늘은 생명공학 분야에서 중요한 연구 결과 하나를 소개해드리려고 합니다. 바로 멕시코 북동부 지역 여성들을 대상으로 한 BRCA 유전자 변이에 대한 연구입니다.

BRCA 유전자는 인간의 유전 정보를 담고 있는 DNA 중 유방암 및 난소암과 관련된 변이를 가지고 있는 유전자입니다. 이 유전자의 변이 여부는 암의 조기 진단 및 예방, 치료에 큰 영향을 미치기 때문에, 많은 연구가 이루어지고 있습니다.

이번 연구는 멕시코 북동부 지역의 여성들을 대상으로 BRCA1과 BRCA2 유전자의 변이 빈도를 조사하였습니다. 그 이유는 멕시코는 지리적, 인종적으로 다양한 특성을 가지고 있어, 이 지역 여성들의 유전자 변이 패턴을 파악하는 것이 다른 지역과의 비교를 통해 유전성 유방암의 예방 및 치료에 대한 이해를 높이는 데 도움이 될 것으로 기대했기 때문입니다.

연구진은 총 세 그룹의 여성들을 대상으로 연구를 진행했습니다. 첫 번째 그룹은 40세 이하의 유방암 진단을 받았거나 유전성 유방암 위험 요인이 있는 여성 101명, 두 번째 그룹은 50세 이상의 산발성 유방암 환자 22명, 마지막 그룹은 건강한 여성 72명이었습니다.

혈액 샘플에서 DNA를 추출하여 차세대 염기서열 분석을 수행한 결과, BRCA1과 BRCA2 유전자의 변이가 발견되었으며, 특히 40세 이하의 유방암 환자 그룹에서 높은 빈도로 발견되었습니다. 또한, 삼중 음성 아형을 가진 환자에서 유전자 돌연변이 빈도가 40%로 높았습니다.

삼중 음성 유방암은 에스트로겐 수용체, 프로게스테론 수용체, HER2 단백질이 모두 음성인 유방암으로, 다른 유형의 유방암보다 공격적이고 예후가 좋지 않은 것으로 알려져 있습니다. 이번 연구 결과는 삼중 음성 유방암과 BRCA 유전자 변이 사이의 연관성을 보여주는 것으로, 이에 대한 추가적인 연구가 필요함을 시사합니다.

이번 연구는 멕시코 북동부 지역 여성들의 BRCA 유전자 변이에 대한 이해를 높이는 데 큰 역할을 했으며, 이를 바탕으로 유전성 유방암의 예방 및 치료에 대한 보다 효과적인 접근 방법을 개발할 수 있을 것으로 기대됩니다. 또한, 이번 연구 결과는 인종적, 지리적 다양성이 유전자 변이에 미치는 영향을 보여주는 사례로, 다른 지역에서도 이와 유사한 연구가 이루어져야 할 것입니다.



NotebookLM

## 멕시코 여성에게서 나타나는 BRCA 유전자 변이, 그리고 유방암

**유방암은 전 세계 여성들에게 가장 흔한 암**이며, 특히 개발도상국에서는 주요 사망 원인이기도 합니다. 유방암 중에서도 **약 10%는 유전적인 요인**으로 발생하는데, 그중 **BRCA1과 BRCA2 유전자의 변이는 15-40%를 차지**합니다. BRCA 유전자는 DNA 손상을 복구하고 세포 성장을 조절하는 중요한 역할을 하지만, 이 유전자에 변이가 생기면 유방암, 난소암 등 여러 암 발생 위험이 크게 증가하게 됩니다. 

**이 연구는 멕시코 북동부 지역 여성들을 대상으로 BRCA1, BRCA2 유전자 변이의 빈도를 조사하고, 이 변이가 유방암 발생과 어떤 관련성을 가지는지 알아보기 위해 진행되었습니다.** 특히, 이 지역은 유럽, 아프리카, 아메리카 원주민의 유전적 혼합으로 인해 BRCA 유전자 변이에 대한 정보가 부족했기 때문에 이 연구가 중요한 의미를 가집니다.

### 연구는 어떻게 진행되었을까요?

연구팀은 멕시코 북동부 지역의 여성들을 세 그룹으로 나누어 연구를 진행했습니다. 

* **1군**: 40세 이하의 유방암 환자 또는 유전성 유방암 위험 요인을 가진 여성 101명 

* **2군**: 50세 이상의 산발성 유방암 환자 22명 

* **3군**: 건강한 여성 72명

각 그룹 참가자들의 혈액 샘플에서 DNA를 추출하여 차세대 염기서열 분석(NGS)을 통해 BRCA1, BRCA2 유전자의 변이를 분석했습니다.

### 연구 결과는?

* **1군 (40세 이하 유방암 환자 또는 유전성 유방암 위험 요인을 가진 여성) 에서는 13.8%의 여성에게서 BRCA 유전자 변이가 발견되었습니다.** 이 중 BRCA1 유전자 변이를 가진 여성은 12명, BRCA2 유전자 변이를 가진 여성은 2명이었습니다.

* **2군 (50세 이상의 산발성 유방암 환자) 에서는 2명의 여성에게서 BRCA1 유전자 변이가 발견되었으며, 3군 (건강한 여성) 에서는 BRCA 유전자 변이가 발견되지 않았습니다**.

* 특히 **삼중 음성 유방암** 아형을 가진 1군 여성의 경우, **무려 40%에서 BRCA 유전자 변이가 발견**되었습니다. **삼중 음성 유방암**은 에스트로겐 수용체, 프로게스테론 수용체, HER2 수용체가 모두 음성인 유방암으로, 예후가 좋지 않고 치료법이 제한적인 유형입니다.

### 이 연구 결과가 말해주는 것은?

* 멕시코 북동부 지역 여성의 **BRCA 유전자 변이 빈도는 다른 인구 집단에서 보고된 것과 유사한 수준**입니다. 

* **젊은 여성의 유방암 발생률이 예상보다 높게 나타났으며**, 이는 BRCA 유전자 변이 검사의 필요성을 시사합니다. 

* **특히 삼중 음성 유방암 환자의 경우 BRCA 유전자 변이 빈도가 매우 높기 때문에 유전자 검사를 통해 적절한 치료 방향을 결정하는 것이 중요합니다**.

### 앞으로 더 논의되어야 할 점은?

* 멕시코는 다양한 인종이 혼재된 국가이기 때문에, 지역별 BRCA 유전자 변이 빈도와 유형을 더 자세히 조사할 필요가 있습니다.

* BRCA 유전자 변이를 가진 여성들의 유방암 발생 위험을 낮추기 위한 예방 전략과, 효과적인 치료법 개발에 대한 연구가 더 필요합니다.

* 유전자 검사 비용 부담, 검사 결과에 대한 오해, 사회적 차별 등 유전자 검사 접근성을 제한하는 요인들을 해결하기 위한 노력이 필요합니다.

이 연구는 BRCA 유전자 변이가 멕시코 여성의 유방암 발생에 미치는 영향을 이해하는 데 중요한 기반을 마련했습니다. 앞으로 더 많은 연구와 논의를 통해 유방암 예방과 치료, 그리고 유전자 검사의 접근성을 향상시키는 데 기여할 수 있기를 기대합니다. 



claude

안녕하세요, 오늘은 멕시코에서 진행된 흥미로운 유방암 연구에 대해 이야기해보려 합니다. 

우리는 종종 유방암에 대해 듣게 되는데요, 그중에서도 '유전성 유방암'이라는 말을 들어보셨나요? 이는 특정 유전자의 변화로 인해 발생하는 유방암을 말합니다. 그 중심에 있는 유전자가 바로 BRCA1과 BRCA2입니다.

왜 이 연구를 했을까요?

1. 지역적 특성 이해: 유전자 변이는 지역과 인종에 따라 다르게 나타날 수 있어요. 멕시코 북동부 지역의 특성을 이해하기 위해 이 연구를 진행했습니다.

2. 효과적인 검진 방법 개발: 어떤 사람들이 유전자 검사를 받아야 하는지 결정하는 데 도움이 됩니다.

3. 맞춤 의료의 기초: 개인의 유전적 특성에 맞는 치료 방법을 개발하는 데 중요한 정보를 제공합니다.

연구 결과 무엇을 알게 되었나요?

1. 변이 빈도: 고위험군 여성 중 약 14%가 BRCA1 또는 BRCA2 유전자에 변이가 있었습니다. 이는 다른 나라의 연구 결과와 비슷한 수준이에요.

2. 특정 유형의 유방암과의 연관성: BRCA 유전자 변이가 있는 사람들 중 65%가 '삼중음성 유방암'이라는 특정 유형의 유방암을 가지고 있었습니다. 이는 매우 중요한 발견인데요, 이 유형의 유방암 환자들에게 유전자 검사를 권유해볼 만하다는 뜻입니다.

3. 모유 수유의 중요성: 흥미롭게도, 유전자 변이가 있는 여성들 중 모유 수유를 한 비율이 더 낮았어요. 이는 모유 수유가 유방암 예방에 도움이 될 수 있다는 기존의 연구 결과를 뒷받침합니다.

4. 검사 방법의 중요성: 연구팀은 두 가지 다른 방법으로 유전자를 검사했는데, 둘 다 중요한 것으로 나타났습니다. 이는 정확한 진단을 위해 여러 방법을 병행해야 한다는 점을 시사합니다.

이 연구 결과는 어떤 의미가 있을까요?

1. 맞춤형 검진: 특정 유형의 유방암 환자나 가족력이 있는 사람들에게 유전자 검사를 권유할 수 있게 되었습니다.

2. 예방의 중요성: 모유 수유와 같은 생활 습관이 유전적 위험을 가진 사람들에게도 도움이 될 수 있다는 점을 확인했습니다.

3. 정확한 진단: 여러 검사 방법을 병행해야 한다는 점을 알게 되어, 앞으로 더 정확한 진단이 가능해질 것입니다.

4. 지역 맞춤 의료: 멕시코 북동부 지역의 특성을 이해함으로써, 이 지역 주민들에게 더 적합한 의료 서비스를 제공할 수 있게 되었습니다.

앞으로 더 연구해야 할 점은 무엇일까요?

1. 다른 지역과의 비교: 멕시코의 다른 지역이나 다른 나라와 비교 연구를 통해 더 넓은 이해를 얻을 수 있을 것입니다.

2. 예방 전략: 모유 수유 외에 다른 생활 습관이 유전적 위험을 줄일 수 있는지 연구할 필요가 있습니다.

3. 치료법 개발: 이런 유전적 특성을 가진 환자들에게 가장 효과적인 치료법은 무엇인지 연구해야 합니다.

이 연구는 유방암 예방과 치료에 있어 큰 진전을 이루었습니다. 우리 모두가 건강에 대해 더 관심을 가지고, 필요하다면 의사와 상담하여 적절한 검진을 받는 것이 중요하다는 점을 다시 한 번 상기시켜주는 연구 결과였습니다.


오늘은 간만에 claude를 사용해봤습니다. 이유는!! 논문의 양이 무료이용범위안에 허용되어서 입니다. ;) 

NGS는 시간도 절약하고 비용 효율적이면서 민감도와 특이도가 높아서 유전자 검사에 용이(지금은 누구나 알고 있지만)하나 MLPA와 같은 다른 기술을 함께 사용하면 더 좋은 결과(aka 정확도를 높이는)를 얻을 수 있어서 임상의들의 결정에 중요하다고 하네요.

중남미국가에서 대규모의 195명의 환자를 대상으로 연구를 했다는것에 의의가 있지 않을까 합니다. :)


출처: @ye._.vely618


목요일, 8월 08, 2024

NGS는 진짜 더 나은 치료법을 제시할 수 있는가

오늘은 전이성 전립선암과 요로상피암에서 NGS 방법이 과연 합리적인 검사 방법인지에 대해서 노한 Trends and Disparities in Next-Generation Sequencing in Metastatic Prostate and Urothelial Cancers 논문을 가져와 봤습니다.


DOI: 10.1001/jamanetworkopen.2024.23186


clova-x

NGS 검사는 치료 선택, 예후 예측, 환자 상담 등에 도움을 줄 수 있습니다. 예를 들어, 이전 연구들은 RB1, PTEN, TP53 등의 종양 억제 유전자의 변이가 더 공격적인 질병 특성과 나쁜 생존 결과와 관련이 있음을 보여주었습니다. 이러한 유전적 취약성 변이가 존재하는 경우 혈청 전립선 특이항원 수치 감시보다는 영상 연구를 통한 더 빈번한 모니터링이 필요할 수 있습니다. 또한 진행 중인 연구에서는 초기 질병 설정에서 추가적인 취약성 변이 표적화 에이전트를 조사하고 있습니다.

NGS 검사는 전이성 전립선암(mPC) 및 진행성 요로상피암(aUC) 환자에서 유전자 분석을 통해 암을 진단하고 치료 방법을 결정하는 데 중요한 역할을 합니다. NGS 검사는 암의 유전적 특성을 파악하여 개인 맞춤형 치료를 가능하게 하며, 이를 통해 환자의 치료 효과를 향상시킬 수 있습니다.

NGS 검사는 진단 후 1년 이내에 1.3%에서 32.7%로 증가했으며, 이는 환자들이 진단 후에도 NGS 검사를 받는 비율이 증가하고 있음을 보여줍니다. 이는 환자들이 자신의 질병에 대한 더 많은 정보를 얻고, 이를 바탕으로 치료 방법을 결정하고자 하는 욕구가 증가하고 있기 때문일 수 있습니다. 또한, NGS 검사가 비용이 저렴해지고, 검사 방법이 간편해지면서 환자들이 더 쉽게 검사를 받을 수 있게 된 것도 원인 중 하나일 수 있습니다.

하지만, NGS 검사는 아직까지 완벽한 검사는 아닙니다. 검사 결과가 항상 정확하지는 않으며, 검사 결과를 해석하는 데에도 전문적인 지식이 필요합니다. 또한, 검사 결과가 환자의 치료에 직접적인 영향을 미치는 경우에는 신중한 판단이 필요합니다. 따라서, NGS 검사는 전문가의 조언을 받아 신중하게 결정해야 합니다.


chatGPT

안녕하세요! 오늘은 최근 발행된 흥미로운 논문을 소개하려고 합니다. 이 논문은 차세대 염기서열 분석(NGS, Next-Generation Sequencing)을 사용하여 전이성 전립선암(mPC)과 요로상피암(aUC)을 연구한 내용을 담고 있습니다. 이 글에서는 NGS가 무엇인지, 왜 이 연구가 중요한지, 그리고 기존 검사법에 비해 얼마나 효과적인지 쉽게 설명해 드리겠습니다.

### 차세대 염기서열 분석(NGS)이란?

차세대 염기서열 분석(NGS)은 DNA의 유전적 정보를 빠르고 정확하게 분석할 수 있는 기술입니다. 이 기술은 다양한 질병의 유전적 원인을 파악하고 개인 맞춤형 치료를 가능하게 하는 데 중요한 역할을 하고 있습니다.

- **빠른 분석**: NGS는 기존의 DNA 분석법보다 훨씬 빠르게 많은 양의 데이터를 처리할 수 있습니다.

- **정확한 결과**: 개별 환자의 유전자 변이를 정확히 파악하여 맞춤형 치료법을 제시합니다.

- **경제적**: 초기에는 비용이 높았지만, 기술 발전으로 인해 비용이 점점 낮아지고 있습니다.

### 연구의 주요 내용

이 논문은 미국의 다양한 전립선암 및 요로상피암 환자들을 대상으로 NGS의 사용 현황을 분석했습니다. 연구의 핵심은 인종, 사회경제적 상태(SES), 보험 상황 등이 NGS 접근성에 미치는 영향을 조사하는 것이었습니다. 연구 결과는 다음과 같습니다.

1. **NGS 사용 증가**: 2012년부터 2019년까지 NGS의 사용이 꾸준히 증가했습니다. 특히, 2018년 미국 Medicare에서 전이성 암 환자에게 NGS를 필수 진단 도구로 지정한 이후 사용률이 크게 증가했습니다.

2. **인종적 격차**: 흑인과 히스패닉 환자는 백인 환자에 비해 NGS 검사를 받을 가능성이 낮았습니다. 이는 의료 접근성의 불평등과 관련이 있으며, 이를 해소하기 위한 정책적 노력이 필요합니다.

3. **사회경제적 상태**: 사회경제적 상태가 낮은 환자들도 NGS 검사 접근성이 낮았습니다. 그러나 Medicare의 정책 덕분에 일부 개선이 이루어졌습니다.

### NGS가 전이성 전립선암과 요로상피암에 합리적인 검사 방법인가?

기존의 암 검사 방법과 비교하여 NGS는 몇 가지 중요한 장점을 가지고 있습니다.

1. **정밀한 유전자 분석**: NGS는 암세포의 유전적 변이를 정확히 분석하여 각 환자에게 맞는 맞춤형 치료법을 제안합니다. 이는 환자의 치료 성공률을 높이고 부작용을 최소화하는 데 도움을 줍니다.

2. **광범위한 적용 가능성**: NGS는 단순한 진단을 넘어, 치료 경과 모니터링, 재발 여부 확인 등 다양한 용도로 사용됩니다. 이는 전이성 암과 같은 복잡한 질병에 특히 유리합니다.

3. **비용 효율성**: 과거에 비해 비용이 낮아졌고, 특히 전이성 암 환자에게는 더 많은 정보를 제공할 수 있어 치료의 경제성을 높입니다.

4. **신속한 결과**: 기존의 검사 방법보다 빠르게 결과를 도출하여, 환자의 치료 시작 시기를 앞당길 수 있습니다.

### 결론

NGS는 전이성 전립선암과 요로상피암 환자에게 효과적이고 합리적인 검사 방법으로 자리 잡고 있습니다. 이 연구는 이러한 검사 방법이 다양한 인종과 사회경제적 배경을 가진 환자들에게 더욱 공평하게 제공될 필요가 있음을 강조합니다. NGS의 장점을 살려 더 많은 환자들이 혜택을 받을 수 있도록 의료 시스템의 개선이 필요합니다.

### 앞으로의 방향

의료 기술의 발전은 환자의 생존율과 삶의 질을 크게 향상시킬 수 있습니다. NGS와 같은 첨단 기술이 보다 널리 보급되어 모든 환자들이 균등한 의료 혜택을 받을 수 있도록 하는 것이 중요합니다. 이 연구는 그 첫걸음이며, 앞으로 더 많은 연구와 정책 개선이 이루어질 것입니다.

---

이 글이 차세대 염기서열 분석에 대한 이해를 높이는 데 도움이 되었기를 바랍니다. 암 치료에 있어 이러한 혁신적인 기술이 어떻게 적용되고 있는지를 알고 나면, 우리의 건강 관리가 얼마나 발전하고 있는지를 실감할 수 있을 것입니다. 궁금한 점이 있다면 언제든지 댓글로 남겨주세요!


gemini

## 전이성 전립선암과 요로상피암 환자, NGS 검사 얼마나 받고 있을까?

**NGS 검사, 정확히 뭐지?**

우리가 흔히 듣는 유전자 검사 중 하나인 NGS(차세대 염기서열 분석) 검사는 암 환자에게 매우 중요한 역할을 합니다. 암세포의 유전자 정보를 빠르고 정확하게 분석하여 환자에게 가장 적합한 치료법을 찾는 데 도움을 주기 때문이죠. 특히 전이성 전립선암이나 요로상피암처럼 진행된 암의 경우, NGS 검사를 통해 암세포의 특징을 파악하고 맞춤형 치료를 할 수 있습니다.

**전이성 전립선암과 요로상피암 환자의 NGS 검사 현황**

최근 발표된 한 연구에 따르면, 전이성 전립선암과 요로상피암 환자에게 NGS 검사를 시행하는 비율이 점차 증가하고 있다고 합니다. 하지만 아직까지 모든 환자가 NGS 검사를 받고 있는 것은 아니며, 특히 소수 인종이나 저소득층 환자의 경우 NGS 검사를 받는 비율이 상대적으로 낮은 것으로 나타났습니다.

**NGS 검사, 왜 중요할까?**

* **맞춤형 치료:** NGS 검사를 통해 암세포의 특정 유전자 변이를 찾아내면, 이 변이에 맞는 표적 치료제를 사용하여 더 효과적인 치료를 할 수 있습니다.

* **치료 효과 예측:** NGS 검사 결과를 바탕으로 특정 치료법에 대한 환자의 반응을 예측하고, 부작용 발생 가능성을 줄일 수 있습니다.

* **새로운 치료법 개발:** NGS 데이터를 분석하여 새로운 치료 타겟을 발굴하고, 더욱 효과적인 암 치료제를 개발하는 데 활용할 수 있습니다.

**NGS 검사, 기존 검사보다 나은 점은?**

기존의 암 검사 방법은 특정 유전자만을 검사하는 경우가 많았지만, NGS 검사는 한 번에 수천 개의 유전자를 동시에 분석할 수 있습니다. 따라서 더 많은 유전 정보를 얻을 수 있고, 암 환자에게 더욱 정확한 진단과 치료 계획을 제공할 수 있습니다.

**그렇다면 NGS 검사는 모든 환자에게 필수일까요?**

NGS 검사는 암 환자에게 매우 유용한 검사이지만, 모든 환자에게 반드시 필요한 것은 아닙니다. 의사와 충분히 상담하여 개인의 상황에 맞는 검사를 선택하는 것이 중요합니다.

**결론**

NGS 검사는 전이성 전립선암과 요로상피암 환자의 치료에 있어서 점차 중요한 역할을 하고 있습니다. 하지만 아직까지 모든 환자가 NGS 검사를 받고 있지는 않으며, 특정 집단 간의 불평등이 존재합니다. 앞으로 NGS 검사에 대한 접근성을 높이고, 모든 암 환자가 최신 치료 혜택을 누릴 수 있도록 노력해야 할 것입니다.

**핵심 요약**

* NGS 검사는 암세포의 유전자 정보를 분석하여 맞춤형 치료를 가능하게 하는 검사입니다.

* 전이성 전립선암과 요로상피암 환자에게 NGS 검사를 시행하는 비율이 증가하고 있지만, 아직 모든 환자가 검사를 받고 있지는 않습니다.

* NGS 검사는 기존 검사보다 더 많은 유전 정보를 얻을 수 있어 더 정확한 진단과 치료 계획을 세울 수 있습니다.

* NGS 검사는 모든 환자에게 필수는 아니지만, 의사와 상담하여 개인의 상황에 맞게 검사를 선택하는 것이 좋습니다.

**참고:** 위 내용은 일반적인 정보이며, 개인의 건강 상태에 대한 정확한 판단은 의료 전문가와 상담해야 합니다.

**궁금한 점이 있다면 언제든지 질문해주세요.**

**#NGS검사 #전이성전립선암 #요로상피암 #맞춤형치료 #암진단 #암치료**


NotebookLM

## 차세대 염기서열 분석(NGS) 검사: 전립선암과 요로상피암 환자에게 더 나은 치료법을 제시할 수 있을까요?

최근 의학 기술의 발전으로 개인 맞춤형 치료가 점점 더 중요해지고 있습니다. 특히 암 치료 분야에서는 **차세대 염기서열 분석(NGS)** 기술이 주목받고 있는데요, NGS는 개인의 유전 정보를 빠르게 분석하여 암세포의 특징을 파악하고 이를 바탕으로 **환자에게 가장 적합한 치료법을 제시**할 수 있게 해줍니다.

NGS 검사가 전립선암과 요로상피암 환자에게 얼마나 유용한지, 그리고 어떤 문제점이 있는지 자세히 알아보겠습니다.

### NGS 검사란 무엇일까요?

NGS 검사는 **암세포의 유전자를 분석하여 특정 약물에 대한 반응성이나 예후를 예측**하는 검사입니다. 예를 들어, BRCA 유전자 변이가 있는 전립선암 환자는 PARP 억제제라는 약물에 좋은 반응을 보일 가능성이 높습니다. 이처럼 NGS 검사는 **환자에게 최적의 치료법을 선택하고 불필요한 치료를 줄이는 데 도움**을 줄 수 있습니다.

### NGS 검사는 전립선암과 요로상피암 치료에 얼마나 활용되고 있을까요?

미국에서 2015년부터 2022년까지 전이성 전립선암과 진행성 요로상피암 환자를 대상으로 NGS 검사 이용 추세를 분석한 연구 결과가 발표되었습니다. 연구 결과, NGS 검사 비율이 증가하고 있는 것은 긍정적이지만, **2022년에도 여전히 많은 환자들이 NGS 검사를 받지 못하는 것으로 나타났습니다.**

특히 **흑인, 히스패닉 또는 라틴계 환자, 사회경제적 지위가 낮은 환자, 메디케이드 또는 메디케어와 같은 공공 보험 가입 환자**는 NGS 검사를 받을 확률이 낮았습니다. 이는 **의료 서비스 접근성의 불평등**을 보여주는 중요한 문제입니다.

### NGS 검사가 더 활발하게 활용되기 위해서는 어떤 노력이 필요할까요?

NGS 검사는 **개인 맞춤형 암 치료를 가능하게 하는 중요한 기술**이지만, 아직 널리 보급되지 못하고 있으며, **특정 집단의 환자들은 여전히 검사 접근성이 떨어지는 문제점**을 안고 있습니다. 의료 서비스 제공자와 정책 입안자들은 **모든 환자에게 동등한 의료 서비스를 제공**하고, NGS 검사와 같은 **첨단 의료 기술의 혜택을 모든 환자가 누릴 수 있도록 노력**해야 합니다. 

### 이 연구의 한계점

이 연구는 **미국 환자 데이터만을 사용**했기 때문에 한국 환자들에게 적용하기에는 한계가 있을 수 있습니다. 또한, 의료기록에 기반한 연구이기 때문에 **데이터 누락이나 부정확성**이 존재할 가능성도 있습니다.

### 결론

NGS 검사는 암 치료 분야의 혁신적인 기술로, **환자에게 최적의 치료 기회를 제공할 수 있는 가능성**을 제시합니다. 하지만 **모든 환자가 평등하게 NGS 검사를 받을 수 있도록 의료 서비스 접근성을 개선하고,  지속적인 연구를 통해 정확성과 효율성을 높여나가는 노력**이 필요합니다.



NGS라는 기술이 이세상에 나온지... 이제 10년하고도 5년정도? 되가는듯하고, 최근에는 많은 사람들의 노력으로 임상적인 결과로 의미가 있다는 연구결과가 속속 나오고 있지만, 병원에가서 암환자분이라고 해도 NGS 검사를 경험해보시는 분들이 많이 있지는 않으실 것이라고 생각합니다.

비용도 비용이고 해석에도 많은 시간과 노력이 들어가는것에 비해 알 수 있는, 선택할 수 있는 치료제가 많지 않아서 그러지 않나 싶습니다.

그래서 그만큼 시간과 비용을 들어가는 검사인데 진짜 의미가 있는지 한번 더 확인해 보자는 의미의 논문이라고 생각하시면 될 것 같고, 역시나 NGS 결과는 유의미하니 도입이 필요하나 현실적으로는 아직 좀 더 시간이 필요하지 않나 싶습니다. :)



출처: @ye._.vely618


일요일, 8월 04, 2024

인공 변이 생성기, 과연 필요한가

 오늘은 NGS 분석방법에서 NGS 파이프라인을 평가를 위해 임의로 돌연변이를 생성해내는 tool에 대한 논문을 가져와봤습니다. 제목은 in silico Mutator Software for Bioinformatics Pipeline Validation of Clinical Next-Generation Sequencing Assays 입니다.

DOI: 10.1016/j.jmoldx.2018.08.001

 

gemini

## NGS 검사의 정확성을 높이는 비밀 무기: 인공 돌연변이 생성 기술

NGS (Next-Generation Sequencing) 기술은 유전체 검사 분야에 혁신을 가져왔습니다. 이 기술은 우리 몸을 구성하는 DNA 전체를 빠르고 저렴하게 분석할 수 있게 해주었습니다. 하지만 NGS 검사 결과의 정확성을 보장하기 위해서는 신뢰할 수 있는 바이오인포매틱스 파이프라인이 필수적입니다. 바이오인포매틱스 파이프라인은 NGS 검사 데이터를 분석하고 해석하는 데 사용되는 일련의 프로그램과 알고리즘입니다.

하지만 바이오인포매틱스 파이프라인을 검증하는 것은 쉽지 않습니다. 기존 방법은 실제 환자 검체를 사용하는데, 이는 비용과 시간이 많이 소요됩니다. 또한, 실제 검체는 유전적 다양성이 매우 높아 검증 과정을 복잡하게 만듭니다.

이러한 문제를 해결하기 위해 개발된 것이 바로 인공 돌연변이 생성 기술입니다. 인공 돌연변이 생성 기술은 실제 검체를 사용하지 않고도 다양한 유형의 돌연변이를 포함하는 가상의 NGS 데이터를 생성할 수 있게 합니다. 이렇게 생성된 데이터를 사용하여 바이오인포매틱스 파이프라인을 검증하면 다음과 같은 이점을 얻을 수 있습니다.

* **비용 및 시간 절감:** 실제 검체를 사용하는 것보다 훨씬 저렴하고 빠르게 검증 과정을 수행할 수 있습니다.

* **검증의 정확성 향상:** 다양한 유형의 돌연변이를 포함하는 데이터를 사용하여 검증함으로써 파이프라인의 정확성을 더욱 높일 수 있습니다.

* **유전적 다양성 고려:** 실제 검체의 유전적 다양성을 반영하여 보다 현실적인 검증 환경을 조성할 수 있습니다.

인공 돌연변이 생성 기술은 NGS 검사의 정확성을 보장하는 데 매우 중요한 역할을 합니다. 이 기술은 앞으로 NGS 검사의 보급을 더욱 확대하고 유전자 기반 의료의 발전에 기여할 것으로 기대됩니다.

**인공 돌연변이 생성 기술을 활용한 NGS 검사 검증 방법**

인공 돌연변이 생성 기술을 활용한 NGS 검사 검증 방법은 다음과 같습니다.

1. **인공 돌연변이 생성:** 인공 돌연변이 생성 소프트웨어를 사용하여 다양한 유형의 돌연변이를 포함하는 가상의 NGS 데이터를 생성합니다.

2. **NGS 검사 시뮬레이션:** 생성된 가상 NGS 데이터를 NGS 검사 파이프라인에 입력하고 검사 결과를 시뮬레이션합니다.

3. **검증 결과 분석:** 시뮬레이션 결과를 실제 NGS 검사 결과와 비교하여 바이오인포매틱스 파이프라인의 정확성을 평가합니다.

**인공 돌연변이 생성 기술의 활용 분야**

인공 돌연변이 생성 기술은 NGS 검사 검증뿐만 아니라 다음과 같은 다양한 분야에 활용될 수 있습니다.

* **새로운 바이오인포매틱스 알고리즘 개발:** 새로운 바이오인포매틱스 알고리즘의 성능을 평가하고 개선하는 데 사용할 수 있습니다.

* **유전 질환 연구:** 유전 질환의 원인을 파악하고 치료 방법을 개발하는 데 사용할 수 있습니다.

* **개인 맞춤형 의료:** 개인의 유전적 특성에 맞는 맞춤형 의료 서비스를 개발하는 데 사용할 수 있습니다.

## NGS 시대, 정확성이 더욱 중요해지는 이유

NGS 기술은 유전체 의학 분야에 혁신을 가져왔지만, 아직 초기 단계에 있습니다. NGS 검사 결과의 정확성을 보장하기 위해서는 지속적인 연구와 개발이 필요합니다. 인공 돌연변이 생성 기술은 NGS 검사의 정확성을 높이는 데 중요한 역할을 할 수 있으며, 앞으로 NGS 시대의 발전에 기여할 것으로 기대합니다.


clova-x

인공적인 변이를 생성하는 이유는 다음과 같습니다.

1. **분석 파이프라인 검증**: 인공적인 변이를 생성하여 분석 파이프라인을 검증할 수 있습니다. 실제 데이터 세트에 적용하여 분석 파이프라인의 성능을 평가하고, 문제를 식별하고 수정할 수 있습니다.

2. **다양한 변이 생성**: 인공적인 변이를 생성하여 다양한 변이를 생성할 수 있습니다. 이를 통해 분석 파이프라인이 다양한 변이를 정확하게 탐지할 수 있는지 확인할 수 있습니다.

3. **비용 절감**: 실제 샘플을 사용하여 분석 파이프라인을 검증하는 것보다 비용이 저렴합니다. 실제 샘플을 사용하여 분석 파이프라인을 검증하는 것은 비용이 많이 들기 때문에, 인공적인 변이 생성을 통해 비용을 절감할 수 있습니다.

4. **실제 데이터 세트 보완**: 실제 데이터 세트는 모든 분석 영역을 완벽하게 커버하지 못할 수 있으므로, 인공적인 변이 생성을 통해 이를 보완할 수 있습니다.

5. **분석 파이프라인 성능 향상**: 실제 데이터 세트와 함께 인공적인 변이 생성을 통해 분석 파이프라인의 성능을 더욱 향상시킬 수 있습니다.

이러한 이유로 인공적인 변이를 생성하는 분석 툴은 분석 파이프라인 검증에 매우 유용하며, 실제 데이터 세트를 보완하여 분석 파이프라인의 성능을 향상시키는 데 도움이 됩니다.

인공적인 변이를 생성하는 분석 툴은 NGS 분석에 있어서 매우 중요한 역할을 합니다. NGS 분석은 복잡한 과정을 거치기 때문에, 분석 과정에서 오류가 발생할 가능성이 높습니다. 이러한 오류를 발견하고 수정하기 위해서는 인공적인 변이를 생성하여 분석 파이프라인을 검증하는 것이 필요합니다.

인공적인 변이를 생성하는 분석 툴은 NGS 분석의 정확성을 높이는 데에도 큰 역할을 합니다. 다양한 변이를 생성하여 분석 파이프라인이 다양한 변이를 정확하게 탐지할 수 있는지 확인할 수 있기 때문입니다.

따라서, NGS 분석을 수행하는 연구자들은 인공적인 변이를 생성하는 분석 툴을 적극적으로 활용하는 것이 좋습니다. 이를 통해 분석 파이프라인의 성능을 향상시키고, NGS 분석의 정확성을 높일 수 있습니다.


chatGPT

### 인공 돌연변이를 생성하는 이유와 그로 인한 이득

현대 의학의 발전은 유전자를 분석하여 다양한 질병의 원인을 규명하고, 치료 방법을 찾아내는 데 큰 도움을 주고 있습니다. 그 중에서도 차세대 염기서열 분석(Next-Generation Sequencing, NGS)은 매우 중요한 역할을 하고 있습니다. 하지만 NGS 분석이 정확하게 작동하는지 검증하는 것은 쉬운 일이 아닙니다. 여기서 인공 돌연변이를 생성하는 분석 툴의 필요성과 그 이점이 나타납니다.

#### 인공 돌연변이란 무엇일까요?

인공 돌연변이는 컴퓨터를 사용하여 유전자 데이터에 가상의 변이를 만들어내는 것입니다. 마치 실제로 존재하는 변이처럼 데이터를 조작하는 것이죠. 이렇게 생성된 인공 돌연변이는 실제 샘플 대신 사용되어 다양한 분석 과정과 도구가 정확히 작동하는지 검증하는 데 사용됩니다.

#### 왜 인공 돌연변이를 생성할까요?

1. **참조 샘플 부족 문제 해결**: 

   NGS 분석의 정확성을 검증하기 위해서는 다양한 유전자 변이를 포함한 참조 샘플이 필요합니다. 그러나 이런 샘플을 충분히 확보하는 것은 쉽지 않습니다. 인공 돌연변이는 이러한 부족한 참조 샘플 문제를 해결할 수 있는 방법입니다.

2. **비용 절감**:

   실제 샘플을 대량으로 시퀀싱하는 것은 매우 비쌉니다. 반면, 인공 돌연변이는 실제 샘플을 대체할 수 있는 저렴한 대안입니다. 컴퓨터에서 생성된 변이는 비용 없이 다양한 변이를 테스트할 수 있게 해줍니다.

3. **포괄적인 검증 가능**:

   인공 돌연변이를 사용하면 NGS 분석 도구가 모든 종류의 변이를 정확히 감지할 수 있는지 포괄적으로 검증할 수 있습니다. 이는 실제 샘플을 사용하는 것보다 더 광범위한 검증을 가능하게 합니다.

#### 인공 돌연변이를 사용함으로써 얻는 이득

1. **높은 신뢰성**:

   인공 돌연변이 데이터를 사용하면 바이오인포매틱스 파이프라인의 성능을 더 철저히 검증할 수 있습니다. 이를 통해 분석 도구의 신뢰성을 높일 수 있으며, 실제 환자 데이터 분석 시 더 정확한 결과를 얻을 수 있습니다.

2. **현실적인 데이터 시뮬레이션**:

   인공 돌연변이는 실제 시퀀싱 데이터에 가상의 변이를 도입하는 방식으로, 실제 데이터의 특성을 그대로 유지하면서도 다양한 변이를 검증할 수 있습니다. 이는 순수 합성 데이터보다 실제 실험 조건을 더 잘 반영합니다.

3. **효율적인 자원 활용**:

   연구소나 병원에서는 자원을 효율적으로 활용하는 것이 중요합니다. 인공 돌연변이를 사용하면 제한된 자원으로 더 많은 검증을 수행할 수 있어, 연구비 절감 및 효율적인 연구가 가능합니다.

#### 결론

인공 돌연변이를 생성하는 분석 툴은 NGS 분석의 정확성을 높이는 데 중요한 역할을 합니다. 이는 참조 샘플 부족 문제를 해결하고, 비용을 절감하며, 분석 도구의 포괄적인 검증을 가능하게 합니다. 이러한 기술을 통해 우리는 더 신뢰성 높은 유전자 분석을 수행할 수 있으며, 이는 궁극적으로 환자 치료에 큰 도움이 됩니다.

여러분도 인공 돌연변이의 중요성을 이해하고, 이러한 기술이 어떻게 우리의 삶을 더 나아지게 하는지 생각해보세요. 기술의 발전은 항상 우리를 더 나은 미래로 이끌고 있습니다.


claude

제목: NGS 분석의 신뢰성을 높이는 비밀: 인공 변이 생성의 힘

안녕하세요, 오늘은 유전체 분석 분야의 흥미로운 주제를 소개해드리려 합니다. 바로 '인공 변이 생성'에 대한 이야기인데요. 이게 대체 무엇이고, 왜 필요한 걸까요?

먼저, NGS(차세대 염기서열 분석)에 대해 간단히 설명드리겠습니다. NGS는 우리 몸의 유전 정보를 빠르고 정확하게 읽어내는 첨단 기술입니다. 의료 분야에서는 이 기술을 이용해 질병의 원인을 찾고 맞춤 치료법을 개발하는 데 활용하고 있죠.

하지만 이렇게 중요한 NGS 기술도 완벽하지는 않습니다. 데이터를 분석하는 과정에서 오류가 발생할 수 있기 때문이죠. 그래서 과학자들은 NGS 분석 시스템이 정확한지 확인하는 방법을 고민했고, 그 결과 '인공 변이 생성'이라는 아이디어를 떠올렸습니다.

인공 변이 생성이란 무엇일까요? 쉽게 말해, 컴퓨터로 가짜 유전자 변화를 만들어내는 것입니다. 이렇게 만든 가짜 변이를 실제 NGS 데이터에 섞어 넣은 뒤, 분석 시스템이 이를 정확히 찾아낼 수 있는지 테스트하는 거죠.

이런 방식으로 인공 변이를 만들어 사용하면 어떤 장점이 있을까요?

1. 전방위적인 검증이 가능해집니다:

   실제 환자 샘플로는 모든 종류의 유전자 변화를 테스트하기 어렵지만, 인공 변이를 이용하면 다양한 상황을 시뮬레이션할 수 있습니다.

2. 비용을 절감할 수 있습니다:

   실제 샘플을 구하거나 인공 DNA를 만드는 것보다 컴퓨터로 변이를 생성하는 게 훨씬 저렴하죠.

3. 현실적인 테스트가 가능합니다:

   실제 NGS 데이터에 인공 변이를 넣기 때문에, 현실 세계의 복잡성을 반영한 테스트가 가능합니다.

4. 시스템의 한계를 파악할 수 있습니다:

   어떤 종류의 변이를 잘 찾아내고, 어떤 것을 놓치는지 정확히 알 수 있어 시스템 개선에 도움이 됩니다.

결론적으로, 인공 변이 생성 기술은 NGS 분석의 정확도를 높이는 강력한 도구입니다. 이를 통해 의료진은 더욱 신뢰할 수 있는 유전체 분석 결과를 얻을 수 있고, 궁극적으로는 환자들에게 더 나은 의료 서비스를 제공할 수 있게 되는 것이죠.

유전체 분석 기술이 발전할수록 우리의 삶은 더욱 풍요로워질 것입니다. 그 과정에서 인공 변이 생성과 같은 혁신적인 방법들이 중요한 역할을 하고 있다는 점, 기억해 주세요!


이런 tool이 진짜 있나 했는데 있네요;; 근데 분석 tool을 평가하기 위한 변이 생성기지 이 변이 생성기를 사용해서 한국이나 미국의 식약처 인증에 사용하면 안될거 같은데 진짜 사용하실 분이 있을지... 굉장히 걱정이네요 ㅎㅎ 

2024년 여름은 파리 올림픽으로 더위를 잘 나는 것 같습니다.

다들 더위 조심하시기 바랍니다. :)


출처: @ye._.vely618


월요일, 6월 17, 2024

2024년, NGS와 찰떡 궁합인 PCR enzyme는?

 오늘은 NGS 중에서 Amplification NGS에 사용되는 PCR 효소에 대한 내용을 들고 와봤습니다. 이름도 Identifying the best PCR enzyme for library amplification in NGS!! 입니다.

DOI : 10.1099/mgen.0.001228

이미 이전 2011년도에 유사한 작업을 했었고 그때에는 로슈사의 Kapa HiFi가 일루미나에서 라이브러리 증폭 단계에서 최고의 효소임을 확인하였다고 하네요. 그럼 10여년이 지난 2024년도에는 어떤 회사의 polymerase가 압도적 성능을 보여주는지 확인해 보시죠!!


gemini

**제목:** NGS 라이브러리 준비를 위한 최적의 PCR 효소 선택: 2024년 업데이트

**본문:**

NGS는 유전자 검사 및 유전체학 연구에 널리 사용되는 강력한 기술입니다. NGS 라이브러리 준비는 정확하고 효율적인 시퀀싱을 위해 필수적인 단계입니다. 이 단계에서 사용되는 PCR 효소는 결과의 질에 큰 영향을 미칠 수 있습니다.

다양한 PCR 효소가 NGS 라이브러리 준비에 사용할 수 있으며 각 효소마다 고유한 장단점이 있습니다. 연구 목적에 적합한 효소를 선택하는 것이 중요합니다.

최근 연구에서 Quantabio RepliQa Hifi Toughmix, Watchmaker Library Amplification Hot Start Master Mix (2X) ‘Equinox’ 및 Takara Ex Premier가 NGS 라이브러리 준비와 긴 판독 시퀀싱 전의 긴 조각 증폭 모두에 대해 일관된 성능을 제공하는 것으로 나타났습니다.

이 블로그 게시물에서는 NGS에 사용할 최적의 PCR 효소 선택 방법에 대한 지침을 제공합니다. 또한 NGS 라이브러리 준비 및 PCR 효소 선택에 대한 자세한 정보를 제공하는 추가 리소스에 대한 링크를 포함합니다.

**추가 리소스:**

* [NGS 라이브러리 준비를 위한 최적의 PCR 효소 선택]

* [NGS 라이브러리 준비를 위한 PCR 효소 비교]

**결론:**

NGS 라이브러리 준비를 위한 최적의 PCR 효소는 연구 목적, 사용하는 템플릿 및 이용 가능한 예산에 따라 다릅니다. 새로운 효소를 선택하기 전에 다양한 효소를 테스트하는 것이 좋습니다.


chatGPT

### NGS에 사용되는 PCR 효소 성능 비교

차세대 시퀀싱(NGS)은 생물학적 연구와 임상 진단에서 필수적인 도구로 자리 잡았습니다. 그러나 NGS의 성공은 다양한 단계에서 발생할 수 있는 편차를 최소화하는 데 달려 있습니다. 그 중에서도 PCR(중합효소 연쇄 반응) 단계는 편차를 유발할 수 있는 주요 단계입니다. 이번 글에서는 NGS에 사용되는 PCR 효소의 성능을 비교하고, 최근 연구 결과를 통해 어떤 효소들이 가장 좋은 성능을 보이는지 살펴보겠습니다.

#### PCR과 NGS의 관계

NGS를 수행하기 위해서는 DNA를 작은 조각으로 분해하여 시퀀싱 라이브러리를 준비해야 합니다. 이 과정에서 PCR은 중요한 역할을 합니다. PCR을 통해 라이브러리 조각들을 증폭시켜 시퀀싱에 필요한 충분한 양의 DNA를 확보할 수 있습니다. 그러나 모든 PCR 효소가 동일한 성능을 발휘하는 것은 아니며, 특히 GC 함량이 높거나 낮은 DNA 조각에서 차이가 두드러집니다.

#### 최근 연구: 최상의 PCR 효소 비교

최근 Wellcome Sanger Institute와 Cambridge 대학의 연구진이 다양한 PCR 효소를 비교하는 연구를 수행하였습니다. 이 연구에서는 다음과 같은 효소들이 특히 뛰어난 성능을 보였습니다:

1. **Quantabio RepliQa Hifi Toughmix**

2. **Watchmaker Library Amplification Hot Start Master Mix (2X) 'Equinox'**

3. **Takara Ex Premier**

#### 성능 평가 기준

이 연구에서는 효소들의 성능을 다음과 같은 기준으로 평가했습니다:

- **수율**: 증폭된 DNA의 양

- **유전체 커버리지 균일성**: 유전체 전체에서 균일하게 시퀀싱되는 정도

- **SNP 및 Indel 정확도**: 시퀀싱 데이터에서 단일 뉴클레오타이드 변이(SNP)와 삽입/삭제 변이(Indel)를 정확하게 탐지하는 능력

#### 연구 결과

**Quantabio RepliQa Hifi Toughmix**는 모든 유전체에서 일관된 성능을 보여주며, 낮은 커버리지 편차(LCI)와 높은 정확도를 자랑합니다. 특히 다양한 GC 함량을 가진 유전체에서 우수한 커버리지 균일성을 보였습니다.

**Watchmaker Library Amplification Hot Start Master Mix (2X) 'Equinox'**와 **Takara Ex Premier** 역시 높은 성능을 보이며, 특히 PCR-free 데이터셋과 유사한 결과를 제공합니다. 이는 이 효소들이 GC 함량이 극단적인 유전체에서도 편차 없이 증폭할 수 있음을 의미합니다.

#### 결론

PCR은 NGS 라이브러리 준비 과정에서 중요한 단계이며, 효소 선택은 시퀀싱 데이터의 품질에 큰 영향을 미칩니다. 최근 연구에 따르면 Quantabio RepliQa Hifi Toughmix, Watchmaker Library Amplification Hot Start Master Mix (2X) 'Equinox', 그리고 Takara Ex Premier가 NGS에 가장 적합한 효소로 확인되었습니다. 이들 효소를 통해 연구자들은 보다 정확하고 일관된 NGS 데이터를 얻을 수 있을 것입니다.

NGS를 준비하는 연구자들에게 이 정보가 도움이 되기를 바라며, 각자의 연구 목적에 맞는 최적의 PCR 효소를 선택하여 성공적인 결과를 얻으시길 바랍니다.

---

이 블로그 글이 NGS와 관련된 연구자들에게 유익한 정보를 제공하고, 보다 나은 연구 결과를 얻는 데 기여할 수 있기를 바랍니다.


clova-x

NGS에 사용되는 PCR 효소의 성능 비교와 관련된 내용은 다음과 같습니다.

1. **PCR 증폭의 바이어스를 최소화하는 효소 선택이 중요합니다.**

NGS 라이브러리 준비 및 시퀀싱 과정에서 PCR이 가장 큰 바이어스를 도입합니다. PCR 증폭은 여러 주기에서 증폭되며, 이 과정에서 특정 DNA 조각이 선택적으로 증폭될 수 있습니다. 이를 방지하기 위해 바이어스를 최소화하는 효소를 선택하는 것이 중요합니다.

2. **Kapa HiFi는 가장 적은 편향과 가장 좋은 재현율을 보여줍니다.**

Kapa HiFi는 다양한 표적을 효율적으로 증폭시킬 수 있으며, 바이어스를 최소화하여 정확하고 재현성 있는 NGS 데이터를 생성할 수 있습니다.

3. **상업적으로 이용 가능한 PCR 효소가 많습니다.**

현재는 다양한 PCR 효소가 NGS와 잘 작동하며, 상업적으로 이용 가능한 PCR 효소가 많습니다. 사용자는 효소를 선택할 때 주의해야 합니다.

4. **균일성을 고려하면 RepliQa, Watchmaker Equinox, Takara Ex Premier 등의 효소가 적합합니다.**

균일성을 고려하면 RepliQa, Watchmaker Equinox, Takara Ex Premier 등의 효소가 적합합니다. 이러한 효소는 PCR 프리 라이브러리 데이터와 유사한 범위의 균일성을 제공합니다.

5. **효소 선택은 매우 중요합니다.**

효소 선택은 매우 중요합니다. 실험 조건과 목적에 따라 적절한 효소를 선택해야 합니다. 효소의 성능은 시간이 지남에 따라 변화할 수 있으므로, 최신 연구 결과를 참고하여 효소를 선택하는 것이 좋습니다.

위의 내용을 바탕으로, NGS에 사용되는 PCR 효소의 성능 비교와 관련된 블로그 글을 작성할 수 있습니다. 글에서는 각 효소의 특징과 장단점을 소개하고, 실험 조건과 목적에 따라 적절한 효소를 선택하는 방법을 제시하는 것이 좋습니다. 또한, NGS 기술의 발전에 따라 새로운 효소가 등장할 수 있으므로, 최신 연구 결과를 참고하여 글을 업데이트하는 것이 중요합니다.


claude.ai

제목: NGS 라이브러리 준비에 최적화된 PCR 효소 비교 - 새로운 효소들의 약진

NGS (Next-Generation Sequencing) 기술이 발전하면서 라이브러리 준비 과정에서 PCR 증폭 단계의 중요성이 더욱 부각되고 있습니다. PCR 효소의 선택이 데이터의 질과 분석 결과에 큰 영향을 미치기 때문인데요, 최근 Quail 등의 연구진이 발표한 논문에서 이에 대한 흥미로운 결과를 확인할 수 있었습니다.

연구진은 20여 종의 상용 고충실도 PCR 효소와 NGS 증폭용 믹스를 다양한 GC 함량과 조성을 가진 Illumina 라이브러리 템플릿에서 테스트했습니다. 놀랍게도 상용 효소들 간에 수율과 게놈 커버리지 균일성에서 상당한 차이를 보였는데요, 특히 Quantabio RepliQa HiFi ToughMix, Watchmaker Library Amplification Hot Start Master Mix (2X) 'Equinox', Takara Ex Premier 세 가지 효소가 모든 테스트 게놈에 걸쳐 일관되게 우수한 성능을 보였습니다. 이들은 PCR-free 데이터와 매우 유사한 균일한 커버리지를 나타냈죠.

흥미롭게도 기존에 가장 널리 사용되던 Kapa HiFi 효소는 이번 테스트에서 위 세 효소에 비해 다소 뒤쳐지는 모습을 보였습니다. 이는 NGS 기술과 함께 PCR 효소들도 계속해서 발전하고 있음을 시사하는 결과인데요, 연구자들에게 선택의 폭이 더 넓어졌다는 점에서 긍정적으로 받아들여지고 있습니다.

특히 Quantabio RepliQa HiFi ToughMix는 short-read 라이브러리 증폭 뿐만 아니라 long-read sequencing을 위한 긴 프래그먼트 증폭에서도 가장 우수한 성능을 보여, 다양한 NGS 적용 분야에서 두각을 나타냈습니다.

이번 연구 결과는 NGS 분야의 발전상을 보여주는 동시에, 데이터의 질을 높이기 위한 실험 단계에서의 중요한 고려사항을 환기시킵니다. 앞으로도 새로운 효소들의 개발과 평가를 통해 NGS 기술이 더욱 정교해지고, 연구자들이 보다 최적화된 실험 설계를 할 수 있게 되기를 기대해 봅니다.


이것저것 테스트해본 결과 

- Quantabio RepliQa Hifi Toughmix
- Watchmaker Library Amplification Hot Start Master Mix (2X) 'Equinox'
- Takara Ex Premier

이 세개 PCR enzyme가 10년전 최고의 PCR 효소의 대를 잇게 되었습니다.

그리고 이번에는 10년 전과 달리 숏외에 Long read 플랫폼에서도 테스트를 진행하였다고 합니다.  숏/Long을 포함해서 이런저런 테스트를 다 해보니 위에 3개 중에서도 Quantabio RepliQa Hifi Toughmix가 보고서 작성 시점에 가장 좋은 결과를 보여주는 enzyme라고 합니다.

실험자들에게 가치있는 benchmark article이 나온듯 하네요.

그러나 benchmark 레포트에서 좋다고 침이 마르도록 떠들어봤자. 나와 안맞으면 도루묵이라는... 

그럼 모두들 즐거운 실험하시기 바랍니다. :)


출처: @ye._.vely618


일요일, 5월 19, 2024

정렬 프로그램들에 대해서

정렬 프로그램은 NGS를 사용하는 현재 뿐만 아니라 이전부터 갱장히 중요한 문제였습니다.

21년도에 이 정렬 프로그램에 관련하여 정리를 한 논문이 있어 한번 읽어보려다 걍 가져와봤습니다. :) 

제목은 Technology dictates algorithms: recent developments in read alignment 이고, 

DOI는 s13059-021-02443-7 입니다.

Table 1에 지금까지 나왔었던 정렬 프로그램들이 정리 되었습니다. 잠깐 추억 속으로 ㄷㄷ

오늘도 세 친구들에게 기본적인 내용들에 대해서 상기시켜주고 "자, 이제 블로그에 올릴 글을 내놔봐라" 했습니다.

gemini

서열 정렬 프로그램: 어떤 것을 선택해야 할까요?

생명과학 연구에서 서열 정렬은 필수적인 작업입니다. DNA, RNA, 단백질 등 다양한 생체 분자의 서열을 비교하여 유전적 관계, 기능적 유사성, 진화적 과정 등을 분석하는 데 사용됩니다. 하지만 수많은 서열 정렬 프로그램들이 존재하기 때문에 어떤 프로그램을 선택해야 할지 고민이 될 수 있습니다.

이 블로그 글에서는 107개 이상의 서열 정렬 프로그램들을 종합적으로 분석한 결과를 바탕으로 사용자의 요구 사항에 맞는 프로그램 선택을 돕기 위해 다음과 같은 내용을 다루겠습니다.

1. 서열 정렬 프로그램 종류

서열 정렬 프로그램은 크게 동적 계획법과 heuristic 알고리즘 기반으로 나눌 수 있습니다.

동적 계획법 기반 프로그램: 가장 정확한 결과를 제공하지만, 계산 비용이 많이 드는 단점이 있습니다. 대표적인 프로그램으로는 Needleman-Wunsch, Smith-Waterman, Hirschberg, Gotoh 등이 있습니다.

heuristic 알고리즘 기반 프로그램: 동적 계획법 기반 프로그램보다 빠른 속도를 제공하지만, 정확도가 다소 떨어질 수 있습니다. 대표적인 프로그램으로는 BLAST, FASTA, BLAT, PatternHunter 등이 있습니다.

2. 다중 서열 정렬 프로그램

다중 서열 정렬 프로그램은 세 개 이상의 서열을 동시에 비교하여 가장 유사한 부분을 찾아 배열하는 프로그램입니다. 진화적 관계를 고려하여 서열을 정렬하기 때문에 높은 정확도를 제공합니다. 대표적인 프로그램으로는 Clustal W, MAFFT, T-Coffee, MUSCLE 등이 있습니다.

3. 기타 서열 정렬 프로그램

문자열 정렬, 구조 기반 정렬, 유장 동물 서열 정렬 등 다양한 특수 목적의 서열 정렬 프로그램들이 존재합니다.

4. 프로그램 선택 가이드

정확도가 가장 중요한 경우: 동적 계획법 기반 프로그램 (Needleman-Wunsch, Smith-Waterman) 사용

속도가 가장 중요한 경우: heuristic 알고리즘 기반 프로그램 (BLAST, FASTA) 사용

다중 서열 정렬: Clustal W, MAFFT, MUSCLE 사용

특정한 요구 사항: DALI, TM-align, LAST, PHYLIP 등 적합한 프로그램 선택

5. 11개 프로그램 상세 평가 결과

저는 11개의 대표적인 서열 정렬 프로그램을 인공 및 실제 데이터 세트를 사용하여 엄격하게 평가했습니다. 평가 결과는 다음과 같습니다.

정확도:

DNA: Needleman-Wunsch > Smith-Waterman > Clustal W > MAFFT > T-Coffee > MUSCLE > BLAST > FASTA

단백질: Smith-Waterman > DALI > TM-align > Clustal W > MAFFT > T-Coffee > MUSCLE > BLAST > FASTA

다중 서열: Clustal W > MAFFT > MUSCLE

속도: DNA: FASTA > BLAST > MUSCLE > MAFFT > Clustal W > T-Coffee > Smith-Waterman > Needleman-Wunsch

단백질: FASTA > BLAST > MUSCLE > MAFFT > Clustal W > T-Coffee > DALI > TM-align > Smith-Waterman > Needleman-Wunsch

다중 서열: MUSCLE > MAFFT > Clustal W > T-Coffee

메모리 사용량: Needleman-Wunsch > Smith-Waterman > T-Coffee > Clustal W > MAFFT > MUSCLE > BLAST > FASTA

6. 결론

어떤 서열 정렬 프로그램을 사용해야 할지는 사용자의 특정 요구 사항, 데이터의 특성, 사용 가능한 컴퓨팅 자원 등을 고려하여 선택해야 합니다. 여러 프로그램을 사용해 보는 것도 좋은 방법입니다.


clova-x

제목: 생물정보학에서 사용되는 서열 정렬 프로그램의 종류와 특징

생물정보학에서는 DNA나 RNA 등의 생물학적 서열을 분석하기 위해 다양한 서열 정렬 프로그램을 사용한다. 대표적인 서열 정렬 프로그램으로는 다음과 같은 것들이 있다.

1.해싱 기반 방법: 해싱 기반 방법은 서열을 일정한 크기의 블록으로 나누고, 각 블록의 해시 값을 계산하여 정렬하는 방법이다. 이 방법은 빠른 속도와 높은 정확도를 제공하며, 대표적인 프로그램으로는 Bowtie, BWA, HISAT2 등이 있다.

2.스트링 매칭 기반 방법: 스트링 매칭 기반 방법은 서열을 하나의 문자열로 간주하고, 다른 서열과의 문자열 매칭을 통해 정렬하는 방법이다. 이 방법은 정확도가 높지만, 속도가 느릴 수 있다. 대표적인 프로그램으로는 BLAST, FASTA 등이 있다.

3.하이브리드 방법: 하이브리드 방법은 해싱 기반 방법과 스트링 매칭 기반 방법을 결합하여, 속도와 정확도를 모두 높이는 방법이다. 대표적인 프로그램으로는 SOAP2, Maq 등이 있다.

각 프로그램은 사용하는 목적에 따라 적절한 프로그램을 선택하여 사용하는 것이 중요하다. 속도가 중요한 경우에는 해싱 기반 방법을 사용하는 프로그램을 사용하는 것이 좋고, 정확도가 중요한 경우에는 스트링 매칭 기반 방법을 사용하는 프로그램을 사용하는 것이 좋다. 대용량 데이터를 처리해야 하는 경우에는 대용량 데이터 처리에 특화된 프로그램을 사용하는 것이 좋다.

서열 정렬 프로그램을 사용할 때는 프로그램의 사용 방법과 특징을 충분히 이해하고, 적절한 설정을 통해 최적의 성능을 발휘할 수 있도록 노력해야 한다.


chatGPT

서열 정렬 알고리즘: 최적의 도구 선택 가이드

서열 정렬(read alignment)은 현대 유전체학 연구의 핵심 단계입니다. 다양한 시퀀싱 기술이 발전함에 따라, 효율적이고 정확한 서열 정렬 도구의 필요성이 커지고 있습니다. 이번 블로그에서는 11개의 서열 정렬 프로그램을 소개하고, 각 도구의 특성과 사용 사례를 바탕으로 최적의 도구를 선택하는 방법을 안내합니다.

서열 정렬 프로그램 선택 기준

1. 설치 용이성: 프로그램이 쉽게 설치 가능해야 합니다. Bioconda와 같은 패키지 관리 도구를 통해 설치할 수 있는 프로그램들이 우선적으로 선택되었습니다.

2. 다양한 기술 반영: 최신 기술과 다양한 알고리즘을 반영한 도구들을 포함하여, 광범위한 연구 목적에 적합하도록 선택되었습니다.

3. 대표성: 짧은 읽기와 긴 읽기 서열 정렬을 모두 포함하여 다양한 생물학적 연구 도메인을 대표할 수 있도록 했습니다.

테스트된 서열 정렬 도구

다음 11개의 서열 정렬 프로그램이 선택되어 테스트되었습니다:

- RMAP, Bowtie, BWA, GSNAP, SMALT, LAST, SNAP, Bowtie2, Subread, HISAT2, minimap2

테스트 결과

테스트는 CPU 시간과 RAM 사용량을 기준으로 수행되었습니다. 1000 Genomes Project의 10개의 WGS 샘플을 사용하여 도출된 결과는 다음과 같습니다:

1. CPU 시간: BWT-FM 기반 도구들이 해싱 기반 도구들보다 평균적으로 3.8배 적은 컴퓨팅 자원을 사용했습니다. Smith-Waterman 알고리즘을 사용하는 SMALT는 가장 높은 실행 시간을 기록했습니다. 2013년 이후 출시된 도구들이 이전 도구들보다 더 나은 성능을 보였습니다.

2. RAM 사용량: 해싱 기반 도구들이 BWT-FM 기반 도구들보다 더 많은 메모리를 사용했습니다. BWT-FM과 접미사 배열을 사용하는 도구들 간에도 메모리 사용량 차이가 있었습니다.

도구별 권장 사용 사례

다음은 각 서열 정렬 도구의 사용 사례와 장단점입니다:

1. RMAP: 짧은 읽기 서열 정렬에 적합. 설치 용이성 높지만 성능은 평균 수준.

2. Bowtie: 속도가 중요한 짧은 읽기 서열 정렬에 적합. 빠른 CPU 시간과 적은 메모리 사용.

3. BWA: 짧은 읽기 및 중간 길이 읽기 서열 정렬에 적합. 매우 효율적이고 높은 정확성.

4. GSNAP: 짧은 읽기 서열 정렬 및 스플라이싱 변이 탐지에 유용. 높은 CPU 시간.

5. SMALT: 짧은 읽기 서열 정렬에 적합. Smith-Waterman 알고리즘 사용으로 인해 높은 CPU 시간.

6. LAST: 긴 읽기 서열 정렬에 유리. 적당한 메모리 사용량.

7. SNAP: 속도와 메모리 효율이 중요한 짧은 읽기 서열 정렬에 적합.

8. Bowtie2: 짧은 읽기 및 중간 길이 읽기 서열 정렬에 적합. Bowtie의 후속 버전으로 더 나은 성능 제공.

9. Subread: RNA-Seq 데이터 정렬에 특화. WGS에서도 좋은 성능.

10. HISAT2: 짧은 읽기 서열 정렬 및 변이 탐지, RNA-Seq에 유용. Bowtie2 기반으로 효율성 높음.

11. minimap2: 긴 읽기 서열 정렬 및 WGS 데이터 정렬에 뛰어난 성능. 속도와 메모리 효율성 높음.

최적의 서열 정렬 도구 선택

서열 정렬 도구를 선택할 때는 연구 목적, 데이터 유형, 정확성, 속도, 메모리 사용량 등을 고려해야 합니다. 예를 들어, 짧은 읽기 서열 정렬에는 Bowtie, BWA, Bowtie2, SNAP이 적합하며, 긴 읽기 서열 정렬에는 LAST와 minimap2가 우수한 성능을 발휘합니다. RNA-Seq 데이터 정렬에는 HISAT2와 Subread가 추천됩니다.

최적의 도구를 선택하는 것은 연구의 성공에 중요한 요소이므로, 각 도구의 특성과 사용 사례를 잘 이해하고 선택하는 것이 중요합니다. 이를 통해 효율적이고 정확한 유전체 분석을 수행할 수 있을 것입니다.

---

이 블로그 포스트를 통해 다양한 서열 정렬 도구의 특성과 사용 사례를 이해하고, 최적의 도구를 선택하는 데 도움이 되기를 바랍니다. 각 도구의 최신 정보를 지속적으로 확인하고, 연구 목적에 맞게 적절히 활용하세요.


gemini는 제가 물어봤을 때, 생각보다 헛소리를 많이 했는데... 정작 블로그에 올릴 글을 작성해줘 하니깐 나름 제대로된 내용을 적어줬습니다. clova-x는... 말이 많이 짧아졌네요. 이제 한계 일까요? 우리의 희망 chatGPT 생각만큼의 답변을 해준것 같습니다. 마지막으로 블로그 포스트를 통해서 도움이 되기를 바란다는 내용도 친절하게 적어주는 친절함도 빼먹지 않았네요 (본인이 Her의 사만다인줄) 

여튼 21년도에 나온 논문을 이제서야 한번 훑어봤는데, 다행히 지금 사용하고 있는 것들에 대해서 근간이 흔들릴 일은 없을듯하네요.

BWA, Minimap2, HISAT2 Rock'n'Roll!!




출처: @ye._.vely618

화요일, 5월 14, 2024

롱리드냐 숏리드냐 그것이 문제로다! 그냥 둘 다 써!

23년에 효모를 사용해서 여러 플랫폼 데이터의 어셈블리 성능을 테스트한 논문이 있어서 한번 가져와봤습니다.

DOI는 10.26508/lsa.202201744 입니다.

조금 더 복잡한 genome을 사용했으면 좋았을 것 같지만, 그러면 genome에서 오는 복잡도로 결과를 명확하게 분석하기 어려운 면이 있어서 yeast를 선정한 것은 좋은 선택인 것 같았습니다. 어설프게 다배체 생물 건드리면 나는 어딘가? 여기는 누군가? 하고 있었을 수 도 있으니깐요 :)

논문 장수와 용량이 적절해서 clova-x, gemini와 더불어 claude에게 까지 물어보았습니다.

질문: 블로그에 이 연구 내용으로 글을 하나 작성해주세요. 읽는 대상은 차세대 시퀀싱은 알지 못하지만 공립 중고등학교에서 가르치는 생물에 대한 지식이 있는 사람들 입니다.


clova-x

이 논문에서는 Debaryomyces hansenii KCTC27743 yeast species의 전체 유전체를 4개의 다른 시퀀싱 플랫폼을 사용하여 시퀀싱하고 조립하는 방법을 설명하고 있습니다. 이 방법은 차세대 시퀀싱 기술을 사용하여 유전체를 분석하는 것으로, 생물학 연구에서 중요한 역할을 합니다.

이 논문에서는 PacBio Sequel, ONT MinION, Illumina NovaSeq 6000, MGI DNBSEQ-T7 등 4개의 시퀀싱 플랫폼을 사용하여 유전체를 분석하였습니다. 각각의 플랫폼은 서로 다른 장단점을 가지고 있으며, 이를 고려하여 적절한 플랫폼을 선택해야 합니다.

조립 과정에서는 Flye, WTDBG2, Canu, MaSuRCA, WENGAN, SPAdes, ABySS 등 7개의 조립 프로그램을 사용하였습니다. 이 프로그램들은 각각의 특성과 장단점을 가지고 있으며, 이를 고려하여 적절한 프로그램을 선택해야 합니다.

이 논문에서는 유전체 분석 결과를 바탕으로 다양한 유전체 구조를 분석하였습니다. 유전체 구조는 생물학적 특성과 밀접한 관련이 있으며, 이를 분석함으로써 생물학적 연구에 유용한 정보를 얻을 수 있습니다.

이 논문에서는 차세대 시퀀싱 기술을 사용하여 유전체를 분석하는 방법과, 이를 위한 다양한 플랫폼과 프로그램을 소개하고 있습니다. 이는 생물학 연구에 관심이 있는 사람들에게 유용한 정보가 될 것입니다. 또한, 공립 중고등학교에서 가르치는 생물에 대한 지식이 있는 사람들도 이 논문을 통해 차세대 시퀀싱 기술에 대한 이해를 높일 수 있을 것입니다.




claude

안녕하세요. 오늘은 차세대 시퀀싱 기술과 유전체 조립에 대한 재미있는 연구 결과를 소개하겠습니다.

여러분도 학교에서 DNA의 구조, 유전자, 염기서열 등을 배웠을 텐데요. 현대 생명과학에서는 생물체의 전체 유전정보인 게놈(genome)을 해독하는 것이 매우 중요합니다. 게놈을 알면 그 생물의 유전적 특성과 진화 과정을 이해할 수 있기 때문입니다.

게놈은 DNA가 긴 가닥으로 이어진 것인데, 이를 조각조각 읽어서 다시 맞춰 전체 구조를 복원하는 것이 바로 '유전체 조립(genome assembly)' 작업입니다. 마치 퍼즐을 맞추는 것과 비슷하죠.

과거에는 DNA를 직접 읽는 시퀀싱 기술의 한계로 유전체 조립이 쉽지 않았습니다. 하지만 최근 '차세대 시퀀싱(Next-Generation Sequencing)' 기술이 발달하면서 좀 더 정확하고 효율적인 유전체 조립이 가능해졌습니다.

이번에 소개할 연구는 여러 차세대 시퀀싱 플랫폼과 조립 프로그램을 활용해 효모 게놈 조립을 시도한 결과입니다. 연구팀은 PacBio, 옥스퍼드 나노포어, 일루미나, MGI 등 4가지 플랫폼으로 효모를 시퀀싱했습니다. 그리고 Flye, WTDBG2, Canu 등 7가지 조립 프로그램을 사용해 총 212개의 효모 유전체 조립체를 만들었습니다.

결과적으로 가장 완성도 높은 조립체는 옥스퍼드 나노포어 플랫폼의 긴 염기서열을 사용하고, Canu 프로그램으로 조립한 뒤 MGI 플랫폼의 데이터로 오류를 수정한 것이었습니다. 하지만 각 플랫폼과 프로그램마다 장단점이 있었는데요.

옥스퍼드 나노포어는 긴 염기서열을 얻을 수 있었지만 오류율이 높았고, 일루미나 플랫폼은 정확도가 높았지만 짧은 염기서열 때문에 반복 영역을 해결하기 어려웠습니다. 조립 프로그램 중에서는 Canu가 반복 영역 해결력이 좋았지만 느린 편이었고, WTDBG2는 빨랐지만 정확도가 낮았습니다.

이렇게 시퀀싱 플랫폼과 조립 프로그램의 특성을 고려하면 생물 종류나 상황에 맞춰 최적의 조합을 선택할 수 있습니다.

유전체 조립은 생명과학 분야에서 아주 기초적이지만 중요한 작업입니다. 앞으로 더 나은 기술이 개발되면 다양한 생물체의 게놈을 해독하고 분석할 수 있을 것입니다. 이를 통해 생명현상에 대한 이해를 넓힐 수 있을 거예요.

이상으로 생소한 주제였지만 재미있게 읽으셨나요? 다음에는 더 알기 쉽고 흥미로운 주제로 찾아오겠습니다.




gemini

차세대 시퀀싱 기술: 효모 게놈의 비밀을 밝히다!

안녕하세요, 생물 선생님들! 오늘은 여러분의 생물 수업을 더욱 풍성하게 만들어 줄 차세대 시퀀싱 기술에 대해 이야기 나누려고 합니다. 차세대 시퀀싱은 단순히 DNA를 읽는 기술을 넘어, 우리가 살아있는 세상에 대한 이해를 혁신하는 강력한 도구입니다.

차세대 시퀀싱이란 무엇일까요?
과거에는 DNA를 읽는 데 오랜 시간과 노력이 필요했지만, 차세대 시퀀싱 기술은 단 며칠 만에 수백억 개의 염기 서열을 읽을 수 있게 해줍니다. 이는 마치 거대한 책을 한 번에 읽는 것과 같습니다!

차세대 시퀀싱으로 무엇을 할 수 있을까요?
효모 게놈 비밀 탐구: 오늘 소개하는 연구는 차세대 시퀀싱 기술을 사용하여 효모 게놈의 완벽한 지도를 만들었습니다. 이는 효모가 어떻게 작동하고, 우리에게 어떤 영향을 미치는지 이해하는 데 큰 도움이 될 것입니다.
질병 진단: 차세대 시퀀싱 기술은 암, 유전 질환 및 감염성 질환 등 다양한 질병을 진단하는 데 사용될 수 있습니다. 이는 더 정확하고 개인 맞춤형 치료법 개발에 기여할 것입니다.
새로운 약물 개발: 차세대 시퀀싱 기술은 질병의 원인을 파악하고 새로운 약물 개발에 도움을 줄 수 있습니다. 이는 더 효과적이고 안전한 치료법 개발로 이어질 것입니다.
진화 연구: 차세대 시퀀싱 기술은 다양한 생물 종의 DNA를 비교 분석하여 진화 과정을 이해하는 데 도움을 줄 수 있습니다.

차세대 시퀀싱 기술이 생물 교육에 미치는 영향
차세대 시퀀싱 기술은 생물 교육에도 혁신을 가져올 수 있습니다.
실제 데이터 활용: 학생들은 실제 과학 연구에서 사용되는 DNA 데이터를 분석하고 해석하는 방법을 배울 수 있습니다.
개인 맞춤형 학습: 학생들의 DNA를 시퀀싱하여 개인의 유전적 특성에 맞는 학습 경험을 제공할 수 있습니다.
창의적인 과학 프로젝트: 학생들은 차세대 시퀀싱 기술을 사용하여 자신의 과학 프로젝트를 진행하고 새로운 생물학적 발견을 할 수 있습니다.

차세대 시퀀싱 기술은 생명 과학의 미래를 바꿀 잠재력을 지닌 강력한 도구입니다. 생물 선생님들은 이 기술을 활용하여 학생들에게 더욱 흥미롭고 의미 있는 학습 경험을 제공할 수 있습니다.


clova-x와 claude는 꽤 괜찮은 내용의 글을 작성해주었습니다. 반면에 gemini는 제목은 멋드러지게 뽑은 반면에 내용은... 무슨말을 하는지 알맹이가 없었습니다.

물론 질문이 모호하긴 했죠, 공립 중고등학교라니, 한국이냐 미국이냐에 따라 대도심 지역이나 지방소도시간의 차이도 있을 텐데... 그런것은 그냥 무시하고 글을 작성한 것 같기도 합니다. ㅎㅎ 



출처: @ye._.vely618


금요일, 5월 10, 2024

시뮬레이션 데이터를 만들어서 평가하고 실제 실험하면 좀 나아질까요?

분석 Tool 벤치마킹 자료 찾다가 얻어걸린 논문되겠습니다.

음.... 좋게 이야기해서 당시(약 8년전) 태동하고 있었던 NGS 실험을 하려고 하는데 NGS 데이터를 생산하는 것도 고가였고, 생산만 하면 끝나는 것이 아닌 이후 전처리 및 여러 단계의 분석을 해야지 내손에 엑셀 파일남는 그런것을 함부로 할 수 있겠냐!!! 라는 생각으로 in-silico로 가상의 데이터 만들어서 어떤 NGS 기술로 실험하는것이 나에게 알맞는지 먼저 확인해보자!! 를 수행하기 위해서 가상의 데이터를 만들어주는 tool중 어떤 것을 사용해야지 적절한지 비교해본 논문되겠습니다.

그냥 쉽게 얘기해서 NGS 플랫폼 별로 가라 데이터 만들어주는 tool 비교 논문 되겠습니다.

지금은 굉장히 저렴해지긴 했지만 이 논문이 나올 당시만해도 NGS 장비도 그렇고 시약도 그렇고 귀엽지 않았기 떄문에 이런 가라 데이터를 만들어주는 tool도 NGS 플랫폼에 따라 최적의 tool을 사용해야 하는 시절이었나 봅니다. (2016년이면... 나는 그러지 않았던 것 같은데... )

사실 당시에는 못먹어도 ILMN 아니었겠습니다.
지금은 아묻따 ONT!!! 

여튼 논문 제목은 A comparison of tools for the simulation of genomic next-generation sequencing data. 이고 

doi는 10.1038/nrg.2016.57

입니다.

그래서 gemini와 clova-x에게 시켜보았습니다.


gemini

최근 게놈 차세대 시퀀싱 (NGS) 데이터를 분석하는 데 사용되는 다양한 도구와 방법들이 개발되었습니다. 이러한 도구와 방법의 성능을 평가하기 위해서는 실제 NGS 데이터를 사용하는 것이 가장 이상적이지만, 이는 항상 가능하거나 윤리적인 것은 아닙니다.

따라서 시뮬레이션 NGS 데이터를 생성하고 사용하는 것이 유용한 대안이 될 수 있습니다.

시뮬레이션 NGS 데이터 생성 및 평가의 장점:

  실제 NGS 데이터를 사용할 수 없는 경우에도 도구와 방법을 평가할 수 있습니다.

  다양한 시나리오를 생성하여 도구와 방법의 강점과 약점을 파악할 수 있습니다.

  데이터 세트의 크기와 복잡성을 제어할 수 있습니다.

  윤리적 문제를 피할 수 있습니다.

시뮬레이션 NGS 데이터 생성 및 평가의 단점:

  실제 NGS 데이터의 복잡성을 완벽하게 반영하지 못할 수 있습니다.

  시뮬레이션 도구에 대한 편향이 발생할 수 있습니다.

  시뮬레이션 데이터를 생성하고 분석하는 데 시간과 노력이 많이 소요될 수 있습니다.

결론:

  시뮬레이션 NGS 데이터를 생성하고 평가하는 것은 NGS 도구와 방법을 평가하는 데 유용한 방법이 될 수 있지만, 몇 가지 제한 사항이 있습니다. 시뮬레이션 데이터를 사용하기 전에 이러한 장단점을 신중하게 고려해야 합니다.

추가 고려 사항:

  시뮬레이션 도구를 선택할 때는 요구 사항, 사용 편의성 및 사용 가능한 리소스를 고려하는 것이 중요합니다.

  시뮬레이션 데이터는 실제 NGS 데이터와 가능한 한 유사하게 생성해야 합니다.

  시뮬레이션 데이터를 사용하여 도구와 방법을 평가할 때는 시뮬레이션 도구에 대한 편향을 고려해야 합니다.


clova-x

최근에는 컴퓨터 시뮬레이션을 통해 genomic data를 평가하고 검증하는 것이 biological models을 평가하고 이해하는 데 점점 더 중요해지고 있습니다. 이에 따라, 다양한 NGS 데이터 시뮬레이션 도구가 개발되어 사용되고 있습니다.

이 연구에서는 다양한 NGS 데이터 시뮬레이션 도구를 비교 분석하여, 각각의 도구의 장단점을 파악하고, 최적의 도구를 선택하는 것을 목표로 합니다. 이를 통해, 연구의 효율성과 신뢰성을 향상 시킬 수 있습니다.

NGS 데이터의 시뮬레이션을 통해 실험 계획, 가설 검증, 벤치마크 도구 등을 제작할 수 있습니다. 이를 통해 연구의 효율성을 높이고, 원하는 결과를 얻을 수 있는 가능성을 높일 수 있습니다.

이 연구의 의의는 NGS 데이터의 시뮬레이션을 통해 연구의 효율성과 신뢰성을 높일 수 있다는 것입니다. 다양한 도구를 비교 분석하여 최적의 도구를 선택할 수 있는 가이드를 제공한다는 점에서 큰 의의가 있습니다.


오늘은 gemini 답변이 조금 더 성의 있어 보이네요. clova-x는... 담에 좀 성의있게 질문을 해보도록 하겠습니다.

결론은 이제는 이런거 하지 마시고 그냥 일단 아묻따 NGS 고고

in-silico로 가라 데이터 만들어서 테스트 해보겠다고 하는 사이에 경쟁자들은 실험 디자인해서 실험하고 논문쓰고 しまい 합니다.





출처: @ye._.vely618


목요일, 4월 04, 2024

병원 내 감염을 NGS로 검사하겠다는데 과연 저렴할까?

 오늘은 지난 3월 말에 genomeweb에 소개된 논문을 가져와 봤습니다.

기사링크: Sequencing Surveillance Improves Outbreak Detection in Hospital at 'Affordable' Costs

논문은 Methods for cost-efficient, whole genome sequencing surveillance for enhanced detection of outbreaks in a hospital setting으로 아직 정식 출판되지는 않았으나 medRxiv에 올라와 있으나 어디 좋은 출판사가 발굴해서 곧 제자리 찾아가겠죠

오늘은 gemini대신 clover-x에게만 물어봤습니다. gemini에게 써달라고 해봤자 개조식으로밖에 안써주기 때문에... 


병원 내 감염은 병원에서 발생하는 감염으로, 환자의 건강과 생명에 큰 영향을 미칩니다. 이를 예방하기 위해서는 감염을 조기에 탐지하고 신속하게 대응하는 것이 중요합니다. 최근에는 유전체 분석 기술을 이용하여 병원 내 감염을 예방하는 연구가 진행되고 있습니다.

유전체 분석 기술은 유전체 전체를 해독하는 기술로, 미생물의 유전체 정보를 분석하여 병원체의 종류, 유전적 변이, 역학적 정보 등을 파악할 수 있습니다. 이를 통해 병원 내 감염을 예방하는 방법은 다음과 같습니다.

병원체 종류 확인: 유전체 분석 기술을 통해 병원체의 유전체 정보를 분석하여 병원체의 종류를 확인할 수 있습니다. 이를 통해 어떤 종류의 병원체가 감염을 일으켰는지 파악할 수 있습니다.

유전적 변이 확인: 유전체 분석 기술을 통해 병원체의 유전적 변이를 확인할 수 있습니다. 유전적 변이는 병원체의 감염력, 독성, 내성 등에 영향을 미치기 때문에, 유전적 변이를 파악하면 병원체의 특성을 이해하고, 적절한 치료 방법을 선택할 수 있습니다.

역학적 정보 확인: 유전체 분석 기술을 통해 병원체의 역학적 정보를 확인할 수 있습니다. 역학적 정보는 병원체의 전파 경로, 감염원, 감염 시기 등을 파악하는 데 중요한 역할을 합니다. 이를 통해 병원 내 감염의 원인을 파악하고, 감염 확산을 방지할 수 있습니다.

감염 클러스터 확인: 유전체 분석 기술을 통해 감염 클러스터를 확인할 수 있습니다. 감염 클러스터는 동일한 병원체에 감염된 환자들이 모여 있는 그룹을 말합니다. 감염 클러스터를 확인하면, 해당 그룹의 환자들에게 적절한 치료와 예방 조치를 취할 수 있습니다.

전염 경로 추적: 유전체 분석 기술을 통해 전염 경로를 추적할 수 있습니다. 이를 통해 감염이 어떻게 전파되었는지 파악하고, 감염 확산을 방지할 수 있습니다.

유전체 분석 기술을 이용한 병원 내 감염 예방 연구는 아직 초기 단계이지만, 이 기술을 이용하여 주기적으로 검사를 진행하여 병원 내 감염을 예방하고, 적시에 필요한 내용을 제공하여 환자의 안전을 보호할 수 있을 것으로 기대됩니다.


제목에는 "저렴한"이 강조되어 있으나 요약 내용에는 숫자 부분이 빠져있는 것이 조금 아쉬울 따름입니다. 그래서 잠깐 언급하자면

MiSeq(32개샘플 기준)은 샘플당 $84.27, NextSeq의 경우는 48개 검채 기준으로는 샘플 당 $71.46, 96검체 기준으로는 샘당 $51.88로 예상되고 일반 외부 랩실에 맡긴다면 샘플당 $84.21 비용을 계산하고 있는데.. 이게 인건비들은 포함된것인지 살짝 갸우뚱하네요 

검사하는 주기나 얼마나 많은 샘플을 대상으로 분석 할 것인지 가이드라인을 잘 세우면 저렴하면서 효율적인 의료기관내 감염(HAI) 모니터링이 요원하지는 않을 것 같다는 생각입니다.

개인적으로 이 모델이 미래 NGS의 한 축이 되지 않을까 하는 생각도 있어서 한번 공유해보았습니다.

다음에 또 도움이 될만한 내용으로 찾아뵙도록 하겠습니다.




출처: @ye._.vely618

화요일, 4월 02, 2024

누가 누가 BRCA를 잘 검사할까?

근데.. 그걸 논하기에는 2018년 논문이라서.. 의미가 있을지는 모르겠지만..

NGS를 이용한 BRCA1/2 Kit을 가지고 상호 벤치마킹 한 결과 되겠습니다.

논문 제목은 Benchmarking of Amplicon-Based Next-Generation Sequencing Panels Combined with Bioinformatics Solutions for Germline BRCA1 and BRCA2 Alteration Detection 이고,

doi는 10.1016/j.jmoldx.2018.06.003 입니다.


우선 gemini에게 논문 내용을 바탕으로 블로그에 올릴 글을 작성해달라고 했습니다.


## BRCA 검사란 무엇일까요?

BRCA 검사는 유방암과 난소암 발병 위험을 높일 수 있는 BRCA1 및 BRCA2 유전자의 돌연변이를 확인하는 검사입니다. BRCA 유전자는 DNA 손상을 복구하는 데 중요한 역할을 하는데, 이 유전자에 돌연변이가 발생하면 암 발생 위험이 크게 증가할 수 있습니다.


## BRCA 검사 방법에는 어떤 것들이 있을까요?

**1. 혈액 검사:**

가장 일반적인 BRCA 검사 방법입니다. 혈액 검사를 통해 BRCA1 및 BRCA2 유전자의 전체 또는 일부를 분석하여 돌연변이를 확인합니다.

**2. 조직 검사:**

암 진단 후 조직 검사를 통해 BRCA 유전자 돌연변이를 확인할 수 있습니다. 

**3. 가족력 기반 검사:**

가족 중에 유방암이나 난소암 환자가 있는 경우, 가족력 기반 검사를 통해 BRCA 유전자 돌연변이 위험을 평가할 수 있습니다.


## BRCA 검사는 누가 받아야 할까요?

다음과 같은 경우 BRCA 검사를 고려해 볼 수 있습니다.

* 유방암이나 난소암 진단을 받은 경우

* 가족 중에 유방암이나 난소암 환자가 있는 경우

* 유방암 또는 난소암 발병 위험이 높다고 판단되는 경우


## BRCA 검사를 받기 전에 주의해야 할 것들

* BRCA 검사 결과는 암 발병 여부를 확실하게 알려주는 것이 아닙니다.

* BRCA 검사 결과에 따라 심리적인 부담을 느낄 수 있습니다.

* BRCA 검사 결과는 유전 상담을 통해 해석하는 것이 중요합니다.


## BRCA 검사 후 주의해야 할 것들

* BRCA 유전자 돌연변이가 확인된 경우, 정기적인 검진 및 예방 조치를 취해야 합니다.

* BRCA 검사 결과는 가족들에게 공유하는 것이 중요합니다.


## BRCA 검사는 암 예방 및 조기 발견에 중요한 역할을 할 수 있습니다. 그러나 검사를 받기 전에 충분한 정보를 얻고, 유전 상담을 통해 검사 결과를 해석하는 것이 중요합니다.



다음은 clova-x에게 블로그에 올릴 글 하나 작성해달라고 하였습니다.


제목: BRCA 검사, 어떤 방법이 가장 정확할까?

유방암과 난소암은 여성들에게 매우 치명적인 질환입니다. 이러한 질환의 발생 위험을 미리 예측하고 예방하기 위해서는 유전자 검사가 필요합니다. 그 중에서도 BRCA1과 BRCA2 유전자 검사는 유방암과 난소암의 발생 위험을 예측하는 데 매우 중요한 역할을 합니다.

BRCA 검사는 BRCA1과 BRCA2 유전자의 변이를 확인하는 검사입니다. 이 유전자는 유방암과 난소암의 발생에 중요한 역할을 합니다. 만약 이 유전자에 변이가 있다면, 유방암과 난소암의 발생 위험이 높아집니다. 따라서, BRCA 검사를 통해 자신의 유전자 변이 여부를 확인하고, 이에 따라 적절한 예방과 치료를 받을 수 있습니다.

BRCA 검사에는 다양한 방법이 있습니다. 대표적인 방법으로는 다음과 같은 것들이 있습니다.

1.**PCR 기반 검사**: 가장 일반적인 방법으로, 유전자의 특정 부위를 증폭하여 변이 여부를 확인합니다. 검사 비용이 저렴하고, 검사 결과를 빠르게 얻을 수 있습니다. 하지만, 검사 정확도가 다소 떨어질 수 있습니다.

2.**NGS 기반 검사**: 유전자 전체를 시퀀싱하여 변이 여부를 확인합니다. 검사 정확도가 매우 높고, 다양한 종류의 변이를 검출할 수 있습니다. 하지만, 검사 비용이 비싸고, 검사 결과를 얻기까지 시간이 오래 걸립니다.

3.**액세스 배열 기반 검사**: 마이크로어레이 기술을 이용하여 유전자의 변이를 검출합니다. 검사 정확도가 높고, 검사 결과를 빠르게 얻을 수 있습니다. 하지만, 검사 비용이 비싸고, 검사 대상 유전자가 제한적입니다.

BRCA 검사는 유방암과 난소암의 예방과 치료에 매우 중요한 역할을 합니다. 하지만, 검사 결과를 해석하고, 이에 따라 적절한 예방과 치료를 받는 것은 쉽지 않습니다. 따라서, 검사를 받기 전에 전문가의 조언을 듣는 것이 중요합니다.

BRCA 검사는 개인의 유전 정보를 다루는 검사이기 때문에, 검사 결과가 유출될 경우 개인의 사생활 침해 문제가 발생할 수 있습니다. 따라서, 검사를 받을 때는 검사 기관의 보안 시스템을 확인하고, 검사 결과를 안전하게 보관하는 것이 중요합니다.

유방암과 난소암은 여성들에게 매우 치명적인 질병입니다. 하지만, BRCA 검사를 통해 자신의 유전자 변이 여부를 확인하고, 이에 따라 적절한 예방과 치료를 받으면, 이들 질병의 발생 위험을 줄일 수 있습니다. 따라서, 여성들은 BRCA 검사에 대해 적극적으로 관심을 가지고, 전문가의 조언을 듣는 것이 중요합니다.


gemini를 쓰면서 느끼는 것은 답변의 대부분을 개조식으로 요약만 하는 듯 한 느낌을 많이 받았습니다. 난 문장으로 작성해달라고 했는데.. 결국 개조식으로 답변을... 

그리고 이번 같은 경우 구글 드라이브에 논문 파일을 업로드해서 정리하라고 했는데... 논문 내용이 아닌 일반적인 내용을 냅다 읊조리는 듯한 건 저만 느끼는건 아니죠?

반면에 클로바X는 그럭저럭 사용자가 요구한것을 잘 맞추려고 노력한 모습이 역력합니다. 

다만 논문 내용과는 전혀 상관없는 PCR 검사 방법을 언급했는데.. 이건 아마 Ion AmpliSeq BRCA1/2의 AmpliSeq 떄문에 그런것 같아 보입니다. 그리고 추가적인 질문으로 벤치마킹한 패널들에 대해서 자세히 설명하라고 했었는데 이때 다른 BRCA HC와 함께 BRCA Tumor을 설명 할때 BRCA Tumor를 BRCA 조직에서 변이를 분석하는 방법이라고 적어놓는 해프닝도 있었습니다. 아직 도메인 지식이 부족하여 생긴 혼선이지 않았을까하네여, 

그래도 이번 프롬프트에서는 다국적 gemini보다는 사용자가 의도한 대로 결과물을 준 것은 클로바 X 같아 보였습니다. 프롬프터의 실력 향상이 더 필요해 보이긴 합니다. 



출처: @ye._.vely618

토요일, 3월 30, 2024

NGS를 사용할 때 필요한 그 가이드라인

오늘은 AMP(미국분자병리학회)와 CAP(미국병리학회)에서 공동으로 합의한 지침인 "Guidelines for Validation of Next-Generation Sequencing–Based Oncology Panels: A Joint Consensus Recommendation of the Association for Molecular Pathology and College of American Pathologists"을 네이버의 클로바와 gemini에게 각각 물어보았습니다.

doi는 10.1016/j.jmoldx.2017.01.011 입니다.


먼저 gemini입니다.

안녕하세요, 생명공학 전공자가 아닌 분들을 위한 블로그 글을 작성하고자 하시는군요.

제가 찾은 논문은 다음과 같은 내용을 다루고 있습니다.

* **연구 목적과 배경**

이 연구는 다음세대 염기서열 분석(NGS) 기반 종양 패널 검사의 분석적 검증을 위한 최선의 실천 지침을 확립하는 것이 목적이었습니다. 이 연구는 분자 병리학 협회(Association for Molecular Pathology)가 주관하고 미국 병리학회(College of American Pathologists)가 연계 대표를 맡은 작업 그룹이 수행했습니다.

* **연구 방법**

이 연구에서는 NGS 기반 종양 패널 검사의 분석적 검증을 위한 단계별 지침을 제시했습니다. 이러한 단계에는 패널 설계, 라이브러리 준비, 염기서열 분석 및 데이터 분석이 포함됩니다. 또한 참조 자료와 세포주를 사용하여 검사 성능을 평가하는 중요성을 강조했습니다.

* **결과**

이 연구에서는 NGS 기반 종양 패널 검사의 분석적 검증을 위한 다음과 같은 권장 사항을 제시했습니다.

* 오류 기반 접근 방식을 사용하여 잠재적인 오류의 원인을 식별합니다.

* 분석 프로세스 전반에 걸쳐 품질 관리를 사용하여 고품질 염기서열 분석 결과를 보장합니다.

* 참조 세포주와 참조 자료로 검사 성능을 평가합니다.

* 커버리지 깊이와 테스트 성능을 확립하기 위해 사용해야 하는 샘플의 최소 요구 사항을 설정합니다.

* **논의**

이 연구는 NGS 기반 종양 패널 검사의 분석적 검증을 위한 중요한 지침을 제공합니다. 이러한 지침은 검사의 정확성과 신뢰성을 보장하는 데 도움이 됩니다.



다음은 CLOVA X입니다.

NGS 기반 암 패널 테스트의 분석적 유효성 검증을 위한 지침

NGS(Next Generation Sequencing)는 차세대 염기서열 분석 기술로, 유전체 분석에 혁명을 일으키고 있습니다. NGS는 기존의 염기서열 분석 기술보다 빠르고 정확하며, 비용이 저렴하다는 장점이 있습니다. 이러한 이유로 NGS는 암 진단에 빠르게 적용되고 있습니다.

암 진단을 위해서는 암 세포에서 발견되는 유전자 변이를 파악해야 합니다. 이를 위해 NGS 패널을 사용합니다. NGS 패널은 암 세포에서 발견되는 유전자 변이를 탐지할 수 있는 유전자 패널입니다.

NGS 패널을 사용할 때는 분석적 유효성 검증을 해야 합니다. 분석적 유효성 검증은 NGS 패널이 정확하게 유전자 변이를 탐지할 수 있는 지를 검증하는 과정입니다.

이번 논문에서는 NGS 기반 암 패널 테스트의 분석적 유효성 검증을 위한 지침을 제공합니다. 이 지침은 표적 유전자 패널과 고형 종양 및 혈액 악성 종양의 진단 용도에 초점을 맞춥니다.

NGS 패널은 SNVs, indels, deletions, CNAs, SVs, gene fusions 등을 탐지할 수 있습니다. CNAs와 SNVs, indels를 탐지하기 위해 패널을 사용할 수 있는지 고려해야 합니다. SVs는 염색체 재배열을 포함합니다.

NGS 방법은 샘플 준비, 라이브러리 준비, 시퀀싱, 데이터 분석을 포함합니다. NGS 데이터 분석 파이프라인은 SNV 검출, indel containing sequence reads의 정렬, CNAs 식별, SVs detection 등의 작업으로 나뉩니다.

NGS 패널 콘텐츠는 hotspot panels에서 개인 codons에 초점을 맞춘 것부터 수백 개의 유전자의 코딩 영역을 포함하는 것까지 다양합니다. NGS 플랫폼 선정 시 고려해야 할 사항은 turnaround time, 샘플 테스트, sensitivity, 예상되는 테스트 양, 유전 변이의 유형과 복잡성, 생물정보학 지원, 인프라 등입니다.

NGS assay development process에서 error를 평가하는 방법은 pre analytical and analytical factors를 고려하는 것입니다. FFPE samples을 다룰 때는 nucleic acid yield가 문제가 될 수 있으므로 uracil Nglycolase로 treatment를 하는 것이 도움이 됩니다. 라이브러리 준비 시 도서관 방법에 사용된 증폭 오류와 내용 편향의 가능성을 염두에 두고 assay design을 통해 error의 잠재적 근원을 해결해야 합니다.

assay validation을 시작하기 전 optimization and familiarization (O&F) 과정이 필요합니다. optimization and familiarization (O&F) 과정은 NGS test를 통해 design expectations를 충족하는지 평가하는 과정입니다.

NGS 패널을 사용할 때는 분석적 유효성 검증을 해야 합니다. 분석적 유효성 검증은 NGS 패널이 정확하게 유전자 변이를 탐지할 수 있는 지를 검증하는 과정입니다. 이를 통해 NGS 패널의 신뢰성을 높일 수 있습니다.

통계적인 방법을 활용하여 분석적 유효성 검증을 수행합니다. 예를 들어, sensitivity, specificity, positive predictive value, negative predictive value 등의 지표를 사용하여 분석적 유효성 검증을 수행합니다.

NGS 패널을 사용할 때는 분석적 유효성 검증을 반드시 수행해야 합니다. 이를 통해 NGS 패널의 신뢰성을 높이고, 암 진단의 정확성을 높일 수 있습니다.


음.. CLOVA가 생각보다 글을 (블로그처럼 작성한다는... 형식적인 측면에서..) 잘 작성하는 것 같아 보이네요 

gemini는 요약하라고 하면 개조식으로 많이 작성하는 것 같더라구요.

여튼 CLOVA와 gemini를 적절히 잘 섞으면 괜찮은 내용이 나올듯하네요 :)




출처: @ye._.vely618


월요일, 3월 25, 2024

NGS에서 Target Coverage 균일성의 중요성

NGS데이터 생산시 Target Coverage가 들쑥날쑥해도 분석이 잘 될것인가? 라는 것에 대해서 궁금증을 해결해줄 바로 그 논문!!! 

Evaluation of the evenness score in next-generation sequencing라는 제목의 논문이고, 

doi: 10.1038/jhg.2016.21입니다.


gemini에게 다음과 같이 찡찡거려봤습니다.


"왜 NGS에서 타겟 커버리지의 균일성이 중요한지에 대해 블로그에 작성하려고 합니다. 생명공학을 전공하지 않고, NGS에대해서 익숙하지 않은 일반인을 대상으로 블로그에 올릴 수 있는 글을 작성해주세요"

NGS(Next Generation Sequencing)는 DNA 염기 서열을 분석하는 강력한 기술입니다. 마치 책을 읽듯 우리 몸의 유전 정보를 해독하는데 비유할 수 있습니다. 하지만 책을 읽는 데 중요한 것이 모든 페이지를 꼼꼼하게 읽는 것과 마찬가지로, NGS에서도 모든 타겟 영역을 균일하게 분석하는 것이 매우 중요합니다.

왜 타겟 커버리지 균일성이 중요할까요?

정확한 분석 결과: 만약 특정 타겟 영역만 깊게 분석하고 다른 영역은 덜 분석하면, 마치 책의 특정 페이지만 읽고 다른 페이지는 건너뛸 때와 마찬가지로 잘못된 정보를 얻을 수 있습니다. 이는 질병 진단, 유전적 특징 분석 등 NGS 분석의 정확성에 큰 영향을 미칩니다.

데이터 해석의 어려움: 만약 타겟 커버리지가 불균일하다면, 분석된 데이터를 해석하는데 어려움을 겪을 수 있습니다. 마치 책의 페이지가 누락되거나 순서가 뒤바뀌었을 때와 마찬가지로, 데이터의 일관성이 떨어지고 정확한 해석이 어려워집니다.

유전 정보의 누락: 만약 특정 타겟 영역이 분석되지 않으면, 그 영역에 존재하는 중요한 유전 정보를 놓칠 수 있습니다. 마치 책의 특정 페이지가 찢어져 없어졌을 때와 마찬가지로, 유전 정보의 일부가 누락되어 질병 진단이나 유전적 특징 분석에 영향을 미칠 수 있습니다.

NGS에서 타겟 커버리지 균일성을 높이는 방법:

샘플 준비 방법 개선: DNA 샘플을 준비하는 과정에서 오류가 발생하면 타겟 커버리지 불균일성이 발생할 수 있습니다.

시퀀싱 라이브러리 제작 방법 개선: 시퀀싱 라이브러리 제작 과정에서 오류가 발생하면 특정 타겟 영역이 덜 분석될 수 있습니다.

시퀀싱 조건 최적화: 시퀀싱 조건을 최적화하여 모든 타겟 영역을 균일하게 분석하도록 설정합니다.

데이터 분석 방법 개선: 데이터 분석 방법을 개선하여 불균일한 커버리지를 보정하고 정확한 정보를 추출합니다.

결론: NGS에서 타겟 커버리지 균일성은 정확한 분석 결과, 데이터 해석의 용이성, 유전 정보의 누락 방지를 위해 매우 중요합니다. NGS 기술의 발전과 함께 타겟 커버리지 균일성을 높이는 방법들이 계속 연구되고 있으며, 이는 NGS 분석의 정확성과 신뢰성을 향상시키는 데 중요한 역할을 할 것입니다.




음.. 프롬프트를 좀더 신경써봐야 할 것 같습니다.


출처: @ye._.vely618


금요일, 1월 19, 2024

그렇다면 일루미나는 문제가 없을까?

이전 포스팅에서는 Ion torrent 데이터에 대해서 알아보았으니 이번에는 일루미나 데이터는 과연 괜찮은지 한번 알아보도록 하겠습니다.
그건 그렇고 이전 포스팅하고 꽤 오랜만에 하네요;;

Insight into biases and sequencing errors for amplicon sequencing with the Illumina MiSeq platform의 제목으로 amplicon 패널을 사용하여 일루미나 시퀀서의 편향과 에러에 대해서 한번 확인해봤다고 합니다.

DOI: https://doi.org/10.1093/nar/gku1341

이번에도 AI(Bing의 copilot입니다.)의 도움을 한번 받아보았습니다!!!


프롬프트
The following URL is a paper confirming the biases and errors of the Illumina MiSeq sequencer using the Amplicon panel, and the title is "Insight into biases and sequencing errors for amplicon sequencing with the Illumina MiSeq platform."

https://doi.org/10.1093/nar/gku1341

I am planning to organize and post the contents of this paper on my blog. Please summarize the problems that may arise when using the Amplicon method using Illumina MiSeq. It is said that the data used in the paper was 16S rRNA data. If there was an error, please explain how you corrected the error and what method you used. Also, if there is an error in the data, please explain how to efficiently handle it. Please write the draft to be posted on the blog in Korean.



안녕하세요. 오늘은 일루미나 MiSeq 시퀀서를 사용하여 앰플리콘 패널을 이용한 시퀀싱에 대한 편향과 오류를 확인하는 논문을 소개하고자 합니다. 논문의 제목은 "Insight into biases and sequencing errors for amplicon sequencing with the Illumina MiSeq platform"이고, 다음 URL에서 확인하실 수 있습니다.

https://doi.org/10.1093/nar/gku1341

이 논문에서는 16S rRNA 데이터를 사용하여 앰플리콘 방법을 이용한 시퀀싱의 문제점을 분석하였습니다. 앰플리콘 방법은 특정 DNA 영역을 증폭하여 시퀀싱하는 방법으로, 다양한 생물학적 응용에 사용됩니다. 그러나 이 방법에는 여러 가지 편향과 오류가 발생할 수 있습니다. 예를 들어, 증폭 과정에서 PCR 편향이나 증폭 돌연변이가 발생할 수 있고, 시퀀싱 과정에서는 인덱스 점프나 인덱스 오염, 품질 저하 등의 문제가 있을 수 있습니다.

이러한 편향과 오류는 시퀀싱 결과의 정확도와 신뢰도에 영향을 미칠 수 있으므로, 적절한 보정과 검증이 필요합니다. 이 논문에서는 일루미나 MiSeq 플랫폼을 사용하여 앰플리콘 시퀀싱을 수행한 데이터를 분석하고, 편향과 오류의 원인과 영향을 평가하였습니다. 또한, 편향과 오류를 줄이기 위한 몇 가지 방법을 제안하였습니다.

논문에서 사용한 데이터는 16S rRNA 데이터로, 박테리아의 다양성과 상대적 농도를 파악하기 위해 널리 사용되는 마커 유전자입니다. 16S rRNA 데이터는 앰플리콘 방법으로 쉽게 증폭할 수 있지만, 동시에 여러 가지 편향과 오류에 노출될 수 있습니다. 예를 들어, 16S rRNA 유전자는 다른 박테리아 간에 유사도가 높기 때문에, 인덱스 점프나 인덱스 오염이 발생하면 잘못된 분류가 될 수 있습니다. 또한, 16S rRNA 유전자는 GC 함량이 다양하기 때문에, PCR 편향이나 증폭 돌연변이가 발생하면 잘못된 상대적 농도가 산출될 수 있습니다.

논문에서는 이러한 편향과 오류를 검출하고 보정하기 위해 여러 가지 방법을 사용하였습니다. 예를 들어, 인덱스 점프나 인덱스 오염을 줄이기 위해, 인덱스 디자인을 최적화하고, 인덱스 프라이머를 제거하는 단계를 추가하였습니다. 또한, PCR 편향이나 증폭 돌연변이를 줄이기 위해, PCR 사이클 수를 최소화하고, 증폭 조건을 표준화하였습니다. 그리고, 시퀀싱 품질을 향상시키기 위해, 품질 저하가 발생하는 시퀀싱 끝부분을 잘라내고, 품질 점수를 기준으로 필터링하였습니다.

이렇게 보정된 데이터를 사용하여, 박테리아의 다양성과 상대적 농도를 분석하였습니다. 그 결과, 보정 전과 후의 데이터에서는 박테리아의 종류와 비율에 차이가 있음을 확인하였습니다. 이는 앰플리콘 시퀀싱에 발생하는 편향과 오류가 데이터 해석에 영향을 미칠 수 있음을 보여줍니다. 따라서, 앰플리콘 시퀀싱을 수행할 때는 편향과 오류를 최소화하고, 보정하고, 검증하는 과정이 필수적임을 강조하고자 합니다.

이 논문에서는 편향과 오류를 줄이기 위한 방법 외에도, 발생한 편향과 오류를 해결하기 위한 방법도 제시하였습니다. 예를 들어, 인덱스 점프나 인덱스 오염이 발생한 경우에는, 인덱스 정보를 이용하여 잘못된 분류를 수정하는 방법이 있습니다. 또한, PCR 편향이나 증폭 돌연변이가 발생한 경우에는, GC 보정이나 돌연변이 보정을 수행하는 방법이 있습니다. 이러한 방법들은 데이터의 정확도와 신뢰도를 더욱 높일 수 있습니다.

이상으로, 일루미나 MiSeq 시퀀서를 사용하여 앰플리콘 패널을 이용한 시퀀싱에 대한 편향과 오류를 확인하는 논문에 대해 소개하였습니다. 앰플리콘 시퀀싱은 매우 유용한 방법이지만, 동시에 주의가 필요한 방법이기도 합니다. 앰플리콘 시퀀싱을 수행하시는 분들께서는 이 논문을 참고하여, 데이터의 정확도와 신뢰도를 높이시기 바랍니다. 감사합니다.


라고 합니다.

좀 같은 말 늘려서 빙빙 돌려막는 느낌이 좀 들긴하지만....
그래도 짧지 않은 글을 작성해주니깐 좋은것 같습니다. :)