수요일, 11월 06, 2024

InterVar, 유전자 변이 해석을 위한 도우미

지난번에는 변이 판독을 어떻게 하는지 설명하는 ACMG/AMP 가이드라인 논문을 올렸었는데요, 이걸 사람이 매번 할 수 있지만, 굳이... 이걸?

그래서 ACMG/AMP 가이드라인을 로직화하여서 변이를 입력하면 어떤 근거로 변이가 병원성인지 아닌지를 판별해주는 프로그램에 대한 논문을 가져와봤습니다. InterVar: Clinical Interpretation of Genetic Variants by the 2015 ACMG-AMP Guidelines

이후 다양한 상업적인 tool들도 많이 나온 상황인데, 초창기에 나왔던 tool인데 꽤나 잘 만들었습니다.

DOI: 10.1016/j.ajhg.2017.01.004


gemini

## InterVar: 유전자 변이 해석을 위한 도우미

**유전자 변이**는 개인의 DNA 서열에서 발생하는 차이를 말하며, 질병 발생과 연관될 수 있습니다. 이러한 변이를 해석하는 것은 복잡하고 전문적인 지식을 요구하는 작업입니다. InterVar는 이러한 유전자 변이 해석을 돕기 위해 개발된 도구입니다.

**InterVar가 하는 일**

InterVar는 2015년 미국 의학 유전체학회(ACMG)와 미국 분자 병리학회(AMP)에서 발표한 유전자 변이 해석 가이드라인을 기반으로 개발되었습니다. 이 가이드라인은 28가지 기준을 사용하여 변이의 질병 유발 가능성을 평가합니다. InterVar는 이 중 18가지 기준에 대해 자동으로 점수를 매겨 변이를 해석합니다.

**InterVar의 장점**

* **전문 지식 없이도 사용 가능**: InterVar는 복잡한 유전자 변이 해석 과정을 자동화하여 일반인도 쉽게 사용할 수 있도록 설계되었습니다.

* **객관적인 결과 제공**: InterVar는 정해진 기준에 따라 객관적인 결과를 제공하여 변이 해석의 정확성을 높입니다.

* **시간 절약**: InterVar는 자동으로 변이를 해석하여 시간을 절약하고, 전문가의 추가 분석 시간을 줄여줍니다.

**InterVar의 활용**

InterVar는 다양한 유전 질환의 진단 및 예측에 활용될 수 있습니다. 예를 들어, 특정 질환과 관련된 유전자 변이가 발견된 경우, InterVar를 통해 해당 변이의 질병 유발 가능성을 평가하고, 질병 발생 위험을 예측할 수 있습니다.

**InterVar의 미래**

InterVar는 지속적으로 업데이트되고 있으며, 더 많은 유전자 변이에 대한 정보를 포함하도록 개선될 예정입니다. 또한, 더욱 정확하고 효율적인 변이 해석을 위해 인공지능 기술을 활용하는 방안도 연구 중입니다.

**결론**

InterVar는 유전자 변이 해석을 위한 강력한 도구입니다. 일반인들도 InterVar를 통해 자신의 유전 정보를 더 잘 이해하고, 건강 관리에 활용할 수 있습니다.



clova-x

InterVar는 유전자 변이를 해석하는 데 도움을 주는 컴퓨터 프로그램입니다. 이 프로그램은 2015년에 미국 의학 유전체 학회(ACMG)와 미국 분자병리학회(AMP)에서 발표한 유전자 변이 해석에 관련된 가이드라인을 기반으로 만들어졌습니다.

InterVar는 사용자가 유전자 변이 데이터를 입력하면, 해당 변이가 어떤 질병과 관련이 있는지, 그리고 그 변이가 건강에 어떤 영향을 미칠 수 있는지를 분석해 줍니다. 이 프로그램은 18개의 기준을 사용하여 유전자 변이를 자동으로 해석하고, 그 결과를 사용자에게 제공합니다.

변이의 해석 결과는 '병원성', '가능성 있는 병원성', '불확실한 의미', '가능성 있는 양성', '양성'의 다섯 단계로 분류됩니다. 이 분류는 변이가 얼마나 위험한지를 나타내며, 사용자는 이 결과를 바탕으로 적절한 조치를 취할 수 있습니다.

InterVar는 유전자 변이와 생명공학에 익숙하지 않은 일반인들도 쉽게 사용할 수 있도록 설계되었습니다. 사용자는 프로그램을 다운로드하여 컴퓨터에 설치하고, 유전자 변이 데이터를 입력하기만 하면 됩니다. 프로그램은 자동으로 변이를 분석하고, 그 결과를 시각적으로 보여주기 때문에, 사용자는 쉽게 이해할 수 있습니다.

또한, InterVar는 웹 기반 버전인 wInterVar도 제공합니다. wInterVar는 인터넷 브라우저를 통해 접속할 수 있으며, 사용자는 웹사이트에서 직접 유전자 변이를 입력하고, 그 결과를 확인할 수 있습니다.

InterVar는 유전자 변이 해석에 있어서 정확성과 신속성을 제공하며, 의료 분야에서 매우 유용한 도구로 활용되고 있습니다.



chatGTP

InterVar는 유전자 변이에 대한 해석을 도와주는 도구로, 2015년 미국 의학 유전학회(ACMG)와 분자병리학회(AMP)에서 발표한 유전 변이 해석 가이드라인을 바탕으로 만들어졌습니다. 이 도구는 사람들이 유전자의 변화가 특정 질병과 관련이 있는지 여부를 빠르고 정확하게 판단할 수 있도록 지원합니다. 

### 1. InterVar는 어떤 도구인가요?

우리 몸의 유전자에는 다양한 변이가 존재하며, 이 변이 중 일부는 질병을 유발하거나 특정한 건강 상태와 관련될 수 있습니다. InterVar는 이런 유전자 변이의 임상적 중요성을 자동으로 분석하여 결과를 제공합니다. 즉, InterVar를 사용하면 유전자 변이가 질병과 관련이 있는지, 얼마나 위험한지를 체계적으로 평가할 수 있습니다.

### 2. InterVar는 어떻게 작동하나요?

InterVar는 유전자 변이에 대해 자동으로 점수를 매기고, 이를 바탕으로 변이의 위험 수준을 해석합니다. 이 과정은 크게 두 가지 단계로 나뉩니다.

   - **자동화 단계**: 먼저 InterVar는 18개의 기준을 바탕으로 유전자 변이를 평가합니다. 여기에는 유전자 변이가 얼마나 자주 발생하는지, 유전자 변이가 단백질 구조에 어떤 영향을 미치는지 등의 정보가 포함됩니다.

   - **수동 조정 단계**: 자동 해석 결과를 바탕으로 전문가가 추가 정보를 고려하여 변이의 위험도를 재평가할 수 있습니다. 이 수동 조정 단계는 변이 해석의 정확도를 높이는 데 기여합니다.

### 3. InterVar를 사용하면 어떤 점이 좋을까요?

InterVar는 유전자 변이 해석을 위한 복잡한 과정을 단순화하여 빠르고 효율적인 해석을 가능하게 합니다. 특히 선천성 질환이나 조기 발병 질환과 같이, 높은 위험성을 가진 변이를 찾아내는 데 매우 유용합니다. 예를 들어, InterVar는 변이가 특정 질병을 일으킬 가능성이 높은지 여부를 판단하여, 의사들이 신속하게 진단과 치료 계획을 세울 수 있도록 돕습니다.

### 4. InterVar가 일반인에게 중요한 이유는 무엇일까요?

유전자 검사는 이제 의료 서비스의 중요한 부분이 되었으며, 많은 사람들이 자신의 유전자 정보를 알고 싶어 합니다. 하지만 복잡한 유전자 변이 정보를 이해하고 해석하는 것은 쉬운 일이 아닙니다. InterVar와 같은 도구는 유전자 변이의 임상적 중요성을 명확하게 알려주어, 유전자 검사를 받은 사람들이 자신의 건강 상태나 유전적 위험에 대해 이해하는 데 큰 도움을 줍니다. 

### 요약

InterVar는 유전자 변이가 질병과 어떤 관련이 있는지를 판단하는 데 유용한 도구로, 의료 전문가와 연구자들이 유전자 정보를 보다 쉽게 해석할 수 있도록 돕습니다. 이로 인해 유전자 검사의 활용이 더욱 활발해질 것으로 기대됩니다.



NotebookLM

## InterVar: 유전자 변이 해석 도구, 일반인을 위한 설명

InterVar는 유전자 검사 결과에서 발견되는 유전자 변이가 질병을 유발하는 가능성을 판단하는 데 도움을 주는 컴퓨터 프로그램입니다. 생명공학 분야의 전문 지식이 없는 일반인도 이해하기 쉽도록 InterVar에 대해 설명해 드리겠습니다.

### 유전자 검사와 유전자 변이

우리 몸의 설계도는 DNA라는 유전 물질에 담겨 있습니다. 유전자 검사는 이 DNA를 분석하여 질병과 관련된 변이를 찾아내는 검사입니다. 유전자 변이는 DNA 염기서열의 변화를 말하며, 이 변화가 단백질의 기능에 영향을 미쳐 질병을 유발할 수 있습니다.

### 유전자 변이 해석의 중요성과 어려움

유전자 검사를 통해 많은 유전자 변이가 발견되지만, 모든 변이가 질병을 유발하는 것은 아닙니다. 어떤 변이는 아무런 영향을 미치지 않거나, 심지어 유익한 경우도 있습니다. 따라서 **유전자 변이가 질병을 유발할 가능성이 얼마나 되는지 정확하게 판단하는 것이 매우 중요**합니다.

하지만 유전자 변이 해석은 복잡하고 쉽지 않은 작업입니다. 유전자 변이의 종류, 위치, 변화의 정도, 관련된 질병 정보 등 다양한 요소를 종합적으로 고려해야 하기 때문입니다.

### InterVar: 2015 ACMG-AMP 가이드라인 기반 자동화된 유전자 변이 해석 도구

InterVar는 미국 의학 유전체학회(ACMG)와 미국분자병리학회(AMP)에서 발표한 유전자 변이 해석 가이드라인을 기반으로 개발되었습니다. 이 가이드라인은 **유전자 변이를 병원성, 가능성 높은 병원성, 불확실한 유의성, 가능성 높은 양성, 양성의 5단계로 분류**합니다. InterVar는 이 가이드라인에 명시된 28가지 기준 중 18가지 기준에 대한 정보를 자동으로 분석하여 변이의 병원성을 판단합니다.

### InterVar의 작동 원리

InterVar는 다음과 같은 두 단계를 거쳐 유전자 변이를 해석합니다.

1. **자동 분석 단계**: InterVar는 입력된 유전자 변이 정보를 바탕으로 18가지 기준에 대한 점수를 자동으로 계산합니다. 예를 들어, 변이가 단백질의 중요한 부분에 위치하는지, 변이가 유전자 발현에 영향을 미치는지, 변이가 이미 질병과 관련된 것으로 알려져 있는지 등을 분석합니다.

2. **수동 조정 단계**: InterVar는 자동 분석 결과를 제시하고, 전문가가 자신의 지식을 활용하여 결과를 검토하고 수정할 수 있도록 합니다. 예를 들어, 환자의 가족력, 증상, 다른 유전자 검사 결과 등을 고려하여 InterVar의 판단을 조정할 수 있습니다.

### InterVar의 장점

* **객관적이고 일관된 해석**: InterVar는 ACMG-AMP 가이드라인이라는 표준화된 기준을 사용하므로 객관적이고 일관된 해석을 제공합니다.

* **시간 절약**: InterVar는 자동으로 많은 정보를 분석하여 전문가의 시간을 절약해 줍니다.

* **전문 지식 보완**: InterVar는 전문가가 자신의 지식을 활용하여 해석 결과를 조정할 수 있도록 하여, 보다 정확하고 신뢰할 수 있는 해석을 가능하게 합니다.

### InterVar의 한계

* **모든 유전자 변이 해석 가능한 것은 아님**: InterVar는 멘델리안 질환이나 침투율이 높은 유전 질환에 적합하며, 복잡한 질병과 관련된 변이를 해석하는 데는 제한적입니다.

* **데이터베이스 의존성**: InterVar는 유전자 변이 정보, 질병 정보 등을 담고 있는 데이터베이스를 기반으로 작동합니다. 따라서 데이터베이스의 품질이 InterVar의 해석 정확도에 영향을 미칠 수 있습니다.

### InterVar의 활용 및 기대 효과

InterVar는 유전자 검사 결과를 해석하는 데 유용한 도구이며, 의료진이 환자에게 보다 정확한 진단과 치료를 제공하는 데 도움을 줄 수 있습니다. 또한 InterVar는 유전자 변이 연구를 촉진하여 새로운 질병 유전자를 발견하고, 질병의 발생 메커니즘을 이해하는 데 기여할 수 있습니다.

### 결론

InterVar는 복잡한 유전자 변이 해석 과정을 자동화하고 표준화하여 의료진의 유전자 검사 결과 해석을 지원하는 유용한 도구입니다. InterVar를 통해 유전 질환 진단의 정확성을 높이고 개인 맞춤형 의료 시대에 더 나은 의료 서비스를 제공할 수 있을 것으로 기대됩니다.


varsome, franklin 이나 VarSeq같은 상용 tool들이 있어서 크게 와닿지는 않지만, 생각보다 지금도 잘 작동하고, 내부에서 사용하는 DB나 로직을 계속 업데이트 해주면 어느 tool과도 비교해도 떨어지지 않을듯합니다.

물론 유행하는 머신러닝이나 딥러닝을 활용하여 구축한 변이예측모델까지 접목한다면 금상첨화가 되지 않을까 하네요. 물론 이런 시도나 연구는 현재 계속 이뤄지고 있으니 조만간 더 좋은 tool을 쏟아져 나오지 않을까 합니다 :)


출처: @ye._.vely618


월요일, 11월 04, 2024

NanoRanger, 유전자 검사의 새로운 지평을 열다

최근에 게재된 유전자 변이와 서열 재배열과 같은 SV를 탐지하는데 탁월한 방법을 개발했다는 내용인 NanoRanger enables rapid single-base-pair resolution of genomic disorders을 가져 와봤습니다.

DOI: 10.1016/j.medj.2024.07.003


gemini

## NanoRanger: 유전자 검사의 새로운 지평을 여는 기술

NanoRanger라는 혁신적인 유전자 검사 기술을 소개하는 논문입니다. 이 기술은 기존 유전자 검사 기술로는 찾기 어려웠던 복잡한 유전자 변이를 정확하게 식별하여 유전 질환 진단에 획기적인 발전을 가져올 것으로 기대됩니다. 

### 유전자와 유전 질환

우리 몸의 세포에는 DNA라는 유전 물질이 존재합니다. DNA는 아데닌(A), 티민(T), 구아닌(G), 시토신(C)이라는 네 가지 염기로 이루어진 긴 사슬입니다. 이 염기들의 배열 순서에 따라 유전 정보가 결정됩니다. 유전자는 DNA의 특정 부분으로, 특정 단백질을 만들도록 지시하는 역할을 합니다. 단백질은 우리 몸의 구조를 형성하고 기능을 조절하는 데 필수적인 요소입니다.

유전자에 변이가 발생하면 단백질 생성에 문제가 생겨 유전 질환을 일으킬 수 있습니다. 유전자 변이는 DNA 염기 서열의 변화, 일부 염기의 결손, 중복, 삽입 등 다양한 형태로 나타날 수 있습니다. 특히 유전자의 일부가 뒤집히거나, 삭제되거나, 중복되는 등 복잡한 구조적 변이는 질병을 유발하는 중요한 원인이지만, 기존의 검사 기술로는 정확한 위치를 파악하기 어려웠습니다.

### NanoRanger 기술의 등장

NanoRanger는 이러한 한계를 극복하기 위해 개발된 기술입니다. NanoRanger는 특정 유전자 영역을 선택적으로 증폭하여 분석하는 기술입니다. 이 기술은 기존 기술보다 훨씬 긴 DNA 조각을 분석할 수 있으며, 높은 정확도로 유전자 변이를 식별할 수 있습니다. 

**NanoRanger의 핵심 과정:**

1. **DNA 추출:** 환자의 혈액, 타액, 조직 등에서 DNA를 추출합니다.

2. **제한 효소 처리:** DNA를 특정 염기 서열을 인식하여 자르는 제한 효소로 처리합니다.

3. **자가 연결:** 잘린 DNA 조각들을 DNA ligase를 이용하여 원형으로 연결합니다.

4. **역 PCR:** 원형 DNA를 주형으로 하여 역 PCR (Inverse PCR)을 수행하여 분석하고자 하는 유전자 영역을 증폭합니다.

5. **염기서열 분석:** 증폭된 DNA 조각의 염기 서열을 분석하여 유전자 변이를 확인합니다.

### NanoRanger 기술의 장점

* **정확성:** NanoRanger는 단일 염기 수준의 정확도로 유전자 변이를 식별할 수 있습니다.

* **속도:** 기존 기술보다 빠르게 분석 결과를 얻을 수 있습니다.

* **경제성:** 적은 양의 DNA 샘플로도 분석이 가능하며, 비용 효율적입니다.

* **범용성:** 다양한 유전 질환에 적용 가능합니다.

### NanoRanger 기술의 활용 및 전망

NanoRanger는 유전 질환의 진단, 예측, 치료에 혁신적인 변화를 가져올 것으로 예상됩니다. 

* **진단:** NanoRanger는 기존 검사에서 진단이 어려웠던 다양한 유전 질환의 원인을 밝혀낼 수 있습니다.

* **예측:** 가족 구성원의 보인자 여부를 확인하여 유전 질환의 발병 가능성을 예측할 수 있습니다.

* **치료:** 유전자 변이에 대한 정확한 정보를 제공하여 개인 맞춤형 치료법 개발에 기여할 수 있습니다.

NanoRanger는 유전자 검사 기술의 새로운 지평을 열 것입니다. 이 기술은 유전 질환으로 고통받는 환자들에게 희망을 주고, 인류의 건강 증진에 크게 기여할 것으로 기대됩니다.



clova-x

제목: 복잡한 유전적 이상을 빠르고 정확하게 진단하는 NanoRanger 기술

최근 생명공학 분야에서는 유전자 검사 기술의 발전으로 인해 복잡한 유전적 이상을 빠르고 정확하게 진단할 수 있게 되었습니다. 특히, NanoRanger라는 새로운 기술은 기존의 유전자 검사 방법으로는 파악하기 어려운 복잡한 유전적 이상을 빠르고 정확하게 진단할 수 있어 주목받고 있습니다.

NanoRanger는 긴 읽기 시퀀싱 방법을 사용하여 복잡한 유전적 이상 부위를 빠르게 찾아낼 수 있습니다. 이 기술은 적은 양의 샘플로도 검사가 가능하며 비용 효율적이어서, 멘델 유전병 환자들에게 정확한 유전자 검사를 제공할 수 있는 기회를 확대합니다.

기존의 짧은 읽기 시퀀싱 방법은 복잡하고 비용이 많이 드는 과정 때문에 정확한 진단이 어려웠습니다. 하지만 NanoRanger는 빠르고 정확하며, 최소한의 샘플 요구량과 저렴한 비용으로 복잡한 유전적 이상을 파악할 수 있습니다.

실제로, 16개의 가족 사례를 통해 NanoRanger를 이용하여 기존의 유전자 검사 방법으로는 파악하지 못한 유전적 이상을 정확하게 진단하였습니다. 이를 통해 보인자 상태를 파악하고, 지역 사회 내에서의 유전적 이상의 빈도를 파악하는 데에도 활용되었습니다.

NanoRanger 기술은 앞으로 더욱 발전하여, 보다 많은 환자들이 정확한 유전자 검사를 받을 수 있는 기회를 제공할 것으로 기대됩니다. 이 기술을 통해 유전적 이상을 조기에 발견하고 치료함으로써, 환자들의 건강과 삶의 질을 향상시킬 수 있을 것입니다.



chatGPT

**새로운 유전자 검사 기술, NanoRanger 소개**

---

유전자 질환의 진단은 많은 사람들이 겪는 문제입니다. 복잡한 유전자 변이가 원인인 경우 기존 검사로는 진단이 어렵고, 진단에 오랜 시간이 걸릴 수 있습니다. 이를 해결하기 위해 개발된 새로운 기술 *NanoRanger*는 신속하고 정밀한 유전자 진단을 가능하게 합니다. 이 기술이 왜 중요한지, 어떤 방식으로 작동하는지, 그리고 어떤 효과가 기대되는지를 쉽게 설명해 보겠습니다.

### 1. **NanoRanger가 필요한 이유**

유전자 질환 환자들은 오랜 시간 동안 정확한 진단을 받지 못해 어려움을 겪고 있습니다. 기존 유전자 검사 방법은 단순한 유전자 변이만 확인할 수 있고, 복잡한 유전자 재배열이 원인인 질병을 정확히 진단하기에는 한계가 있습니다. 특히 드물게 나타나는 질환의 경우, 기존 검사법으로는 진단에 실패하거나 고가의 장비가 필요하여 비용이 많이 드는 문제가 있습니다.

### 2. **NanoRanger의 작동 원리**

*NanoRanger*는 새로운 방식의 유전자 검사 기술로, 기존 방식과 달리 긴 염기서열을 빠르고 저렴하게 분석할 수 있습니다. 이 기술은 유전자에서 변이가 발생한 위치를 염기 하나 단위로 찾아내어 질병과 관련된 변이를 정확하게 분석합니다. 이를 통해 복잡한 유전자 재배열의 위치를 빠르게 파악하고, 기존 검사로 확인되지 않던 돌연변이를 찾아낼 수 있습니다.

#### 주요 특징

- **빠르고 정확한 분석**: 단시간 내에 유전자 변이 위치를 확인할 수 있습니다.

- **낮은 샘플량**: 기존 기술보다 적은 샘플로 검사할 수 있어 환자에게 부담이 적습니다.

- **저비용**: 고가의 장비나 복잡한 절차 없이 진행할 수 있어 비용 효율성이 높습니다.

### 3. **NanoRanger의 장점**

*NanoRanger*는 기존의 유전자 검사와 비교했을 때 여러 가지 강점을 가지고 있습니다.

- **높은 진단 성공률**: 유전자 질환의 원인이 되는 복잡한 변이를 염기 단위로 정확히 파악하여 진단 실패율을 낮춥니다.

- **보인자 검사**: 특정 유전자 질환을 가진 가족 내에서 유전적 위험을 평가하여 미래의 질환 발병 가능성을 예측할 수 있습니다.

- **발견된 변이의 기전 분석**: 이 기술은 유전자가 변이되는 기작까지 파악할 수 있어, 질환 연구에 중요한 정보를 제공합니다.

### 4. **NanoRanger의 활용 가능성**

이 기술은 특히 다음과 같은 분야에서 유용할 것으로 기대됩니다:

- **멘델형 질환 진단**: 부모로부터 물려받은 유전자 변이로 인해 발병하는 질환을 정확히 진단합니다.

- **유전자 보인자 검사**: 특정 유전자 변이를 가진 보인자를 선별하여 질병 유전자를 가진 사람의 가족을 검사할 수 있습니다.

- **비용 절감**: 기존 검사법에 비해 비용이 낮아졌기 때문에 더 많은 사람들이 유전자 검사를 받을 수 있습니다.

### 5. **NanoRanger가 가져올 변화**

*NanoRanger*의 도입으로 유전자 질환 진단 분야는 크게 발전할 것입니다. 빠르고 정확한 유전자 검사는 환자와 가족이 더 이른 시점에 치료 및 예방 계획을 세울 수 있도록 돕습니다. 또한, 연구자들에게는 유전자 변이와 관련된 중요한 데이터를 제공하여 질병의 원인을 더 깊이 이해하는 데 기여할 것입니다.



NotebookLM

## 일반인도 이해할 수 있는 NanoRanger 기술 설명

이 글은 NanoRanger라는 새로운 유전자 검사 기술에 대한 연구 내용을 생명공학을 전공하지 않은 일반인도 이해할 수 있도록 설명합니다.

### 희귀 질환 진단의 어려움

* 전 세계적으로 4억 명 이상이 희귀 질환을 앓고 있으며, 그중 80%는 유전적 원인으로 발생합니다.

* 유전자 검사 기술의 발전에도 불구하고 멘델리안 유전 질환 의심 환자의 약 절반은 정확한 진단을 받지 못하고 있습니다.

* 엑솜 시퀀싱(ES)은 유전자 검사의 표준 방법이지만, 멘델리안 질환 의심 환자의 최소 50%에서 분자 진단을 확보하지 못하는 경우가 많습니다.

* **엑솜 시퀀싱과 게놈 시퀀싱의 진단적 가치 차이가 미미하다는 연구 결과는 질병을 유발하는 변이가 해석 수준에서 누락되었을 가능성을 시사합니다.**

* **즉, 엑솜 및 게놈 시퀀싱에 현재 사용되는 기술(숏 리드 시퀀싱, SRS)은 분석적 민감도에 내재적인 한계가 있습니다.**

* **롱 리드 시퀀싱(LRS)은 SRS의 검출 한계를 해결할 수 있는 가능성을 제시합니다.**

* **특히 유전체 질환, 즉 DNA 염기서열 변화보다는 인간 유전체의 재배열로 인해 발생하는 질환의 경우 LRS가 우수할 수 있습니다.**

### NanoRanger 기술의 등장

* **NanoRanger는 표적 롱 리드 시퀀싱(T-LRS) 전략으로, 숏 리드 시퀀싱의 한계를 극복하고 유전체 질환의 복잡한 재배열 지점을 정확하게 매핑하는 데 효과적입니다.**

* NanoRanger는 광학 게놈 매핑(OGM)과 같은 기존 방법보다 비용이 저렴하고 샘플 요구량이 적습니다.

### NanoRanger 기술의 작동 원리

1. **환자 샘플에서 DNA를 추출합니다.**

2. **제한 효소를 사용하여 DNA를 부분적으로 소화합니다.**

3. **DNA 단편을 자가 순환시킵니다.**

4. **역 PCR을 사용하여 의심되는 돌연변이 위치에 인접한 DNA 영역을 증폭합니다.**

5. **증폭된 DNA 단편을 나노포어 시퀀싱을 사용하여 시퀀싱합니다.**

### NanoRanger 기술의 장점

* **NanoRanger는 기존 유전자 검사로 해결되지 않은 복잡한 구조적 변이(SV)를 염기 수준 해상도로 신속하고 정확하게 식별합니다.**

* **기존 방법과 비교하여 NanoRanger는 훨씬 적은 DNA를 필요로 하며 플로우 셀 용량의 일부만 사용하면서도 수만 배 높은 시퀀스 커버리지를 달성합니다.**

* **NanoRanger는 광범위한 유전자좌에 걸쳐 일반적으로 적용할 수 있으며 다양한 크기의 SV에 적용할 수 있습니다.**

* **NanoRanger는 혈액과 같은 일상적인 임상 샘플로 작동하며 염기쌍 수준의 해상도로 크거나 복잡한 유전체 변화를 해결합니다.**

* **NanoRanger는 최대 1.5Mb의 재배열을 해결할 수 있으며 샘플당 약 8.8달러의 저렴한 비용으로 수행할 수 있습니다.**

### NanoRanger 기술의 적용 사례

* 연구팀은 NanoRanger를 사용하여 다양한 열성 유전 질환을 진단받았지만 다른 기술로는 SV의 좌표를 확인할 수 없었던 환자의 정확한 분자 진단을 제공했습니다.

* 예를 들어, NanoRanger는 이전에 엑솜 시퀀싱 및 OGM으로 진단되지 않았던 신경세포증후군 환자의 MFSD8 유전자에서 8.8kb 결실을 식별하는 데 사용되었습니다.

* NanoRanger는 또한 Usher 증후군과 고인슐린혈증이 복합적으로 나타난 환자의 USH1C 및 ABCC8 유전자에 영향을 미치는 123kb 결실을 식별하는 데 사용되었습니다.

### NanoRanger 기술의 미래

* NanoRanger는 유전 질환 진단 및 보인자 스크리닝을 위한 강력한 도구로서, 개인 맞춤형 의료 시대에 정밀 의학을 향한 중요한 진전입니다.

* **NanoRanger는 잘 정의된 후보 유전자가 있는 유전 질환의 보완 진단 도구 및 일반적인 유전 질환에 대한 비용 효율적인 결혼 전 스크리닝 검사 역할을 할 수 있을 것으로 예상됩니다.**

### 결론

NanoRanger는 유전체 질환 진단을 혁신할 잠재력이 있는 새롭고 유망한 유전자 검사 기술입니다. 이 기술은 기존 방법의 한계를 극복하여 복잡한 유전적 재배열에 대한 보다 정확하고 저렴하며 접근 가능한 진단을 가능하게 합니다. NanoRanger의 개발은 유전 질환의 진단 및 치료에 중요한 진전이며 개인 맞춤형 의료를 향한 중요한 단계입니다.


분명 Long-read 시퀀싱으로 변이와 SV를 판독하는 것으로 봐서 분명 Nanopore를 사용하는것으로 보이는데 이게 좀 가물가물 합니다. ONT 사용하고, minimap2도 사용하는것 봐서는 맞는데, primer design하는 단계는 굳이 왜 있는건지.. 흠.. 

나중에 시간되면 한번 읽어봐야 더 잘 이해를 하지 않을까합니다. :)


출처: @ye._.vely618

토요일, 11월 02, 2024

PCR in Forensic Science: A Critical Review

코로나이후 많은 사람들이 알게된 기술은 PCR에 대해서 법의학 분야쪽에서 정리한 논문이 있어 가져와봤습니다. PCR in Forensic Science: A Critical Review 입니다.

음... 갱장히 light한데 그냥 가볍게 읽어보면 좋을 듯합니다. :)

DOI : 10.3390/genes15040438



gemini

**PCR이란 무엇일까요?**

PCR은 아주 적은 양의 DNA를 복사해서 양을 늘리는 기술입니다. 마치 복사기처럼요! 범죄 현장에서 발견되는 아주 작은 혈흔이나 머리카락에도 DNA가 있는데, PCR을 이용하면 이 DNA를 분석할 수 있을 만큼 충분히 늘릴 수 있습니다. 이렇게 늘어난 DNA를 분석하면 범인을 찾거나 혈연관계를 확인하는 데 도움이 됩니다.

**PCR은 어떻게 발전해 왔나요?**

PCR 기술은 처음에는 결과가 일정하지 않고 정확도도 떨어졌습니다. 하지만 과학자들의 노력으로 PCR 기술은 점점 더 정확하고 빠르게, 그리고 더 적은 양의 DNA로도 분석이 가능하도록 발전했습니다. 이제는 극미량의 DNA만 있어도 범인을 찾아낼 수 있게 되었죠!

**PCR은 어디에 사용될까요?**

PCR은 범죄 수사 외에도 다양한 분야에서 활용됩니다. 예를 들어, 친자 확인을 하거나, 오래된 유골에서 DNA를 추출하여 분석할 수도 있습니다. 또한 바이러스나 질병을 진단하는 데에도 PCR 기술이 사용됩니다. 코로나19 진단 검사에도 PCR 기술이 활용되었다는 사실, 알고 계셨나요?

**PCR 기술은 어떤 어려움이 있나요?**

PCR은 매우 유용한 기술이지만, 아직 해결해야 할 과제도 남아있습니다. 예를 들어, 범죄 현장의 DNA는 햇빛이나 습기에 의해 손상되는 경우가 많은데, 이런 손상된 DNA는 PCR로 증폭하기가 어렵습니다. 과학자들은 이러한 문제를 해결하기 위해 끊임없이 노력하고 있습니다.

**PCR 기술의 미래는 어떨까요?**

PCR 기술은 앞으로도 더욱 발전할 것으로 예상됩니다. 더 빠르고 정확하게 DNA를 분석할 수 있는 새로운 기술들이 개발되고 있으며, 이러한 기술들은 범죄 수사, 질병 진단, 유전자 연구 등 다양한 분야에서 더욱 중요한 역할을 할 것입니다.



clova-x

PCR(중합효소 연쇄 반응)은 DNA를 대량으로 복제하는 기술로, 1980년대에 개발되어 현재 다양한 분야에서 활용되고 있습니다. 특히, 법의학 분야에서는 범죄 현장에서 발견된 DNA 증거물을 분석하는 데 중요한 역할을 합니다.

PCR의 원리는 다음과 같습니다. 먼저, DNA 샘플을 가열하여 이중 나선 구조를 풀어줍니다. 그 다음, 온도를 낮추어 DNA의 한쪽 가닥에 상보적인 염기서열을 가진 프라이머가 결합합니다. 이후, 온도를 다시 높여 DNA polymerase가 프라이머를 시작점으로 하여 새로운 DNA 가닥을 합성합니다. 이 과정을 반복하면 DNA의 양이 기하급수적으로 증가하게 됩니다.

PCR은 세 단계로 구성됩니다. 첫 번째 단계는 denaturation으로, DNA를 95°C 정도의 고온에서 가열하여 이중 나선을 단일 가닥으로 분리합니다. 두 번째 단계는 annealing으로, 50-65°C에서 단일 가닥 DNA에 프라이머가 결합합니다. 마지막 단계는 extension으로, 70-74°C에서 DNA polymerase가 프라이머를 기점으로 DNA를 복제합니다. 이 과정을 25-35회 반복하면 원래의 DNA 양이 수백만 배로 증폭됩니다.

법의학 분야에서는 PCR을 이용하여 범죄 현장에서 발견된 DNA 증거물을 분석합니다. 예를 들어, 혈액, 정액, 머리카락 등에서 추출한 DNA를 PCR로 증폭하여 개인의 신원을 확인하거나, 범죄자의 DNA 데이터베이스와 비교하여 범인을 추적할 수 있습니다. 또한, PCR을 통해 DNA의 변이를 검출하여 질병의 진단이나 치료에도 활용할 수 있습니다.

PCR 기술은 계속해서 발전하고 있습니다. 최근에는 고속 PCR 기술인 Rapid DNA가 개발되어 DNA 프로파일링 시간을 크게 단축할 수 있게 되었습니다. 또한, 다중 PCR 기술을 통해 여러 유전자를 동시에 증폭하여 보다 정확한 분석이 가능해졌습니다. 이러한 기술 발전으로 인해 법의학 수사에서 DNA 증거의 활용이 더욱 확대될 것으로 기대됩니다.



chatGPT

### 1. PCR이란?

PCR은 아주 작은 양의 DNA를 짧은 시간 안에 대량으로 복제하는 방법입니다. 예를 들어, 우리가 범죄 현장에서 머리카락 하나를 발견하면, 그 머리카락에서 추출한 아주 적은 양의 DNA를 PCR로 증폭하여 충분한 양의 DNA를 확보할 수 있습니다. 이를 통해 사람의 신원을 확인하거나, 어떤 특정 생물체가 범죄 현장에 있었는지 알 수 있습니다.

### 2. PCR의 기본 원리

PCR은 간단히 세 단계로 이루어져 있습니다:

1. **변성(가열)**: DNA를 뜨겁게 데워서 두 가닥으로 분리합니다.

2. **결합(냉각)**: 온도를 낮춰서 특수한 '프라이머'라는 분자들이 원하는 위치에 붙도록 합니다.

3. **합성(온도 올리기)**: 다시 온도를 적절하게 높여서 새로운 DNA 가닥이 합성되도록 합니다.

이 과정을 여러 번 반복하면, 작은 양의 DNA가 수백만 배로 증폭됩니다.

### 3. 법과학에서 PCR의 역할

법과학에서 PCR은 범죄 현장에서 매우 작은 증거물에서 DNA를 추출하고 분석하는 데 사용됩니다. PCR 기술 덕분에 범죄 현장에서 수집한 아주 미세한 증거도 DNA 프로파일링을 통해 범죄자나 피해자를 식별하는 데 사용할 수 있게 되었습니다.

### 4. PCR의 발전

1980년대 초에 처음 도입된 PCR은 시간이 지나면서 기술적으로 발전해왔습니다. 특히 법과학에서 사용되는 PCR 키트는 DNA가 잘 보존되지 않은 시료에서도 정확한 결과를 얻을 수 있도록 계속 개선되었습니다. 이 논문은 이러한 발전 과정을 설명하면서 PCR 기술이 어떻게 진화해왔는지를 다룹니다.

### 5. PCR의 한계와 향후 방향

PCR 기술은 많은 이점을 가지고 있지만, 여전히 제한된 부분이 있습니다. 예를 들어, DNA가 심하게 손상된 경우에는 PCR이 잘 작동하지 않을 수 있습니다. 이 논문에서는 그러한 문제점과 함께, 미래에 PCR 기술이 더 발전하여 이러한 한계를 극복할 수 있는 가능성을 제시하고 있습니다.

이와 같은 내용들은 법과학뿐만 아니라, 의료, 생명공학, 환경 분석 등 다양한 분야에서도 활용됩니다.



NotebookLM

## PCR: 미세한 DNA 증거를 확대하여 범죄를 해결하는 과학 기술

PCR(Polymerase Chain Reaction, 중합효소 연쇄 반응)은 **DNA의 특정 부분을 복제하여 증폭시키는 기술**입니다. 범죄 현장에서 발견되는 아주 작은 양의 DNA를 증폭하여 분석 가능하게 만들어 범인을 찾는 데 중요한 역할을 합니다. PCR은 마치 돋보기를 사용하여 작은 글씨를 크게 보는 것과 같습니다. 

**PCR은 어떻게 작동할까요?**

PCR은 DNA, 프라이머, DNA 중합효소, 뉴클레오티드, 버퍼 용액 등 다섯 가지 핵심 요소가 필요합니다.

1. **DNA**: 증폭할 대상이 되는 DNA입니다. 

2. **프라이머**: 증폭할 DNA 부분의 시작과 끝을 지정하는 짧은 DNA 조각입니다. 

3. **DNA 중합효소**: 프라이머를 기준으로 DNA를 복제하는 효소입니다. 

4. **뉴클레오티드**: DNA를 구성하는 기본 단위입니다.

5. **버퍼 용액**: DNA 중합효소가 활성화될 수 있는 환경을 제공합니다. 

PCR 과정은 다음과 같이 세 단계로 이루어지며, 이 과정을 반복하면서 DNA가 기하급수적으로 증폭됩니다.

1. **DNA 변성 (Denaturation)**: 높은 온도(94~96℃)에서 DNA의 이중 나선 구조를 단일 가닥으로 분리합니다. 

2. **프라이머 결합 (Annealing)**: 온도를 낮춰 (50~65℃) 프라이머가 DNA의 특정 부분에 결합하도록 합니다. 

3. **DNA 합성 (Extension)**: DNA 중합효소가 프라이머를 기준으로 새로운 DNA 가닥을 합성합니다 (72℃).

**법의학 분야에서 PCR의 역사**

1980년대 PCR 기술이 개발된 이후, **법의학 분야는 혁명적인 변화**를 맞이했습니다. 과거에는 범죄 현장에서 충분한 양의 DNA를 확보하기 어려워 범인을 특정하는 데 어려움을 겪었습니다. 하지만 PCR 기술을 이용하여 극미량의 DNA를 증폭하여 분석할 수 있게 되면서 **미제 사건 해결에도 큰 도움**을 주고 있습니다.

**PCR 기술의 진화**

초기 PCR 기술은 한 번에 DNA의 한 부분만 증폭할 수 있었습니다. 하지만 기술이 발전하면서 **동시에 여러 부분을 증폭할 수 있는 Multiplex PCR**이 개발되어, 더 많은 유전 정보를 얻을 수 있게 되었습니다. 

또한 **실시간으로 증폭되는 DNA 양을 측정할 수 있는 qPCR** (Quantitative PCR) 기술은 DNA의 양을 정확하게 측정하여 분석의 정확성을 높이는 데 기여했습니다.

최근에는 **더 빠른 속도로 DNA를 증폭시키는 Rapid PCR** 기술이 개발되어, 현장에서 즉각적으로 DNA 분석 결과를 확인할 수 있게 되었습니다.

**PCR 기술의 미래**

PCR 기술은 끊임없이 발전하고 있으며, **더욱 정확하고 빠르게 DNA를 분석**할 수 있는 방향으로 나아가고 있습니다. 

* **미세유체학 (Microfluidics)**: 아주 작은 칩 위에서 PCR을 수행하는 기술로, 적은 양의 시료와 시약을 사용하여 빠르고 효율적인 분석이 가능합니다. 

* **인공 지능 (AI)**: 인공 지능을 활용하여 PCR 과정을 최적화하고, 분석 결과 해석의 정확성을 높이는 연구가 진행 중입니다.

**PCR 기술은 범죄 수사뿐만 아니라 질병 진단, 유전자 연구, 신약 개발 등 다양한 분야에서 활용**되고 있으며, 앞으로 더욱 발전하여 인류의 삶에 큰 영향을 미칠 것으로 기대됩니다. 


다들 PCR에 대해서 한번씩 설명하는 수준이네요 :) 꽤 오래된 방법이긴 하나 그만큼 오랜시간 동안 검증되어왔고, PCR을 사용하지 않고는 연구나 진단을 사용하기 쉽지 않기 때문에 PCR이라는 기술을 교양으로 알아두면 쓸데없기는 하지만 나쁘지는 않을겁니다. :)



출처: @ye._.vely618


금요일, 11월 01, 2024

개인프로젝트 -ABAA 계산하기-

오늘은 자산배분전략중 ABAA에 대한 내용입니다.

여기에도 카나리아 자산군이 있는데 보통 투자자산에 SPY가 들어가는데 여기에는 카나리아 자산군에 SPY가 들어가 있습니다. 


오늘의 스크립트 strategy_ABAA.py

이제 주가 정보를 바탕으로 구현할 수 있는 전략들은 대부분 마무리되고 있는 듯 합니다.

조만간 좀 그럴싸한 페이지를 만드는 코드가 올라가기를 고대해봅니다. :)





출처: ye._.vely618


목요일, 10월 31, 2024

NGS에서 통계적 검정력과 표본 크기 계산의 중요성

오늘은 간만에 좀 지난 논문을 하나 가져와봤슴다. Power and sample size calculations for high-throughput sequencing-based experiments으로 high-throughput seq 실험을 할 떄 검정력과 샘플 개수를 어떻게 사용해야 하는지에 대한 내용되겠습니다. 


DOI: 10.1093/bib/bbx061


gemini

**NGS 기반의 실험의 통계적 Power와 표본 크기 계산**

NGS 기반의 실험은 빠르게 발전하는 기술로, 생명과학 분야에서 광범위하게 사용되고 있습니다. 이 기술은 DNA, RNA, 단백질 등의 고분자를 대상으로 하는 다양한 실험에 활용되며, 대량의 데이터를 생성합니다. 이러한 대량의 데이터를 분석하고 해석하기 위해서는 통계적 방법이 필수적입니다. 통계적 power와 표본 크기 계산은 NGS 기반의 실험을 설계하고 분석하는 데 있어서 매우 중요한 요소입니다.

Power는 통계적 검정에서 유의한 결과를 얻을 수 있는 확률을 나타냅니다. 즉, 1-β로 나타내며, β는 제1종 오류의 확률입니다. 제1종 오류는 귀무가설이 참인데도 거짓으로 기각하는 오류입니다. 표본 크기는 통계적 검정에서 유의한 결과를 얻기 위해 필요한 표본의 크기를 나타냅니다.

NGS 기반의 실험에서 통계적 power와 표본 크기 계산은 여러 가지 요인에 영향을 받습니다. 예를 들어, 실험 대상의 특성, 실험의 목적, 실험 방법, 분석 방법 등이 있습니다. 이러한 요인들을 고려하여 적절한 통계적 power와 표본 크기를 계산하는 것이 중요합니다.

이러한 요인들을 고려하여 적절한 통계적 power와 표본 크기를 계산하는 것이 중요합니다. 이를 위해서는 통계학 전문가의 도움을 받는 것이 좋습니다. 또한, 다양한 통계적 power와 표본 크기 계산 방법이 개발되어 있으므로, 자신의 연구에 가장 적합한 방법을 선택하는 것이 중요합니다.

**NGS 기반의 실험의 통계적 Power와 표본 크기 계산의 중요성**

NGS 기반의 실험에서 통계적 power와 표본 크기 계산을 올바르게 수행하지 않으면, 다음과 같은 문제가 발생할 수 있습니다.

* 유의한 결과를 얻지 못할 수 있습니다.

* 실험에 필요한 비용이 과도하게 발생할 수 있습니다.

* 실험 결과의 신뢰성이 떨어질 수 있습니다.

따라서, NGS 기반의 실험을 설계하고 분석할 때에는 통계적 power와 표본 크기 계산을 반드시 고려해야 합니다.



clova-x

최근 생명공학 분야에서는 차세대 염기서열 분석(NGS) 기술이 빠르게 발전하면서, 대규모의 유전 정보를 빠르고 정확하게 분석할 수 있게 되었습니다. 이에 따라 NGS 기술을 활용한 다양한 연구가 활발하게 이루어지고 있습니다.

NGS 기반의 실험에서는 많은 양의 데이터가 생성되기 때문에, 이를 효과적으로 분석하기 위해서는 적절한 통계적 방법이 필요합니다. 특히, 실험의 목적에 따라 적절한 표본 크기를 결정하고, 통계적 파워를 계산하는 것이 중요합니다.

통계적 파워란, 연구에서 설정한 가설을 검증할 수 있는 능력을 나타내는 지표입니다. 즉, 실험에서 얻은 결과가 우연에 의한 것이 아니라, 실제로 가설을 지지하는 것인지를 판단하는 데 도움을 줍니다.

표본 크기란, 연구에서 사용하는 데이터의 양을 말합니다. 표본 크기가 클수록 통계적 파워가 높아지기 때문에, 보다 정확한 결과를 얻을 수 있습니다. 하지만, 표본 크기가 너무 커지면 비용이 많이 들기 때문에, 적절한 균형을 유지하는 것이 중요합니다.

이번 연구에서는 NGS 기반의 실험에서 통계적 파워와 표본 크기를 계산하는 방법에 대해 다루었습니다. 이를 위해 다양한 통계적 모델과 알고리즘을 사용하였으며, 실제 데이터를 활용하여 검증하였습니다.

연구 결과, NGS 기반의 실험에서는 리드 깊이, 분산 등의 고유한 매개변수를 고려하여 통계적 파워와 표본 크기를 계산해야 한다는 것을 확인하였습니다. 또한, 여러 가지 통계적 모델 중에서 Negative Binomial 모델이 NGS 데이터의 특성을 잘 반영하는 것으로 나타났습니다.

이번 연구는 NGS 기반의 실험을 계획하는 연구자들에게 유용한 정보를 제공합니다. 실험의 목적에 따라 적절한 표본 크기를 결정하고, 통계적 파워를 계산함으로써 보다 정확한 결과를 얻을 수 있으며, 이를 통해 생명공학 분야의 발전에 기여할 수 있을 것으로 기대됩니다.

NGS 기술과 통계적 방법은 계속해서 발전하고 있기 때문에, 이에 대한 지속적인 연구와 업데이트가 필요합니다. 연구자들은 최신 기술과 방법을 적극적으로 활용하여, 보다 정확하고 효율적인 연구를 수행해야 합니다.



chatGPT

이 연구는 고처리량 시퀀싱(HTS) 기반 실험에서 통계적 파워와 샘플 크기 계산의 중요성을 설명하는 데 중점을 두고 있습니다. **통계적 파워**란, 실험에서 의미 있는 차이나 효과를 발견할 수 있는 능력을 의미하며, 실험의 성공 여부에 중요한 역할을 합니다. 샘플 크기 역시 실험 결과의 신뢰성을 결정하는 핵심 요소입니다. 따라서 실험을 설계할 때, 통계적 파워와 적절한 샘플 크기를 계산하는 것은 필수적입니다.

**연구 배경**  

고처리량 시퀀싱(HTS)은 DNA, RNA, 마이크로바이옴(미생물군집), 단백질-유전체 상호작용 연구 등에서 활용되는 최신 기술로, 한 번에 수백만 개의 데이터를 분석할 수 있습니다. HTS 기술은 생물학적 연구를 한 단계 더 발전시키는 데 기여했지만, 이러한 복잡한 데이터 분석에 맞는 통계적 방법을 적용하는 것이 매우 어렵습니다. 특히, HTS 실험에서는 데이터의 다양성과 복잡성으로 인해 **파워 분석**이 필수적입니다. 기존의 유전자 분석 방식과는 달리, HTS 데이터는 더 많은 변동성과 오류 가능성을 포함하고 있어 더욱 세밀한 분석이 요구됩니다.

**연구에서 사용된 방법**  

이 연구에서는 HTS 기반 실험에 필요한 파워와 샘플 크기 계산 방법을 다루고 있습니다. 연구진은 다양한 시퀀싱 방법에 따른 통계적 분석 도구를 사용했습니다. 예를 들어, DNA 시퀀싱에서는 변이(유전자 돌연변이)를 발견하고 이를 표현형(겉으로 드러나는 특성)과 연관 짓기 위한 파워 분석을 진행했습니다. RNA 시퀀싱에서는 유전자 발현 수준의 차이를 분석하기 위해 **Poisson 분포**와 **음이항 분포** 등의 통계 모델을 적용하여 샘플 크기를 계산했습니다. 또한, 마이크로바이옴 연구에서는 미생물 종의 다양성을 분석하기 위해 **다항 분포**를 사용한 파워 분석을 수행했습니다. 이 연구에서 사용된 통계적 방법들은 모두 HTS 실험의 목표와 데이터 유형에 맞게 조정되었습니다.

**연구 결과**  

연구진은 HTS 실험에서 실험 설계의 성공 여부를 판단하는 데 있어 파워 분석이 필수적이라는 결론을 내렸습니다. HTS 데이터는 기존의 유전자 분석 데이터보다 더 많은 변수를 포함하고 있어, 정확한 분석을 위해서는 실험의 목표에 맞춘 정교한 통계적 방법이 필요합니다. 연구는 각 시퀀싱 방법에 맞는 다양한 파워 분석 도구와 계산 방법을 제안했으며, 이를 통해 연구자들이 실험 설계 시 적절한 샘플 크기를 선택하고 신뢰성 있는 결과를 얻을 수 있도록 안내했습니다.

**연구의 의의**  

이 연구는 HTS 기반 실험의 성공을 위한 통계적 파워와 샘플 크기 계산의 중요성을 재조명했습니다. HTS 기술을 사용하는 연구자들에게는 실험 설계 시 데이터의 복잡성을 고려하여 적절한 통계적 방법을 적용하는 것이 필수적입니다. 이를 통해 과학적 연구의 신뢰성을 높이고, 더 나아가 생물학적 발견을 이루는 데 기여할 수 있습니다. 일반 대중에게는 HTS 기술이 얼마나 중요한 역할을 하는지, 그리고 이러한 실험에서 신뢰성 있는 결과를 얻기 위해서는 철저한 통계적 분석이 필요하다는 점을 알리는 중요한 계기가 될 것입니다.



NotebookLM

## 차세대 염기서열 분석(NGS) 기반 실험에서 통계적 검정력과 표본 크기 계산의 중요성

최근 생명 공학 분야에서는 차세대 염기서열 분석(NGS) 기술이 등장하면서 생명 현상을 분자 수준에서 이해하는 데 혁명적인 발전을 이루었습니다. NGS는 DNA나 RNA와 같은 유전 물질을 빠르게 해독하여 방대한 양의 유전 정보를 생성할 수 있는 기술입니다. 이러한 대규모 데이터를 기반으로 질병의 원인을 규명하고 개인 맞춤형 치료법을 개발하는 등 다양한 연구가 진행되고 있습니다. 하지만 NGS 기반 실험은 높은 비용과 복잡한 데이터 분석 과정 때문에 연구 설계 단계에서부터 신중한 고려가 필요합니다. 

특히, **통계적 검정력(Power)**과 **표본 크기**는 NGS 연구의 성공 여부를 결정하는 중요한 요소입니다. 통계적 검정력이란 실제로 효과가 존재할 때, 실험을 통해 해당 효과를 검출할 수 있는 확률을 의미합니다. 즉, 검정력이 높을수록 실험 결과의 신뢰성을 확보할 수 있습니다. 표본 크기는 연구 대상으로 삼는 개체 수를 의미하며, 통계적 검정력과 밀접한 관련이 있습니다. 일반적으로 표본 크기가 클수록 통계적 검정력이 높아지지만, NGS 실험의 경우 비용적인 제약으로 인해 무작정 표본 크기를 늘릴 수는 없습니다. 

제공해주신 자료 에 따르면, NGS 기반 실험의 전력 분석은 기존의 마이크로어레이 기반 실험보다 훨씬 복잡하다고 합니다. 그 이유는 NGS 데이터가 가지는 고유한 특징 때문입니다. 첫째, NGS 데이터는 **읽기 깊이(Read Depth)**와 **읽기 분산(Read Dispersion)**과 같은 요소들을 고려해야 합니다. 읽기 깊이는 특정 유전자 영역이 시퀀싱된 횟수를 의미하며, 읽기 분산은 각 유전자 영역에 대한 읽기 횟수의 변동을 나타냅니다. 둘째, NGS는 DNA 시퀀싱, RNA 시퀀싱, 메타게놈 시퀀싱 등 다양한 분야에 활용될 수 있으며, 각각의 적용 분야에 따라 데이터의 특성과 분석 목표가 달라지기 때문에 전력 분석 방법 또한 다르게 적용되어야 합니다.

NGS 기반 실험에서 통계적 검정력과 표본 크기를 정확하게 계산하기 위해서는 다양한 요소들을 종합적으로 고려해야 합니다. 예를 들어, 연구 목표, 데이터 유형, 분석 방법, 효과 크기, 유의 수준, 예산 등을 고려하여 최적의 표본 크기를 결정해야 합니다.  

**결론적으로, NGS 기반 실험의 성공을 위해서는 연구 설계 단계에서부터 통계적 검정력과 표본 크기에 대한 심층적인 고려가 필수적입니다.** NGS 데이터의 복잡성과 다양한 연구 목표를 고려하여 적절한 전력 분석 방법을 적용하고 최적의 표본 크기를 결정함으로써, 연구 결과의 신뢰성을 확보하고 효율적인 연구를 수행할 수 있습니다. 


결론적으로, NGS 기반 실험의 성공을 위해서는 연구 설계 단계에서부터 통계적 검정력과 표본 크기에 대한 심층적인 고려가 필수적입니다. 결국 잘 해야한다는 얘기 되겠습니다. 

샘플 개수가 작으면 유의미한 결과를 도출 할 수 없고, 샘플 개수가 너무 많이 필요하면 비용이 어마무시하게 많이 소요될 수 있으니깐요. 적절한 점을 잘 찾아야 할 듯 합니다.

우리들의 clova-x 曰 논문을 읽어보니 Negative Binomial 모델이 괜찮아 보인다고하네요.

모두들 10월의 마지막날을 잘 보내시기 바랍니다. :)


출처: @candyz_hyojung


수요일, 10월 30, 2024

멕시코 여성의 유방암, 유전자에 답이 있을까? - BRCA 유전자 변이 연구 이야기

오늘은 2019년도에 출판되었던 논문을 가져와봤습니다. 제목은 Analysis of the pathogenic variants of BRCA1 and BRCA2 using next-generation sequencing in women with familial breast cancer: a case–control study. 으로 멕시코 여성들의 BRCA1/2 변이에 대해서 연구한 내용입니다. 


DOI: 10.1186/s12885-019-5950-4


gemini

## 멕시코 여성의 유방암, 유전자에 답이 있을까? - BRCA 유전자 변이 연구 이야기

안녕하세요! 오늘은 좀 어려운 주제지만, 우리 건강과 밀접한 관련이 있는 유전자 이야기를 해볼까 합니다. 바로 **유방암 발병과 깊은 연관이 있는 BRCA 유전자**에 대한 연구인데요, 멕시코 북동부 지역 여성들을 대상으로 흥미로운 연구 결과가 나왔다고 해서 소개해드리려고 합니다.

### 왜 멕시코 여성을 대상으로 연구했을까요? 🤔

우리 몸의 세포에는 유전 정보를 담고 있는 DNA가 있고, DNA는 여러 개의 유전자로 이루어져 있습니다. 이 중 BRCA1, BRCA2 유전자는 **유방암을 억제하는 중요한 역할**을 하는데요, 이 유전자에 변이가 생기면 유방암에 걸릴 확률이 높아진다고 알려져 있습니다. 

그런데 이 BRCA 유전자 변이는 **인종이나 지역에 따라 그 빈도가 다르게 나타날 수 있습니다.** 멕시코는 다양한 인종이 섞여 있는 나라인데, 특히 북동부 지역은 유전적으로 독특한 특징을 가지고 있어 이 지역 여성들을 대상으로 연구를 진행하게 되었다고 합니다. 

### 연구 결과는 어땠을까요? 🔬

40세 이하의 유방암 환자, 50세 이상의 유방암 환자, 그리고 건강한 여성 그룹으로 나누어 BRCA 유전자 변이를 분석한 결과, 40세 이하 유방암 환자 그룹에서 **13.8%**의 여성이 BRCA 유전자 변이를 가지고 있는 것으로 나타났습니다. 특히 **삼중 음성 유방암**이라는 유형의 유방암을 가진 여성의 경우 변이 빈도가 **40%**까지 높아졌다고 하네요.

### 멕시코 여성에게만 나타나는 특이한 변이도 있었다고요? 😮

놀랍게도 이번 연구에서는 기존에 보고된 적 없는 새로운 BRCA1 유전자 변이가 발견되었습니다! 33세에 양측 유방암과 삼중 음성 유방암 진단을 받은 여성에게서 발견된 이 변이는 유전자의 기능을 손상시켜 유방암 발생 위험을 높이는 것으로 예측됩니다.

### 앞으로 더 연구해야 할 것은 무엇일까요? 🧐

이번 연구는 멕시코 북동부 지역 여성들의 유방암 예방 및 치료에 중요한 정보를 제공합니다. 특히 유전자 검사를 통해 BRCA 유전자 변이를 확인하고, **변이가 발견된 여성들에게는 정기적인 검진과 예방적 치료를 통해 유방암 발생 위험을 낮출 수 있는 방법을 제공**할 수 있습니다. 

하지만 아직까지 유전자 변이와 유방암 발생 사이의 정확한 메커니즘, 그리고 개인별 맞춤형 치료법 개발 등 더 많은 연구가 필요합니다. 앞으로 더 많은 연구를 통해 유방암으로부터 여성들을 보호할 수 있기를 기대해 봅니다!



chatGPT

**멕시코 북동부 지역에서 BRCA 유전자 변이를 조사한 이유와 결과**

유방암은 전 세계적으로 여성에게 가장 흔한 암 중 하나이며, 많은 여성의 건강을 위협하는 중요한 질환입니다. 특히 유전적 요인이 유방암 발생에 큰 영향을 미친다는 사실이 알려지면서, BRCA1과 BRCA2 유전자가 중요한 역할을 한다는 연구가 활발히 진행되고 있습니다. 최근 멕시코 북동부 지역을 대상으로 한 연구에서 이 유전자의 변이가 얼마나 자주 발생하는지, 그리고 이런 변이가 유방암 발병에 어떤 영향을 미치는지 조사되었습니다.

### 왜 BRCA 유전자를 조사했을까?

BRCA1과 BRCA2 유전자는 우리 몸의 세포가 제대로 작동하고, 손상된 DNA를 복구하는 데 중요한 역할을 합니다. 하지만 이 유전자에 변이가 생기면 유방암이나 난소암 같은 암이 발생할 위험이 매우 높아집니다. 특히 가족력이 있는 경우, 이 유전자 변이를 가진 여성은 평생 동안 50-85%의 확률로 유방암에 걸릴 수 있다고 알려져 있습니다.

이 연구는 멕시코 북동부 지역에서 유방암의 가족력이 있거나 유전적 요인이 의심되는 여성들을 대상으로 진행되었습니다. 그동안 많은 연구가 미국이나 유럽에서 진행되었지만, 라틴 아메리카, 특히 멕시코 지역에 대한 정보는 부족했습니다. 연구진은 이 지역의 여성들에게서 BRCA 유전자 변이가 얼마나 흔한지 알아보고, 이를 통해 해당 변이와 유방암의 관계를 명확히 하고자 했습니다.

### 연구에서 얻은 주요 결과는?

연구는 총 195명의 여성을 대상으로 진행되었습니다. 이 중 101명은 유전적 요인이 의심되는 고위험군에 속했고, 22명은 산발적으로 발생한 유방암 환자였으며, 72명은 건강한 여성이었습니다. 이들의 DNA를 분석한 결과, 고위험군의 13.8%가 BRCA1 또는 BRCA2 유전자 변이를 가지고 있는 것으로 확인되었습니다. 특히 삼중 음성 유방암(호르몬 수용체와 HER2 수용체가 모두 없는 유형) 환자에서는 변이 빈도가 40%로 매우 높게 나타났습니다.

연구 결과는 이 지역 여성들 사이에서 BRCA 유전자 변이 빈도가 다른 인구 집단과 유사하다는 것을 보여주었으며, 특히 삼중 음성 유방암 환자에서는 BRCA 유전자 검사의 필요성이 강조되었습니다. 즉, 특정 임상적 특성을 가진 환자들은 유전자 검사를 받아야 한다는 것을 확인한 것입니다.

### 앞으로 더 논의되어야 할 내용은?

이 연구는 멕시코 북동부 지역에서 BRCA1과 BRCA2 유전자 변이가 어느 정도 발생하는지 밝히는 중요한 첫걸음을 내딛었지만, 추가 연구가 필요합니다. 연구진은 변이 유형과 관련된 정보가 여전히 부족하다는 점을 강조하며, 멕시코와 같은 유전적 다양성이 높은 지역에서는 더 많은 연구가 필요하다고 지적했습니다.

또한, 이 연구는 유방암 위험이 높은 여성들이 유전자 검사를 받을 수 있도록 적극적으로 권장해야 한다는 메시지를 전달합니다. 유전자 검사 결과에 따라 개인 맞춤형 암 예방 및 치료 전략을 세우는 것이 가능하며, 이를 통해 암 발생 위험을 줄일 수 있을 것입니다.

### 결론

이 연구는 멕시코 북동부 지역의 BRCA1과 BRCA2 유전자 변이 빈도를 처음으로 체계적으로 조사한 중요한 연구입니다. 유전적 요인이 중요한 역할을 하는 유방암의 경우, 조기 검진과 유전자 검사를 통해 적절한 예방 조치를 취하는 것이 매우 중요합니다. 특히 가족력이 있거나 삼중 음성 유방암과 같은 특정 유형의 암에 걸린 환자라면 유전자 검사를 통해 변이 여부를 확인하고, 이를 통해 암 예방과 치료에 도움을 받을 수 있습니다.

이 연구는 멕시코뿐만 아니라 다른 지역에서도 유전적 특성을 이해하고, 이를 기반으로 한 맞춤형 치료의 필요성을 강조하는 중요한 자료로 활용될 수 있을 것입니다.



clova-x

제목: 멕시코 북동부 여성의 BRCA 유전자 변이 연구 결과

안녕하세요, 오늘은 생명공학 분야에서 중요한 연구 결과 하나를 소개해드리려고 합니다. 바로 멕시코 북동부 지역 여성들을 대상으로 한 BRCA 유전자 변이에 대한 연구입니다.

BRCA 유전자는 인간의 유전 정보를 담고 있는 DNA 중 유방암 및 난소암과 관련된 변이를 가지고 있는 유전자입니다. 이 유전자의 변이 여부는 암의 조기 진단 및 예방, 치료에 큰 영향을 미치기 때문에, 많은 연구가 이루어지고 있습니다.

이번 연구는 멕시코 북동부 지역의 여성들을 대상으로 BRCA1과 BRCA2 유전자의 변이 빈도를 조사하였습니다. 그 이유는 멕시코는 지리적, 인종적으로 다양한 특성을 가지고 있어, 이 지역 여성들의 유전자 변이 패턴을 파악하는 것이 다른 지역과의 비교를 통해 유전성 유방암의 예방 및 치료에 대한 이해를 높이는 데 도움이 될 것으로 기대했기 때문입니다.

연구진은 총 세 그룹의 여성들을 대상으로 연구를 진행했습니다. 첫 번째 그룹은 40세 이하의 유방암 진단을 받았거나 유전성 유방암 위험 요인이 있는 여성 101명, 두 번째 그룹은 50세 이상의 산발성 유방암 환자 22명, 마지막 그룹은 건강한 여성 72명이었습니다.

혈액 샘플에서 DNA를 추출하여 차세대 염기서열 분석을 수행한 결과, BRCA1과 BRCA2 유전자의 변이가 발견되었으며, 특히 40세 이하의 유방암 환자 그룹에서 높은 빈도로 발견되었습니다. 또한, 삼중 음성 아형을 가진 환자에서 유전자 돌연변이 빈도가 40%로 높았습니다.

삼중 음성 유방암은 에스트로겐 수용체, 프로게스테론 수용체, HER2 단백질이 모두 음성인 유방암으로, 다른 유형의 유방암보다 공격적이고 예후가 좋지 않은 것으로 알려져 있습니다. 이번 연구 결과는 삼중 음성 유방암과 BRCA 유전자 변이 사이의 연관성을 보여주는 것으로, 이에 대한 추가적인 연구가 필요함을 시사합니다.

이번 연구는 멕시코 북동부 지역 여성들의 BRCA 유전자 변이에 대한 이해를 높이는 데 큰 역할을 했으며, 이를 바탕으로 유전성 유방암의 예방 및 치료에 대한 보다 효과적인 접근 방법을 개발할 수 있을 것으로 기대됩니다. 또한, 이번 연구 결과는 인종적, 지리적 다양성이 유전자 변이에 미치는 영향을 보여주는 사례로, 다른 지역에서도 이와 유사한 연구가 이루어져야 할 것입니다.



NotebookLM

## 멕시코 여성에게서 나타나는 BRCA 유전자 변이, 그리고 유방암

**유방암은 전 세계 여성들에게 가장 흔한 암**이며, 특히 개발도상국에서는 주요 사망 원인이기도 합니다. 유방암 중에서도 **약 10%는 유전적인 요인**으로 발생하는데, 그중 **BRCA1과 BRCA2 유전자의 변이는 15-40%를 차지**합니다. BRCA 유전자는 DNA 손상을 복구하고 세포 성장을 조절하는 중요한 역할을 하지만, 이 유전자에 변이가 생기면 유방암, 난소암 등 여러 암 발생 위험이 크게 증가하게 됩니다. 

**이 연구는 멕시코 북동부 지역 여성들을 대상으로 BRCA1, BRCA2 유전자 변이의 빈도를 조사하고, 이 변이가 유방암 발생과 어떤 관련성을 가지는지 알아보기 위해 진행되었습니다.** 특히, 이 지역은 유럽, 아프리카, 아메리카 원주민의 유전적 혼합으로 인해 BRCA 유전자 변이에 대한 정보가 부족했기 때문에 이 연구가 중요한 의미를 가집니다.

### 연구는 어떻게 진행되었을까요?

연구팀은 멕시코 북동부 지역의 여성들을 세 그룹으로 나누어 연구를 진행했습니다. 

* **1군**: 40세 이하의 유방암 환자 또는 유전성 유방암 위험 요인을 가진 여성 101명 

* **2군**: 50세 이상의 산발성 유방암 환자 22명 

* **3군**: 건강한 여성 72명

각 그룹 참가자들의 혈액 샘플에서 DNA를 추출하여 차세대 염기서열 분석(NGS)을 통해 BRCA1, BRCA2 유전자의 변이를 분석했습니다.

### 연구 결과는?

* **1군 (40세 이하 유방암 환자 또는 유전성 유방암 위험 요인을 가진 여성) 에서는 13.8%의 여성에게서 BRCA 유전자 변이가 발견되었습니다.** 이 중 BRCA1 유전자 변이를 가진 여성은 12명, BRCA2 유전자 변이를 가진 여성은 2명이었습니다.

* **2군 (50세 이상의 산발성 유방암 환자) 에서는 2명의 여성에게서 BRCA1 유전자 변이가 발견되었으며, 3군 (건강한 여성) 에서는 BRCA 유전자 변이가 발견되지 않았습니다**.

* 특히 **삼중 음성 유방암** 아형을 가진 1군 여성의 경우, **무려 40%에서 BRCA 유전자 변이가 발견**되었습니다. **삼중 음성 유방암**은 에스트로겐 수용체, 프로게스테론 수용체, HER2 수용체가 모두 음성인 유방암으로, 예후가 좋지 않고 치료법이 제한적인 유형입니다.

### 이 연구 결과가 말해주는 것은?

* 멕시코 북동부 지역 여성의 **BRCA 유전자 변이 빈도는 다른 인구 집단에서 보고된 것과 유사한 수준**입니다. 

* **젊은 여성의 유방암 발생률이 예상보다 높게 나타났으며**, 이는 BRCA 유전자 변이 검사의 필요성을 시사합니다. 

* **특히 삼중 음성 유방암 환자의 경우 BRCA 유전자 변이 빈도가 매우 높기 때문에 유전자 검사를 통해 적절한 치료 방향을 결정하는 것이 중요합니다**.

### 앞으로 더 논의되어야 할 점은?

* 멕시코는 다양한 인종이 혼재된 국가이기 때문에, 지역별 BRCA 유전자 변이 빈도와 유형을 더 자세히 조사할 필요가 있습니다.

* BRCA 유전자 변이를 가진 여성들의 유방암 발생 위험을 낮추기 위한 예방 전략과, 효과적인 치료법 개발에 대한 연구가 더 필요합니다.

* 유전자 검사 비용 부담, 검사 결과에 대한 오해, 사회적 차별 등 유전자 검사 접근성을 제한하는 요인들을 해결하기 위한 노력이 필요합니다.

이 연구는 BRCA 유전자 변이가 멕시코 여성의 유방암 발생에 미치는 영향을 이해하는 데 중요한 기반을 마련했습니다. 앞으로 더 많은 연구와 논의를 통해 유방암 예방과 치료, 그리고 유전자 검사의 접근성을 향상시키는 데 기여할 수 있기를 기대합니다. 



claude

안녕하세요, 오늘은 멕시코에서 진행된 흥미로운 유방암 연구에 대해 이야기해보려 합니다. 

우리는 종종 유방암에 대해 듣게 되는데요, 그중에서도 '유전성 유방암'이라는 말을 들어보셨나요? 이는 특정 유전자의 변화로 인해 발생하는 유방암을 말합니다. 그 중심에 있는 유전자가 바로 BRCA1과 BRCA2입니다.

왜 이 연구를 했을까요?

1. 지역적 특성 이해: 유전자 변이는 지역과 인종에 따라 다르게 나타날 수 있어요. 멕시코 북동부 지역의 특성을 이해하기 위해 이 연구를 진행했습니다.

2. 효과적인 검진 방법 개발: 어떤 사람들이 유전자 검사를 받아야 하는지 결정하는 데 도움이 됩니다.

3. 맞춤 의료의 기초: 개인의 유전적 특성에 맞는 치료 방법을 개발하는 데 중요한 정보를 제공합니다.

연구 결과 무엇을 알게 되었나요?

1. 변이 빈도: 고위험군 여성 중 약 14%가 BRCA1 또는 BRCA2 유전자에 변이가 있었습니다. 이는 다른 나라의 연구 결과와 비슷한 수준이에요.

2. 특정 유형의 유방암과의 연관성: BRCA 유전자 변이가 있는 사람들 중 65%가 '삼중음성 유방암'이라는 특정 유형의 유방암을 가지고 있었습니다. 이는 매우 중요한 발견인데요, 이 유형의 유방암 환자들에게 유전자 검사를 권유해볼 만하다는 뜻입니다.

3. 모유 수유의 중요성: 흥미롭게도, 유전자 변이가 있는 여성들 중 모유 수유를 한 비율이 더 낮았어요. 이는 모유 수유가 유방암 예방에 도움이 될 수 있다는 기존의 연구 결과를 뒷받침합니다.

4. 검사 방법의 중요성: 연구팀은 두 가지 다른 방법으로 유전자를 검사했는데, 둘 다 중요한 것으로 나타났습니다. 이는 정확한 진단을 위해 여러 방법을 병행해야 한다는 점을 시사합니다.

이 연구 결과는 어떤 의미가 있을까요?

1. 맞춤형 검진: 특정 유형의 유방암 환자나 가족력이 있는 사람들에게 유전자 검사를 권유할 수 있게 되었습니다.

2. 예방의 중요성: 모유 수유와 같은 생활 습관이 유전적 위험을 가진 사람들에게도 도움이 될 수 있다는 점을 확인했습니다.

3. 정확한 진단: 여러 검사 방법을 병행해야 한다는 점을 알게 되어, 앞으로 더 정확한 진단이 가능해질 것입니다.

4. 지역 맞춤 의료: 멕시코 북동부 지역의 특성을 이해함으로써, 이 지역 주민들에게 더 적합한 의료 서비스를 제공할 수 있게 되었습니다.

앞으로 더 연구해야 할 점은 무엇일까요?

1. 다른 지역과의 비교: 멕시코의 다른 지역이나 다른 나라와 비교 연구를 통해 더 넓은 이해를 얻을 수 있을 것입니다.

2. 예방 전략: 모유 수유 외에 다른 생활 습관이 유전적 위험을 줄일 수 있는지 연구할 필요가 있습니다.

3. 치료법 개발: 이런 유전적 특성을 가진 환자들에게 가장 효과적인 치료법은 무엇인지 연구해야 합니다.

이 연구는 유방암 예방과 치료에 있어 큰 진전을 이루었습니다. 우리 모두가 건강에 대해 더 관심을 가지고, 필요하다면 의사와 상담하여 적절한 검진을 받는 것이 중요하다는 점을 다시 한 번 상기시켜주는 연구 결과였습니다.


오늘은 간만에 claude를 사용해봤습니다. 이유는!! 논문의 양이 무료이용범위안에 허용되어서 입니다. ;) 

NGS는 시간도 절약하고 비용 효율적이면서 민감도와 특이도가 높아서 유전자 검사에 용이(지금은 누구나 알고 있지만)하나 MLPA와 같은 다른 기술을 함께 사용하면 더 좋은 결과(aka 정확도를 높이는)를 얻을 수 있어서 임상의들의 결정에 중요하다고 하네요.

중남미국가에서 대규모의 195명의 환자를 대상으로 연구를 했다는것에 의의가 있지 않을까 합니다. :)


출처: @ye._.vely618


월요일, 10월 28, 2024

개인프로젝트 -GTAA 계산하기-

오늘은 자산분배 방법 중에 GTAA를 작성하였습니다.

오늘의 코드는 여기 ↓↓↓↓↓

strategy_GTAA.py


근데 지난번 다른 자산분배전략 부터 모멘텀 스코어를 계산할 수 없음에도 불구하고 포트폴리오를 구성하는 문제가 존재하고 있습니다. 이 문제는 조만간 확인해서 수정한 코드를 업데이트 하도록 하겠습니다. 당연히 chatGPT한테 물어봐서 작성하고 있는데, 놓치고 있는 듯 하더라구요 ㅎㅎ 



출처: @ye._.vely618


RNA-Seq 데이터로 SNP를 찾아내보자

오늘은 오랜만에 예전에(10년이 넘었네요;;;) 출판된 RNA-seq에서 SNP를 식별하는 논문을 가져와봤습니다. 제목은 Reliable Identification of Genomic Variants from RNA-Seq Data 입니다. RNA-seq 데이터가지고 SNP를 식별하는 것을 좀 거부감이 있었... 혹시 나만 그런거였나.. 
그러나 요즘엔 RNA-seq 가지고 SNP를 탐지하는 것이 이상하지 않죠.
그래서 옛날옛적엔 어떤 아이디어로 접근했었는지 확인해보려고 한번 가져와봤습니다




gemini
## RNA-seq 데이터로 유전체 변이 찾기: SNPiR 이야기
### 우리 몸의 설계도, 유전체
우리 몸은 하나의 정교한 기계와 같습니다. 이 기계를 만드는 설계도가 바로 유전체(genome)입니다. 유전체는 A, T, G, C 네 가지 염기로 이루어진 긴 염기 서열로, 이 서열의 차이가 사람마다 다른 특징을 만들어냅니다. 이러한 염기 서열의 차이 중 하나가 바로 SNP(Single Nucleotide Polymorphism)입니다. SNP는 단 하나의 염기가 다른 사람과 다르게 나타나는 현상을 말하며, 이러한 SNP들이 질병 발생이나 특정 형질에 영향을 미칠 수 있습니다.
### 유전체 분석 방법: WGS, WES, 그리고 RNA-seq
유전체를 분석하는 방법에는 여러 가지가 있습니다. 대표적인 방법으로는 Whole Genome Sequencing(WGS), Whole Exome Sequencing(WES), 그리고 RNA Sequencing(RNA-seq)이 있습니다.
* **WGS (Whole Genome Sequencing):** 유전체 전체를 낱낱이 해독하는 방법입니다. 가장 많은 정보를 얻을 수 있지만, 비용이 많이 들고 분석 시간이 오래 걸리는 단점이 있습니다.
* **WES (Whole Exome Sequencing):** 유전체 중에서 단백질을 만드는 데 직접적인 역할을 하는 부분인 엑솜만을 해독하는 방법입니다. WGS에 비해 비용이 적게 들고 분석 시간이 짧지만, 엑솜 이외의 부분에 있는 유전 변이는 찾아낼 수 없습니다.
* **RNA-seq (RNA Sequencing):** 유전체 정보가 실제로 어떻게 활용되는지를 분석하는 방법입니다. 유전체 정보는 RNA라는 중간 매개체를 거쳐 단백질로 만들어지는데, RNA-seq은 이러한 RNA를 직접 분석하여 어떤 유전자가 활성화되어 있는지, 어떤 유전자에 변이가 있는지를 파악합니다.
### 왜 RNA-seq으로 SNP를 찾을까?
일반적으로 SNP를 찾을 때는 WGS나 WES를 많이 사용합니다. 그런데 왜 RNA-seq으로 SNP를 찾으려고 할까요? 그 이유는 다음과 같습니다.
* **특정 조건에서 발현되는 유전자의 변이를 찾을 수 있다:** RNA-seq은 특정 조건에서 활성화되는 유전자의 변이를 찾는 데 유리합니다. 예를 들어, 특정 질병에 걸린 환자의 RNA-seq 데이터를 분석하면, 질병과 관련된 유전자의 변이를 더 정확하게 찾아낼 수 있습니다.
* **비용 효율적이다:** WGS나 WES에 비해 비용이 적게 듭니다.
* **발현되는 변이에 집중할 수 있다:** RNA-seq은 실제로 단백질로 만들어지는 부분의 변이에 집중하기 때문에, 질병과의 연관성을 밝히는 데 더 효과적일 수 있습니다.
### SNPiR: RNA-seq 데이터에서 SNP를 더 정확하게 찾는 방법
SNPiR은 RNA-seq 데이터에서 SNP를 찾는 새로운 방법입니다. 기존의 방법보다 더 정확하게 SNP를 찾아낼 수 있다는 장점이 있습니다. SNPiR이 기존 방법보다 좋은 이유는 다음과 같습니다.
* **더 높은 정확도:** SNPiR은 기존 방법보다 더 높은 정확도로 SNP를 찾아냅니다.
* **더 많은 발현된 변이 발견:** SNPiR은 기존 방법보다 더 많은 발현된 변이를 찾아냅니다.
* **비용 효율적:** SNPiR은 WGS나 WES에 비해 비용이 적게 듭니다.
### 결론
RNA-seq 데이터를 이용하여 SNP를 찾는 것은 유전체 연구의 새로운 가능성을 열어줍니다. 특히 SNPiR과 같은 새로운 방법의 개발은 더욱 정확하고 효율적인 유전체 분석을 가능하게 합니다. 이러한 연구는 질병의 원인 규명, 새로운 치료법 개발 등 다양한 분야에 활용될 수 있을 것으로 기대됩니다.
**핵심 정리**
* SNP는 유전체 염기 서열의 차이를 의미하며, 질병 발생과 관련이 있을 수 있습니다.
* RNA-seq은 유전체 정보가 실제로 어떻게 활용되는지를 분석하는 방법입니다.
* SNPiR은 RNA-seq 데이터에서 SNP를 더 정확하게 찾는 새로운 방법입니다.
* SNPiR은 기존 방법보다 더 높은 정확도로 SNP를 찾아내고, 비용 효율적입니다.


clova-x
제목: RNA-seq 데이터에서 SNP를 식별하는 SNPiR 방법이란?
생명공학 분야에서는 유전자 변이를 파악하는 것이 중요한데, 이를 위해 그동안은 비용이 많이 드는 Whole Genome Sequencing(WGS), Whole Exome Sequencing(WES) 방법을 주로 사용해왔습니다. 하지만 최근에는 RNA 시퀀싱 데이터를 활용하여 유전자 변이를 파악하는 연구가 활발하게 이루어지고 있습니다.
RNA-seq 데이터에서 SNP를 식별하는 이유는 크게 두 가지입니다. 첫째, RNA-seq은 유전자의 발현량을 측정할 수 있을 뿐만 아니라, 변이를 동시에 파악할 수 있어 유용합니다. 둘째, RNA-seq은 WGS나 WES에 비해 비용이 저렴하고, 다양한 생물종에서 적용할 수 있습니다.
하지만 RNA-seq 데이터에서 SNP를 식별하는 것은 전사체의 복잡성으로 인해 쉽지 않은 일입니다. 이러한 문제를 해결하기 위해 SNPiR이라는 방법이 개발되었습니다. SNPiR은 splice-aware 방식으로 RNA-seq 데이터를 매핑하고, 변이를 호출한 후, false-positive를 강력하게 필터링하는 방법입니다.
기존의 RNA-seq 데이터에서 SNP를 식별하는 방법에 비해 SNPiR은 다음과 같은 장점이 있습니다. 먼저, splice-aware 방식을 사용하여 정확한 매핑이 가능합니다. 그리고 변이 호출 및 필터링 과정에서 false-positive를 효과적으로 제거하여 높은 정확도를 보장합니다. 마지막으로, RNA-seq 데이터의 특성을 고려하여 개발되었기 때문에, 다른 방법에 비해 더욱 효율적입니다.
이러한 SNPiR 방법을 통해 RNA-seq 데이터에서 SNP를 식별함으로써, 유전자 변이 연구에 큰 도움이 될 것으로 기대됩니다.


chatGPT
### RNA-Seq 데이터로 유전자 변이를 찾아내는 새로운 방법: SNPiR
유전자와 질병의 관계를 이해하는 중요한 방법 중 하나는 **단일염기 다형성(SNP, Single Nucleotide Polymorphism)**을 찾아내는 것입니다. SNP는 유전자 서열의 작은 변화로, 개개인의 차이를 만들어내고 질병의 원인이 될 수 있습니다. 기존에는 주로 **전체 유전체 시퀀싱(Whole Genome Sequencing, WGS)**이나 **전체 엑솜 시퀀싱(Whole Exome Sequencing, WES)** 같은 DNA 기반 기술을 통해 SNP를 찾아냈습니다. 하지만 이번 연구는 **RNA 시퀀싱(RNA-seq)** 데이터를 활용해 SNP를 더 효율적으로 찾아내는 방법을 제안합니다. 여기서 사용된 방법이 바로 **SNPiR**라는 기술입니다.
#### 1. 연구 배경
왜 우리는 RNA 시퀀싱을 통해 SNP를 찾아내려고 할까요? 전통적인 WGS나 WES는 이미 잘 알려진 방법인데도 말이죠. 그 이유는 RNA-seq가 몇 가지 독특한 장점을 가지고 있기 때문입니다.
- **비용 효율성**: RNA-seq는 WGS에 비해 비용이 저렴합니다. 많은 연구에서 이미 RNA-seq 데이터를 수집한 상태이기 때문에, 별도의 비용 없이 추가 분석을 통해 SNP를 찾아낼 수 있습니다.
- **유전자 발현 분석**: RNA-seq는 어떤 유전자가 활성화되고 있는지 보여주기 때문에, 변이가 실제로 발현되는 유전자에 있는지 알 수 있습니다. 이는 질병 연구에서 중요한 정보입니다.
#### 2. RNA-seq를 통한 SNP 탐지의 장점과 단점
RNA-seq를 통해 SNP를 찾아내는 것에는 분명한 장점이 있지만, 단점도 존재합니다.
##### 장점:
- **기존 데이터 활용**: 많은 질병 샘플에 대해 이미 RNA-seq 데이터를 가지고 있는 경우, 추가로 WGS나 WES를 수행하지 않고도 변이를 찾아낼 수 있습니다.
- **유전자 발현 정보**: RNA-seq 데이터는 발현 중인 유전자에서만 변이를 탐지할 수 있기 때문에, 기능적으로 중요한 변이를 더 쉽게 찾을 수 있습니다.
##### 단점:
- **전체 유전체 커버리지 부족**: RNA-seq는 발현 중인 유전자에서만 변이를 찾을 수 있기 때문에, 발현되지 않은 유전자나 비암호화 영역에서는 변이를 탐지할 수 없습니다.
- **기술적 복잡성**: RNA는 전사체의 복잡성(예: 스플라이싱) 때문에 분석이 더 어렵습니다. 잘못된 위치에 읽힘이 매핑되면 거짓 양성 결과가 나올 수 있습니다.
#### 3. SNPiR: RNA-seq 데이터를 활용한 SNP 탐지 방법
이번 연구에서 제안된 **SNPiR** 방법은 RNA-seq 데이터를 활용해 고도로 정확하게 SNP를 찾아낼 수 있는 알고리즘입니다. 이 방법의 핵심은 다음과 같습니다:
- **스플라이싱 인식 매핑**: RNA-seq 데이터는 유전자가 어떻게 조합되어 발현되는지 보여주기 때문에, SNPiR은 이러한 스플라이싱 정보를 인식하면서 매핑을 진행합니다.
- **GATK를 통한 변이 탐지**: Genome Analysis Toolkit(GATK)를 활용해 변이를 탐지하고, 엄격한 필터링 과정을 통해 잘못된 결과를 걸러냅니다.
SNPiR은 WGS 또는 WES 데이터와 비교했을 때 98% 이상의 정확도를 기록하며, 매우 높은 민감도를 보여줍니다.
#### 4. 다른 방법과의 비교: SNPiR vs. RNASEQR
SNPiR은 기존의 **RNASEQR**이라는 RNA-seq 변이 탐지 방법보다 더 나은 성능을 보였습니다. RNASEQR은 많은 거짓 양성 결과를 생성했지만, SNPiR은 더 적은 오류로 더 높은 정확도를 보여주었습니다. 특히 **코딩 영역**에서의 변이 탐지 민감도가 SNPiR이 RNASEQR보다 훨씬 높았습니다. 따라서 RNA-seq 데이터를 사용해 SNP를 찾는다면 **SNPiR**이 더 나은 선택입니다.
#### 5. 결론
RNA-seq 데이터를 통해 SNP를 찾는 방법은 기존의 WGS나 WES 방법을 보완할 수 있는 중요한 도구입니다. 특히 비용 효율성과 발현 유전자에서의 변이 탐지라는 장점 덕분에 RNA-seq를 통한 SNP 탐지는 앞으로도 더 많이 활용될 가능성이 큽니다. **SNPiR**은 그 중에서도 높은 정확성과 민감도를 자랑하는 방법으로, 유전체 연구나 질병 연구에 매우 유용할 것입니다.


NotebookLM
## RNA Sequencing 데이터를 이용한 SNP 식별: SNPiR 소개
**유전체 변이는 개인의 특징을 결정하는 중요한 요소**이며, 질병 발생과도 밀접한 관련이 있습니다. 이러한 유전체 변이를 정확하게 식별하는 것은 질병 메커니즘 이해, 진단 및 치료법 개발에 필수적입니다. 기존에는 **WGS (Whole Genome Sequencing)** 나 **WES (Whole Exome Sequencing)** 와 같은 DNA 염기서열 분석 방법을 통해 유전체 변이를 식별해왔습니다. 하지만 이러한 방법은 **비용이 많이 들고**, 분석 과정이 복잡하다는 단점이 있습니다.
최근에는 RNA Sequencing 데이터를 이용하여 유전체 변이를 식별하는 **RNA-seq** 방법이 주목받고 있습니다. **RNA-seq**는 DNA 염기서열 분석보다 **저렴**하며, 유전자 발현량, alternative splicing, allele-specific expression 등 다양한 정보를 얻을 수 있다는 장점이 있습니다.
### RNA-seq 기반 SNP 식별의 장단점
**장점**:
* **비용 효율성**: RNA-seq 데이터는 DNA 염기서열 분석보다 저렴합니다.
* **발현된 유전자에 대한 정보**: RNA-seq 데이터는 실제로 발현되는 유전자에 대한 정보를 제공하기 때문에, 유전체 변이가 유전자 발현에 미치는 영향을 파악하는데 유용합니다.
**단점**:
* **발현되지 않는 유전자**: RNA-seq는 발현되는 유전자만 분석 가능하기 때문에, 발현되지 않는 유전자의 변이는 찾을 수 없습니다.
* **RNA editing**: RNA-seq 데이터에서 RNA editing과 유전체 변이를 구분하는 것이 어려울 수 있습니다.
### SNPiR: RNA-seq 기반 SNP 식별의 새로운 방법
기존의 RNA-seq 기반 SNP 식별 방법은 정확도가 낮고, 분석 과정이 복잡했습니다. 이러한 문제점을 해결하기 위해 **SNPiR**이라는 새로운 방법이 개발되었습니다. **SNPiR**은 다음과 같은 특징을 가지고 있습니다.
* **splice-aware read mapping**: RNA splicing을 고려하여 read를 정확하게 mapping합니다.
* **GATK 기반 variant calling**: GATK (Genome Analysis Toolkit)을 사용하여 정확하게 변이를 calling합니다.
* **엄격한 filtering**: false-positive를 효과적으로 제거하기 위한 엄격한 filtering 과정을 거칩니다.
**SNPiR**은 기존 방법보다 **높은 정확도와 민감도**를 보여주며, RNA-seq 데이터에서 SNP를 효과적으로 식별할 수 있습니다. 또한, SNPiR은 **낮은 coverage 데이터에서도** 높은 정확도를 유지하며, 적은 양의 데이터로도 효율적인 분석이 가능합니다.
### SNPiR의 활용 가능성
**SNPiR**은 유전체 연구, 질병 연구, 맞춤형 의료 등 다양한 분야에서 활용될 수 있습니다. 특히 **암 유전체 연구**에서 **SNPiR**을 이용하여 암세포 특이적인 유전체 변이를 식별하고, 이를 바탕으로 새로운 치료법 개발에 기여할 수 있습니다.
### 결론
**SNPiR**은 RNA-seq 데이터를 이용하여 유전체 변이를 효과적으로 식별할 수 있는 새로운 방법입니다. **높은 정확도와 민감도**, 낮은 coverage 데이터에서의 성능, 다양한 분야에서의 활용 가능성을 고려했을 때, **SNPiR**은 유전체 연구의 새로운 지평을 열어줄 것으로 기대됩니다.

당시 나와있었던 RNAseq 기반의 SNP 탐지 프로그램들 보다 SNPiR이 좀 더 나은 성능을 보여준다고 서술하고 있지만... 그거야 너님들이 사용한 데이터 가지고 그런거 이지 않을까합니다. 실제 다른 상황의 샘플들 가져오면 이전에 나와서 사용하던 것들이나 이번것이나 도토리 키재기이지 않을까 하지만 그래도 우리에게 또 하나의 무기가 생기는 것이니깐 잘 활용하면 좋을듯 합니다.
최근에 새롭게 나온 RNAseq 기반의 SNP 탐지 툴은 없는지 다시 확인해봐야 겠네요. 
그래봤자 알파폴드나 gatk로 해쳐모여 할듯하긴한데.. :)




출처: @ye._.vely618


일요일, 10월 27, 2024

개인프로젝트 -BAA 계산하기-

오늘은 BAA 전략을 구현하는 파이썬 코드를 (chatGTP가) 작성하였습니다.

sqlite3에 저장되어있는 자산들의 정보가 균일하지 않기 때문에, 과거로 갈수록 자산들의 모멘텀스코어가 계산되지 않은 경우가 있는데 공란을 무시하고 포트폴리오를 뽑아주는 문제가 아직 있습니다.

현재 이 문제는 수정되지 않았고, 조만간 수정해서 업데이트 하도록 하겠습니다. :)

오늘의 코드 strategy_BAA.py 입니다.

각각의 자산배분스크립트 작성을 마무리하고 flask를 사용해서 소규모 사이트를 한번 작성해야하는데... 놀고 있더라고 생각보다 이게 작업속도가 붙지 않네요

또 조만간 작업해서 업데이트 하도록 하겠습니다. :)




출처: @ye._.vely618


토요일, 10월 26, 2024

ACMG 및 AMP의 염기서열 변이 해석 지침, 2015년 버전

오늘 ACMG/AMP 가이드라인의 바이블 Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology 을 가져와봤습니다.


DOI: 10.1038/gim.2015.30


임상데이터를 다루시는 분들께서는 읽지 않는 사람은 있어도(진짜?) 한번만 읽지는 않는다는 바로 그 논문 되겠습니다. 


gemini

**ACMG 및 AMP의 표준 및 지침**

**서열 변이 해석**

**임상 실험실 유전학자에게 도움을 주기 위한 ACMG 및 AMP의 공동 합의**

**배경**

ACMG(American College of Medical Genetics and Genomics)는 이전에 서열 변이 해석에 대한 지침을 개발했습니다. 지난 10년 동안, 차세대 염기서열 분석 기술은 고속 처리량의 차세대 염기서열 분석의 출현으로 빠르게 발전해 왔습니다. 차세대 염기서열 분석을 도입하고 활용함으로써, 임상 실험실은 이제 유전자형 분석, 단일 유전자, 유전자 패널, 엑솜, 게놈, 전사체 및 후생유전학 검사에 이르는 점점 더 많은 유전자 검사 카탈로그를 수행하고 있습니다. 증가된 복잡성으로 인해, 이러한 유전자 검사의 전환은 서열 변이 해석에 새로운 과제를 수반했습니다. 이러한 맥락에서 ACMG는 2013년에 ACMG, AMP(Association for Molecular Pathology) 및 College of American Pathologists의 대표들로 구성된 작업 그룹을 구성하여 서열 변이 해석에 대한 표준 및 지침을 재검토하고 개정하기 시작했습니다. 이 그룹은 임상 실험실 책임자와 임상의로 구성되었습니다. 이 보고서는 ACMG, AMP 및 College of American Pathologists의 이해 관계자들의 의견을 반영한 작업 그룹의 전문가 의견을 나타냅니다. 이러한 권장 사항은 주로 임상 실험실에서 사용되는 유전자형 분석, 단일 유전자, 패널, 엑솜 및 게놈을 포함한 광범위한 유전자 검사에 적용됩니다. 이 보고서는 "병원성", "개연성이 높은 병원성", "의의 불명", "개연성이 높은 양성", "양성"이라는 특정 표준 용어를 사용하여 멘델 장애를 유발하는 유전자에서 발견된 변이를 분류할 것을 권장합니다. 또한, 이 권장 사항은 일반적인 변이 증거 유형(예: 인구 데이터, 계산 데이터, 기능 데이터, 분리 데이터)을 사용하여 변이를 이러한 5개 범주 중 하나로 분류하기 위한 프로세스를 설명합니다. 이 보고서에서 설명된 임상 유전자 검사의 분석 및 해석의 복잡성이 증가함에 따라, ACMG는 임상 분자 유전자 검사를 Clinical Laboratory Improvement Amendments(CLIA) 승인 실험실에서 수행하고 결과를 임상 분자 유전학자 또는 분자 유전학 병리학자 또는 이와 동급의 자격을 갖춘 사람이 해석할 것을 강력히 권장합니다.

**개요**

이 문서는 임상 분자 유전학자에게 도움을 주기 위한 ACMG 및 AMP의 공동 합의 표준 및 지침을 제공합니다. 이 지침은 서열 변이 해석에 관한 것입니다. ACMG는 이전에 서열 변이 해석에 대한 지침을 개발했습니다. 지난 10년 동안, 차세대 염기서열 분석 기술은 고속 처리량의 차세대 염기서열 분석의 출현으로 빠르게 발전해 왔습니다. 차세대 염기서열 분석을 도입하고 활용함으로써, 임상 실험실은 이제 유전자형 분석, 단일 유전자, 유전자 패널, 엑솜, 게놈, 전사체 및 후생유전학 검사에 이르는 점점 더 많은 유전자 검사 카탈로그를 수행하고 있습니다. 증가된 복잡성으로 인해, 이러한 유전자 검사의 전환은 서열 변이 해석에 새로운 과제를 수반했습니다. 이러한 맥락에서 ACMG는 2013년에 ACMG, AMP(Association for Molecular Pathology) 및 College of American Pathologists의 대표들로 구성된 작업 그룹을 구성하여 서열 변이 해석에 대한 표준 및 지침을 재검토하고 개정하기 시작했습니다. 이 그룹은 임상 실험실 책임자와 임상의로 구성되었습니다. 이 보고서는 ACMG, AMP 및 College of American Pathologists의 이해 관계자들의 의견을 반영한 작업 그룹의 전문가 의견을 나타냅니다. 이러한 권장 사항은 주로 임상 실험실에서 사용되는 유전자형 분석, 단일 유전자, 패널, 엑솜 및 게놈을 포함한 광범위한 유전자 검사에 적용됩니다. 이 보고서는 "병원성", "개연성이 높은 병원성", "의의 불명", "개연성이 높은 양성", "양성"이라는 특정 표준 용어를 사용하여 멘델 장애를 유발하는 유전자에서 발견된 변이를 분류할 것을 권장합니다. 또한, 이 권장 사항은 일반적인 변이 증거 유형(예: 인구 데이터, 계산 데이터, 기능 데이터, 분리 데이터)을 사용하여 변이를 이러한 5개 범주 중 하나로 분류하기 위한 프로세스를 설명합니다. 이 보고서에서 설명된 임상 유전자 검사의 분석 및 해석의 복잡성이 증가함에 따라, ACMG는 임상 분자 유전자 검사를 Clinical Laboratory Improvement Amendments(CLIA) 승인 실험실에서 수행하고 결과를 임상 분자 유전학자 또는 분자 유전학 병리학자 또는 이와 동급의 자격을 갖춘 사람이 해석할 것을 강력히 권장합니다.

**중요 포인트**

*   ACMG 및 AMP는 서열 변이 분류를 위한 새로운 표준 및 지침을 개발했습니다.

*   이 지침은 멘델 질환에 관련된 유전자에서 발견된 변이를 분류하기 위한 것입니다.

*   이 지침은 "병원성", "개연성이 높은 병원성", "의의 불명", "개연성이 높은 양성", "양성"이라는 5개의 표준 용어를 사용합니다.

*   이 지침은 변이를 이러한 5개 범주 중 하나로 분류하기 위한 기준을 제공합니다.

*   이 지침은 임상 실험실에서 사용되는 유전자 검사의 복잡성이 증가함에 따라, 임상 분자 유전자 검사를 CLIA 승인 실험실에서 수행하고 결과를 임상 분자 유전학자 또는 분자 유전학 병리학자 또는 이와 동급의 자격을 갖춘 사람이 해석할 것을 권장합니다.



chatGPT

### 배경:

이 논문은 **미국 의학유전학 및 유전체학회(ACMG)**와 **분자병리학회(AMP)**의 공동 합의에 따라 작성된 **유전자 변이 해석을 위한 표준 및 가이드라인**에 관한 내용입니다. 최근 **차세대 시퀀싱(NGS)** 기술의 발전으로 인해 유전자 검사가 임상 실험실에서 점점 더 복잡해지고 있으며, 이에 따라 유전자 변이 해석에 대한 명확한 기준과 용어의 필요성이 대두되었습니다. 기존에는 일부 유전자에 대한 해석 가이드라인이 있었으나, 모든 유전자를 포괄하는 일관된 기준이 부족했습니다. 이러한 배경에서 ACMG와 AMP는 2013년에 전문가 그룹을 구성하여 유전자 변이 해석을 위한 통일된 표준과 가이드라인을 수립하게 되었습니다.

### 개요:

이 논문은 임상 실험실에서 사용하는 유전자 변이 해석의 표준 용어를 확립하고, 변이를 "병원성(Pathogenic)", "병원성 가능성 높음(Likely Pathogenic)", "불확실한 의미(Uncertain Significance)", "양성 가능성 높음(Likely Benign)", "양성(Benign)"의 5단계로 분류하는 것을 권장하고 있습니다. 변이의 해석은 다양한 증거(예: 인구 데이터, 계산 데이터, 기능적 데이터 등)를 바탕으로 이루어지며, 각 증거의 강도에 따라 변이가 분류됩니다. 또한, 변이 해석의 기준이 실제 임상 진단 및 환자 관리에 미치는 영향을 고려하여, 결과 해석에 대한 신중한 접근을 강조합니다.

### 중요 사항 요약:

1. **변이 분류 체계**: 유전자 변이는 5단계로 분류되며, 각 변이는 그에 따른 증거를 바탕으로 "병원성"에서 "양성"까지의 등급으로 해석됩니다.

2. **증거의 유형 및 강도**: 변이 해석을 위해 사용하는 증거는 인구 데이터, 기능적 연구, 유전적 데이터 등을 포함하며, 각 증거는 강도에 따라 매우 강함, 강함, 중간, 지원 등의 등급으로 나뉩니다.

3. **기능적 연구의 중요성**: 변이가 단백질 기능에 미치는 영향을 평가하기 위해서는 실험적 증거가 중요한 역할을 합니다. 잘 확립된 **in vitro** 또는 **in vivo** 기능적 연구가 있으면 변이의 병원성을 뒷받침하는 강력한 증거로 사용될 수 있습니다.

4. **인구 데이터의 활용**: 변이가 일반 인구에서 얼마나 자주 나타나는지에 대한 데이터는 변이의 병원성을 평가하는 데 중요한 자료입니다. 일반 인구에서 변이가 너무 빈번하게 나타나면 그 변이는 병원성이 없을 가능성이 높습니다.

5. **임상적 적용**: 이 가이드라인은 임상 실험실이 유전자 변이 해석을 보다 정확하게 수행할 수 있도록 돕는 것을 목표로 하며, 최종적으로는 환자 관리와 치료에 도움을 줄 수 있도록 합니다.



NotebookLM

## ACMG 및 AMP의 염기서열 변이 해석 지침: 배경 및 주요 내용

**배경:**

2015년 미국 의학 유전체학회(ACMG)와 분자병리학회(AMP)는 급증하는 유전자 검사 데이터의 해석 및 보고 방식을 표준화하고자 “염기서열 변이의 해석을 위한 표준 및 지침”을 발표했습니다. 이는 차세대 염기서열 분석(NGS) 기술 발전으로 대량의 유전 정보 생성이 가능해지면서, 멘델 질환 관련 유전자 검사 결과에서 발견되는 다양한 염기서열 변이 해석에 일관성을 부여하고 임상적 유용성을 높이기 위한 노력의 일환입니다. 

* **NGS 기술 발전과 유전자 검사 확대:** NGS 기술의 발전은 유전자 검사를 통해 더 많은 유전자를 더 빠르고 저렴하게 분석할 수 있도록 하였습니다. 이는 단일 유전자 검사에서 다중 유전자 패널, 그리고 전체 엑솜 및 유전체 염기서열 분석으로 검사 범위를 확대시키는 계기가 되었습니다.

* **염기서열 변이 해석의 복잡성 증가:** 유전자 검사 범위의 확대는 더 많은 염기서열 변이를 발견하게 되면서 그 해석의 복잡성을 증가시켰습니다. 특히 희귀 변이나 새로운 변이의 경우, 기존 정보만으로는 임상적 유의성을 판단하기 어려운 경우가 많았습니다.

* **표준화된 해석 지침의 필요성:**  다양한 유전자 검사 방법과 분석 도구가 사용되면서, 검사 기관이나 연구자에 따라 변이 해석 기준 및 결과 보고 방식이 달라질 수 있다는 문제점이 제기되었습니다. 이러한 문제는 유전자 검사 결과의 정확성 및 신뢰성 저하,  그리고 환자 진료의 비효율성을 초래할 수 있기 때문에 표준화된 해석 지침 마련이 시급했습니다.

**논문의 개요:**

본 논문에서는 멘델 유전 질환 관련 유전자 검사에서 발견된 염기서열 변이를 임상적 유의성에 따라 5단계 (**병원성**, **병원성 가능성 높음**, **의미 불분명**, **양성 가능성 높음**, **양성**)로 분류하는 표준화된 체계와  각 분류 단계를 결정하기 위한 구체적인 기준을 제시하고 있습니다. 또한, 변이 해석에 활용 가능한 다양한 증거 유형과 각 증거의 강도,  그리고 여러 증거를 조합하는 규칙 등을 상세히 설명하고 있습니다.

**주요 내용 요약:**

* **변이 분류:** 5단계 분류 체계 (병원성, 병원성 가능성 높음, 의미 불분명, 양성 가능성 높음, 양성)를 사용하여 변이의 임상적 유의성을 명확하게 구분합니다.

* **분류 기준:** 변이 종류, 위치, 빈도, 기능적 영향, 가족력 정보 등 다양한 증거를 사용하여 변이를 분류합니다.

* **증거 강도:** 각 증거는 강도에 따라 "매우 강함", "강함", "보통", "지지" 등급으로 분류됩니다.

* **증거 조합 규칙:**  여러 증거를 조합하여 최종 분류 등급을 결정하는 규칙을 제시합니다.

* **보고 지침:**  보고서에 변이 분류 등급, 분류 근거, 추가 검사 필요성 등을 명확하게 기술하도록 권고합니다. 

**본 논문은 멘델 유전 질환 관련 유전자 변이 해석에 대한 표준화된 지침을 제공함으로써, 유전자 검사 결과의 정확성과 신뢰성을 높이고,  궁극적으로 환자 진료 개선에 기여하고자 합니다.**


gemini가 교묘하게 첫문장을 끼워놓고 동어반복을 했네요. 깜빡 속을뻔...

음... ACMG/AMP 가이드라인은 LLM 요약본 보다는 본문의 Table 3, Table 4 그리고 Figure 1을 봐야 봤다고 할 수 있는 내용이니 꼭 본문의 Table과 Figure를 보시기 바랍니다. 

그리고 이 가이드라인은 한 번으로 끝나는게 아니라 시리즈로 나오다보니 이번 기회에 한번 씩 LLM에게 읽혀보도록 하겠습니다.  :)




출처: @wm_ohmygirl