레이블이 GWAS인 게시물을 표시합니다. 모든 게시물 표시
레이블이 GWAS인 게시물을 표시합니다. 모든 게시물 표시

월요일, 1월 27, 2025

28만 명 동아시아인 유전체 연구: 우리의 건강과 유전자의 연결고리

오늘은 한국인 유전자 마이크로어레이로 분석된 내용의 논문을 한번 가져와봤습니다. The contribution of common and rare genetic variants to variation in metabolic traits in 288,137 East Asians 22년도 논문으로 28만명의 동아시아인구를 대상으로 진행한 연구 결과 되겠습니다.

DOI: 10.1038/s41467-022-34163-2


gemini

**288,137명의 동아시아인을 대상으로 한 유전자 변이와 대사 특성의 연관성 연구**

안녕하세요! 오늘은 288,137명의 동아시아인을 대상으로 한 유전자 변이와 대사 특성의 연관성 연구에 대해서 알아보겠습니다. 이 연구는 2022년 10월 17일 Nature Communications에 게재되었습니다.

**연구 배경 및 목적**

대사 특성은 혈당, 지질, 간 효소 수치 등을 포함하여 다양한 질병의 위험을 평가하는 데 사용되는 유전적 특징입니다. 이 연구의 목적은 동아시아인 288,137명을 대상으로 대사 특성과 관련된 유전적 위험을 예측하는 모델을 개발하는 것입니다.

**연구 방법**

이 연구에서는 125,872명의 한국인을 대상으로 유전자형을 분석하고, 162,255명의 일본인을 대상으로 한 유전자형 분석 결과와 메타 분석을 수행했습니다. 또한, 124,560명의 유럽인을 대상으로 한 연구 결과와의 비교 분석도 수행했습니다.

**연구 결과**

이 연구에서는 1,444개의 공통 변이가 9가지 대사 특성과 유의미하게 관련되어 있음을 발견했습니다. 이 중 144개는 이전에 보고된 바 없는 새로운 변이입니다. 또한, 66개의 희귀 변이가 9가지 대사 특성과 유의미하게 관련되어 있음을 발견했습니다. 이 중 22개는 이전에 보고된 바 없는 새로운 변이입니다.

공통 변이와 희귀 변이 모두 대사 특성의 변이에 기여하지만, 희귀 변이의 기여도는 공통 변이에 비해 상대적으로 작습니다. 희귀 변이를 포함한 유전적 위험 점수는 공통 변이만을 사용한 유전적 위험 점수보다 대사 특성과 관련된 질병의 위험을 더 정확하게 예측합니다.

특히, SLC30A8 유전자의 희귀 변이는 제2형 당뇨병의 위험을 크게 증가시킵니다.

**연구의 의미 및 활용**

이 연구는 대사 특성과 관련된 유전적 위험을 예측하는 모델을 개발하는 데 중요한 기여를 했습니다. 이 모델은 향후 대사 특성과 관련된 질병의 예방과 치료에 활용될 수 있을 것으로 기대됩니다.

**결론**

이 연구는 288,137명의 동아시아인을 대상으로 한 유전자 변이와 대사 특성의 연관성 연구입니다. 이 연구는 대사 특성과 관련된 유전적 위험을 예측하는 모델을 개발하는 데 중요한 기여를 했습니다. 이 모델은 향후 대사 특성과 관련된 질병의 예방과 치료에 활용될 수 있을 것으로 기대됩니다.

이 블로그 글이 도움이 되었기를 바랍니다. 감사합니다.



clova-x

제목: 동아시아인의 대사 특성에 대한 유전적 변이 연구

안녕하세요, 오늘은 동아시아인을 대상으로 한 대규모 유전 연구에 대한 논문을 소개해 드리려고 합니다.

이 논문은 288,137명의 동아시아인을 대상으로 하여, 대사 특성에 대한 유전적 변이의 기여도를 조사한 연구입니다. 특히, 일반적인 유전적 변이와 희귀 유전적 변이를 모두 고려하여, 이들이 대사 특성에 미치는 영향을 분석하였습니다.

연구 방법으로는 한국 바이오뱅크 배열을 이용하여 125,872명의 한국인을 대상으로 게놈 전체 연관 분석(GWAS)을 수행하였고, 일본 바이오뱅크와의 메타 분석을 통해 144개의 새로운 신호(빈도 ≥ 1%)를 발견하였으며, 이 중 57.0%가 영국 바이오뱅크에서 재현되었습니다.

연구 결과, 희귀 변이(빈도 < 1%)는 전체 특성 분산에 제한적인 기여를 하지만, 이러한 변이는 보균자에서 흔한 변이만으로 예측한 질병 위험에 대한 다인성 예측의 정확도를 크게 떨어뜨리는 것으로 나타났습니다. 또한, 공복 혈당과 제2형 당뇨병의 유전적 위험 점수와 희귀 보호 변이 I349F를 통합하여 제2형 당뇨병 발병률이 최대 16배까지 차이 나는 그룹을 포착할 수 있었습니다.

이 연구는 동아시아인의 유전적 특성을 이해하는 데 큰 도움이 되었으며, 향후 유전적 정보를 활용하여 개인 맞춤형 의료 서비스를 제공하는 데에도 큰 역할을 할 것으로 기대됩니다. 유전적 정보를 통해 개인의 대사 특성을 파악하고, 이에 맞는 건강 관리 및 예방 조치를 취할 수 있게 될 것입니다.

더 궁금한 점이 있으시면 언제든지 문의해 주세요. 감사합니다.



chatGPT

### 동아시아 28만 명의 유전체를 분석한 연구 이야기: 우리의 건강과 유전자의 연결고리

최근 유전체 연구가 의료와 건강 관리에 미치는 영향이 커지고 있습니다. 그중에서도 동아시아 28만 명의 유전체를 분석한 대규모 연구는 우리의 삶과 건강에 중요한 통찰을 제공합니다. 이 글에서는 복잡한 용어를 배제하고, 일반 독자들도 이해할 수 있도록 연구 내용을 쉽게 풀어보겠습니다.

---

#### 유전자와 대사 형질: 우리의 몸이 가진 비밀

우리 몸은 혈당, 콜레스테롤, 간 효소 같은 다양한 대사 형질로 구성되어 있습니다. 이러한 형질은 질병 위험을 평가하거나 건강 상태를 진단하는 데 중요한 역할을 합니다. 예를 들어, 공복 혈당 수치가 높으면 당뇨병 위험이 증가하고, 간 효소 수치가 높으면 간 질환을 의심할 수 있죠. 이 연구는 대사 형질이 어떻게 유전자와 연결되어 있는지 밝혀내는 데 초점을 맞췄습니다.

---

#### 28만 명의 동아시아인을 대상으로 한 대규모 연구

연구진은 한국과 일본의 생명은행 데이터를 활용해 28만 8,137명의 유전체를 분석했습니다. 이 과정에서 유전자 변이(유전체 안에서의 차이점)를 흔한 변이와 희귀 변이로 나누어 연구했습니다.

1. **흔한 변이**: 대사 형질에 비교적 작은 영향을 미치지만, 많은 사람들에게 공통적으로 나타나는 변이입니다.

2. **희귀 변이**: 전체 인구에서는 드물게 나타나지만, 특정 사람들에게는 큰 영향을 미칠 수 있는 변이입니다.

연구 결과, 흔한 변이 144개와 희귀 변이 66개가 대사 형질에 영향을 미친다는 사실을 밝혔습니다. 이 중 희귀 변이는 흔한 변이와는 독립적으로 작용해 질병 예측에 중요한 영향을 미칠 수 있었습니다.

---

#### 이 연구가 중요한 이유

이전의 유전체 연구는 주로 유럽인을 대상으로 했기 때문에 동아시아인을 대상으로 한 대규모 연구는 그 자체로 의미가 큽니다. 이번 연구는 동아시아인의 유전적 특성을 더 잘 이해하고, 이를 통해 맞춤형 의료 서비스를 제공할 수 있는 기반을 마련했습니다.

---

#### 우리의 삶에 어떻게 활용될 수 있을까?

이 연구는 유전자를 기반으로 질병을 예방하거나 치료하는 데 중요한 정보를 제공합니다. 예를 들어:

1. **개인 맞춤형 건강 관리**: 유전자 정보를 활용해 개인의 질병 위험도를 미리 파악하고, 생활습관을 개선하거나 약물을 처방하는 데 사용할 수 있습니다.

2. **신약 개발**: 유전자 변이와 질병의 관계를 더 잘 이해함으로써, 새로운 치료제를 개발하는 데 기여할 수 있습니다.

3. **예방 의료**: 희귀 변이를 가진 사람들을 조기에 발견해 적절한 예방 조치를 취할 수 있습니다.

---

#### 미래를 여는 유전체 연구

28만 명의 유전체를 분석한 이 연구는 우리가 유전자를 통해 건강과 질병을 이해하는 데 중요한 첫걸음입니다. 앞으로 더 많은 연구가 이루어진다면, 각자의 유전자 정보를 바탕으로 더욱 정확한 건강 관리와 치료가 가능해질 것입니다. 유전체 연구는 단순히 과학의 영역을 넘어 우리의 일상과 삶의 질을 크게 향상시킬 수 있는 잠재력을 가지고 있습니다.

유전자 속에 숨겨진 우리의 건강 이야기를 찾아가는 여정, 여러분도 함께 관심을 가져보세요!



NotebookLM

## **내 몸속 유전자 지도, 질병 예측의 열쇠가 되다: 28만 명 동아시아인 유전체 연구**

안녕하세요! 오늘은 흥미로운 연구 논문을 소개해 드리려고 합니다. 바로 **28만 명이 넘는 동아시아인의 유전체를 분석**하여 우리 몸의 **대사 특성**과 **질병 위험**을 예측하는 데 한 걸음 더 다가선 연구입니다. 

### 🧬 **유전체 연구, 왜 중요할까요?**

우리 몸의 특징과 질병 발생 가능성은 **유전적 요인과 환경적 요인**의 복합적인 작용으로 결정됩니다. 그중 유전적 요인을 분석하는 **유전체 연구**는 질병 예측, 맞춤형 치료, 신약 개발 등 다양한 분야에서 혁신을 이끌어 낼 수 있는 핵심 열쇠입니다. 

### 🔬 **28만 명의 유전 정보를 분석하다!**

이번 연구에서는 **한국인 12만 명**을 포함하여 **총 28만 명의 동아시아인** 유전체 데이터를 활용했습니다. 혈액 검사를 통해 얻을 수 있는 **9가지 대사 특성** (**혈당, 콜레스테롤, 간 기능** 등)과 관련된 유전 변이를 찾기 위해 **전체 유전체 연관 분석 (GWAS)**이라는 방법을 사용했죠. 

### 💡 **새로운 유전 변이 발견, 질병 예측 정확도 높인다!**

연구 결과, **144개의 새로운 유전 변이 신호**를 발견했으며, 이 중 57%는 **영국 바이오뱅크** 데이터에서도 확인되어 신뢰도를 높였습니다. 특히, 이전 연구에서는 흔하지 않아 잘 알려지지 않았던 **'드문 변이'**에 주목했습니다. 드문 변이는 전체 특성 변이에 대한 기여도는 제한적이지만, 질병 위험 예측의 정확도에 영향을 미칠 수 있다는 것을 밝혀냈죠. 

### 🎯 **'흔한 변이'와 '드문 변이'의 상호 작용, 질병 예측의 새로운 지평을 열다**

이 연구의 핵심은 **흔한 변이와 드문 변이의 상호 작용**을 분석했다는 점입니다. 흔한 변이만으로는 설명하기 어려웠던 질병 발생 위험을 드문 변이까지 고려하여 더 정확하게 예측할 수 있게 된 것입니다. 예를 들어, **SLC30A8 유전자**의 드문 변이를 가진 사람은 **제2형 당뇨병**에 걸릴 확률이 낮다는 것을 밝혀냈습니다. 이는 기존의 흔한 변이 기반 예측 모델보다 더 정확하게 개인의 질병 위험을 예측할 수 있다는 것을 의미합니다.

### 🌟 **미래 의학의 핵심, 개인 맞춤형 질병 예방 및 치료**

이번 연구는 **동아시아인의 유전적 특징**을 반영한 질병 예측 및 치료법 개발에 중요한 발판을 마련했습니다. 앞으로 더 많은 연구를 통해 유전 변이와 질병 간의 관계를 명확히 밝혀낼 수 있다면, 개인별 유전 정보에 기반한 **맞춤형 질병 예방 및 치료**가 가능해질 것입니다. 

**예를 들어,**

* 개인의 유전 정보를 분석하여 특정 질병에 대한 위험도를 예측하고, 예방 전략을 수립할 수 있습니다.

* 유전 변이에 따른 약물 반응성 차이를 예측하여 개인에게 최적화된 약물을 처방할 수 있습니다.

* 특정 질병과 관련된 유전 변이를 표적으로 하는 신약 개발이 가능해집니다.

### 🌈 **유전체 연구, 더 밝은 미래를 향하여**

이번 연구는 28만 명이 넘는 대규모 데이터를 활용하여 유전체 연구의 새로운 가능성을 제시했습니다. 앞으로 더욱 발전할 유전체 연구는 **질병 극복**과 **건강한 삶**을 위한 희망을 제시하며 우리 삶을 더욱 풍요롭게 만들어 줄 것입니다. 



wrtn.ai

## 서론

대규모 유전체 연구는 다양한 이점을 제공합니다. 먼저 대규모 샘플 크기를 통해 복잡한 질병과 형질에 대한 새로운 유전적 요인들을 발견할 수 있습니다 [1]. 예를 들어 676,000명의 개인을 대상으로 한 연구에서 복잡한 형질의 다형성 위험 점수와 수명과의 연관성이 밝혀졌고, 동아시아인 433,540명을 대상으로 한 연구에서 2형 당뇨병 유전자 좌위가 발견되었습니다.

또한 다양한 인종 집단을 대상으로 한 대규모 유전체 연구를 통해 질병과 형질에 대한 공통적인 유전적 요인들을 밝힐 수 있습니다 [3]. 예를 들어 동아시아인을 대상으로 한 연구에서 혈압 변이와 대사 형질에 영향을 미치는 새로운 유전자 좌위가 확인되었습니다. 

대규모 유전체 연구 데이터를 활용하면 복잡한 형질에 대한 유전적 기여도를 보다 정확하게 추정할 수 있습니다 [1]. 유럽인을 대상으로 한 연구에서 8개의 혈액 지표와 관련된 22개의 새로운 유전자 좌위가 발견된 것이 그 예입니다.

이번 연구의 주요 목적은 유전체 데이터 분석을 통해 제2형 당뇨병과 관련된 당 대사 및 적혈구 지표들의 유전적 기반을 밝히는 것입니다 [5]. 이를 위해 유전체 상관관계 분석, LD score 회귀분석, 유전자 기능 분석 등의 방법을 사용하였습니다.

## 연구 방법

이 연구는 한국인 211,725명을 대상으로 한 대규모 유전체 연구입니다. 3개의 인구 기반 코호트 연구(KoGES_Ansan and Ansung study, KoGES_health examinee (HEXA) study, KoGES_cardiovascular disease association study (CAVAS))에서 각각 10,030명, 173,357명, 28,338명의 참여자가 모집되었습니다. 참여자들의 연령은 40-70세 사이였으며, 역학 조사, 신체 검사, 혈액 검사 등을 통해 혈당, 지질, 간 효소 수치 등의 생화학적 지표 데이터가 수집되었습니다 [31].

유전형 데이터는 Korea Biobank Array (KBA) 칩을 이용해 생산되었습니다. KBA 칩에는 약 60만 개의 태그 variant와 20만 개의 기능성 variant가 포함되어 있습니다. 총 134,721개의 샘플이 KBA v1.0과 v1.1 플랫폼을 통해 유전형을 측정했습니다 [34].

유전형 데이터에 대해서는 엄격한 품질 관리 과정이 적용되었습니다. 성별 불일치, 낮은 call rate, 과도한 heterozygosity 등을 기준으로 부적절한 샘플을 제거했고, 2차 친족관계도 제거하여 관련성이 없는 7,576명의 유전형 데이터를 확보했습니다. 또한 SNP 클러스터링 품질, 결측률, 하디-바인베르크 평형 등을 기준으로 SNP을 제거했습니다 [2].

이처럼 대규모 유전체 데이터를 체계적으로 수집하고 정제하는 과정이 중요합니다. 이를 통해 개인 간 유전 변이를 이해하고, 질병 관련 유전 요인을 규명할 수 있기 때문입니다.

## 주요 발견

이번 연구는 동아시아인 288,137명을 대상으로 9가지 대사 관련 형질에 대한 대규모 유전체 분석을 수행한 것입니다. 주요 발견으로는 다음과 같습니다:

첫째, 기존에 알려진 415개의 공통 변이 위치를 611개로 확장하였으며, 이 중 133개가 새로운 위치였습니다. 또한 332개의 추가적인 독립적인 신호도 발견되었습니다. 이러한 발견을 통해 대사 관련 형질의 유전적 기반에 대한 이해를 높일 수 있었습니다 [46].

둘째, 144개의 새로운 신호 중 5개는 직접적으로 새로운 생물학적 추론으로 이어지는 비동의성 코딩 변이였습니다. 특히 FUT2 유전자의 rs1047781 변이가 ALT 수준과 관련이 있었습니다. 또한 기존에 보고된 ALT 관련 좌위와 새로 발견된 ALT 관련 좌위는 조직 특이성에서 차이가 있었습니다 [44].

셋째, 121개의 새로운 신호 중 73개(57.0%)가 UK Biobank 데이터를 통해 명목상 복제되었습니다. 동아시아인과 유럽인 사이의 대립 유전자 빈도 차이로 인해 많은 새로운 연관성이 발견되었다고 볼 수 있습니다 [46].

넷째, 66개의 희귀 변이(MAF<1%)도 추가로 발견되었으며, 이 중 94.4%가 기존 공통 변이 신호 부근에 위치하고 있었습니다. 이러한 희귀 변이는 전체 형질 변이에 대한 기여도가 제한적이지만, 일부 보인자에게는 상당한 영향을 미칠 수 있음을 시사합니다 [50].

이번 연구 결과는 대사 관련 형질의 유전적 기반에 대한 이해를 높였으며, 특히 동아시아인 집단에서 새롭게 발견된 유전적 변이들은 향후 맞춤의학 발전에 기여할 수 있을 것으로 기대됩니다 [3].

## 연구의 의의 및 미래 전망

이번 연구는 동아시아인 288,137명을 대상으로 대사 관련 9가지 형질에 대한 대규모 유전체 분석을 수행했으며, 그 결과는 과학적 및 의학적으로 중요한 의의를 지니고 있습니다.

첫째, 기존에 알려진 415개의 공통 변이 위치를 611개로 확장하고, 이 중 133개가 새로운 위치였습니다. 또한 332개의 추가적인 독립적인 신호도 발견되었습니다. 이는 대사 관련 형질의 유전적 기반에 대한 이해를 높이는 데 기여했습니다 [1].

둘째, 144개의 새로운 신호 중 5개가 직접적으로 새로운 생물학적 추론으로 이어지는 비동의성 코딩 변이였습니다. 특히 FUT2 유전자의 rs1047781 변이가 ALT 수준과 관련이 있었는데, 이는 간 질환 연구에 시사점을 줄 수 있습니다 [5].

셋째, 121개의 새로운 신호 중 73개(57.0%)가 UK Biobank 데이터를 통해 복제되었습니다. 이는 동아시아인과 유럽인 사이의 대립 유전자 빈도 차이로 인해 많은 새로운 연관성이 발견되었음을 의미합니다 [3]. 이는 기존 유전체 연구가 주로 유럽계 개인을 대상으로 이루어져 왔기 때문에, 다른 인종 배경의 개인들에 대한 유전적 위험도 예측이 부정확할 수 있다는 문제를 해결할 수 있는 중요한 기여입니다.

또한 이번 연구의 레어 변이 분석 결과는 유전체 정보의 다양한 활용 분야와 잠재력을 보여주고 있습니다. 특히 레어 변이 rs770224130(I349F)의 경우 제2형 당뇨병 위험도 예측에 중요한 역할을 할 것으로 기대됩니다 [41].

종합적으로 이번 연구는 동아시아인에게 영향을 미치는 유전 변이에 대한 이해를 높였으며, 이를 활용하여 다양한 인구집단에서 활용할 수 있는 임상 유전체 도구 개발에 기여할 것으로 기대됩니다. 또한 대사 관련 질병의 병인론 규명과 정밀의료 발전에도 도움이 될 것으로 보입니다.

## 결론

이번 연구는 동아시아인 288,137명을 대상으로 대사 관련 9가지 형질에 대한 대규모 유전체 분석을 수행했습니다. 그 결과 기존에 알려진 415개의 공통 변이 위치를 611개로 확장하고, 332개의 새로운 독립적인 신호를 발견하는 등 대사 관련 형질의 유전적 기반에 대한 이해를 높였습니다. 특히 동아시아인 집단에서 새롭게 발견된 유전적 변이들은 향후 맞춤의료 발전에 기여할 수 있을 것으로 기대됩니다.

이처럼 대규모 유전체 연구는 복잡한 질병과 형질에 대한 새로운 유전적 요인을 발견하고, 다양한 인종 집단 간 유전적 차이를 규명하는 데 매우 중요합니다. 따라서 앞으로도 지속적인 유전체 연구가 필요할 것입니다. 이번 연구 결과가 일반인들에게도 유전체 연구의 가치와 중요성을 알리는 계기가 되기를 바랍니다. 



이 논문은 KBA 연구 결과물을 다른 연구 결과를 정제해서 잘 접목한 결과로 각각 생산한 한국, 일본, 유럽의 유전체 정보를 잘 조합하여 연구한 결과로 생각하면 될 것 같습니다. 

한마디로 정보는 널려 있으니 잘 실험 디자인을 하면 사용 할 만한 데이터는 이미 잘 공유되고 있으니 실험 디자인을 잘 설계하면 좋겠다 이지 않을까 하네요 :)

올해는 을사년으로 우리나라에서는 을사늑약으로 인해 그렇게 좋은 해로 인식되지는 않지만  청사처럼 허물을 벗어 새롭게 태어나고 지혜로운 새해 맞이하시기 바랍니다. :)


출처: @ye._.vely618


금요일, 1월 03, 2025

글로벌 바이오뱅크 협력: 모두를 위한 건강한 미래를 향하여

새해 첫 포스팅 내용은 세계적으로 각국에서 진행되고 있는 바이오뱅크 사업간의 협력과 공조에 대한 내용의 논문이 있어서 25년은 이 논문으로 시작하려고 합니다. 요즘 하는 업무가 이쪽이다보니 (LLM의 눈을 통해) 면밀하게 훑고 있습니다. 

25년 첫 포스팅이라는 상징성에 걸맞는 Global Biobank Meta-analysis Initiative: Powering genetic discovery across human disease 라는 제목의 논문 되겠습니다.

DOI: 10.1016/j.xgen.2022.100192



gemini

## 전 세계가 힘을 합쳐 질병의 비밀을 푼다! 🧬

**바이오뱅크와 GWAS, 그리고 글로벌 협력**

혹시 여러분의 건강 정보가 질병 연구에 도움이 될 수 있다는 사실을 알고 계신가요? 최근 전 세계적으로 **바이오뱅크**라는 곳에서 사람들의 건강 정보와 유전 정보를 모아 질병 연구에 활용하고 있습니다. 마치 은행에 돈을 저축하듯이, 바이오뱅크에는 혈액, 조직, 유전 정보 등의 생체 시료와 건강 정보가 차곡차곡 모입니다. 이렇게 모인 정보는 과학자들이 질병의 원인을 밝혀내고 새로운 치료법을 개발하는 데 중요한 역할을 합니다.

특히 **GWAS (전장 유전체 연관 분석)**라는 연구 방법은 바이오뱅크에 모인 유전 정보를 활용하여 질병과 관련된 유전자를 찾아내는 데 널리 사용됩니다. GWAS는 수많은 사람들의 유전 정보를 비교 분석하여 특정 질병을 가진 사람들에게서 공통적으로 나타나는 유전 변이를 찾아냅니다. 이러한 유전 변이는 질병의 발생 위험을 높이거나 낮추는 데 영향을 미칠 수 있습니다.

하지만 GWAS는 엄청난 양의 데이터를 필요로 하기 때문에, 한 나라의 바이오뱅크만으로는 충분한 정보를 얻기 어려울 수 있습니다. 이러한 문제를 해결하기 위해 전 세계의 바이오뱅크들이 힘을 합쳐 **Global Biobank Meta-analysis Initiative (GBMI)**라는 프로젝트를 시작했습니다. GBMI는 4개 대륙, 23개 바이오뱅크의 협력 네트워크로, 220만 명 이상의 유전 데이터와 전자 건강 기록을 공유하며 질병 연구에 박차를 가하고 있습니다.

**GBMI, 질병 연구의 새로운 지평을 열다**

GBMI는 14개의 질병에 대한 GWAS를 수행하여 질병과 관련된 유전자를 찾아내고, 질병의 발생 메커니즘을 밝혀내는 데 significant한  성과를 거두었습니다. 그 결과, 기존 연구에서 밝혀진 317개의 유전자를 다시 확인하고, 183개의 새로운 유전자를 발견하는 쾌거를 이루었습니다. 또한, GBMI는 다양한 인종의 유전 정보를 분석하여 특정 인종에서 더 흔하게 나타나는 질병 관련 유전 변이를 찾아내기도 했습니다.

**국제 협력, 질병 극복의 열쇠**

GBMI의 성공은 전 세계 바이오뱅크들의 협력이 얼마나 중요한지를 보여주는 사례입니다. 각국의 바이오뱅크들은 서로 다른 인종, 환경, 질병 특징을 가진 사람들의 데이터를 공유함으로써 질병 연구의 효율성을 높이고, 더욱 정확하고 신뢰성 있는 결과를 얻을 수 있었습니다.

앞으로도 GBMI는 더 많은 바이오뱅크와 협력하여 질병 유전자 발굴, 약물 개발, 질병 예측 등 다양한 분야에서 연구를 지속할 계획입니다. GBMI의 노력은 인류의 건강 증진에 크게 기여할 것으로 기대됩니다.

**함께 질병을 극복하는 미래, GBMI가 그 중심에 있습니다!**



clova-x

최근 생명과학 분야에서는 전 세계 각지의 바이오뱅크들이 협력하여 대규모 유전 정보와 건강 기록을 분석하는 프로젝트가 진행되고 있습니다. 이번 블로그 글에서는 이러한 글로벌 바이오뱅크 메타분석 이니셔티브(GBMI)에 대해 소개하고자 합니다.

GBMI는 전 세계 23개의 바이오뱅크가 참여하는 대규모 협력 네트워크로, 2,200만 명 이상의 개인 유전체 데이터와 전자 건강 기록을 공유하고 있습니다. 이 프로젝트의 목적은 다양한 질병에 대한 유전적 위험 요인을 파악하고, 이를 바탕으로 질병 예방과 치료에 대한 새로운 접근 방식을 개발하는 것입니다.

각국의 바이오뱅크들은 각자의 지역과 인구 집단에서 수집한 유전체 데이터와 건강 기록을 GBMI에 제공합니다. 이렇게 수집된 데이터는 표준화된 절차를 거쳐 분석되며, 이를 통해 질병과 유전적 요인 사이의 연관성을 파악할 수 있습니다.

GBMI는 이러한 데이터를 바탕으로 게놈 전체 연관 연구(GWAS)를 수행하여, 다양한 질병에 대한 유전적 변이를 식별하고 그 영향을 평가하고 있습니다. GWAS는 수많은 유전자 변이를 동시에 분석하여 특정 질병의 발생 위험과 관련된 유전적 변이를 찾아내는 연구 방법입니다. GBMI의 메타분석 결과는 기존의 단일 바이오뱅크 연구보다 더 높은 검증력을 보여주며, 새로운 질병 유전자와 약물 후보군을 발굴하는 데에도 큰 도움이 되고 있습니다.

또한, GBMI는 다양한 인종과 질병을 포괄하여 연구를 진행함으로써, 기존의 연구에서 놓치기 쉬웠던 희귀 질병이나 소외된 지역의 질병에 대한 이해도를 높이고 있습니다. 이는 각국의 바이오뱅크 협력이 왜 중요한지를 보여주는 대목입니다.

바이오뱅크 간의 협력은 단순히 데이터의 양을 늘리는 것뿐만 아니라, 다양한 관점과 데이터를 통합하여 보다 정확하고 풍부한 연구 결과를 도출하는 데에도 큰 역할을 합니다. GBMI의 성공적인 사례는 앞으로의 유전학 연구와 의료 기술 발전에 큰 영향을 미칠 것으로 기대됩니다.

이번 블로그 글에서는 GBMI의 연구에 대해 간단히 소개해 드렸습니다. 더 자세한 내용은 해당 논문을 참고하시거나, GBMI의 웹사이트를 방문해 보시기 바랍니다. 유전 정보와 건강 기록의 공유와 협력을 통해 인류의 건강과 복지에 기여하는 바이오뱅크들의 노력에 박수를 보냅니다.



chatGPT

### 글로벌 바이오뱅크 협력: 유전학 연구의 새로운 길을 열다  

전 세계적으로 유전 질환의 원인을 밝히고 더 나은 치료법을 찾기 위해 국가 간 협력의 중요성이 커지고 있습니다. 이번 블로그에서는 *Global Biobank Meta-analysis Initiative (GBMI)*라는 연구 프로젝트를 소개하며, 각국의 바이오뱅크 간 협력이 인간 질병 연구에 어떤 기여를 하고 있는지 쉽게 풀어보려 합니다.  

---

### **바이오뱅크란 무엇인가요?**  

바이오뱅크는 사람의 혈액, 조직, DNA 같은 생체 샘플과 함께 건강 정보(예: 병원 기록, 설문조사 결과)를 수집하고 보관하는 시설입니다. 연구자들은 바이오뱅크 데이터를 통해 질병의 유전적 요인을 찾고, 이를 기반으로 새로운 치료법이나 약물을 개발할 수 있습니다.  

---

### **GWAS는 무엇일까요?**  

GWAS(*Genome-Wide Association Studies*, 전장 유전체 연관 연구)는 많은 사람의 DNA와 건강 데이터를 분석하여 특정 질병과 관련된 유전자 위치를 찾는 연구 방법입니다. 예를 들어, 특정 유전 변이가 당뇨병 위험을 높일 가능성이 있다고 밝혀지면, 이 유전자를 표적으로 한 약물 개발이 가능해집니다. 하지만 GWAS는 분석 대상의 데이터 양과 다양성이 부족할 경우 정확한 결과를 얻기 어렵습니다.  

---

### **GBMI: 글로벌 협력의 힘**  

GBMI는 24개 바이오뱅크가 협력하여 220만 명 이상의 데이터를 통합 분석한 대규모 국제 프로젝트입니다. 이 연구에서는 세계 각국에서 수집된 유전자 정보와 건강 기록을 활용해 다음과 같은 성과를 거두었습니다:  

1. **질병 유전자 발굴**  

   - 14개 질병에서 183개의 새로운 유전자 위치를 발견했으며, 기존에 알려진 317개의 유전자 위치를 확인했습니다.  

2. **다양한 인구 집단 데이터 통합**  

   - 유럽, 아시아, 아프리카 등 다양한 민족의 데이터를 포함해 유전 연구의 편향을 줄이고 결과의 신뢰성을 높였습니다.  

3. **새로운 약물 후보 제시**  

   - 유전자와 단백질 데이터를 결합하여 새로운 약물 개발에 활용할 수 있는 질병 관련 유전자를 제안했습니다.  

---

### **어떻게 연구가 이루어졌을까요?**  

GBMI는 각 바이오뱅크에서 수집된 데이터를 표준화하고, 이를 통합해 분석했습니다. 특히 국제 질병 분류(ICD)와 같은 공통 기준을 사용해 데이터의 일관성을 확보했습니다. 또한, 비유럽권 데이터를 포함해 다양한 유전적 배경을 분석함으로써 더 많은 질병 관련 유전자와 변이를 찾을 수 있었습니다.  

---

### **이 연구가 왜 중요한가요?**  

1. **질병 진단과 치료의 발전**  

   - GBMI를 통해 발견된 유전적 정보는 질병의 원인을 이해하고, 이를 기반으로 개인 맞춤형 치료법 개발에 기여할 수 있습니다.  

2. **다양성의 중요성**  

   - 기존 연구는 유럽 중심의 데이터에 편중되어 있었습니다. GBMI는 아시아, 아프리카 등 다양한 인구 집단을 포함함으로써 연구 결과의 보편성을 높였습니다.  

3. **국제 협력의 모범 사례**  

   - 전 세계 바이오뱅크가 협력해 데이터를 공유하고 분석하면서, 한 국가나 기관이 단독으로는 이루기 어려운 성과를 냈습니다.  

---

### **미래를 향한 도전과제**  

GBMI는 많은 성과를 이루었지만, 여전히 유럽 외 지역의 데이터 부족, 분석 방법의 개선 필요성 등 해결해야 할 과제가 남아 있습니다. 이를 위해 각국의 바이오뱅크 간 지속적인 협력과 데이터 공유가 더욱 중요해질 것입니다.  

---

### **맺음말**  

이번 GBMI 연구는 국제 협력을 통해 인간 질병 연구의 새로운 가능성을 열었습니다. 바이오뱅크와 같은 데이터 기반 연구는 질병의 원인을 더 깊이 이해하고, 전 세계 사람들에게 더 나은 건강을 제공할 수 있는 열쇠가 될 것입니다. 우리의 건강을 위한 과학자들의 노력이 앞으로 어떤 혁신을 가져올지 기대됩니다.  



NotebookLM

##  전 세계 바이오뱅크 협력을 통한 질병 유전자 발굴: 모두를 위한 건강한 미래를 향하여

최근 의학 연구에서는 **질병의 유전적 원인을 밝히는 것이 중요해졌습니다.** 개인의 유전 정보는 질병 발생 가능성, 약물 반응, 심지어 질병 예방 전략까지 예측하는 데 도움을 줄 수 있습니다. 이러한 유전 정보를 연구하는 데 중요한 역할을 하는 것이 바로 **바이오뱅크**입니다. 바이오뱅크는 **많은 사람들의 유전체 데이터와 전자 건강 기록을 수집하고 저장하는 대규모 데이터베이스**라고 할 수 있습니다.

**GWAS (전장유전체 연관 분석)**은 이러한 바이오뱅크에 저장된 유전 정보를 분석하여 질병과 관련된 유전 변이를 찾아내는 연구 방법입니다. 하지만 개별 국가의 바이오뱅크만으로는 충분한 데이터를 확보하기 어렵고, 특정 인종에 편향된 데이터를 분석하게 될 수 있다는 한계가 있습니다. 

이러한 문제를 해결하기 위해 **전 세계 여러 국가의 바이오뱅크들이 협력하여 GBMI (Global Biobank Meta-analysis Initiative)라는 연구 프로젝트를 시작했습니다.** GBMI는 **2019년에 설립되어 4개 대륙 23개 바이오뱅크의 데이터를 통합하여 220만 명 이상의 유전체 데이터와 전자 건강 기록을 분석**했습니다. 

### GBMI 연구는 어떻게 진행되었을까요?

GBMI는 먼저 **표준화된 질병 정의**를 만들어 각 바이오뱅크에서 **동일한 기준으로 질병 정보를 추출**했습니다. 그 후, **각 바이오뱅크에서 GWAS를 수행하고 그 결과를 통합하여 메타 분석**을 진행했습니다. 이 과정에서 **유전적 조상, 성별 등 다양한 요소들을 고려하여 분석**했습니다. 

### GBMI 연구는 어떤 결과를 얻었을까요?

**GBMI 연구는 천식, 만성 폐쇄성 폐 질환, 심부전, 뇌졸중, 통풍 등 14가지 질병에 대해 317개의 알려진 유전자좌와 183개의 새로운 유전자좌를 식별하는 데 성공했습니다.** 이는 개별 바이오뱅크에서 수행된 연구보다 훨씬 더 많은 유전자좌를 발견한 것으로, **전 세계 바이오뱅크 협력의 중요성을 보여주는 결과**입니다. 

### 왜 바이오뱅크 협력이 중요할까요?

* **더 많은 데이터 확보:** 여러 바이오뱅크의 데이터를 통합하면 **더 많은 표본을 확보**할 수 있습니다. 이는 **GWAS의 통계적 검증력을 높여 질병과 관련된 유전 변이를 더 정확하게 찾아낼 수 있도록 합니다.** 

* **다양한 인종 집단 연구:** GBMI에는 아프리카, 아메리카, 아시아, 유럽, 중동 등 **다양한 인종 집단의 데이터가 포함**되어 있습니다. 이는 **특정 인종에 편향되지 않은 연구 결과를 얻을 수 있도록 하며, 인종별로 질병에 미치는 유전적 영향의 차이를 규명하는 데 도움을 줍니다.**

* **새로운 질병 유전자 및 약물 표적 발굴:** GBMI 연구 결과는 **질병 메커니즘을 이해하고 새로운 약물 표적을 발굴하는 데 기여**할 수 있습니다. 실제로 GBMI 연구에서는 **새로운 질병 유전자와 약물 후보들을 발굴하는 데 성공**했습니다. 

### 앞으로의 과제는 무엇일까요?

GBMI 연구는 **전 세계 바이오뱅크 협력의 중요성을 보여주는 성공적인 사례**입니다. 하지만 **여전히 유럽 인종 집단의 데이터가 많다는 점**, **전자 건강 기록을 사용함으로써 발생할 수 있는 질병 정의의 한계** 등 몇 가지 개선해야 할 점들이 남아 있습니다. 앞으로 **더 많은 국가의 바이오뱅크가 참여하고, 더욱 정확하고 다양한 데이터를 수집해야 합니다.**

결론적으로, **전 세계 바이오뱅크 협력은 인류의 건강을 증진하는 데 필수적인 요소**입니다. GBMI와 같은 연구는 **질병을 예방하고 치료하는 새로운 방법을 개발하는 데 기여할 것이며, 궁극적으로 모두를 위한 건강한 미래를 만드는 데 도움이 될 것입니다.** 


전세계적으로 다양한 바이오뱅크가 있겠거니 막연하게 생각은 하고 있었지만 꽤 다양하고 대규모의 바이오뱅크들이 산재해 있다는 것을 알게 되었고, 각자 중요하게 다루고 있는 것들이 있다보니 한계가 있었는데 GBMI라는 프로젝트를 통해 상호 보완적인 연구가 국제적으로 가능하게 된다는 것은 참 좋아 보입니다.
그만큼 일단 영어가 중요하다는 내용으로 귀결되는 25년 첫 포스팅이네요... Orz

25년 금년 한해도 다양한 주제로 포스팅 하도록 하겠습니다.



출처: @ye._.vely618


금요일, 12월 06, 2024

개인 맞춤형 약물 치료의 미래, PRS의 활용

오늘은 약물유전체학에 대한 내용을 가져와봤습니다. 제목은 Applying polygenic risk score methods to pharmacogenomics GWAS: challenges and opportunities 으로 23년도 그래도 최근에 나온 논문 되겠습니다.



gemini

## 약물 유전체학과 나의 유전자, 그리고 맞춤형 치료

**나의 유전자, 약에 어떤 영향을 미칠까요?**

우리 몸은 모두 다르게 생겼고, 각자 다른 질병에 걸리기 쉽습니다. 똑같은 약을 먹어도 효과를 보는 사람이 있는 반면, 부작용을 겪는 사람도 있습니다. 왜 이런 차이가 생길까요? 그 이유 중 하나는 바로 우리의 유전자 때문입니다. 

**약물 유전체학이란 무엇일까요?**

약물 유전체학은 유전 정보를 분석하여 개인에게 맞는 약을 선택하고, 적절한 용량을 결정하는 학문입니다. 즉, 우리의 유전자를 분석하면 어떤 약에 잘 반응하고, 어떤 약에 부작용이 나타날 가능성이 높은지 예측할 수 있습니다. 

**GWAS는 무엇일까요?**

GWAS(Genome-Wide Association Study)는 전장유전체 연관 분석이라고 불리는 연구 방법입니다. 수많은 사람들의 유전체를 분석하여 특정 질병이나 특성과 관련된 유전자 변이를 찾아내는 연구입니다. 마치 퍼즐 조각을 맞추듯이, 수많은 유전자 변이를 분석하여 질병의 원인을 밝히는 것이죠. 

**PRS란 무엇일까요?**

PRS(Polygenic Risk Score)는 다유전자 위험 점수라고 불리는 것으로, 여러 개의 유전자 변이가 질병에 미치는 영향을 종합적으로 평가하여 질병 발생 위험을 예측하는 수치입니다. 마치 여러 개의 작은 단서를 모아서 큰 그림을 완성하는 것처럼, PRS는 여러 개의 유전자 변이를 종합하여 질병 발생 위험을 더 정확하게 예측할 수 있도록 도와줍니다.

**약물 유전체학에 PRS를 활용하는 이유**

PRS는 약물 유전체학에서 매우 유용하게 활용될 수 있습니다. 

* **개인 맞춤형 치료:** PRS를 이용하여 개인의 약물 반응을 예측하고, 가장 효과적인 약과 용량을 선택할 수 있습니다. 

* **부작용 감소:** 부작용이 나타날 가능성이 높은 약물 사용을 줄여 환자의 안전을 확보할 수 있습니다. 

* **치료 효과 증가:** 개인에게 맞는 약을 사용하여 치료 효과를 높일 수 있습니다.

**연구 내용**

이 연구는 약물 유전체학에서 PRS를 활용하는 데 있어서 발생하는 어려움과 해결 방안을 제시하고 있습니다. 특히, 다양한 인종 간의 유전적 차이를 고려하여 PRS를 적용하는 방법에 대한 연구가 진행되었습니다. 

**연구 결과 및 고찰**

* **PRS의 한계점:** PRS는 아직까지 완벽한 예측 모델이 아니며, 환경적인 요인이나 다른 유전적 변이 등 다양한 요소가 질병 발생에 영향을 미치기 때문에 PRS만으로 질병을 완벽하게 예측하기는 어렵습니다.

* **인종 간 차이:** PRS는 주로 유럽인을 대상으로 개발되었기 때문에 다른 인종에게는 정확도가 떨어질 수 있습니다. 따라서 다양한 인종을 대상으로 PRS를 개발하고 검증하는 연구가 필요합니다.

* **미래 전망:** PRS는 아직 초기 단계에 있지만, 앞으로 더 많은 연구를 통해 정확도가 높아지고 다양한 질병에 적용될 수 있을 것으로 기대됩니다. 

**결론**

약물 유전체학은 개인 맞춤형 치료를 가능하게 하는 미래 의학의 핵심 분야입니다. PRS는 약물 유전체학 연구에 새로운 가능성을 열어주고 있으며, 앞으로 더 많은 연구를 통해 더욱 발전할 것으로 기대됩니다. 



clova-x

제목: 약물유전체학에서 다유전자 위험 점수(PRS)의 활용과 그에 따른 연구 결과

안녕하세요, 여러분! 오늘은 약물유전체학과 관련된 흥미로운 주제를 다루어 보려고 합니다. 바로 다유전자 위험 점수(PRS)라는 개념인데요, 이는 유전적 위험을 예측하는 데 사용되는 도구 중 하나입니다. 이번 글에서는 PRS가 약물유전체학에서 어떻게 활용될 수 있는지, 그리고 이와 관련된 연구 결과에 대해 알아보겠습니다.

먼저, 약물유전체학이란 개인의 유전적 특성이 약물 반응에 미치는 영향을 연구하는 학문입니다. 여기서 중요한 점은 모든 사람이 동일한 방식으로 약물에 반응하지 않는다는 것입니다. 유전적 요인은 우리의 약리학적 반응에 영향을 미칠 수 있으며, 이는 개인 맞춤형 치료를 가능하게 하는 중요한 요소입니다.

GWAS는 게놈 전체에서 유전적 변이와 특정 질병 또는 특성 사이의 연관성을 찾는 연구 방법입니다. 이 방법을 통해 수많은 유전적 변이가 발견되었으며, 이들은 질병의 감수성과 약물 반응에 영향을 미칠 수 있습니다.

PRS는 이러한 GWAS 연구에서 나온 데이터를 기반으로 생성됩니다. 즉, 여러 유전적 변이의 영향을 하나의 점수로 종합하여 표현한 것입니다. 이는 개인의 유전적 위험을 예측하는 데 사용될 수 있으며, 약물유전체학에서는 특히 개인 맞춤형 치료를 제공하는 데 도움이 될 수 있습니다.

PRS를 약물유전체학에 활용하는 것에는 몇 가지 장점이 있습니다. 우선, PRS는 대규모 GWAS 연구에서 도출된 유전적 변이를 활용하므로, 높은 예측력을 가질 수 있습니다. 또한, 개인의 유전적 특성을 고려하여 약물 반응을 예측함으로써, 불필요한 부작용을 줄이고 치료 효과를 높일 수 있습니다.

하지만, PRS에도 몇 가지 단점이 존재합니다. 예를 들어, PRS는 아직 완벽하지 않으며, 예측력에는 한계가 있을 수 있습니다. 또한, 유전적 요인 외에도 환경적 요인이 약물 반응에 영향을 미칠 수 있으므로, PRS만으로 모든 것을 설명할 수는 없습니다.

이번에 소개한 연구에서는 약물유전체학 GWAS에 PRS 방법을 적용하여, 환자 계층화와 약물 반응 예측을 개선할 수 있는 가능성을 탐색하였습니다. 연구 결과, PRS는 약물 반응 예측에 있어 유의미한 결과를 보여주었으며, 환자 계층화에도 활용될 수 있는 것으로 나타났습니다.

그러나, 이 연구에서도 언급되었듯이, PRS를 약물유전체학에 적용하는 데에는 여전히 여러 가지 도전 과제가 남아 있습니다. 예를 들어, 유전적 변이 선택의 문제, 샘플 크기의 한계, 그리고 복잡한 통계 모델링 등이 그 과제입니다.

그럼에도 불구하고, PRS는 약물유전체학 분야에서 중요한 발전을 가져올 수 있는 도구 중 하나로 여겨집니다. 개인의 유전적 특성을 고려한 맞춤형 치료를 제공함으로써, 의료 서비스의 질을 향상시킬 수 있을 것으로 기대됩니다.

이번 글에서는 약물유전체학과 PRS에 대한 기본적인 개념과 그 활용에 대해 알아보았습니다. 앞으로의 연구를 통해 PRS의 정확도와 활용도가 더욱 향상될 것으로 기대됩니다. 감사합니다!



chatGPT

### **약물유전체학과 다유전자 위험 점수 (PRS)의 가능성: 약물 유전체학 연구에서의 활용**  

유전학과 약물 반응의 연결고리는 현대 의학에서 중요한 분야로 자리 잡았습니다. 여기서 등장하는 개념이 바로 **약물유전체학(Pharmacogenomics)**과 **다유전자 위험 점수(Polygenic Risk Score, PRS)**입니다. 본 글에서는 이를 쉽게 설명하고, 최근 PRS를 약물유전체학 연구에 적용한 연구를 바탕으로 그 가능성과 한계를 살펴보겠습니다.

---

### **1. 약물유전체학이란?**  

약물유전체학은 개개인의 유전적 차이가 약물의 효과와 부작용에 어떤 영향을 미치는지 연구하는 분야입니다.  

- **목표:** 환자에게 최적화된 약물 선택 및 용량 조절로 맞춤형 치료를 실현.  

- **주요 연구 대상:** 약물의 **약동학(Pharmacokinetics, PK)** (흡수, 분포, 대사, 배설) 및 **약력학(Pharmacodynamics, PD)** (약물의 생리적 효과) 과정에 영향을 미치는 유전자.

---

### **2. 다유전자 위험 점수 (PRS)란?**  

PRS는 질병 위험을 예측하기 위해 여러 유전적 변이를 조합하여 점수화한 지표입니다.  

- **구성 요소:** 개별 변이(SNP)들의 효과 크기를 종합.  

- **활용:** 특정 질병의 유전적 소인을 평가하거나, 건강한 사람들을 위험군과 비위험군으로 나누는 데 사용.  

예를 들어, 심장병 예측을 위한 PRS는 심장병 관련 유전자의 변이를 분석하여 고위험군(상위 8%)을 식별하는 데 성공한 사례가 있습니다.

---

### **3. PRS와 약물유전체학의 만남: 가능성은?**  

약물유전체학 연구에서 PRS의 적용은 새로운 가능성을 열어줍니다.  

- PRS를 통해 약물 반응을 더 정확히 예측할 수 있어, 개인별 맞춤 치료의 정밀도를 높일 수 있습니다.

- 예를 들어, 특정 항정신병제의 효과는 환자의 PRS 점수에 따라 달라진다는 연구 결과가 있습니다.

---

### **4. PRS의 약물유전체학 적용 시 도전 과제**  

1. **데이터 부족:** 약물유전체학 연구는 질병 연구에 비해 샘플 크기가 작아 PRS 분석의 통계적 파워가 낮을 수 있음.  

2. **유럽 중심 데이터 편향:** 유럽인 데이터에 기반한 PRS는 다른 인종에서 덜 정확하게 작동할 가능성이 높음.  

3. **복잡한 모델 요구:** 약물 반응은 유전적 요인뿐만 아니라 약물 치료와의 상호작용도 포함하므로 더 정교한 PRS 모델이 필요.  

---

### **5. 연구에서 제안된 솔루션**  

연구팀은 PRS를 약물유전체학 연구에 효과적으로 적용하기 위한 방법으로 두 가지를 제안했습니다:  

1. **질병 및 약물유전체 데이터 통합:** 질병 GWAS와 약물유전체학 GWAS 데이터를 모두 활용하여 PRS를 생성.  

   - 더 많은 샘플로 예측 정확도를 높이고, 약물 반응 예측에서의 유효성을 강화.  

2. **새로운 통계 모델 개발:** **PRS-PGx-Bayesx**라는 새로운 Bayesian 기반 모델을 통해 여러 인종 데이터를 통합하여 인종적 편향을 줄임.  

---

### **6. 연구 결과 요약**  

- PRS-PGx-Bayesx는 기존 PRS 모델보다 약물 반응 예측 정확도가 높았으며, 특히 데이터가 제한적인 상황에서 강점을 보였습니다.  

- 여러 인종 데이터를 통합했을 때, 유럽 중심 데이터에서 발생하는 편향을 효과적으로 줄일 수 있음을 확인.  

---

### **7. PRS의 장점과 한계**  

**장점**  

- 유전적 변이를 기반으로 질병 및 약물 반응 예측 가능.  

- 환자 맞춤형 치료의 핵심 기술로 부상.  

**한계**  

- 데이터 부족과 인종 간 편향 문제.  

- 복잡한 통계 모델 요구로 실질적인 적용까지의 추가 연구 필요.  

---

### **맺음말**  

PRS는 약물유전체학 분야에서 개인화된 의학 실현을 위한 중요한 도구로 자리 잡고 있습니다. 이번 연구는 PRS가 약물 반응 예측에 어떻게 기여할 수 있는지 보여주며, 이를 통해 환자 중심 치료를 한 단계 더 진전시킬 가능성을 열어주었습니다. 앞으로 더 많은 연구와 데이터 축적을 통해 PRS가 의료 현장에서 실질적으로 활용될 날을 기대합니다.  



NotebookLM

## 개인 맞춤형 약물 치료의 미래, 다유전자 위험 점수(PRS) 활용

### 들어가며: 약물 유전체학과 개인 맞춤형 의학

현대 의학은 개인 맞춤형 의학 시대로 접어들고 있습니다. 환자 개개인의 유전적 특징을 고려하여 질병 위험을 예측하고, 가장 효과적이고 안전한 치료법을 선택하는 것이 개인 맞춤형 의학의 핵심입니다. 

**약물 유전체학**은 이러한 개인 맞춤형 의학의 중요한 분야 중 하나로, 유전적 변이가 약물 반응에 미치는 영향을 연구합니다. 약물 유전체학 연구를 통해 우리는 개인에게 최적화된 약물 종류와 용량을 결정하고, 약물 부작용을 예측하여 치료 효과를 극대화할 수 있습니다.

### 1. 유전체 정보 분석의 핵심 도구: GWAS와 PRS

**전장유전체 연관 분석(GWAS)**은 개인의 유전체 전체를 스캔하여 특정 질병이나 특징과 관련된 유전적 변이를 찾는 연구 방법입니다. GWAS를 통해 우리는 특정 질병에 걸릴 위험을 높이거나 낮추는 유전자 변이를 식별할 수 있습니다.

**다유전자 위 점수(PRS)**는 GWAS 결과를 바탕으로 개인의 유전체 정보를 종합하여 특정 질병이나 특징에 대한 유전적 위험도를 수치화한 점수입니다. 수많은 유전자 변이가 복합적으로 작용하여 질병 발생에 영향을 미치는 경우, PRS는 개인의 질병 위험을 예측하는 데 유용하게 활용될 수 있습니다.

### 2. 약물 유전체학에서 PRS의 활용: 가능성과 과제

PRS는 약물 유전체학 연구에도 활용되어 **약물 반응성 예측**과 **환자 계층화**에 기여할 수 있습니다.

* **약물 반응성 예측**:  특정 약물에 대한 개인의 반응성을 예측하여 치료 효과를 높이고 부작용을 줄일 수 있습니다. 예를 들어, 심혈관 질환 치료제인 에볼로쿠맙의 경우, PRS를 이용하여 약물 치료 효과가 높을 것으로 예상되는 환자를 선별할 수 있습니다. 

* **환자 계층화**:  PRS를 기준으로 환자를 유전적 위험도에 따라 그룹화하여 치료 전략을 차별화할 수 있습니다.

하지만, 약물 유전체학에서 PRS를 활용하는 데에는 몇 가지 과제가 존재합니다.

* **기반 코호트 선택 문제**: PRS를 구축할 때, 질병 GWAS 데이터를 사용할지, 약물 유전체학 GWAS 데이터를 사용할지, 아니면 둘 다 사용할지 결정해야 합니다. 질병 GWAS 데이터는 샘플 크기가 크다는 장점이 있지만, 약물 반응성 예측에 직접적으로 관련된 정보가 부족할 수 있습니다. 반대로, 약물 유전체학 GWAS 데이터는 약물 반응성과 관련된 정보를 제공하지만, 샘플 크기가 작아 예측 정확도가 떨어질 수 있습니다.

* **유럽 중심적 편향**:  대부분의 GWAS 연구는 유럽계 인구를 대상으로 수행되어 왔기 때문에, 다른 인종 집단에 PRS를 적용할 때 예측 정확도가 떨어지는 문제가 발생할 수 있습니다.

* **작은 샘플 크기**:  약물 유전체학 GWAS는 질병 GWAS에 비해 샘플 크기가 작은 경우가 많아 PRS의 예측 정확도를 제한할 수 있습니다.

* **복잡한 PRS 모델링**: 약물 반응성은 유전적 요인뿐만 아니라 환경적 요인, 약물 상호 작용 등 다양한 요인의 영향을 받기 때문에 PRS 모델링이 복잡해질 수 있습니다.

### 3. 연구 결과: PRS 성능 향상을 위한 노력

본 연구에서는 약물 유전체학 GWAS에서 PRS를 활용할 때 발생하는 과제를 해결하기 위한 새로운 분석 전략과 방법을 제시하고 있습니다.

* **질병 및 약물 유전체학 GWAS 데이터의 통합**:  PRS 구축 과정에서 질병 GWAS와 약물 유전체학 GWAS 데이터를 모두 활용하여 예측 정확도를 높이는 방법을 제안합니다. 질병 GWAS 데이터는 예후 효과 예측에, 약물 유전체학 GWAS 데이터는 예측 효과 예측에 각각 강점을 가지고 있기 때문에, 두 데이터를 통합하여 사용하면 PRS 성능을 향상시킬 수 있습니다.

* **새로운 베이지안 방법(PRS-PGx-Bayesx) 개발**: 유럽 중심적 편향 문제를 해결하기 위해 다양한 인종 집단의 유전체 정보를 활용하여 PRS를 구축하는 새로운 베이지안 방법을 개발했습니다. PRS-PGx-Bayesx는 여러 인종 집단에서 공유되는 shrinkage parameter를 사용하여 집단 간의 차이를 조정하고, 예측 정확도를 향상시킵니다.

* **다중 형질 PRS 방법**:  유전적으로 관련된 여러 형질의 정보를 통합하여 PRS 분석의 검정력을 높이는 방법을 제안합니다. 여러 형질의 정보를 활용하면 PRS가 더 많은 유전적 변이를 포착할 수 있으므로, 약물 반응 예측 및 환자 계층화에 도움이 됩니다.

### 4. 고찰: PRS의 미래와 개인 맞춤형 의학

PRS는 약물 유전체학 연구에서 개인 맞춤형 의학을 실현하기 위한 강력한 도구가 될 수 있습니다. 그러나 PRS의 정확성과 신뢰성을 높이기 위해서는 앞서 언급된 과제들을 해결하기 위한 지속적인 연구가 필요합니다.

* **다양한 인종 집단**:  다양한 인종 집단의 유전체 정보를 포함하는 대규모 GWAS 연구를 통해 유럽 중심적 편향 문제를 해결하고, PRS의 일반화 가능성을 높여야 합니다.

* **표현형**:  약물 반응은 다양한 표현형으로 나타날 수 있으므로, 정확하고 일관된 표현형 정의와 측정 방법을 개발해야 합니다.

* **임상적 유용성**:  PRS의 임상적 유용성을 입증하기 위해 PRS를 사용한 약물 반응 예측 결과와 실제 치료 결과를 비교하는 연구가 필요합니다.

### 5. 결론: PRS, 개인 맞춤형 약물 치료의 핵심 열쇠

PRS는 개인 맞춤형 약물 치료 시대를 앞당기는 핵심 열쇠가 될 것입니다. 약물 유전체학 연구에서 PRS의 활용 가능성은 무궁무진하며, 앞으로 PRS 연구의 발전과 함께 개인 맞춤형 의학 시대가 더욱 가속화될 것으로 기대됩니다. 


약물유전체학을 얘기하면 항상 라떼에는 나오는 것이 헤파린, 와파린, 아스피린같은 얘기들이었을 겁니다. 사실 이거 말고 일반적으로 많이 활용되는 예가 없는게 다른것들을 얘기해봤자 직접적으로 체감되지 않는것도 있을 것이고, 위의 예들 외에 드라마틱하게 보여줄 만한 내용들도 없어서 그러지 않았나 싶기도 합니다. 그럼에도 연구는 계속 되고 있었고, 23년도에 Bayesian 통계모델을 가지고 작성한 논문이 나온거 보니 어딘가에 찾아보면 deep learning을 이용한 논문도 있을 것 같네요. 계속 데이터들이 쌓이고 있다보니 25년도 쯤에는 좀더 상용화된 tool이 나오지 않을까 싶네요. 


출처: @ye._.vely618


화요일, 11월 26, 2024

가족 유전체 정보로 질병 위험도 예측하기

오늘은 PRS관련해서 22년도에 나왔던 가족을 대상으로 사례 연구한 논문을 가져와봤습니다. 제목은 Implementation of individualised polygenic risk score analysis: a test case of a family of four입니다. 기존에 연구된 GWAS등 정보를 바탕으로 모델을 만들어 놓고 4인 가족의 유전체 정보를 바탕으로 질명에 대해서 예측해본 논문 되겠습니다.

DOI: 10.1186/s12920-022-01331-8


gemini

## 내 유전자에 질병의 비밀이? 가족 유전체로 질병 위험도 알아보기!

### 🧬 유전자와 질병, 무슨 관계가 있을까요?

우리 몸의 설계도인 유전자는 키, 눈 색깔 같은 외모뿐만 아니라 질병 발생에도 영향을 미칩니다. 암, 당뇨병, 심혈관 질환과 같은 흔한 질병들은 여러 유전자 변이가 복합적으로 작용하여 발생하는데, 이러한 유전적 요인을 분석하여 질병 발생 위험도를 예측하는 기술이 바로 **다유전자 위험점수(PRS)** 입니다.

### 👨‍👩‍👧‍👦 가족 유전체로 질병 위험도 예측하기

최근, 가족 구성원 4명의 유전체 데이터를 이용하여 PRS를 분석한 흥미로운 연구 결과가 발표되었습니다. 이 연구는 공개된 유전체 데이터베이스와 가족의 전체 유전체 염기서열 분석 데이터를 활용하여 암, 심혈관 질환, 대사 질환, 자가면역 질환 등 15가지 질병에 대한 위험도를 예측했습니다.

### 📈 연구 방법

1. **유전체 데이터 수집**: 4명 가족 구성원의 타액 샘플을 채취하여 전체 유전체 염기서열 분석을 수행했습니다.

2. **PRS 계산**: 공개 데이터베이스에서 수집한 질병 관련 유전자 변이 정보를 이용하여 각 가족 구성원의 PRS를 계산했습니다.

3. **위험도 예측**: 1000 Genomes Project 데이터베이스의 인구 집단 정보를 활용하여 가족 구성원의 PRS를 비교 분석하고, 각 질병에 대한 위험도를 백분위수로 나타냈습니다. 즉, 특정 질병에 대한 위험도가 상위 5%에 해당한다면, 해당 질병에 걸릴 확률이 인구 집단의 95%보다 높다는 것을 의미합니다.

### 💡 이 연구를 통해 알 수 있는 것은 무엇일까요?

* **개인별 질병 위험도 예측**: 가족 구성원 각자의 유전 정보를 바탕으로 15가지 질병에 대한 개인별 위험도를 예측할 수 있습니다. 예를 들어, 아버지는 대장암 위험도가 높지만, 심혈관 질환 위험도는 낮게 나타났습니다.

* **질병 예방 및 관리**: 높은 위험도를 보이는 질병에 대해서는 정기적인 검진, 생활 습관 개선 등 예방적 조치를 취할 수 있습니다.

* **유전적 요인과 질병의 관계**: 가족 구성원 간 질병 위험도를 비교 분석함으로써 유전적 요인이 질병 발생에 미치는 영향을 파악할 수 있습니다.

### 🚧 연구의 한계점

* **제한적인 표본 크기**: 4명의 가족 구성원만을 대상으로 했기 때문에 연구 결과를 일반화하기에는 제한적입니다.

* **인종적 다양성 부족**: 연구에 참여한 가족 구성원은 모두 스페인 이베리아인으로, 다른 인종 집단에 대한 PRS 예측 정확도는 다를 수 있습니다.

### ✨ 연구의 의의

이 연구는 개인 유전체 데이터를 활용하여 질병 위험도를 예측하고, 개인 맞춤형 질병 예방 및 관리 전략을 수립하는 데 도움을 줄 수 있음을 보여줍니다. 또한, PRS 연구의 표준화 및 개선 필요성을 제기하며, 향후 더욱 정확하고 신뢰성 있는 질병 위험도 예측 기술 개발에 기여할 수 있을 것으로 기대됩니다.



clova-x

제목: 가족 유전체 데이터를 활용한 질병 위험도 예측 연구

안녕하세요! 오늘은 유전체 연구 분야에서 최근에 진행된 흥미로운 연구에 대해 소개해 드리려고 합니다. 이 연구는 개인 유전체 데이터를 활용하여 질병 위험도를 예측하는 다유전자 위험 점수(Polygenic Risk Score, PRS)를 가족 구성원에게 적용한 사례 연구입니다.

1. 연구 방법

먼저, 연구진은 공공 데이터 저장소에서 수집한 PRS 소스를 체계적으로 선별하고, 암, 심혈관, 대사 및 자가면역 질환과 관련된 3,700만 개 이상의 SNP를 포함하는 15개의 표현형을 선택했습니다. 그리고 선택된 표현형을 가족 구성원 네 명의 전체 게놈 시퀀싱 데이터를 사용하여 테스트하였습니다. 각 개인의 위험 점수는 1000 게놈 이베리아인, 유럽인 또는 모든 샘플 참조 분포에 기반한 백분위수로 부여되었습니다.

2. 연구를 통해 얻을 수 있는 내용

이 연구를 통해 우리는 가족 내에서 유전적 요인이 질병 위험도에 미치는 영향을 파악할 수 있습니다. 또한, PRS를 개인 수준에서 질병 예방에 활용할 수 있는 가능성을 보여줍니다.

3. 한계점

이 연구는 가족 구성원 네 명을 대상으로 한 소규모 연구이기 때문에, 결과를 일반화하기 어렵습니다. 또한, PRS는 환경적 요인을 고려하지 않기 때문에, 실제 질병 발생 위험을 완벽하게 예측하지 못할 수 있습니다.

4. 의의

그럼에도 불구하고, 이 연구는 PRS 개발 및 공유에 대한 표준화의 필요성, 유전적 평균 가정 대신 개별 위험 평가의 중요성, 그리고 PRS를 위험 지표로 변환할 때 발생하는 현재의 도전 과제를 강조합니다. 또한, 가족 내에서 유전적 요인이 질병 위험도에 미치는 영향을 파악함으로써, 개인 맞춤형 질병 예방에 기여할 것으로 기대됩니다.




chatGPT

**개인 유전자 데이터를 이용한 질병 예측: 한 가족 사례로 본 다중유전자 위험 점수(PRC) 연구**

오늘날 유전학의 발달로 개인의 유전자 정보를 바탕으로 질병 위험을 예측할 수 있는 도구들이 발전하고 있습니다. 다중유전자 위험 점수(Polygenic Risk Score, PRS)는 수백만 개의 유전적 변이를 분석하여 특정 질병에 걸릴 위험을 수치화해 보여주는 방법입니다. 이번에 소개할 연구는 한 가족의 유전자 정보를 활용해 다중유전자 위험 점수를 계산하고, 이를 통해 질병 발생 가능성을 예측한 흥미로운 사례입니다.

### 연구 방법: 다중유전자 위험 점수(PRC)의 활용

이 연구에서는 부모와 두 자녀로 구성된 한 가족의 유전체 데이터를 사용했습니다. 연구팀은 암, 심혈관 질환, 대사 질환, 자가면역 질환 등 15가지 주요 질병과 관련된 수백만 개의 유전 변이를 포함한 PRS를 계산했습니다. 유전적 위험 점수를 계산하기 위해 연구팀은 1000개의 유전체 프로젝트(1000 Genomes Project)에서 얻은 데이터를 참조하여 각 가족 구성원의 점수를 해당 인구의 유전자 분포와 비교했습니다. 이를 통해 개인의 위험 점수를 인구 평균과 비교하여, 각 가족 구성원이 질병에 걸릴 위험이 얼마나 높은지를 평가했습니다.

### PRS를 통해 얻을 수 있는 정보

다중유전자 위험 점수를 통해 다음과 같은 유용한 정보를 얻을 수 있습니다.

1. **질병 발생 가능성 평가**: 각 구성원이 특정 질병에 걸릴 위험도가 얼마나 높은지 수치적으로 확인할 수 있습니다. 예를 들어, 가족 중에서 특정 암에 대한 위험 점수가 높은 구성원이 있다면, 이를 미리 알고 건강 관리에 더 많은 주의를 기울일 수 있습니다.

 2. **유전적 위험의 가족 내 전이**: 한 가족 내에서 질병에 대한 유전적 위험이 어떻게 전달되는지 확인할 수 있습니다. 이 연구에서는 부모의 위험 점수가 자녀에게 어떻게 전달되는지 관찰하여, 유전적 위험이 단순히 평균적으로 전달되는 것이 아니라 특정 질병에서는 부모 중 한 사람의 고위험도가 자녀에게 영향을 미칠 수 있음을 발견했습니다.

3. **개인화된 건강 관리 가능성**: PRS는 단순한 통계적 예측을 넘어서 개인화된 건강 관리 전략을 세우는 데 중요한 기초 자료가 될 수 있습니다. 개인의 유전적 위험을 미리 알고 예방적 조치를 취할 수 있기 때문입니다.

### 연구의 한계

다중유전자 위험 점수에는 아직 해결해야 할 몇 가지 한계가 존재합니다.

- **유전자 데이터의 다양성 부족**: 이 연구는 유럽인을 대상으로 한 데이터에 기반하고 있어, 다른 인종 또는 지역 인구에 동일한 정확도로 적용하기 어려울 수 있습니다.

  - **개인별 차이 고려 부족**: 현재 PRS는 인구 통계를 바탕으로 위험을 계산하기 때문에 개개인의 생활 습관, 환경적 요인, 다른 건강 정보 등을 충분히 반영하지 못합니다. 

- **정확성 문제**: PRS는 예측 도구이기 때문에 질병 발생을 확정적으로 진단하는 것이 아닙니다. 예를 들어, PRS가 높은 경우에도 반드시 질병에 걸리는 것은 아니며, 반대로 점수가 낮다고 해서 완전히 안전한 것은 아닙니다.

### 연구의 의의

이 연구는 다중유전자 위험 점수를 개인화된 건강 관리에 실제로 적용하는 데 중요한 자료가 됩니다. 특히 가족 간의 유전적 위험 전달 양상을 분석함으로써, 다중유전자 위험 점수를 어떻게 실생활에 활용할 수 있을지에 대한 실마리를 제공합니다. 앞으로 PRS가 더 널리 활용되기 위해서는 더 많은 인종과 지역 인구를 포함한 데이터가 필요하며, 생활습관과 환경적 요인도 반영할 수 있는 방법이 개발되어야 합니다.

이번 연구는 다중유전자 위험 점수가 단순히 연구의 결과에 그치지 않고, 미래의 개인 맞춤형 건강 관리를 위한 중요한 도구로 자리 잡을 가능성을 제시합니다.



NotebookLM

## 가족 유전체 데이터를 활용한 질병 위험도 예측: 다유전자 위험 점수(PRS) 사례 연구

### 들어가며: 유전체 연구와 질병 예측

최근 유전체 연구, 특히 **GWAS(Genome-Wide Association Study, 전장유전체연관분석)**는 질병 발생에 영향을 미치는 유전적 요인을 밝혀내는 데 큰 역할을 하고 있습니다. GWAS는 수많은 사람들의 유전체 데이터를 분석하여 특정 질병과 관련된 유전자 변이를 찾아냅니다. 이러한 연구 결과를 바탕으로 개인의 유전체 정보를 분석하여 질병 발생 위험도를 예측할 수 있게 되었는데, 이때 활용되는 것이 바로 **다유전자 위험 점수(Polygenic Risk Score, PRS)**입니다.

### 다유전자 위험 점수(PRS)란?

**PRS는 여러 유전자 변이의 영향을 종합적으로 평가하여 특정 질병에 대한 개인의 유전적 위험도를 나타내는 점수**입니다. GWAS를 통해 질병과 관련된 유전자 변이들이 밝혀지면, 개인의 유전체 데이터에서 해당 변이들을 찾아내 각 변이의 위험도를 계산하고 합산하여 PRS를 계산합니다. PRS 점수가 높을수록 해당 질병에 걸릴 확률이 높다는 것을 의미합니다.

### 선택한 소스: 4인 가족의 PRS 분석 사례 연구

선택한 소스는 **4인 가족 구성원의 전체 유전체 염기서열 분석(Whole Genome Sequencing, WGS) 데이터를 이용하여 15가지 질병에 대한 PRS를 계산하고 분석한 사례 연구**입니다. 연구진은 공개 데이터베이스에서 암, 심혈관 질환, 대사 질환, 자가 면역 질환 등 다양한 질병에 대한 PRS 정보를 수집하고 엄격한 기준으로 선별하여 연구에 활용했습니다.

### 연구 방법

1. **PRS 정보 수집 및 선별**: 연구진은 Polygenic Score Catalog, Cancer-PRSweb 등의 공개 데이터베이스에서 15가지 질병에 대한 PRS 정보를 수집했습니다. 선별 기준으로는 GWAS 연구 설계, 성능 지표(AUC 등), 위험 경계, 검증 코호트 등을 고려했습니다.

2. **가족 유전체 데이터 분석**: 4인 가족 구성원의 타액 샘플에서 DNA를 추출하고 WGS를 수행하여 전체 유전체 데이터를 확보했습니다.

3. **1000 Genomes Project 데이터 활용**:  1000 Genomes Project 참가자들의 유전체 데이터를 활용하여 15가지 질병에 대한 PRS 배경 분포를 생성했습니다. 이는 개인의 PRS를 객관적으로 평가하기 위한 기준으로 사용됩니다.

4. **개인별 PRS 및 백분위수 계산**: 가족 구성원 각각의 유전체 데이터에서 질병 관련 유전자 변이를 확인하고, 해당 변이의 위험도를 합산하여 개인별 PRS를 계산했습니다. 계산된 PRS를 1000 Genomes Project 배경 분포와 비교하여 각 개인의 PRS 백분위수를 도출했습니다. 

5. **PRS 백분위수 해석 및 질병 위험 평가**:  PRS 백분위수는 특정 집단 내에서 개인의 질병 위험도가 어느 정도 수준인지를 나타냅니다. 예를 들어, PRS 백분위수가 90%라면, 해당 질병에 대해 유전적 위험도가 상위 10%에 속한다는 것을 의미합니다. 연구진은 가족 구성원의 PRS 백분위수를 바탕으로 각 개인의 질병 위험도를 상대적으로 평가했습니다. 

6. **배경 집단의 영향 분석**:  연구진은 이베리아 스페인(IBS), 유럽(EUR), 전체 인구(ALL) 등 세 가지 1000 Genomes Project 인종 그룹을 배경 집단으로 사용하여 PRS 백분위수를 계산하고 결과를 비교했습니다. 이를 통해 배경 집단에 따라 PRS 백분위수가 어떻게 달라지는지, 즉 특정 인종 집단에 적용된 PRS 모델이 다른 인종 집단에서도 동일하게 적용될 수 있는지를 분석했습니다. 

### 연구 결과 및 해석

* **개인별 질병 위험도 차이**:  연구 결과, 가족 구성원 간에 동일한 질병에 대해 PRS 백분위수가 다르게 나타났습니다. 즉, 동일한 가족 구성원이라도 유전적 요인에 따라 질병 위험도가 다르게 나타날 수 있음을 보여줍니다.

* **위험 유전 패턴 분석**:  일부 질병의 경우 부모에게서 높은 PRS 백분위수가 관찰되면 자녀에게도 높은 PRS 백분위수가 나타나는 경향을 보였습니다. 그러나 모든 질병에서 이러한 경향이 나타나는 것은 아니었으며, 부모의 PRS 백분위수와 자녀의 PRS 백분위수 사이에 명확한 상관관계가 없는 경우도 있었습니다.

* **배경 집단의 영향**:  배경 집단에 따라 개인의 PRS 백분위수가 달라지는 현상이 관찰되었습니다. 특히, 특정 질병의 경우 이베리아 스페인(IBS) 또는 유럽(EUR) 집단을 배경 집단으로 사용했을 때보다 전체 인구(ALL)를 배경 집단으로 사용했을 때 PRS 백분위수가 크게 변하는 경우가 있었습니다. 이는 PRS 모델의 인종 특이성을 시사하는 결과입니다.

### 연구의 한계점

* **제한적인 연구 규모**:  4인 가족이라는 제한적인 연구 규모는 결과의 일반화 가능성을 제한합니다. 더 많은 수의 개인을 대상으로 한 추가 연구가 필요합니다.

* **특정 인종 집단에 대한 연구**:  이베리아 가족에 대한 연구 결과는 다른 인종 집단에 일반화하기 어려울 수 있습니다. 다양한 인종 집단을 대상으로 한 연구가 필요합니다.

* **1000 Genomes Project 데이터의 한계**:  1000 Genomes Project 데이터의 인종 그룹 구성 방식이 연구 결과에 영향을 미칠 수 있습니다.

* **사용된 PRS 정보의 한계**:  연구에 사용된 PRS 정보의 출처, GWAS 연구 설계, 검증 코호트 등에 따라 결과가 달라질 수 있습니다.

### 연구의 의의 및 기여

* **개인 맞춤형 질병 예측 가능성 제시**:  이 연구는 개인의 유전체 데이터를 활용하여 질병 위험도를 예측하고 개인 맞춤형 질병 예방 전략을 수립할 수 있는 가능성을 제시했습니다.

* **질병 위험 예측 및 예방 연구 발전에 기여**:  PRS 연구 방법론 및 결과 해석에 대한 이해를 높여 향후 질병 위험 예측 및 예방 연구 발전에 기여할 수 있습니다.

* **PRS 연구의 표준화 및 개선 필요성 강조**:  연구 결과는 배경 집단에 따라 PRS 백분위수가 달라질 수 있음을 보여주며, PRS 연구의 표준화 및 개선 필요성을 강조합니다.

### 결론

선택한 소스는 가족 유전체 데이터를 활용하여 PRS를 계산하고 질병 위험도를 예측하는 방법론을 제시하고, 개인 맞춤형 질병 예방의 가능성을 보여주는 중요한 사례 연구입니다. 하지만 제한적인 연구 규모, 특정 인종 집단에 대한 연구, 사용된 데이터의 한계 등을 고려하여 결과 해석에 신중해야 하며, 더 많은 연구를 통해 PRS 기반 질병 예측 및 예방 전략을 발전시켜나가야 합니다. 



이미 질병이나 생활습관에 대한 위험도 모델을 구성하기 위한 많은 데이터들이 있습니다.
GWAS Catalog나 UK BioBank, AllofUs, FinnGen등을 비롯해서 국내의 KoGES 같은 데이터들이 공개되어 있습니다. 이 자료들을 가지고 모델링을 잘하면 좋은 모델을 만들 수 있지 않을까하네요 :)


출처: @ye._.vely618


월요일, 11월 18, 2024

유전자와 질병, 그 관계를 밝히는 연구 이야기; OR, IRR의 개념과 중요성

오늘은 제가 잘 다루지는 않지만 DTC 등 질병과 밀접한 관련이 있지 않은 조금은 캐주얼한 유전자 검사에 유용한 내용을 다루는 논문을 한번 가져와봤습니다. 제목은 The importance of distinguishing between the odds ratio and the incidence rate ratio in GWAS 입니다.

DOI: 10.1186/s12881-015-0210-1


이번엔 기존 LLM에 더해서 perplexity에게도 물어보았습니다. :)


gemini

## 유전자와 질병, 그 관계를 밝히는 연구 이야기: 승산비와 발생률 비의 중요성

's12881-015-0210-1.pdf' 파일은 전장 유전체 연관 분석(GWAS)에서 **승산비(Odds Ratio, OR)** 와 **발생률 비(Incidence Rate Ratio, IRR)** 를 구분하는 것의 중요성에 대한 논문입니다. 쉽게 말해, 유전자와 질병 사이의 관계를 파악하는 연구에서 흔히 사용되는 두 가지 지표인 승산비와 발생률 비가 어떤 차이가 있는지, 그리고 왜 그 차이가 중요한지를 다룬 논문입니다.

**전장 유전체 연관 분석(GWAS)** 이란, 우리 몸의 유전 정보 전체를 분석하여 특정 질병과 관련된 유전자 변이를 찾아내는 연구 방법입니다. 

**유전자 변이** 란, 사람마다 유전 정보가 조금씩 다른 것을 의미합니다. 예를 들어 눈동자 색깔이나 머리카락 색깔이 다른 것처럼, 질병에 대한 감수성도 유전자 변이에 따라 다를 수 있습니다.

GWAS에서는 **승산비** 라는 지표를 주로 사용합니다. 승산비는 특정 유전자 변이를 가진 사람이 그 변이가 없는 사람에 비해 질병에 걸릴 확률이 얼마나 높은지를 나타냅니다. 예를 들어, A라는 유전자 변이를 가진 사람이 B라는 질병에 걸릴 승산비가 2라면, A 변이를 가진 사람은 그 변이가 없는 사람에 비해 B 질병에 걸릴 확률이 2배 높다는 것을 의미합니다.

하지만 승산비는 **특정 시점에** 질병에 걸려 있을 확률만을 보여주기 때문에, 시간에 따른 질병 발생률을 제대로 반영하지 못할 수 있습니다. 즉, A 변이를 가진 사람이 B 질병에 걸릴 확률이 2배 높더라도, B 질병에 걸리기 전에 다른 원인으로 사망할 확률 또한 높다면 실제 B 질병 발생률은 2배보다 낮을 수 있습니다.

이러한 문제를 해결하기 위해 **발생률 비** 라는 지표를 사용할 수 있습니다. 발생률 비는 **시간이 지남에 따라** 질병에 걸릴 확률을 나타냅니다. 즉, A 변이를 가진 사람이 B 질병에 걸릴 발생률 비가 2라면, A 변이를 가진 사람은 그 변이가 없는 사람에 비해 B 질병에 걸릴 위험이 2배 높다는 것을 의미합니다.

논문에서는 유전자 변이가 수명과 관련된 경우, 승산비가 실제 발생률 비보다 높게 추정될 수 있다는 것을 보여줍니다. 예를 들어, C라는 유전자 변이를 가진 사람이 D라는 질병에 걸릴 확률은 높지만, 동시에 더 오래 살 수 있다면, D 질병에 걸릴 승산비는 높게 나타나지만 실제 발생률 비는 그보다 낮을 수 있습니다.

**False positive** 란, 실제로는 관련이 없는데 관련이 있는 것처럼 잘못 판단하는 것을 의미합니다. **False negative** 란, 실제로는 관련이 있는데 관련이 없는 것처럼 잘못 판단하는 것을 의미합니다. 유전자 변이와 질병 발생률 사이의 연관성을 연구할 때, false positive 또는 false negative 결과가 나올 수 있습니다. 특히 승산비만을 사용하는 경우, 유전자 변이가 수명과 관련된 경우 false positive 결과가 나올 수 있고, 반대로 유전자 변이가 다른 질병의 위험을 높이는 경우 false negative 결과가 나올 수 있습니다.

따라서 질병의 원인을 정확하게 파악하기 위해서는 발생률 비를 사용하는 것이 더 적절합니다. 발생률 비는 시간에 따른 질병 발생률을 고려하기 때문에, 유전자 변이가 수명이나 다른 질병에 미치는 영향을 배제하고 질병 발생에 대한 유전자 변이의 순수한 영향을 파악할 수 있습니다.

결론적으로, 유전자와 질병 사이의 관계를 연구할 때 승산비와 발생률 비의 차이를 이해하고, 연구 목적에 맞는 지표를 선택하는 것이 중요합니다. 특히 질병의 원인을 파악하는 것이 목적이라면, 발생률 비를 사용하는 것이 더 정확한 결과를 얻을 수 있습니다.



clova-x

전장 유전체 연관 분석(GWAS)은 유전자 변이와 특정 질병 사이의 연관성을 조사하는 연구 방법입니다. 이 분석을 통해 특정 유전자 변이가 특정 질병의 발생 위험을 증가시키는지 여부를 파악할 수 있습니다.

GWAS에서 주로 사용되는 두 가지 지표는 승산비(Odds Ratio, OR)와 발생률 비(Incidence Rate Ratio, IRR)입니다. 이 두 지표는 질병의 발생률과 유병률을 각각 측정하지만, 서로 다른 방식으로 계산되며, 연구 설계와 분석 방법도 다릅니다.

- **승산비(Odds Ratio, OR)**: 이는 질병에 걸린 그룹과 질병에 걸리지 않은 그룹 사이의 유전자 변이 빈도를 비교하여 계산됩니다. OR이 1보다 크면, 해당 유전자 변이가 질병의 발생 위험을 증가시키는 것으로 해석됩니다. 그러나, OR은 질병의 발생률이 아닌 유병률을 측정한다는 점에 유의해야 합니다. 즉, OR은 이미 질병에 걸린 사람들 사이의 유전자 변이 빈도를 나타내는 것입니다.

- **발생률 비(Incidence Rate Ratio, IRR)**: 이는 특정 기간 동안 새로 질병에 걸린 사람들 사이의 유전자 변이 빈도를 측정합니다. IRR은 질병의 발생률을 직접적으로 나타내며, OR과는 달리 질병에 걸리기 전의 유전자 변이 빈도를 고려합니다. 따라서, IRR은 질병의 원인을 파악하는 데 더 유용한 지표일 수 있습니다.

연구 설계와 분석 시, false positive와 false negative 문제를 주의해야 합니다. False positive는 유전자 변이와 질병 사이에 실제로는 연관성이 없는데도 불구하고, 통계적 오류로 인해 연관성이 있는 것으로 잘못 판단하는 것을 말합니다. 반대로, false negative는 실제로는 연관성이 있는데도 불구하고, 이를 발견하지 못하는 것을 의미합니다. 이러한 오류를 최소화하기 위해서는 충분한 샘플 크기와 적절한 통계적 방법을 사용해야 합니다.

또한, 질병의 원인을 파악할 때는 경쟁 이벤트를 고려해야 합니다. 예를 들어, 어떤 유전자 변이가 조기 사망과 동시에 특정 질병의 발생 위험을 증가시킨다면, 단순히 해당 유전자 변이와 질병 사이의 연관성만을 분석하는 것으로는 질병의 원인을 제대로 파악할 수 없습니다. 이 경우, 경쟁 이벤트를 고려한 연구 설계와 분석 방법이 필요합니다.

요약하면, GWAS에서 유전자 변이와 질병 사이의 연관성을 분석할 때는 OR과 IRR을 구분하여 사용해야 하며, 연구 설계와 분석 시 false positive와 false negative 문제, 그리고 경쟁 이벤트를 고려해야 합니다. 이를 통해 보다 정확한 질병의 원인 파악과 예방, 치료 방법 개발에 기여할 수 있습니다.



chatGPT

이 논문은 GWAS(유전체 연관 연구)에서 **오즈 비율(OR)**과 **발생률 비율(IRR)**을 구분하는 것이 중요한 이유를 설명하고 있습니다. 일반인이 이해하기 쉽게 차근차근 설명해 보겠습니다.

### 1. 유전체 연관 연구(GWAS)란?

유전체 연관 연구는 사람의 유전자 변이가 특정 질병과 어떻게 관련되어 있는지 알아보는 연구입니다. 예를 들어, 어떤 유전자가 특정 암에 걸릴 가능성을 높이는지 확인하는 것입니다. 이 연구를 통해 밝혀진 유전자 변이는 질병을 예방하거나 치료할 수 있는 방법을 찾는 데에 도움을 줍니다.

### 2. 오즈 비율(OR)과 발생률 비율(IRR)란?

OR과 IRR은 유전자와 질병의 연관성을 평가할 때 사용하는 통계 지표입니다. 그러나 두 지표는 중요한 차이점을 가지고 있습니다.

- **오즈 비율(OR)**: 특정 유전자가 질병에 걸릴 확률을 상대적으로 보여줍니다. 예를 들어, 특정 유전자를 가진 사람이 질병에 걸린 비율을 가지고 있지 않은 사람과 비교하는 방식입니다. 전통적인 사례-대조 연구(case-control study)에서 많이 쓰입니다.

 - **발생률 비율(IRR)**: 시간에 따른 질병 발생률을 평가합니다. 즉, 유전자가 병에 걸릴 가능성을 시간 경과에 따라 평가하며, 질병의 발생과 관련된 실제 위험을 더 잘 나타내는 경우가 많습니다. IRR은 사건이 시간에 따라 발생하는 비율을 측정하는 데 유용합니다.

이 논문에서는 두 지표를 각각 사용할 때 어떤 차이가 발생하는지 설명합니다. 특히, 유전자 변이가 질병뿐 아니라 다른 사건(예: 사망)과 관련이 있는 경우, OR과 IRR의 값이 달라질 수 있음을 발견했습니다.

### 3. 거짓 양성(False Positive)과 거짓 음성(False Negative) 발생 시 주의점

- **거짓 양성**: 유전자 변이가 실제로 질병과 관련이 없지만 통계적으로 연관이 있는 것처럼 보이는 경우입니다. 예를 들어, 특정 유전자가 심장병과 관계가 없는데도 연구 설계나 데이터 해석 오류로 인해 관계가 있는 것처럼 나타날 수 있습니다. 이런 경우 잘못된 정보를 바탕으로 치료법을 개발하면 효과가 없거나 오히려 부작용이 생길 수 있습니다.

- **거짓 음성**: 반대로, 유전자 변이가 실제로 질병과 관련이 있지만, 통계적으로 관계가 없는 것처럼 보이는 경우입니다. 중요한 유전자 변이를 놓치게 되어 효과적인 치료법을 놓칠 수 있습니다.

OR을 사용할 때는 특히 질병의 유병률(얼마나 많은 사람들이 현재 그 질병을 가지고 있는지)에 민감할 수 있습니다. 따라서 OR만을 사용할 경우, 질병의 원인을 잘못 해석할 위험이 있으며, 이는 거짓 양성 및 거짓 음성을 일으킬 가능성을 높입니다.

### 4. 질병 원인을 찾을 때 주의할 점

질병의 정확한 원인을 찾기 위해서는 OR보다는 IRR을 사용하는 것이 좋습니다. IRR은 유전자가 특정 시점에 병에 걸리는 위험도를 더 정확하게 보여주기 때문입니다. 논문에서는 OR을 사용한 경우와 IRR을 사용한 경우 결과가 상당히 달라질 수 있음을 시뮬레이션을 통해 보여줬습니다. 특히 OR을 사용하면 질병의 빈도가 높은 상황에서 잘못된 결론을 내릴 수 있다고 설명하고 있습니다.

### 결론

이 논문은 유전자 변이와 질병 간의 관계를 연구할 때 OR과 IRR의 차이를 이해하고, 적절한 상황에서 적합한 지표를 선택하는 것이 중요하다고 강조합니다.



NotebookLM

## GWAS, OR, IRR의 개념과 중요성

선택하신 논문은 **전장 유전체 연관 분석(GWAS)**에서 **승산비(Odds Ratio, OR)**와 **발생률 비(Incidence Rate Ratio, IRR)**를 구분하는 것의 중요성을 설명하고 있습니다. 생명공학이나 GWAS에 대한 배경지식이 없는 일반인도 이해할 수 있도록, 논문의 내용을 바탕으로 자세히 설명해 드리겠습니다.

### 1. GWAS란?

GWAS는 **Genome-Wide Association Study**의 약자로, **유전체 전체 연관 분석**이라고 합니다. 쉽게 말해, **우리 몸의 DNA를 구성하는 모든 유전자를 분석하여 특정 질병과 관련된 유전적 변이를 찾는 연구 방법**입니다. GWAS는 많은 질병의 유전적 원인을 밝혀내는 데 큰 역할을 하고 있습니다.

### 2. OR과 IRR이란?

* **OR(Odds Ratio, 승산비)**은 **특정 유전자 변이를 가진 사람들이 질병에 걸릴 확률**을 **그 변이를 가지고 있지 않은 사람들이 질병에 걸릴 확률**과 비교한 값입니다. 

* **IRR(Incidence Rate Ratio, 발생률 비)**은 **특정 유전자 변이를 가진 사람들이 질병에 걸리는 속도**를 **그 변이를 가지고 있지 않은 사람들이 질병에 걸리는 속도**와 비교한 값입니다. 

**OR은 특정 시점에서 질병의 유병률을 기반으로 계산되는 반면, IRR은 특정 기간 동안 질병 발생률을 기반으로 계산됩니다.** 

### 3. OR과 IRR을 구분해야 하는 이유

논문에서는 **OR과 IRR을 구분하는 것이 중요하다고 강조합니다.** 특히 **'경쟁 이벤트'** 라는 개념을 통해 그 중요성을 설명하고 있습니다. 경쟁 이벤트는 **관심 질병 이외에 개인이 겪을 수 있는 다른 사건**, 예를 들어 사망, 이민 등을 의미합니다. 

* **특정 유전자 변이가 질병뿐만 아니라 경쟁 이벤트에도 영향을 미치는 경우,**  **OR은 실제 질병 발생 위험을 정확하게 반영하지 못할 수 있습니다.** 예를 들어, 어떤 유전자 변이가 암 발생 위험을 높이지만 동시에 수명을 단축시키는 경우, OR은 실제 암 발생 위험보다 과대평가될 수 있습니다. 이는 수명이 단축되어 암에 걸릴 시간이 줄어들기 때문입니다.

* **반면 IRR은 경쟁 이벤트의 영향을 배제하고 질병 발생 속도만을 고려하기 때문에,** **OR보다 유전자 변이와 질병 발생 간의 연관성을 더 정확하게 측정할 수 있습니다.** 

### 4. False Positive, False Negative 문제

* **False Positive (위양성):** 실제로는 유전자 변이와 질병 사이에 연관성이 없는데, 연관성이 있는 것으로 잘못 판단하는 경우입니다. 

* **False Negative (위음성):** 실제로는 유전자 변이와 질병 사이에 연관성이 있는데, 연관성이 없는 것으로 잘못 판단하는 경우입니다.

논문에서는 **OR을 사용하는 경우, 경쟁 이벤트의 영향으로 인해 False Positive 또는 False Negative 결과가 발생할 수 있다고 지적**합니다. 

* **특정 유전자 변이가 수명을 연장시키는 경쟁 이벤트와 관련된 경우,** OR은 실제보다 높게 추정되어 False Positive 결과를 낳을 수 있습니다.

* **반대로 유전자 변이가 수명을 단축시키는 경쟁 이벤트와 관련된 경우,** OR은 실제보다 낮게 추정되어 False Negative 결과를 낳을 수 있습니다.

**따라서 질병의 원인을 정확하게 파악하기 위해서는,** **IRR을 사용하여 유전자 변이와 질병 발생 간의 연관성을 분석하는 것이 중요합니다.**

### 5. 질병 원인 파악 시 주의 사항

* **경쟁 이벤트**: 질병 발생에 영향을 미칠 수 있는 다른 요인들을 고려해야 합니다.

* **연구 설계**: 발생 밀도 표본 추출과 같이 경쟁 이벤트의 영향을 최소화할 수 있는 연구 설계를 선택해야 합니다.

* **OR과 IRR의 차이**: OR과 IRR의 차이를 이해하고, 연구 목적에 맞는 적절한 지표를 사용해야 합니다.

**결론적으로, GWAS를 통해 질병과 관련된 유전자 변이를 찾고 그 영향을 정확하게 분석하기 위해서는,** **OR과 IRR의 차이점을 이해하고, 경쟁 이벤트와 같은 다른 요인들을 고려하는 것이 중요합니다.**

**참고:** 본 답변은 제공된 논문의 내용을 바탕으로 작성되었습니다. 논문에서 다루지 않은 내용에 대한 추가적인 정보는 다른 자료를 참고하거나 전문가에게 문의하시기 바랍니다.



perplexity

전장 유전체 연관 분석(GWAS)과 관련된 중요한 개념들을 일반인들이 이해하기 쉽게 설명해드리겠습니다.

## GWAS란 무엇인가?

전장 유전체 연관 분석(GWAS)은 우리 몸의 유전적 변이와 질병 사이의 관계를 찾는 연구 방법입니다. 쉽게 말해, 특정 유전자 변이를 가진 사람들이 어떤 질병에 더 잘 걸리는지 또는 덜 걸리는지를 대규모로 조사하는 것입니다.

## 승산비(OR)와 발생률 비(IRR)의 차이

GWAS에서는 주로 두 가지 통계적 지표를 사용합니다:

1. **승산비(Odds Ratio, OR)**: 질병에 걸린 사람들과 걸리지 않은 사람들 사이에 특정 유전자 변이의 빈도 차이를 나타냅니다.

2. **발생률 비(Incidence Rate Ratio, IRR)**: 시간이 지남에 따라 특정 유전자 변이를 가진 사람들이 질병에 걸리는 속도의 차이를 나타냅니다.

## 나뭇잎 비유를 통한 이해

이 개념을 이해하기 위해 논문에서는 나무와 나뭇잎의 비유를 사용했습니다:

- 나무에는 무거운 잎과 가벼운 잎이 있습니다 (유전자 변이를 나타냄).

- 잎이 떨어져 땅에 닿으면 분해됩니다 (사망을 의미).

- 잎이 콘크리트 위에 떨어지면 병에 걸린 것을 의미합니다.

이 비유에서:

- 콘크리트 위의 잎의 수는 질병의 유병률을 나타냅니다 (OR과 관련).

- 나무에서 콘크리트로 떨어지는 잎의 속도는 질병의 발생률을 나타냅니다 (IRR과 관련).

## 연구 설계의 중요성

논문은 두 가지 연구 설계 방법을 비교합니다:

1. **고전적 환자-대조군 연구**: 특정 시점에 질병에 걸린 사람들과 걸리지 않은 사람들을 비교합니다 (OR 계산).

2. **발생밀도 표본추출**: 질병에 걸린 시점을 기준으로 그 때 아직 질병에 걸리지 않은 사람들과 비교합니다 (IRR 계산).

## 주의해야 할 점

1. **경쟁 사건의 영향**: 어떤 유전자 변이가 특정 질병뿐만 아니라 다른 사건(예: 조기 사망)과도 연관될 수 있습니다. 이를 고려하지 않으면 잘못된 결론을 내릴 수 있습니다.

2. **거짓 양성과 거짓 음성**: 

   - 거짓 양성: 실제로는 연관이 없는데 있다고 잘못 결론 내리는 경우

   - 거짓 음성: 실제로는 연관이 있는데 없다고 잘못 결론 내리는 경우

   연구 설계에 따라 이러한 오류의 가능성이 달라질 수 있습니다.

3. **질병의 원인 파악**: 질병의 원인을 정확히 이해하려면 발생밀도 표본추출 방법이 더 적합할 수 있습니다. 이 방법은 질병에 걸리는 과정을 더 잘 반영하기 때문입니다.

## 결론

GWAS에서 OR과 IRR의 차이를 이해하는 것은 매우 중요합니다. 연구 목적에 따라 적절한 방법을 선택해야 하며, 경쟁 사건의 존재를 고려해야 합니다. 이를 통해 유전자와 질병 간의 관계를 더 정확하게 이해할 수 있으며, 잘못된 결론을 내릴 위험을 줄일 수 있습니다.


결론은 여차하면 잘못된 결론을 내릴 수 있기 때문에, 항상 주의해야 할 듯 합니다.

처음으로 perplexity를 활용했는데, 음... 프롬프트가 검색으로 사용하는데 설정된 perplexity에게는 적절하지 않았나봅니다. 제가 사용하는 프롬프트가 대부분 이거 요약해줘 뿌잉 뿌잉이라서 생각보다 결과물이 좋지는 않은듯 하네요

다음에 또 유익한 논문을 들고 오도록 하겠습니다.


출처: @ye._.vely618