현재 질병에 대한 예측은 개별 질병이 언제 발병될지에 대한 것을 다루고 있는것이 대부분인데 여기 국제질병분류, ICD-10에 등재되어 있는 질병들을 망라해서 예측해주는 tool이 있다면 어떻게 될까요? 전문가가 아니더라도 인류 건강 증진에 많은 도움이 될거라는 생각은 할 수 있을 것 입니다. 여기 그런 연구를 한 논문이 있어 가져왔습니다. 제목은 Learning the natural history of human disease with generative transformers으로 UK Biobank(또 UK Biobank네요) 40만명의 장기 건강기록을 학습하여 약 190만명의 덴마크 국민 건강 기록 데이터를 사용해서 데이터 검증을 했다는데 생각보다 결과가 좋다고 합니다. :)
DOI: 10.1038/s41586-025-09529-3
gemini
업로드하신 논문 **"Learning the natural history of human disease with generative transformers"**의 내용을 일반 성인 독자 눈높이에 맞추어 이해하기 쉽게 요약했습니다.
---
# 미래 건강을 예측하는 AI: GPT를 의사로 만든다면? 🧑⚕️
## 🔬 연구 배경: 한 가지 질병만으로는 알 수 없는 복잡한 건강 경로
[cite_start]의료 전문가들은 환자의 과거와 현재 상태를 바탕으로 미래를 예측하고 치료 방향을 결정합니다[cite: 1]. [cite_start]하지만 사람의 건강은 **나이가 들수록 여러 질병이 복합적으로 나타나는 양상(복합 질환, multi-morbidity)**을 띠게 됩니다[cite: 1].
[cite_start]기존의 예측 기술은 주로 **심혈관 질환이나 암 같은 특정 질병**에 초점을 맞추었을 뿐 [cite: 1][cite_start], **국제 질병 분류(ICD-10) 기준 1,000가지가 넘는** 인간의 모든 질병을 포괄적으로 예측하는 데는 한계가 있었습니다[cite: 1]. [cite_start]또한, 질병들이 서로 **시간에 따라** 어떻게 영향을 주고받는지 모델링하는 것도 어려웠습니다[cite: 1].
## 🎯 연구 목적: 1,000가지 질병을 한 번에 예측하는 AI 개발
[cite_start]이 연구의 목표는 최근 챗봇으로 유명해진 **GPT(Generative Pre-trained Transformer)**와 같은 **AI 언어 모델의 원리**를 사람의 질병 예측에 적용하는 것이었습니다[cite: 1]. [cite_start]마치 언어 모델이 앞선 단어를 바탕으로 다음에 올 단어를 예측하듯, **과거의 건강 기록과 생활 습관을 바탕으로 미래에 발생할 1,000가지 이상의 질병 발생률**을 **동시에** 예측할 수 있는 새로운 AI 모델을 개발하고 그 잠재력을 증명하는 것이 핵심입니다[cite: 1, 4].
---
## ⚙️ 연구 방법: **Delphi-2M**, 40만 명의 데이터를 학습하다
[cite_start]연구팀은 기존 GPT-2 모델을 건강 기록에 맞게 수정한 **'Delphi-2M'**이라는 AI 모델을 만들었습니다[cite: 1].
1. [cite_start]**데이터 학습:** 약 **40만 명**의 **영국 바이오뱅크(UK Biobank)** 참가자들의 장기적인 건강 기록을 학습시켰습니다[cite: 1].
2. **데이터 검증:** 이후 **190만 명**의 **덴마크 국민 건강 등록 데이터**를 사용하여 모델의 성능을 외부에서 검증했습니다. [cite_start]놀랍게도 모델의 설정을 전혀 바꾸지 않고도 검증에 성공했습니다[cite: 1].
3. **모델의 언어:** 이 모델은 환자의 건강 상태를 **'토큰'**이라는 단위로 인식했습니다. [cite_start]이 토큰에는 **1,000가지 이상의 질병 코드, 성별, 나이, 체질량 지수(BMI), 흡연, 음주 여부, 그리고 사망** 등이 포함됩니다[cite: 1, 3].
4. [cite_start]**연속적인 시간 모델링:** 일반 GPT가 단어의 순서를 예측한다면, **Delphi-2M**은 다음 질병이 **무엇일지** 뿐만 아니라 **언제 발생할지(시간)**까지 예측할 수 있도록 특별히 설계되었습니다[cite: 3]. [cite_start]이 모델은 마치 프롬프트(질문)를 입력받아 다음 단어를 생성하듯이, 과거 건강 기록을 기반으로 **개인의 미래 건강 경로 전체를 시뮬레이션**할 수 있습니다[cite: 1, 3].
---
## 📈 연구 결과: 높은 정확도로 미래를 엿보다
### 1. 1,000가지 질병에 대한 정확한 위험 예측
[cite_start]Delphi-2M은 학습에 사용된 질병의 **97%**에서 예측 능력이 우수하다는 것을 보여주었습니다[cite: 1]. [cite_start]특히, **사망 예측**에 있어서는 성별에 관계없이 **0.97**에 달하는 매우 높은 정확도를 보였습니다[cite: 1]. [cite_start]대부분의 질병에서 **기존의 단일 질병 예측 모델**이나 혈액 기반의 예측 모델에 **비슷하거나 더 나은 성능**을 보였습니다[cite: 4].
### 2. 최대 20년 후의 질병 부담 예측
[cite_start]이 모델의 가장 특별한 점은 **미래 건강 경로를 생성적(Generative)으로 샘플링**할 수 있다는 것입니다[cite: 1]. [cite_start]즉, 특정 개인의 건강 이력을 입력하면 **최대 20년 후**까지의 예상되는 질병 발생 시나리오를 만들어낼 수 있으며, 이는 미래에 발생할 **총 질병 부담을 의미 있게 추정**할 수 있게 합니다[cite: 1].
### 3. 질병 간의 시간적 상호작용 발견
[cite_start]Delphi-2M은 질병들이 서로에게 미치는 **시간 의존적인 영향**을 정량화하여 보여줍니다[cite: 1, 4].
* [cite_start]**암**은 진단 후 **수년 동안** 사망률에 지속적인 영향을 미치는 것으로 나타났습니다[cite: 4].
* [cite_start]반면, **패혈증**이나 **심근경색**과 같은 급성 질환의 영향은 **5년 이내에 급격히 감소**하는 것으로 나타났습니다[cite: 4].
---
## 💡 고찰, 의의와 시사점: 데이터의 빛과 그림자
### 긍정적 의의
* [cite_start]**개인 맞춤 예측의 혁신:** Delphi-2M은 개인이 **어떤 질병 클러스터**에 취약한지, 그리고 과거의 어떤 사건이 미래의 위험을 높이는지를 구체적으로 보여주어, **개인 맞춤형 건강 위험 예측**을 가능하게 합니다[cite: 1, 4].
* [cite_start]**국경을 넘는 범용성:** 영국 데이터로 학습하고도 **덴마크 의료 시스템**의 데이터에 적용했을 때 큰 성능 저하가 없다는 점은, 이 모델이 다른 국가의 의료 시스템에도 **광범위하게 적용 가능함**을 시사합니다[cite: 4].
* [cite_start]**인공 합성 데이터의 활용:** 모델이 실제 사람의 정보를 노출하지 않으면서도 **통계적 특성을 보존**하는 **합성 건강 데이터**를 생성할 수 있다는 점은, 개인 정보 보호 문제 없이 **새로운 AI 연구를 촉진**할 수 있는 잠재력을 가집니다[cite: 4].
### 한계점 및 시사점 (데이터 편향)
* [cite_start]연구팀은 모델이 학습 데이터에 내재된 **일부 편향(Bias)**까지 함께 학습했다는 점을 강조했습니다[cite: 1]. [cite_start]예를 들어, 데이터 수집 과정에서 특정 진단이 **병원 기록**에서만 많이 발생하면, 모델은 다른 병원 기록이 있는 사람에게 해당 질병 발생률을 더 높게 예측하는 경향을 보였습니다[cite: 4].
* [cite_start]이는 AI 모델을 실제 의료 현장에 적용할 때, 학습 데이터의 특성(출처, 누락 패턴 등)에서 비롯된 **인위적인 연관성**을 **진짜 질병 경로**로 오인하지 않도록 **주의가 필요함**을 보여줍니다[cite: 4].
---
## 🌟 이 연구가 중요한 이유: 왜 이 연구에 주목해야 할까요?
[cite_start]이 연구는 단순히 질병을 예측하는 것을 넘어, **인간의 평생 건강 경로**를 예측하고 생성할 수 있는 **차세대 AI 모델의 가능성**을 열었습니다[cite: 1, 4].
1. [cite_start]**정밀 의학의 현실화:** 개인의 유전체 정보뿐 아니라, 삶의 모든 순간의 건강 기록을 통합적으로 분석하여, **가장 위험도가 높은 시점**을 예측하고 개인에게 **최적화된 예방 및 치료 전략**을 제공하는 **정밀 의학**의 기반이 됩니다[cite: 1, 4].
2. [cite_start]**미래 의료 시스템 구축의 나침반:** 이 모델을 통해 얻은 집단 수준의 예측은 보건 당국과 의료기관이 **지역별, 연령별 미래 질병 부담을 사전에 파악**하는 데 결정적인 정보를 제공합니다[cite: 4]. [cite_start]특히 고령화가 심화되는 사회에서 **의료 자원(병상, 인력, 장비 등)을 효율적으로 배분**하고 **미래 의료 수요에 대비**하는 데 큰 도움을 줄 수 있습니다[cite: 4].
[cite_start]결론적으로, **Delphi-2M**은 AI가 개인의 건강 관리와 대규모 의료 시스템 계획 모두를 혁신할 수 있는 잠재력을 가진 **가장 유망한 형태의 도구**임을 보여주는 중요한 이정표입니다[cite: 4].
chatGPT
다음은 업로드하신 **Nature(2025)** 논문 *“Learning the natural history of human disease with generative transformers”*의 내용을
일반 성인 독자를 대상으로 이해하기 쉽게 풀어쓴 요약입니다.
(A4 두 장 분량, 연구 배경–목적–방법–결과–고찰–의의와 시사점 순서로 구성)
---
## 🧬 인간 질병의 ‘자연사(自然史)’를 배우는 인공지능, **Delphi-2M**
### 1. 연구 배경
의학의 궁극적인 목표는 **사람이 앞으로 어떤 질병을 겪게 될지 예측하고 예방하는 것**입니다.
하지만 실제 인간의 건강 상태는 단일 질병이 아닌 **여러 질환의 복합적 진행(다질환, multimorbidity)**으로 나타나며, 개인마다 그 패턴이 매우 다릅니다.
현재는 심장병, 당뇨병 등 개별 질환을 예측하는 모델은 많지만, **사람의 전 생애에 걸친 모든 질병의 흐름을 함께 예측하는 모델**은 존재하지 않았습니다.
최근 GPT 같은 대형 언어모델(LLM)이 문장의 흐름을 이해하고 다음 단어를 예측하듯,
“**질병의 순서를 언어처럼 학습할 수 있지 않을까?**” 하는 발상이 연구의 출발점이었습니다.
즉, 사람의 의료 기록을 “건강 상태의 문장”으로 보고, 인공지능이 **인간의 질병 이력으로부터 미래 질병을 예측하도록** 훈련시킨 것입니다.
---
### 2. 연구 목적
연구진은 기존 GPT 구조를 변형해 **‘Delphi-2M’**이라는 모델을 개발했습니다.
이 모델의 목표는 다음과 같습니다.
* 사람의 과거 질병 기록, 생활습관, 나이, 성별 등의 정보를 이용해
**앞으로 어떤 질병이 언제 발생할지 예측**
* 1,000종이 넘는 질환을 동시에 다루며, **20년 후까지의 건강 경로를 시뮬레이션**
* 기존의 단일 질병 예측모델보다 **더 정교하고 종합적인 질병 예측 도구** 제시
---
### 3. 연구 방법
* **데이터:**
영국 바이오뱅크(UK Biobank)의 40만 명과 덴마크 인구 190만 명의 질병 데이터를 활용.
ICD-10 질병 코드, 체질량지수(BMI), 흡연·음주 습관, 사망 여부 등을 입력 데이터로 사용.
* **모델 구조:**
GPT-2를 변형해 ‘나이’를 연속적인 시간으로 인코딩하고,
다음 질병이 발생할 시점까지의 “시간”을 함께 예측하도록 설계.
즉, “다음 단어”가 아니라 “다음 질병과 그 시점”을 예측하는 AI.
* **검증:**
모델을 영국 데이터로 학습한 뒤, 덴마크 인구 데이터에 그대로 적용해 예측력을 평가.
---
### 4. 주요 결과
* **정확도:**
Delphi-2M은 1,000여 개 질병의 발생률을 개인 수준에서 예측했으며,
평균 정확도(AUC)는 0.76으로, 기존 단일 질병 예측 모델과 비슷하거나 더 우수했습니다.
특히 ‘사망’ 예측의 정확도는 AUC 0.97로 매우 높았습니다.
* **장기 예측력:**
10년 이상 장기 예측에서도 유효하며,
나이·성별만 고려한 단순 예측보다 훨씬 높은 예측 정확도를 유지했습니다.
* **질병 궤적(trajectory) 시뮬레이션:**
과거 병력으로부터 **20년 뒤까지의 질병 경로를 샘플링** 가능했습니다.
예를 들어, 흡연·음주·비만 정도에 따른 질병 부담 변화를 실제 통계처럼 재현했습니다.
* **설명 가능한 AI:**
모델이 질병 간 영향을 어떻게 인식하는지 분석한 결과,
같은 계통 질환(예: 소화기계 질환, 정신질환)이 서로 영향을 주며,
암은 사망률을 장기적으로 높이는 반면, 패혈증은 단기적으로만 영향을 주는 등
**질병 간 ‘시간적 관계’를 수량화**할 수 있었습니다.
* **편향과 한계:**
영국 바이오뱅크는 건강한 지원자가 많아 실제 인구보다 질병률이 낮게 나타났고,
이런 **‘데이터 편향’**도 모델이 학습하는 경향이 확인되었습니다.
---
### 5. 고찰 및 의의
Delphi-2M은 단순히 질병을 맞히는 모델이 아니라,
**“질병이 서로 어떤 순서와 관계로 나타나는가”**를 학습한 최초의 대규모 AI입니다.
이 모델은 다음과 같은 의미를 가집니다.
* 🩺 **개인 맞춤 의료:** 개인의 과거 병력으로부터 향후 10~20년 건강 위험을 예측 → 조기검진, 예방치료 설계 가능
* 🧠 **의학 연구:** 질병 간 연관성(예: 당뇨→신경병증→심혈관질환)을 정량적으로 탐구
* 🏥 **보건정책:** 인구집단 단위의 미래 질병 부담을 예측해 자원 배분과 의료 계획에 활용
* 🔒 **데이터 프라이버시:** 실제 환자 데이터를 노출하지 않고도 “합성 의료 데이터”를 생성할 수 있음
---
### 6. 이 연구가 중요한 이유
Delphi-2M은 **‘의료 데이터의 GPT 시대’를 여는 신호탄**입니다.
언어를 배우듯 “질병의 언어”를 배운 AI가
사람의 평생 건강 이력을 이해하고, 미래의 질병 위험을 예측할 수 있게 된 것입니다.
이는 단순한 기술 진보가 아니라,
“질병이 생긴 뒤 치료하는 의학”에서 “질병이 생기기 전에 대비하는 의학”으로
의료 패러다임을 전환시킬 수 있는 혁신적인 도구입니다.
앞으로 이 모델이 유전정보, 생활습관, 영상, 웨어러블 데이터 등과 결합된다면
**진정한 개인 맞춤형 건강 예측 시대**가 현실로 다가올 것입니다.
NotebookLM
제공해주신 논문 자료는 **대규모 언어 모델(LLM)의 핵심 기술인 GPT(Generative Pretrained Transformer) 아키텍처를 변형하여 인간 질병의 진행 과정을 모델링하고 미래 건강 위험을 예측**하는 혁신적인 AI 연구에 대한 내용입니다.
다음은 일반 성인 독자를 대상으로 연구 배경, 목적, 방법, 결과, 의의 및 시사점을 포함하여 쉽게 작성한 요약입니다.
---
## AI, GPT를 활용하여 1,000가지 질병의 미래를 예측하다: Delphi-2M 모델 연구 요약
### 1. 연구 배경: 왜 질병의 '자연사'를 예측해야 하는가?
헬스케어에서 의사 결정을 내릴 때, 의사들은 환자의 과거와 현재 건강 상태를 기반으로 미래에 어떤 질병이 발생할지 예측하는 능력이 필요합니다.
**문제점:**
* 인간의 건강은 단순한 개별 질병 진단만으로는 이해할 수 없으며, **복합적인 이환(multi-morbidity)**, 즉 여러 질병이 시간이 지남에 따라 어떻게 함께 진화하는지의 맥락에서 이해해야 합니다.
* 현재 심혈관 질환이나 암 같은 특정 질병을 예측하는 알고리즘은 있지만, **국제 질병 분류(ICD-10)의 최상위 레벨에서 정의된 1,000가지 이상의 모든 질병 스펙트럼**을 동시에 예측할 수 있는 알고리즘은 거의 없습니다.
* 특히 전 세계적으로 고령화가 진행되고 암 진단이 2050년까지 77% 증가할 것으로 예측되는 상황에서, 미래의 질병 부담을 모델링하는 것은 헬스케어 시스템 및 경제 계획을 위해 필수적입니다.
**연구의 필요성:**
최근 ChatGPT 같은 챗봇을 가능하게 한 AI 분야의 발전(LLMs)은, 언어가 단어 토큰의 순서로 모델링되는 것처럼, 질병 이력도 과거 사건의 상호 의존성을 활용하여 미래의 이환 순서를 예측하는 데 적용될 수 있다는 아이디어를 제공했습니다.
### 2. 연구 목적: 1,000개 질병을 동시에 예측하는 '건강 트랜스포머' 개발
이 연구의 목적은 대규모 언어 모델과 유사한 **트랜스포머 기반 모델**을 확장하여, 개인의 평생 건강 궤적을 학습하고, **과거 건강 진단 및 생활 방식 정보를 기반으로 1,000가지 이상의 질병 발생률을 동시에 정확하게 예측**할 수 있음을 입증하는 것입니다.
연구팀은 이 확장된 모델을 **Delphi-2M**이라고 명명했습니다.
### 3. 연구 방법: GPT 아키텍처를 '질병 타임라인'에 맞게 수정하다
연구팀은 GPT-2 아키텍처를 기반으로 Delphi-2M 모델을 구축했습니다.
1. **데이터 학습:**
* 이 모델은 **UK 바이오뱅크(UK Biobank)** 참가자 40만 명의 데이터로 훈련되었습니다. 이 데이터는 ICD-10 진단 코드, 성별, 체질량 지수(BMI), 흡연, 음주와 같은 생활 방식 정보, 그리고 사망 기록을 포함합니다.
* 훈련 후, 190만 명의 덴마크 국민 데이터를 사용하여 추가적인 매개변수 조정 없이 모델의 일반화 능력을 외부 검증했습니다.
2. **데이터 표현 (토큰화):**
* 환자의 건강 궤적은 언어의 단어처럼 **‘토큰’**이라는 단위로 변환되었습니다. 이 토큰에는 1,256개의 질병 진단 코드와 성별, BMI, 흡연, 음주, 그리고 질병이 없는 기간을 나타내는 '이벤트 없음(no event)' 패딩 토큰이 포함되었습니다.
* **핵심 수정:** 기존 GPT 모델은 텍스트 토큰의 순서(이산적 위치)를 인코딩하지만, 질병은 연속적인 시간 축에서 발생하므로, Delphi는 **연속적인 '연령(age)' 인코딩**으로 이를 대체했습니다.
3. **예측 능력 확장:**
* 표준 GPT는 다음 토큰만 예측하지만, Delphi-2M은 **'다음 토큰(질병)이 발생하기까지 걸리는 시간'**을 예측하는 지수 대기 시간 모델을 추가하여 질병 발생률(rates)을 일관되게 추정할 수 있게 했습니다.
### 4. 연구 결과: 높은 정확도로 미래 건강 궤적을 생성하다
1. **정확한 예측 성능:**
* Delphi-2M은 개인의 과거 질병 이력을 조건으로 하여 **1,000가지 이상의 질병 발생률**을 예측하는 데 있어 기존의 단일 질병 모델과 유사한 수준의 정확도를 보였습니다.
* 인간 질병 스펙트럼 전반에 걸쳐 다음 진단을 예측하는 정확도(AUC 값)는 내부 검증 데이터에서 평균 약 **0.76**을 기록했습니다.
* 특히, 가장 확실하게 예측된 다음 사건 중 하나는 **사망**이었으며, 연령층별 AUC가 양쪽 성별에서 **0.97**에 달했습니다.
* Delphi-2M의 예측은 10년 후에도 여전히 장기 예후에 의미 있는 정확도(평균 AUC 0.70)를 보여주었습니다.
2. **기존 모델 능가:**
* Delphi-2M의 다중 질병 예측은 개별 질병 결과에 대한 현재 위험 모델이나 혈액 생체지표 기반 모델(MILTON)과 비교했을 때 일치하거나 그 이상이었으며, **1,000가지 이상의 질병과 그 타이밍을 동시에 평가**할 수 있다는 큰 장점을 제공합니다.
3. **미래 궤적 생성 (Generative Capability):**
* Delphi-2M의 가장 유망한 특징은 과거 데이터에 조건화하여 **미래 질병 궤적을 샘플링**하는 능력입니다. 이 생성 능력 덕분에 모델은 최대 **20년** 동안의 잠재적 질병 부담에 대한 의미 있는 추정치를 제공할 수 있습니다.
* 또한, 이 모델은 통계적 동시 발생 패턴을 보존하면서도 특정 개인의 특성을 드러내지 않는 **합성 데이터**를 생성할 수 있습니다. 이 합성 데이터로 훈련된 모델은 실제 데이터로 훈련된 모델과 비교했을 때 단지 3% 포인트 낮은 예측 정확도(AUC 0.74)를 보였습니다.
### 5. 고찰 및 시사점: 헬스케어 시스템의 혁신
1. **질병 진행에 대한 심층적 통찰:**
* **설명 가능한 AI(SHAP 분석)** 방법을 통해 Delphi-2M은 질병 진단들 간의 상호 의존성을 밝혀냈습니다.
* 이 분석은 질병들이 ICD-10 챕터 내에서 함께 발생하는 경향이 있음을 보여주었으며, 과거 사건이 미래 위험에 미치는 **시간적 영향**을 정량화할 수 있게 합니다. 예를 들어, 암은 사망률을 **지속적으로** 증가시키는 반면, 심근경색이나 패혈증의 영향은 5년 이내에 급격히 감소하며 단기적인 영향력을 보였습니다.
2. **광범위한 적용 가능성:**
* Delphi-2M은 덴마크 등록 데이터에 외부 검증되었을 때, 추가적인 미세 조정 없이도 다른 국가의 헬스케어 시스템 전반에 걸쳐 광범위하게 적용될 수 있음을 입증했습니다.
3. **미래 헬스케어 혁신:**
* **개인화된 예방 의학:** Delphi 모델은 복잡한 데이터 양식(health records)을 합리적으로 통합하여 의료 의사 결정을 지원하는 데 활용될 수 있습니다. 이는 진단 테스트나 선별 검사 프로그램(예: 암 검진)이 가장 필요하지만 아직 기존 연령 기준에 도달하지 못한 개인을 식별하는 데 도움이 될 수 있습니다.
* **정책 입안 지원:** 이 모델은 개인 예측을 집계하여 지역 및 국가 수준에서 예상되는 질병 부담을 정확하게 예측함으로써, 특히 의료 수요가 복잡하고 자원 집약적인 **고령화 인구**에서 향후 1~20년 동안 예상되는 헬스케어 요구 사항을 충족시키기 위한 계획 수립에 중요한 정보를 제공할 수 있습니다.
### 6. 이 연구가 중요한 이유
Delphi-2M 연구는 **트랜스포머 기반 모델이 예측 및 생성적 건강 관련 작업에 매우 적합하며, 인구 규모의 데이터셋에 적용될 수 있고, 질병 사건 간의 복잡한 시간적 종속성에 대한 통찰력을 제공한다**는 것을 입증합니다.
이 모델은 단순히 개별 질병 위험을 예측하는 것을 넘어, **개인의 평생 건강 궤적 전체**를 예측하고 시뮬레이션할 수 있는 새로운 프레임워크를 제시합니다. 이는 AI 시대의 상당한 헬스케어 이점을 실현하기 위한 중요한 진전이며, 정밀 의학 및 공중 보건 계획에 필수적인 맞춤형 건강 위험 정보를 제공할 잠재력을 가지고 있습니다.
grok3
### 인간 질병의 자연사를 학습하는 생성형 트랜스포머 모델
#### 연구 배경
의료 결정은 환자의 과거와 현재 건강 상태를 바탕으로 미래를 예측하고 변화시키는 데 초점을 맞춘다. 그러나 인간 질병은 건강 기간, 급성 질환, 만성 다중 질환(공존 질환)으로 특징지어지며, 생활 습관, 유전, 사회경제적 요인에 따라 개인차가 크다. 기존 예측 알고리즘은 심혈관 질환이나 암 같은 특정 질환에 국한되어 있으며, ICD-10 코드로 분류되는 1,000개 이상의 전체 질병 스펙트럼을 포괄하지 못한다. 인구 고령화로 인해 2050년까지 암 진단이 77% 증가할 것으로 예상되는 상황에서, 다중 질환 진행 패턴을 학습하는 AI 모델이 필요하다. 대형 언어 모델(LLM)처럼 AI가 건강 기록에서 패턴을 학습할 수 있지만, 대규모 적용은 아직 미흡하다.
#### 연구 목적
이 연구는 GPT(생성형 사전 훈련 트랜스포머) 아키텍처를 수정하여 인간 질병의 진행과 경쟁성을 모델링하는 것을 목표로 한다. Delphi-2M 모델을 개발해 개인의 과거 질병 이력에 기반한 1,000개 이상 질병 발생률을 예측하고, 합성 미래 건강 궤적을 생성한다. UK Biobank의 40만 명 데이터로 훈련하고, 덴마크 190만 명 데이터로 외부 검증하며, 모델의 설명 가능성을 통해 공존 질환 클러스터와 시간 의존성을 밝힌다. 궁극적으로 개인화된 건강 위험 이해와 정밀 의학을 지원한다.
#### 연구 방법
GPT-2 아키텍처를 기반으로 연속 시간 축을 처리하도록 수정: (1) 위치 인코딩을 연속 연령(사인/코사인 함수)으로 대체, (2) 다음 토큰 시간 예측을 위한 지수 대기 시간 모델 추가, (3) 동일 시간 토큰 마스킹. 토큰은 ICD-10 상위 코드(1,256개), 성별(2개), BMI/흡연/음주(각 3개), '무사건' 패딩(1개)으로 구성. UK Biobank 훈련 데이터(40만 명, 생후~2020년 7월)로 2.2백만 파라미터 모델 학습. 검증(10만 명)과 외부 덴마크 데이터(193만 명, 1978~2018)로 성능 평가. SHAP(설명 가능 AI)으로 예측 해석.
#### 연구 결과
Delphi-2M은 1,000개 이상 질병 발생률을 기존 단일 질병 모델(예: QRisk3, UKBDRS)과 유사한 정확도(AUC 0.76)로 예측하며, 사망 예측은 AUC 0.97로 뛰어나다. 장기(10년) 예측도 AUC 0.70으로 유지. 합성 궤적은 20년 미래 부하 추정 가능하며, 흡연/음주/BMI 고위험 그룹의 질병 증가를 정확히 재현. SHAP 분석으로 공존 질환 클러스터(예: 당뇨와 망막 장애)와 시간 의존성(암은 장기 사망 증가, 패혈증은 단기) 드러냄. 합성 데이터 훈련 모델도 AUC 0.74로 실제 데이터와 유사.
#### 연구 고찰
모델은 훈련 데이터 편향(UK Biobank의 건강 편향, 데이터 소스 누락)을 반영해 예측 왜곡 가능성 지적. 민족/빈곤 그룹 간 공정성 평가에서 희귀 질환은 분산 크지만, 전체적으로 안정. 덴마크 데이터 적용 시 AUC 0.67로 약간 하락하나, 국가 간 패턴 일반화 확인. 미래 확장으로 유전체, 혈액 검사, 이미징 데이터 통합 제안.
#### 의의와 시사점
Delphi-2M은 다중 질환 예측과 생성으로 개인화된 위험 평가를 가능케 하며, 스크리닝 프로그램 참여 유도나 생활 변화 촉진에 활용. 인구 수준 부하 예측으로 의료/경제 계획 지원. 합성 데이터는 프라이버시 보호하며 AI 훈련 대안. 시간 의존성 통찰로 암처럼 장기 영향 질환 이해 향상.
이 연구는 트랜스포머 모델이 대규모 건강 데이터에 적합함을 보여, 개인 건강 위험 이해를 개선하고 정밀 의학을 촉진하는 데 중요하다. AI가 의료를 혁신할 잠재력을 강조하며, 미래 다중 모달 모델로 예방 의학 강화 기대.
perplexity.ai
이 논문은 인공지능(AI) 기술을 이용해 개인의 질병 발생과 건강 변화를 예측하는 새로운 의료 모델 **‘Delphi-2M’**을 개발하고 검증한 연구이다. 영국의 *Nature*지에 2025년에 실린 이 연구는 단순한 질병 위험 예측을 넘어, **인간의 전 생애에 걸친 건강 궤적을 학습하고 미래의 질병 진행을 예측할 수 있는 GPT 기반 AI 모델**을 제시했다.
***
### 연구 배경
기존 의학 연구는 주로 한 가지 질병의 발병 원인이나 위험 요인을 예측하는 데 집중해왔다. 하지만 실제로 개인의 건강은 수많은 질환이 서로 영향을 주는 복잡한 과정을 거친다. 특히 고령화 사회에서는 여러 질환이 동시에 나타나는 ‘다중질환(다병증, multimorbidity)’ 문제가 심각하다. 이에 따라 의료 데이터의 방대한 양을 통합적으로 분석해 건강 궤적을 예측하는 AI 기술이 필요해졌다[ file:1 ].
***
### 연구 목적
연구팀은 인간의 언어를 학습하는 **GPT(Generative Pre-trained Transformer)** 기술을 응용해, ‘언어 대신 질병의 시간적 흐름’을 학습하는 모델을 만들었다. **목표는 사람마다 어떤 질환이 언제, 어떤 순서로 나타날지를 예측하는 것**이었다. 이를 통해 개인 맞춤형 예방의료를 가능하게 하고, 국가 단위의 보건정책에도 근거를 제공하는 것을 궁극적인 목적으로 했다[ file:1 ].
***
### 연구 방법
- **데이터 구성:** 40만 명 넘는 영국 ‘UK Biobank’ 참가자의 평생 의료 기록을 학습 데이터로 사용했다. 이 데이터에는 병원 진단, 사망 기록, 자가 보고 건강 정보가 포함됐다.
- **모델 구조:** 자연어 모델인 GPT-2를 변형해 ‘질병 토큰’과 ‘나이’를 입력으로 받아, 다음 질병이 언제 발생할지를 예측하도록 설계했다.
- **외부 검증:** 덴마크 전 국민 건강기록(약 190만 명)을 사용해 모델의 일반화 가능성을 평가했다.
- **설명 가능한 AI:** SHAP 기법을 이용해 어떤 질병이 이후 질병 및 사망 위험에 얼마나 영향을 미치는지를 시각적으로 분석했다[ file:1 ].
***
### 주요 결과
- **예측 정확도:** Delphi-2M은 약 1,000여 가지 질병의 발병 시점과 순서를 높은 정확도로 예측했다. 영국 내 시험에서는 평균 예측 성능(AUC) 0.69, 덴마크 데이터에서도 0.67이라는 유사한 결과를 보였다.
- **질병 간 영향:** 암과 같은 질환은 수년간 사망 위험을 높게 유지했지만, 패혈증(혈액감염)처럼 급성 질환은 영향이 짧게 지속되었다.
- **가상 데이터 생성:** 실제 환자 데이터를 모방한 ‘가짜 건강 이력’을 생성해, 민감한 개인정보를 보호하면서도 분석할 수 있는 가능성을 확인했다.
- **예측의 한계:** 데이터의 불균형(예: 고령층, 비유럽계 인구 부족)과 영국 바이오뱅크의 참가자 편향성이 일부 예측에 영향을 미쳤다는 점도 보고됐다[ file:1 ].
***
### 고찰 및 의의
Delphi-2M은 단순히 ‘AI가 질병을 맞춘다’는 수준을 넘어, **건강의 흐름 자체를 문장처럼 해석하고 다음 단어(질병)를 예측하는 인공지능**이라는 점에서 중요하다. 이 모델은 질병 예측뿐 아니라 다음과 같은 응용 가능성을 가진다.
- 개인의 건강 이력에 기반한 **맞춤형 조기검진 시기 추천**
- **보건정책 수립**에 필요한 미래 질병 부담 예측
- **신약 개발 및 유전학 연구**에서 질병 간 관계 분석 지원
또한, 모델의 구조가 개방적이어서 생활습관, 유전자, 웨어러블 센서 등 다양한 데이터 형태를 통합할 수 있는 확장성도 높다[ file:1 ].
***
### 시사점
이 연구의 가장 큰 의미는 **AI가 언어 대신 ‘인간의 생애’를 해석할 수 있게 되었다는 점**이다. 언어 모델이 문장의 의미를 학습하듯, Delphi-2M은 질병의 순서를 학습해 ‘건강의 문법’을 이해한다.
이는 의료진이 환자의 미래 위험을 미리 파악해 예방적 조치를 취하거나, 정부가 10년 뒤 의료 수요를 예측하는 데에도 활용될 수 있다.
즉, 이 연구는 **“질병 중심의 의학에서, 건강 여정 중심의 의학으로의 전환”**을 여는 중요한 첫걸음으로 평가된다[ file:1 ].
![]() |
| 출처: @ye._.vely618 |





