Lee Gir-Won (Lee Gil-Won): Sleep Foundation Model

오늘은 수면 데이터로 미래의 질병을 예측하는 AI 모델에 대한 논문을 가져왔습니다.

혹시 아침에 일어나서 스마트워치로 수면 점수 확인해보신 적 있으신가요. 저는 가끔 깊은 잠 비율이 얼마나 됐는지 들여다보곤 하는데, 사실 그 숫자들이 뭘 의미하는지는 잘 몰라서 그냥 "오늘도 수고했어" 하고 넘기곤 합니다. 근데 이제는 그 잠자는 동안의 기록이 단순한 점수를 넘어서 내 몇 년 뒤 건강까지 알려줄 수 있다면 어떨까요.

제목은 **A multimodal sleep foundation model for disease prediction**으로, 스탠퍼드 연구진이 Nature Medicine에 발표한 내용입니다. 이름이 긴 만큼 내용도 상당한데요. SleepFM이라는 AI 모델을 만들어서 수면다원검사(PSG) 데이터를 학습시켰더니 단 한 번의 수면 기록만으로 130가지 질병을 꽤 정확하게 예측할 수 있었다고 합니다.

이 모델이 특별한 점은 크게 세 가지 정도로 정리해볼 수 있을 것 같습니다. 첫째, 데이터 규모가 어마어마하다는 것. 65,000명이 넘는 사람들의 수면 기록을 총 58만 시간 이상 모았다고 하네요. 둘째, 병원마다 측정하는 채널 개수가 다르더라도 문제없이 분석할 수 있는 구조를 만들었다는 점입니다. 뇌파가 빠져 있어도 심전도와 호흡 신호만으로 충분히 짐작할 수 있도록 훈련시켰다고 하더라고요. 셋째는 예측 성능인데, 치매(C-Index 0.85), 심근경색(0.81), 심부전(0.80), 뇌졸중(0.78) 등 주요 질병뿐 아니라 사망 위험까지 0.84 수준으로 맞췄다고 합니다. 나이와 성별, BMI만 가지고 예측하는 것보다 월등히 높은 수치였고요.

재미있는 건 신호 종류별로 예측이 잘 되는 질병이 조금씩 달랐다는 점입니다. 뇌파는 치매나 파킨슨병 같은 신경 질환에, 심전도는 심혈관 질환에, 호흡 신호는 대사 질환에 각각 더 민감하게 반응했는데, 이걸 모두 합쳐서 볼 때 가장 성능이 좋았다고 하네요. 우리 몸이 잠든 동안에도 뇌와 심장, 폐가 서로 대화를 나누고 있다는 걸 다시 한번 느끼게 됩니다.

물론 아직은 수면 클리닉에 다녀온 환자 중심의 데이터라 일반인에게 바로 적용하기는 이르고, AI가 왜 그런 예측을 내놓았는지 설명하는 것도 쉽지 않다는 한계는 있습니다. 하지만 고가의 MRI나 침습 검사 없이, 병원에서 하룻밤 자면서 찍은 기록만으로 몇 년 뒤 건강 위험을 미리 체크할 수 있다는 가능성 자체가 꽤 흥미로워 보입니다. 앞으로 웨어러블 기기 기술이 더 발달하면 집에서도 비슷한 수준의 모니터링이 가능해질지도 모르겠네요.

잠은 그냥 쉬는 시간이 아니라 몸이 보내는 건강 보고서였던 셈인데, 이제 그 보고서를 AI가 읽어주는 시대가 오고 있는 것 같습니다. :)

DOI: 10.1038/s41591-025-04133-4

gemini

네, 업로드하신 논문 **'A multimodal sleep foundation model for disease prediction'** (질병 예측을 위한 다양식 수면 파운데이션 모델, Nature Medicine 게재)의 내용을 바탕으로 일반인들이 이해하기 쉽게 요약해 드립니다.
---
### [블로그 포스팅] 하룻밤 잠이 말해주는 나의 미래 건강: 인공지능 'SleepFM'의 탄생
잠은 우리 인생의 3분의 1을 차지하는 아주 중요한 과정입니다. 하지만 지금까지 우리가 수면 중에 측정하는 복잡한 생체 신호들은 그 가치를 충분히 인정받지 못했습니다. 최근 세계적인 학술지 '네이처 메디슨(Nature Medicine)'에 발표된 연구는 AI 기술을 통해 우리가 잠든 사이 측정된 데이터가 어떻게 미래의 질병을 예측하는 '수정구슬'이 될 수 있는지 보여줍니다.
#### 1. 연구 배경: 잠든 사이 흐르는 '데이터의 바다'
수면의 질을 평가하는 가장 정밀한 방법은 '수면다원검사(PSG)'입니다. 뇌파, 심전도, 호흡, 근육 움직임 등 수많은 신호를 동시에 기록하죠. 하지만 이 데이터들은 너무나 방대하고 복잡해서 전문가들조차 이를 일일이 분석해 미래의 질병까지 예측하기에는 한계가 있었습니다. 기존의 연구들은 특정 질환과 수면의 관계만 좁게 보거나, 사람이 직접 눈으로 확인한 데이터에만 의존하는 문제가 있었습니다.
#### 2. 연구 목적: 수면의 언어를 이해하는 AI 모델 개발
연구진은 언어 모델인 GPT처럼, 수면 신호의 방대한 패턴을 스스로 학습하는 인공지능 모델 **'SleepFM'**을 개발하고자 했습니다. 이 모델의 목표는 수면 중에 발생하는 다양한 신호들 사이의 연결 고리를 찾아내고, 이를 바탕으로 미래에 발생할 수 있는 다양한 질병 위험을 정확하게 예측하는 것입니다.
#### 3. 연구 방법: 65,000명의 잠을 학습하다
*
**어마어마한 데이터양:** 연구팀은 약 65,000명의 참가자로부터 얻은 585,000시간 이상의 수면 기록을 활용했습니다.
*
**다양한 신호 통합:** 뇌파(뇌 활동), 심전도(심장), 호흡 신호, 근전도(근육 움직임) 등 서로 다른 종류의 신호를 동시에 학습하는 '다양식(Multimodal)' 방식을 사용했습니다.
*
**독창적인 학습법 (LOO-CL):** 특정 신호(예: 뇌파)가 없어도 다른 신호(예: 심장, 호흡)를 통해 수면 상태를 유추할 수 있도록 훈련시켜, 검사 환경이 달라도 정확한 결과를 낼 수 있게 만들었습니다.
#### 4. 연구 결과: 하룻밤 검사로 130가지 질병 예측
SleepFM은 단 한 번의 하룻밤 수면 기록만으로 놀라운 성과를 거두었습니다.
* **질병 예측력:** 치매(0.85), 심근경색(0.81), 심부전(0.80), 뇌졸중(0.78) 등 **총 130가지 질환**에 대해 매우 높은 예측 정확도를 보였습니다. (C-Index 0.75 이상 기준)
*
**사망 위험 예측:** 전체 원인에 의한 사망 위험을 예측하는 정확도는 0.84에 달했습니다.
*
**기존 모델 압도:** 단순히 나이, 성별, 체질량지수(BMI) 등 기본 정보만 활용했을 때보다 훨씬 더 정확하게 질병을 맞혔습니다.
#### 5. 고찰 및 시사점: '신호의 조화'가 핵심
연구 결과, 질병마다 유독 강한 신호를 보내는 부위가 다르다는 점이 밝혀졌습니다. 예를 들어 정신 및 신경계 질환은 '뇌파'가, 순환기 질환은 '심전도'가 더 많은 정보를 담고 있었습니다. 하지만 가장 중요한 점은 **모든 신호를 합쳐서 분석할 때 예측력이 가장 높았다**는 것입니다. 이는 우리 몸이 수면 중에 유기적으로 연결되어 작동함을 시사합니다.
#### 6. 의의: 왜 이 연구가 중요한가요?
이 연구가 중요한 이유는 단순히 '병을 잘 맞힌다'는 것 이상입니다.
1. **조기 발견의 창:** 수면 장애는 종종 치매나 심혈관 질환이 겉으로 드러나기 수년 전부터 나타납니다. SleepFM은 이를 미리 포착해 예방할 수 있는 기회를 제공합니다.
2.
**개인 맞춤형 의료:** 병원에 가지 않고 집에서 측정하는 간이 수면 기기 데이터에도 적용될 수 있어, 누구나 자신의 건강 상태를 정밀하게 모니터링할 수 있는 시대를 앞당겼습니다.
3.
**의료 효율성:** 전문가가 수 시간 동안 매달려야 했던 수면 분석을 AI가 순식간에 처리함으로써, 의료 서비스의 문턱을 낮출 수 있습니다.
---
**요약하자면, SleepFM은 우리가 잠든 사이 몸이 보내는 '비밀 신호'를 해독해 미래의 건강 성적표를 미리 보여주는 혁신적인 도구입니다.** 앞으로 수면 검사가 단순한 코골이 진단을 넘어, 전신 건강을 체크하는 필수 코스가 될 날이 머지않아 보입니다.

chatGPT

아래는 **업로드하신 Nature Medicine 논문
「A multimodal sleep foundation model for disease prediction」**의 내용을 바탕으로,
**블로그 게시용 / 비전공 일반 성인 독자**를 대상으로 이해하기 쉽게 정리한 요약입니다.
(요청하신 대로 **논문 내용에 근거**해 작성했으며, 일반론 위주 설명은 피했습니다.)
---
# 하룻밤의 수면이 미래의 질병을 예측할 수 있을까?
## 초대규모 수면 AI 모델 *SleepFM* 연구 쉽게 풀어보기
---
## 1. 연구 배경: 왜 ‘수면 데이터’에 주목했을까?
수면은 단순한 휴식이 아니라 **뇌, 심장, 호흡, 근육 등 여러 생리 시스템이 동시에 작동하는 복합적인 생물학적 과정**입니다.
수면 중의 이상은 치매, 파킨슨병, 심혈관질환, 우울증, 당뇨병 등 다양한 질병의 **아주 초기 단계에서 먼저 나타나는 경우**가 많습니다.
하지만 지금까지의 수면 연구에는 한계가 있었습니다.
* 병원에서 시행하는 **수면다원검사(PSG)** 는 매우 풍부한 데이터를 제공하지만
* 채널 수와 구성(EEG, ECG, 호흡 등)이 병원마다 다르고
* 전문가 판독에 의존해 **대규모 분석과 표준화가 어려웠습니다**
* 기존 AI 연구들은
* 특정 질병 하나만 예측하거나
* 비교적 작은 데이터(수천 건)에 의존하거나
* 수면 단계를 맞히는 데에만 집중하는 경우가 많았습니다
👉 연구진은 이렇게 질문합니다.
**“수십만 시간의 수면 데이터를 AI가 스스로 학습한다면,
수면 자체를 하나의 ‘질병 예측 언어’로 이해할 수 있지 않을까?”**
---
## 2. 연구 목적: ‘수면의 언어’를 배우는 범용 AI 만들기
이 연구의 목표는 명확합니다.
> **하룻밤의 수면 데이터만으로,
> 미래에 발생할 수 있는 다양한 질병 위험을 예측할 수 있는
> 범용 수면 AI 모델(SleepFM)을 만드는 것**
이를 위해 연구진은 다음을 달성하고자 했습니다.
1. **라벨(전문의 판독)이 거의 없는 대규모 수면 데이터**로 학습
2. 병원·연구소마다 다른 **PSG 구성 차이를 견디는 모델**
3. 수면 무호흡, 수면 단계 분류뿐 아니라
👉 **치매, 심부전, 뇌졸중, 암, 사망 위험까지 폭넓게 예측**
---
## 3. 연구 방법: SleepFM은 어떻게 만들어졌나?
### ① 전례 없는 규모의 수면 데이터
연구진은 4개 주요 코호트에서 데이터를 모았습니다.
* **참여자 수**: 65,000명 이상
* **총 수면 기록**: 585,000시간 이상
* **연령 범위**: 소아부터 100세까지
포함된 신호:
* 뇌파(EEG/EOG)
* 심전도(ECG)
* 근전도(EMG)
* 호흡, 산소포화도, 코골이 등
---
### ② ‘채널에 구애받지 않는’ AI 구조
SleepFM의 핵심 설계는 **“채널 불가지론(channel-agnostic)”**입니다.
* 어떤 검사에는 심전도가 없고
* 어떤 검사에는 근전도가 빠져 있어도
* **모델이 알아서 활용 가능한 신호만 사용**
이를 위해:
* 모든 신호를 5초 단위로 나누고
* CNN + Transformer 구조로 시간 흐름을 학습
* **새로운 대조학습 방식(Leave-One-Out Contrastive Learning)**으로
서로 다른 신호들이 같은 ‘수면 상태’를 표현하도록 학습
👉 즉, **“이게 EEG든, 심전도든, 결국 같은 사람의 같은 밤이다”**라는 공통 표현을 배우게 됩니다.
---
### ③ 질병 예측은 어떻게 했나?
* 스탠퍼드 병원의 **전자 의무기록(EHR)** 과 수면 데이터를 연결
* 1,041개의 질병 범주(phecode)를 대상으로 분석
* 수면 검사 후 **7일 이후 발생한 질병만 ‘미래 질병’으로 정의**
* 생존 분석 지표(C-index, AUROC)를 사용해 예측력 평가
---
## 4. 연구 결과: 수면 한 번으로 무엇을 예측했나?
### ① 단 한 번의 수면 검사로 예측 가능한 질병들
SleepFM은 **130개 질병**에서 매우 높은 예측력을 보였습니다
(C-index 또는 AUROC ≥ 0.75).
대표적인 결과:
| 질병 | 예측 성능 |
| -------- | ------------ |
| 전체 사망 위험 | C-index 0.84 |
| 치매 | 0.85 |
| 심근경색 | 0.81 |
| 심부전 | 0.80 |
| 만성 신장질환 | 0.79 |
| 뇌졸중 | 0.78 |
| 심방세동 | 0.78 |
👉 **“아직 증상이 없을 때”의 수면 패턴만으로도
수년 뒤 질병 위험을 구분해냈다는 점이 핵심입니다.**
---
### ② 수면 단계·신호별 분석에서 드러난 흥미로운 점
* **뇌파 신호** → 치매, 정신·신경질환 예측에 특히 중요
* **호흡 신호** → 대사질환, 치매 예측에 강점
* **심전도** → 심혈관 질환 예측에 핵심적
하지만 가장 성능이 좋았던 것은
👉 **모든 신호를 함께 사용했을 때**였습니다.
---
### ③ 다른 AI 모델보다 정말 나을까?
* 나이·성별·BMI만 사용한 모델
* 수면 데이터를 처음부터 끝까지 감독학습한 모델
👉 **모든 비교에서 SleepFM이 더 우수**
특히,
* 데이터가 적을수록
* 다른 병원 데이터로 옮겼을 때(외부 검증)
SleepFM의 장점이 더욱 두드러졌습니다.
---
## 5. 고찰: 이 연구가 말해주는 것
이 연구는 단순히 “AI가 질병을 잘 맞힌다”는 이야기가 아닙니다.
### 핵심 메시지 ①
**수면은 ‘질병의 결과’가 아니라 ‘질병의 전조’일 수 있다**
* 치매, 파킨슨병, 심혈관 질환은
증상이 나타나기 **수년 전부터 수면에서 신호를 보냅니다**
* SleepFM은 이를 **사람이 정의한 지표가 아니라, 데이터 자체로 학습**
---
### 핵심 메시지 ②
**비침습적 검사만으로 장기 질병 위험을 평가할 수 있다**
* MRI, PET, 뇌척수액 검사 없이
* 단 한 번의 수면 검사로
* 다수 질병에 대한 위험 정보를 얻을 가능성
---
### 한계도 분명하다
* 수면 클리닉 환자 중심 데이터 → 일반 인구와 차이
* AI의 내부 판단 과정 해석이 어려움
* 실제 임상 의사결정에 적용하려면 추가 검증 필요
---
## 6. 의의와 시사점: 이 연구가 열어주는 미래
### 의료 현장에서의 변화 가능성
* 수면 검사 = 단순 진단 → **종합 건강 예측 도구**
* 치매·심혈관질환 **조기 선별**
* 고위험군 맞춤형 추적 관리
---
### 공공보건·연구 측면에서
* 수면을 **질병 예측용 바이오마커**로 활용
* 대규모 비지도 학습 기반 의료 AI의 성공 사례
* 웨어러블 수면 데이터와의 결합 가능성
---
## 7. 결론: 이 연구는 왜 중요한가?
> **SleepFM은 “수면은 건강의 거울”이라는 말을
> 처음으로 데이터와 AI로 증명한 연구입니다.**
이 연구의 진짜 가치는,
* 특정 질병 하나가 아니라
* **‘수면 전체’를 하나의 언어로 이해해**
* **사람이 미처 보지 못한 미래 위험을 읽어냈다는 점**에 있습니다.
하룻밤의 수면이
👉 **당신의 몇 년 뒤 건강을 말해줄 수 있는 시대**,
이 논문은 그 출발점에 해당합니다.

grok

### 수면 데이터로 미래 질병을 예측하는 AI 모델: SleepFM
#### 연구 배경
수면은 우리 몸의 뇌, 심장, 호흡, 근육 등 여러 시스템이 복잡하게 상호작용하는 과정입니다. 폴리솜노그래피(PSG)라는 검사로 이러한 신호를 기록하지만, 데이터가 표준화되지 않고, 다양한 환경에서 수집되다 보니 제대로 활용되지 못했습니다. 수면 장애는 수백만 명에게 영향을 미치며, 정신질환, 신경퇴행성 질환, 심혈관 질환 등의 조기 지표로 알려져 있지만, 기존 연구는 특정 질병이나 단순 지표에만 초점을 맞춰 수면의 전체적인 의미를 놓치고 있었습니다. 최근 딥러닝 기술이 발전했지만, 작은 데이터셋과 전문가 라벨링 의존으로 한계가 있었습니다.
#### 연구 목적
연구팀은 이러한 문제를 해결하기 위해 SleepFM이라는 '다중모달 수면 기초 모델'을 개발했습니다. 이 모델은 PSG의 여러 신호(EEG, EOG, ECG, EMG, 호흡 신호)를 통합해 수면의 생리적·시간적 구조를 학습하고, 이를 바탕으로 미래 질병 위험을 예측하는 것을 목표로 했습니다. 특히, 다양한 데이터 구성에 유연하게 적용되고, 대규모 무감독 학습으로 일반화된 모델을 만드는 데 초점을 맞췄습니다.
#### 연구 방법
연구팀은 스탠포드 수면 클리닉(SSC), BioSerenity, MESA, MrOS 등 4개 코호트에서 65,000명 이상의 585,000시간 PSG 데이터를 수집했습니다. 신호를 128Hz로 재샘플링하고, 5초 단위로 나누어 처리했습니다. 모델 아키텍처는 1D 합성곱층, 채널 무관 주의 풀링, 트랜스포머 블록으로 구성됐으며, 새로운 'LOO-CL(Leave-One-Out Contrastive Learning)' 기법으로 여러 모달리티를 정렬했습니다. 이는 채널 누락이나 이질성에 강합니다. 사전 훈련 후, LSTM 기반 헤드로 미세 조정해 연령 추정, 성별 분류, 수면 단계 분류, 수면 무호흡 분류, 질병 예측 등의 작업을 수행했습니다. 질병 예측은 EHR(전자건강기록)와 연계해 1,041개 phecode(질병 코드)를 평가했으며, CoxPH 손실 함수를 사용했습니다.
#### 연구 결과
SleepFM은 한 밤의 수면 데이터로 130개 질병을 C-Index 0.75 이상으로 예측했습니다. 예를 들어, 사망(0.84), 치매(0.85), 심근경색(0.81), 심부전(0.80), 만성 신장병(0.79), 뇌졸중(0.78), 심방세동(0.78) 등에서 높은 정확도를 보였습니다. 수면 단계 분류(F1 점수 0.70~0.78), 수면 무호흡 중증도 분류(정확도 0.69), 존재 여부(0.87)에서도 기존 모델(U-Sleep, YASA)과 경쟁적입니다. 2020년 이후 데이터나 SHHS 코호트(사전 훈련 제외)에서도 강한 일반화 성능을 보였습니다. 모든 모달리티 결합 시 예측력이 가장 높았으며, REM 단계나 BAS 신호가 특정 질병(신경·정신)에 유리했습니다.
#### 고찰
모델 성능은 질병 카테고리별로 다르지만, 신생물, 순환기, 정신 장애에서 강했습니다. 인구통계학적 요인(연령, 성별)만 사용하는 베이스라인보다 5~17% 우수하며, 사전 훈련 없는 엔드투엔드 모델도 능가합니다. 특정 단계(Stage 1/2, REM)나 모달리티(BAS: 정신·신경, 호흡: 호흡·대사, EKG: 순환기)가 질병 예측에 기여하지만, 전체 통합이 최적입니다. 시간적 변화나 외부 사이트에서도 안정적이었으나, 노인층 연령 예측 오류가 컸습니다.
#### 의의와 시사점
이 연구는 수면 데이터를 '언어'처럼 학습해 광범위 질병 예측을 가능하게 합니다. 기존의 수동 주석 의존을 넘어 대규모 무감독 학습으로 비용을 줄이고, 임상 현장에서 쉽게 적용할 수 있습니다. 미래에 PSG 검사를 통해 조기 개입(예: 치매나 심장병 예방)을 촉진할 수 있으며, 수면 건강의 중요성을 강조합니다.
이 연구가 중요한 이유는 수면이 단순한 휴식이 아닌 건강의 '예언자'임을 증명하기 때문입니다. 한 번의 검사로 여러 질병 위험을 예측하면, 개인화된 의료가 가능해져 수많은 생명을 구할 수 있습니다. 수면을 잘 관리하는 것이 장수와 건강의 열쇠라는 메시지를 대중에게 전파하는 데 기여할 것입니다.

NotebookLM

## 잠든 사이 인공지능이 그리는 건강 지도: 수면 데이터로 질병을 예측하는 'SleepFM'
우리는 인생의 약 3분의 1을 잠을 자며 보냅니다. 수면은 단순히 쉬는 시간이 아니라 뇌, 심장, 호흡기 등 우리 몸의 여러 기관이 복잡하게 상호작용하는 중요한 생물학적 과정입니다. 최근 '네이처 메디슨(Nature Medicine)'에 발표된 연구는 수면 중 발생하는 미세한 신호들을 인공지능이 분석하여, 미래의 질병 위험을 예측할 수 있는 혁신적인 기술을 공개했습니다.
---
### 1. 연구 배경: 풍부하지만 활용되지 못한 수면의 기록
수면 상태를 가장 정밀하게 측정하는 방법은 **수면 다원 검사(PSG)**입니다. 이 검사는 뇌파(EEG), 심전도(ECG), 근전도(EMG), 호흡 신호 등 다양한 생체 신호를 기록합니다. 하지만 이 방대한 데이터는 분석하기가 매우 까다롭고, 전문가의 수동 판독이 필요하며, 병원마다 검사 설정이 달라 표준화가 어렵다는 문제가 있었습니다. 이 때문에 수면 데이터 속에 숨겨진 풍부한 건강 정보들은 그동안 충분히 활용되지 못해 왔습니다.
### 2. 연구 목적: 수면의 언어를 배우는 인공지능 개발
연구진은 수면 데이터의 복잡성을 극복하기 위해 **'SleepFM'**이라는 **수면 기반 파운데이션 모델(Foundation Model)**을 개발했습니다. 이 모델의 목적은 방대한 양의 수면 데이터를 스스로 학습하여 '수면의 언어'를 이해하고, 단 하룻밤의 수면 기록만으로도 다양한 질병 발생 위험을 정확하게 예측하는 것입니다.
### 3. 연구 방법: 65,000명의 수면 기록을 학습한 거대 AI
* **방대한 학습 데이터:** 약 65,000명의 참가자로부터 수집한 **585,000시간 이상의 수면 다원 검사 데이터**를 사용하여 모델을 훈련시켰습니다. 이는 기존의 다른 모델들보다 5~25배 더 많은 양입니다.
* **새로운 학습 방식(LOO-CL):** '리브-원-아웃 대조 학습(LOO-CL)'이라는 새로운 알고리즘을 도입했습니다. 이는 한 종류의 신호(예: 뇌파)가 나머지 다른 신호들(심전도, 근전도 등)과 어떻게 연결되는지 스스로 맞춰보며 학습하는 방식입니다.
* **유연한 설계:** 병원마다 측정하는 채널의 수나 종류가 달라도 문제없이 분석할 수 있는 '채널 무관(Channel-agnostic)' 구조로 설계되어 실용성을 높였습니다.
### 4. 주요 연구 결과: 하룻밤 수면으로 예측하는 130가지 질병
SleepFM은 단 하룻밤의 수면 기록을 통해 **130가지 질환**을 높은 정확도로 예측해 냈습니다.
* **주요 질환 예측력:** 사망 위험(0.84), 치매(0.85), 심근경색(0.81), 심부전(0.80), 만성 신장 질환(0.79), 뇌졸중(0.78) 등 주요 질환에서 높은 예측 점수(C-Index)를 보였습니다. (1.0에 가까울수록 정확함)
* **신호별 특화 정보:** 뇌파(BAS)는 정신 및 신경 질환을, 호흡 신호는 호흡기 및 대사 질환을, 심전도(EKG)는 순환기 질환을 예측하는 데 각각 더 유용한 정보를 제공했습니다.
* **기존 모델 압도:** 단순히 나이나 성별, 체질량지수(BMI)만으로 예측하는 모델이나 기존의 수면 분석 AI보다 훨씬 더 뛰어난 성능을 입증했습니다.
* **범용성 증명:** 학습에 사용하지 않았던 새로운 병원의 데이터(SHHS)나 2020년 이후의 최신 데이터에서도 성능이 떨어지지 않고 잘 작동했습니다.
### 5. 고찰 및 시사점
이번 연구는 수면이 단순한 휴식을 넘어 **전신 건강 상태를 비추는 거울**이라는 점을 과학적으로 증명했습니다. SleepFM은 뇌파의 미세한 변화를 통해 알츠하이머나 파킨슨병의 초기 징후를 포착하고, 호흡과 심장 신호를 결합해 심혈관 위험을 분석합니다. 특히 수면 장애가 뚜렷하게 나타나기 전부터 신체 내부의 이상 신호를 감지할 수 있다는 점이 핵심입니다.
---
### 💡 이 연구가 왜 중요한가요?
이 연구가 중요한 이유는 **"수면 검사를 미래의 건강 검진"**으로 탈바꿈시켰기 때문입니다.
기존에는 수면 검사를 주로 코골이나 불면증 치료를 위해서만 받았습니다. 하지만 이제 SleepFM 기술을 활용하면, 수면 검사 한 번으로 내가 5~10년 뒤에 치매나 심장병에 걸릴 위험이 얼마나 되는지 미리 알 수 있게 됩니다. 이는 증상이 나타나기 전 조기에 대응하여 생명을 구하고 건강 수명을 늘리는 데 결정적인 역할을 할 수 있습니다.
나아가 이 기술은 향후 스마트워치와 같은 웨어러블 기기와 결합되어, 병원에 가지 않고도 매일 밤 집에서 비침습적으로 우리의 건강 상태를 모니터링하는 **'실시간 건강 비서'**의 토대가 될 것입니다.

Perplexity.ai

이 논문은 “하룻밤 자는 동안의 뇌파·심전도·호흡 패턴만 보고 앞으로 몇 년 안에 어떤 병이 생길 위험이 큰지 예측할 수 있는가?”라는 질문에 답하려는 연구입니다.[1]
## 연구 배경
- 수면은 뇌, 심장, 호흡, 근육 등 온몸의 상태가 복합적으로 드러나는 **건강의 창**이지만, 지금까지는 한두 지표(코골이, 무호흡 지수 등)에만 의존해 개별 질환과의 연관성을 보는 연구가 많았습니다.[1]
- 수면다원검사(PSG)는 뇌파(EEG/EOG), 심전도(ECG), 근전도(EMG), 호흡 신호를 동시에 기록하는 가장 정교한 검사지만,
- 장비 구성과 채널 구성이 병원마다 달라 표준화가 어렵고
- 전문의가 한 장 한 장 수동으로 판독해야 해서 대규모 분석이 힘들며
- 기존 인공지능 모델도 특정 과제(예: 수면 단계 분류, 수면무호흡 진단)에만 맞춰 작게 학습된 경우가 대부분이라는 한계가 있었습니다.[1]
- 최근에는 거대한 데이터를 스스로 학습해 다양한 문제에 재활용할 수 있는 ‘파운데이션 모델(Foundation model)’이 영상·텍스트·의료영상에서 큰 성과를 내고 있지만, 수면다원검사에 본격적으로 적용된 사례는 거의 없었습니다.[1]
## 연구 목적
이 논문에서 저자들이 세운 목표는 다음과 같습니다.[1]
1. 뇌파·심전도·호흡·근전도 등 여러 신호를 한 번에 처리할 수 있는, 채널 구성에 **구애받지 않는** 수면 파운데이션 모델(SleepFM)을 만들 것.
2. 이 모델이 단순히 수면 단계·무호흡만 맞히는 데 그치지 않고, **미래 질병 위험**(치매, 심근경색, 심부전, 뇌졸중, 신부전, 암, 사망 등)을 예측할 수 있는지 검증할 것.[1]
3. 서로 다른 병원·시점의 데이터에서도 잘 작동하는지(일반화·전이학습 성능)를 평가해, 실제 임상에 쓸 수 있을 정도의 **범용성**이 있는지를 확인할 것.[1]
## 연구 방법
### 1. 초대형 수면 데이터 구축
- 총 6만 5천여 명, 약 58만 5천 시간에 달하는 수면다원검사 데이터를 사용했습니다.[1]
- 스탠퍼드 수면클리닉(SSC): 35,052건, 1999–2024년, 2–96세, 다양한 뇌파·심전도·호흡 채널 포함.[1]
- BioSerenity: 미국 240개 수면센터에서 수집된 18,869건의 야간 검사.[1]
- MESA, MrOS: 심혈관·노인 코호트에서 수집된 수면다원검사.[1]
- SHHS: 별도의 외부 검증용(전이학습 평가용) 데이터로 사용.[1]
- 모든 신호는 128Hz로 재표본화하고, 5초 단위의 작은 조각으로 잘라 모델의 기본입력 ‘토큰’으로 사용했습니다.[1]
### 2. SleepFM 모델 구조
- 입력: 뇌파·안구운동(BAS), 심전도(ECG), 근전도(EMG), 호흡 신호를 모두 포함.[1]
- 3단계로 처리:[1]
1. 1차원 CNN으로 각 신호 조각(5초)을 특징 벡터(길이 128)로 변환.
2. 채널 수가 병원마다 달라도 상관없도록, **채널-무관(channel-agnostic) 주의(attention) 풀링**을 통해 같은 종류의 신호(예: 여러 EEG 채널)를 하나의 대표 벡터로 통합.
3. Transformer 블록으로 시간 흐름(최대 5분 단위)을 학습해, 잠이 드는 과정·깊은 잠·REM 등 시간적 패턴까지 반영.[1]
### 3. 새로운 학습 방식: LOO-CL(Leave-One-Out Contrastive Learning)
- 이 모델은 처음에는 “라벨 없는” 순수 수면 신호만 보고 자기지도학습을 합니다.[1]
- 핵심 아이디어는, 같은 시점에 기록된 여러 신호(뇌파, 심전도, 호흡 등) 사이에 공통으로 담긴 ‘잠의 상태’를 서로 맞춰보게 하는 것입니다.[1]
- 예: 뇌파로 만든 임베딩에서, “심전도+호흡+근전도”를 평균낸 임베딩과 최대한 비슷해지도록 학습.[1]
- 이렇게 하면 특정 채널이 빠져 있어도 남은 채널들만으로 공통된 ‘수면 표현’을 잘 유지할 수 있어, 실제 임상현장의 **불완전한 검사 데이터**에도 강합니다.[1]
### 4. 다운스트림(세부) 과제 평가
전처리와 기초 학습을 마친 뒤, 다양한 실제 과제에 모델을 얹어 성능을 평가했습니다.[1]
1. 기본 수면 분석 과제
- 나이 추정: 실제 나이와의 평균 오차 약 7.3년, 상관계수 0.88로 상당히 정확하게 예측.[1]
- 생물학적 성별 분류: ROC-AUC 0.86, 정밀·재현율 곡선 AUC 0.90.[1]
- 수면 단계 분류(각성, N1, N2, N3, REM, 5초 단위):
- 주요 단계(각성, N2, REM)에서 좋은 F1 점수(0.70–0.78 범위)로, U-Sleep, YASA 같은 기존 최고 성능 모델과 비슷한 수준.[1]
- 여러 외부 데이터셋(DCSM, HMC)에서도 경쟁력 있는 성능을 보이며, 한 곳(DCSM)에서는 다른 모델들을 능가.[1]
- 수면무호흡 중증도 분류:
- 무, 경도, 중등도, 중증 4단계 분류 정확도 0.69.[1]
- “무·경도 vs 중등도·중증” 이분류 정확도 0.87로, 임상적으로 의미 있는 구분에 강점.[1]
2. 질병 발생 위험 예측(핵심)
- 스탠퍼드 코호트에서는 수면다원검사와 전자의무기록(EHR)을 연결해, 국제질병분류(ICD)를 1,868개 ‘페노코드(phecode)’ 질환 카테고리로 묶고, 이 중 유병률이 충분한 1,041개 질환에 대해 예측 성능을 평가했습니다.[1]
- “수면검사 후 최소 7일 이후에 처음 진단된 질환”만 양성 사례로 잡아, 단순히 동시에 발견된 병이 아니라 **미래 발생 위험**만 보도록 기준을 설정했습니다.[1]
- 생존분석에서 많이 쓰는 C-Index와, “검사 후 6년 이내 해당 질환이 생겼는지”를 기준으로 한 6년 ROC-AUC를 사용했습니다.[1]
## 주요 결과
### 1. 한 번의 수면검사로 130개 질환을 높은 정확도로 예측
- 1,041개 질환 중 130개는 C-Index와 6년 ROC-AUC 모두 0.75 이상(유의수준 Bonferroni 보정 P < 0.01)으로, 단 한 번의 수면다원검사만으로도 상당히 정확한 위험 예측이 가능했습니다.[1]
- 특히 눈에 띄는 질환들에서 높은 예측력을 보였습니다.[1]
- 모든 원인의 사망(All-cause mortality): C-Index 0.84, ROC-AUC 0.84–0.85 수준.[1]
- 치매: C-Index 0.85, ROC-AUC 0.87(6년 기준).[1]
- 심부전: C-Index 0.80, ROC-AUC 0.83.[1]
- 만성 콩팥병(CKD): C-Index 0.79, ROC-AUC 0.82.[1]
- 뇌졸중: ROC-AUC 0.81.[1]
- 파킨슨병: ROC-AUC 0.93(95% CI 0.89–0.96).[1]
- 전립선암·유방암·피부 흑색종 등 여러 암: ROC-AUC 0.83–0.90 범위.[1]
### 2. 어떤 신호·수면 단계가 어떤 병 예측에 중요한가?
- 수면 단계별로 모델 성능을 나눠 보면, 대부분의 단계가 고루 기여하지만,
- 심혈관·신경퇴행성 질환에 대해서는 **REM 수면과 얕은 N1–N2 단계**가 약간 더 높은 예측력을 보였습니다.[1]
- 신호 종류별 중요도를 비교한 결과:[1]
- 뇌파·안구운동(BAS): 치매, 파킨슨병, 정신질환 등 **뇌·정신계 질환** 예측에 가장 유리.[1]
- 호흡 신호: 수면무호흡뿐 아니라 호흡기·대사 질환, 일부 신경질환(파킨슨병 등)의 위험 예측에 중요한 역할.[1]
- 심전도(ECG): 심부전, 부정맥, 심혈관 질환 등 **순환기 질환** 예측에서 핵심 정보 제공.[1]
- 네 가지 신호를 모두 함께 썼을 때가 항상 가장 높은 성능을 보여, 수면이 여러 생리계의 복합적 상호작용이라는 점을 뒷받침합니다.[1]
### 3. 시간·병원·데이터 양이 달라도 견고한 일반화
- 시간에 따른 변화(예: 검사 장비·진료 패턴 변화)를 보려, 2020년 이후 스탠퍼드 환자를 ‘시간 외삽 테스트셋’으로 따로 두고 예측했을 때도 죽음, 심부전, 치매 등에 대해 여전히 높은 C-Index(0.80 이상)를 유지했습니다.[1]
- 전혀 다른 코호트인 SHHS 데이터에 대해서는, 사전학습된 SleepFM의 임베딩만 재사용해 소량의 레이블로 전이학습을 했는데도,
- 뇌졸중: ROC-AUC 0.82.
- 심부전: ROC-AUC 0.85.
- 심혈관 사망: ROC-AUC 0.88 등 의미 있는 성능을 달성했습니다.[1]
- 미세조정(fine-tuning)에 쓰는 라벨 수를 줄여가며 본 실험에서,
- 같은 테스트셋 기준으로, SleepFM은 **10%의 라벨만으로도** 기존 인구통계학 모델(나이·성별·BMI·인종)을 훨씬 상회하는 성능을 내는 경우가 많았습니다.[1]
### 4. 기존 모델보다 얼마나 나은가?
- 비교 대상:[1]
- Demographics 모델: 나이·성별·BMI·인종 같은 기본 정보만 사용하는 다층 퍼셉트론.
- End-to-End PSG 모델: SleepFM과 구조는 같지만, 사전학습 없이 해당 과제에만 직접 학습한 모델.
- 결과:
- 대부분의 질환 카테고리(신경계, 순환기, 내분비·대사, 호흡기 등)에서 SleepFM이 ROC-AUC 기준 **5–17%포인트**까지 개선된 성능을 보였습니다.[1]
- 특히 신경·정신 질환(치매, 발달 지연, 말·언어 장애 등)과 합병증을 동반한 당뇨병, 호흡부전 등에서 격차가 컸습니다.[1]
- 같은 구조라도 “사전학습 + 얕은 미세조정” 방식이, “처음부터 끝까지 과제별 학습”보다 훨씬 더 일반적이고 강력한 표현을 만든다는 점을 보여줍니다.[1]
## 고찰: 무엇을 새로 알았나?
1. **잠의 ‘언어’를 이해하는 파운데이션 모델**
- SleepFM은 뇌파·심장·호흡 데이터를 함께 보며, 인간이 직접 정의하기 어려운 복합적인 수면 패턴을 스스로 학습합니다.[1]
- 기존처럼 특정 질환에 맞춘 작은 모델이 아니라, 한 번 학습해두면 여러 질환·과제에 재활용 가능한 “수면용 기초 모델”이라는 점이 새롭습니다.[1]
2. 수면은 전신 질환의 조기 신호
- 이 연구는 수면 패턴 속에 암, 치매, 파킨슨병, 심혈관·신장 질환, 사망 위험까지 두루 반영된다는 것을 정량적으로 보여줍니다.[1]
- 이전에는 개별 질환과 수면지표(수면 시간, 무호흡 지수 등)의 상관관계 정도만 알려져 있었다면, 이제는 **한 번의 수면다원검사로 “질병 지도” 전체를 동시에 스캔**할 수 있는 가능성을 제시한 셈입니다.[1]
3. 영상·혈액검사와 비교할 만한 예측력
- 치매 예측에서는 MRI·PET 같은 고가 영상검사나 뇌척수액·혈액 바이오마커에 필적하는 수준의 예측력을 일부 질환에서 보여주었습니다.[1]
- 물론 직접 비교는 어렵지만, 비침습적인 수면검사만으로 이 정도의 위험 예측이 가능하다는 것은 큰 장점입니다.[1]
4. 한계점
- 데이터의 대부분이 수면클리닉에 의뢰된 환자들이라, 일반 인구집단과는 다를 수 있습니다(선택 편향).[1]
- 시간에 따른 의료 환경 변화에 따라 성능이 조금 떨어지기도 했고,
- 모델이 왜 그런 예측을 했는지 개별 환자 수준에서 직관적으로 설명하는 것은 아직 쉽지 않습니다(설명가능성의 한계).[1]
- 또 한 외부 코호트(SHHS)에서는 모든 질환을 동일하게 평가할 수 없었고, 수면무호흡·수면 단계 등 일부 과제에서는 여전히 특화 모델이 더 나은 데이터셋도 있었습니다.[1]
## 의의와 시사점
1. 개인 맞춤형 조기 경고 시스템의 기반
- 앞으로 이와 비슷한 모델이 웨어러블 기기(스마트 워치, 홈 슬립 트래커)의 데이터까지 활용하게 된다면, 병원에 가기 전 **일상 생활에서 실시간 건강 리스크 모니터링**이 가능해질 수 있습니다.[1]
- 예를 들어, 수면 데이터만으로 “향후 몇 년 안에 심부전·치매 위험이 높으니, 심장·뇌 관련 정밀검사를 고려하라”는 식의 조기 경고가 가능해질 수 있습니다.[1]
2. 수면의학에서 “질환 중심”에서 “전신 건강 중심”으로
- 지금까지 수면의학은 수면무호흡, 불면증 같은 수면 자체의 장애 진단에 초점을 두는 경우가 많았습니다.[1]
- 이 연구는 수면을 **전신 질환의 조기 바이오마커**로 바라보는 패러다임 전환을 뒷받침하며, 심장내과·신경과·정신과 등과의 융합 진료를 촉진할 수 있습니다.[1]
3. 의료 AI 개발 방식의 변화
- 한 질환·한 과제용 모델이 아니라, 대규모 자기지도학습으로 미리 “공통 표현”을 만들어두고 이를 여러 진단·예측에 재활용하는 전략이 수면 영역에서도 유효하다는 것을 실증했습니다.[1]
- 이는 다른 생체신호(심전도, 뇌파, 웨어러블 센서 등)에도 그대로 확장 가능한 개념입니다.[1]
## 이 연구가 왜 중요한가?
- 이 논문은 “수면다원검사 = 수면무호흡을 찾기 위한 검사”라는 기존 인식을 넘어, **수면이 전신의 미래 건강 상태를 미리 비추는 거대한 스크린**이라는 사실을 데이터로 보여주었다는 점에서 중요합니다.[1]
- 단 한 밤의 수면 기록에서 수십~수백 가지 질환의 장기 위험을 동시에 예측하고, 그것이 나이·BMI 같은 단순 정보나 기존 특화 모델보다도 더 정확할 수 있다는 점은, 앞으로의 건강검진·보험설계·질병 예방 전략에 큰 변화를 가져올 수 있습니다.[1]
- 무엇보다 이 연구는, 수면이라는 일상적이고 비침습적인 행위를 활용해, 고가의 영상검사나 침습적 바이오마커 없이도 개인의 건강 미래를 정밀하게 읽어낼 수 있는 가능성을 열었다는 점에서 큰 의미를 갖습니다.[1]

Kimi

아래는 ‘SleepFM’이라는 인공지능 모델을 개발한 최신 논문(2026년 1월 Nature Medicine)을
**“잠을 듣고 미래 병을 읽는다”** 는 쉬운 말로 A4 두 장 분량(한글 2,000자 내외)에 옮긴 블로그용 요약입니다.
(논문 그대로의 사실만 담았으며, 어려운 전문 용어는 일상 언어로 풀었습니다.)
---
### 잠자는 동안 130가지 병을 미리 알 수 있다고?
우리는 매일 밤 잠을 자며 뇌·심장·폐·근육이 어떻게 움직이는지를 ‘폐쇄회로TV’처럼 찍어둡니다.
의학 용어로 이 녹화를 **‘다도수면다항검사(PSG)’** 라고 하는데, 1박에만 뇌파(EEG), 심전도(ECG), 호흡, 눈동자, 턱근육까지 최대 20개 채널이 찍힙니다.
문제는 **“이 산더미 같은 데이터를 누가 다 보나?”** 였습니다.
한 명 해석하는 데만 전문의가 2~3시간이 걸리고, 어떤 병과 연결되는지 일일이 찾으려면 몇 년이 걸립니다.
---
### 연구배경 : 잠은 병의 ‘조기경보기’라는 힌트
수면장애가 있으면
- 치매·파킨슨병이 5~10년 먼저 올 확률이 높고
- 심장마비·뇌졸중·당뇨·사망 위험도 꾸준히 올라갑니다.
그런데 그동안 연구들은 ‘특정 질병 하나’만 좁게 봤고, 데이터도 수백 명에 그쳤습니다.
**“그러면 잠 신호 전체를 한꺼번에 학습해 보면 어떨까?”**
이 아이디어가 바로 **‘슬립FM(SleepFM)’** 프로젝트의 시작이었습니다.
---
### 연구목적 : “한 번의 수면검사로, 미래에 생길 수 있는 다양한 질병을 예측할 수 있을까?”
---
### 어떻게 만들었나?(방법)
1. **거대한 잠 동영상 보관소**
- 미국·유럽 5개 큰 수면센터(스탠퍼드·BioSerenity·MESA·MrOS·SHHS)에서
- 1만 시간이 넘는 녹화(65,000명 분)를 모았습니다.
→ 24시간 방송이 24년 분량!
2. **채널 걱정 없는 ‘범용 번역기’ 설계**
- 병원마다 뇌파 4개·심전도 2개 식으로 연결 개수가 다른데,
- AI가 **“어차피 뇌 신호면 하나로 뭉쳐!”** 하며 스스로 채널을 압축합니다.
- 이 덕분 **‘채널이 부족해도’** 새 병원 데이터를 바로 읽을 수 있습니다.
3. **자기지도학습(=레이블 없이 공부)**
- 선생님(레이블) 없이 **“같은 시간대 뇌파·심전도·호흡은 서로 닮았다”** 는 규칙만 주고
- 4백만 개 5초 조각을 맞추게 했습니다.
- 이 기법을 **‘Leave-One-Out 대조학습(LOO-CL)’** 이라고 부릅니다.
4. **1,041가지 질병과 맞붙이기**
- 스탠퍼드 병원 전자의무기록(ICD-9/10)에서
- **‘수면검사 다음날부터 6년 안에 생긴 병’** 을 찾아
- **생존분석(Cox 모델)** 로 위험도(위험비)를 계산했습니다.
---
### 핵심 결과
- **130가지 질병**에서 통계적 기준(C-Index ≥ 0.75)을 넘었습니다.
예:
– 전체 사망 위험 0.84(100명 중 84명 순위 맞춤)
– 치매 0.85, 심장마비 0.81, 심부전 0.80, 뇌졸중 0.78, 심방세동 0.78
– 전립선암·유방암·흑색종도 0.83~0.90
- **수면단계·신호 종류별 특성**
– 뇌파는 신경·정신 질환(치매, 파킨슨)에,
– 심전도는 순환기(심근경색, 부정맥)에,
– 호흡은 대사·호흡 질환(수면 무호흡, 당뇨)에 각각 더 민감했습니다.
**하지만 ‘모두 합치면’ 성능이 가장 좋았습니다.**
- **시간·병원 바뀌어도 똑같이 잘 맞춤**
- 2020년 이후 스탠퍼드 환자(아예 학습에 쓰지 않은 데이터)
- SHHS라는 완전히 다른 미국 6개 센터 데이터
→ C-Index 0.80~0.86으로 여전히 정확!
- **기존 모델 대비 성능 ↑**
- 나이·성별·BMI만 넣은 모델보다 평균 **+5~17%p** 높았고,
- 같은 PSG를 쓰되 ‘사전학습 안 한 모델’보다도 **모든 질병군에서 우위**.
- **수면의사 일 돕기도 OK**
- 수면 단계 5초마다 구분하는 정밀 검사에서
- 깨어있음 0.92, REM 0.86, 2단계 0.87로 **세계 최신 모델(U-Sleep 등)과 비슷·혹은 더 좋은 성능**.
---
### 고찰 & 시사점
1. **“잠이 병을 미리 말해준다”** 는 가설을 **대규모·실제 임상 데이터**로 처음 입증.
2. **‘레이블 없는 대규모 PSG’** 만으로도 **의미 있는 질병 예측 표현**을 얻을 수 있음 → **라벨링 비용 0원**.
3. **채널 수가 달라도 OK**인 ‘범용 임베딩’ 덕분,
- **작은 병원·웨어러블 기기**로도 바로 **전이학습** 가능.
4. **생존분석 기반**이므로 **“몇 년 안에 생길 확률이 얼마나 되는가?”** 를 **개인별 점수**로 줄 수 있음.
→ **선별검사·건강보험·원격모니터링**에 활용 가능.
---
### 왜 이 연구가 중요한가?
- **“수면검사=단순히 코 골이 확인”** 에서 **“미래 건강 보고서”** 로 역할 확대.
- **고가 영상(MRI)·침습 검사(조직검사)·혈액 특수 단백질** 없이,
**일상에서 누구나 받을 수 있는 ‘한밤 녹화’만**으로
**치매·심장마비·암 위험**을 **6년 전에 알 수 있다**는 사실을 과학적으로 증명했습니다.
- 앞으로 **웨어러블 심박·뇌파 센서**와 연결하면
**집에서 매일 내 몸의 ‘레드클라이브’** 를 받아볼 수 있는
**‘수면 기반 개인 맞춤 예방의학’** 시대를 열었습니다.
---
“잘 자면 병이 보인다”는 말이, 이제는 **증거 기반 과학**이 되었습니다.

출처: @ye._.vely618

Lee Gir-Won (Lee Gil-Won)

Pages

월요일, 6월 22, 2026

잘 자면 병이 보인다? 수면 AI의 시작