레이블이 UTR인 게시물을 표시합니다. 모든 게시물 표시
레이블이 UTR인 게시물을 표시합니다. 모든 게시물 표시

금요일, 10월 10, 2025

프로모터와 UTR, 희귀질환의 숨겨진 원인일까?

오늘은 영국 Genomics England 사업에 참여한 참여차들 중 아직 진단전인 희귀질환 참여자들의 데이터를 사용해서 확인한 내용 되겠습니다. 제목은 Systematic identification of disease-causing promoter and untranslated region variants in 8040 undiagnosed individuals with rare disease으로 유전자 프로모터 영엿과 UTR 영역 단백질로 coding되지 않는 영역들에 대해서 심도있게 바라봤다고 보면됩니다. :)

지금까지는 coding되는 영역인 exon 영역을 많이 봐왔다면 여기는 그렇지 않는 부분들을 집중적으로 파헤친것 같고, 아마 WGS 데이터를 썼는ㄷ... pacbio나 nanopore같은 long read NGS를 사용한것인지는 잘 모르곘지만 결론적으로 비코딩되는 영역을 봤지만 그렇게까지 유의미한 것은 확인하지 못했다... 그래도 졌잘싸 느낌으로 질환에 따라 바라봐야하는 부분들이 조금씩 달라지게 되면 이해하는 폭이 넓어지지 않겠냐라고 잘 마무리하면되겠습니다. :)


DOI: 10.1186/s13073-025-01464-2



clova-x

이 연구는 유전자 프로모터와 untranslated regions (UTR)에서의 변이를 조사하여 희귀 질환 진단에 기여할 수 있는지를 평가하였습니다.

1. **연구 배경**

   - 기존의 유전학적 진단 방법은 주로 단백질 코딩 영역에 초점을 맞추고 있으며, 프로모터와 UTR 변이는 해석의 어려움으로 인해 임상 검사에서 제외되는 경향이 있습니다.

   - 이러한 변이는 희귀 질환의 원인이 될 수 있으며, 그 범위와 영향력은 아직 잘 알려지지 않았습니다.

2. **연구 방법**

   - Genomics England 100,000 genomes 프로젝트의 8040 미진단 개인을 대상으로 잠재적으로 해로운 프로모터와 UTR 변이를 식별하고 주석화하는 프레임워크를 개발하였습니다.

   - 변이의 생물학적 의미를 평가하기 위해 다양한 주석 도구를 사용하였으며, 엄격한 지역 기반 필터링과 임상 검토를 통해 결과를 도출하였습니다.

3. **연구 결과**

   - 총 12개의 변이를 우선순위로 지정하였으며, 이 중 10개는 개인의 표현형과 일치하였고 6개는 이전에 발견되지 않은 변이였습니다.

   - 부담 테스트를 통해 희귀 질환 환자에서 프로모터와 UTR 변이의 유의미한 증가를 관찰하지 못했습니다.

4. **결론 및 의의**

   - 프로모터와 UTR을 검사함으로써 추가적인 희귀 질환 진단을 찾을 수 있지만, 진단 파이프라인에 포함시키는 것이 극적인 진단율 향상을 가져오지 않을 것으로 보입니다.

   - 그러나 이러한 변이를 식별하고 주석화하는 데 도움이 되는 프레임워크를 제공하였습니다.


gemini

## 논문 요약: 희귀 질환 진단의 새로운 길을 찾아서

이 논문은 유전성 희귀 질환을 앓고 있지만 아직 정확한 진단을 받지 못한 사람들을 위한 연구입니다. [cite_start]우리 유전자 정보의 대부분은 단백질을 만드는 '코딩 영역'에 집중되어 있지만, 이 논문은 지금까지는 제대로 연구되지 않았던 **비코딩 영역(non-coding region)**, 그중에서도 **프로모터(promoter)**와 **UTR(untranslated regions)**이라는 곳에 주목했습니다[cite: 1, 16, 22].

---

### 연구 배경

[cite_start]현재 희귀 질환의 유전적 원인을 찾는 방법은 대부분 **유전자의 코딩 영역**에 초점을 맞추고 있습니다[cite: 16]. 코딩 영역은 단백질을 만드는 설계도 역할을 하기 때문에, 여기에 변이가 생기면 질병이 발생할 가능성이 높다고 여겨지기 때문이죠. 하지만 우리 유전자의 98%는 단백질을 만들지 않는 비코딩 영역이며, 이 중 일부는 유전자 발현을 조절하는 중요한 역할을 합니다. [cite_start]지금까지는 이 비코딩 영역의 변이가 질병을 일으킬 수 있다는 사실은 알려져 있었지만, 임상적으로 해석하기가 매우 어려워 진단 과정에서 배제되는 경우가 많았습니다[cite: 2, 18, 19]. 이 논문은 바로 이 문제에 주목하여, 비코딩 영역에 숨겨진 변이가 희귀 질환의 원인일 수 있다는 가설을 세우고 연구를 시작했습니다.

---

### 연구 목적

이 연구의 주된 목적은 크게 두 가지입니다.

1.  [cite_start]**희귀 질환의 원인이 될 수 있는 프로모터와 UTR 변이를 체계적으로 찾아낼 수 있는 방법(프레임워크)을 개발하는 것**입니다[cite: 4, 32].

2.  [cite_start]이 방법을 실제로 적용하여 **진단되지 않은 희귀 질환 환자들에서 새로운 진단을 찾아내는 것**입니다[cite: 3, 31, 32].

---

### 연구 방법

[cite_start]연구팀은 **영국 유전체 10만 프로젝트(Genomics England 100,000 Genomes Project)**에 참여한 8,040명의 미진단 희귀 질환 환자들의 유전체 데이터를 활용했습니다[cite: 5, 56]. [cite_start]이들은 기존의 검사에서 유전자 코딩 영역으로는 진단되지 않은 사람들입니다[cite: 66, 68].

1.  [cite_start]**연구 대상 변이 정의**: 먼저, 유전자 발현을 조절하는 역할을 하는 **프로모터**와 **UTR** 영역의 변이들로 분석 대상을 한정했습니다[cite: 22, 44, 45].

2.  **변이 분석 및 필터링**: 연구팀은 새로 개발한 분석 방법을 적용해 수십만 개의 변이 중에서 질병을 일으킬 가능성이 높은 변이를 선별했습니다. [cite_start]이 과정에서 유전자 발현에 영향을 미치거나, 단백질 생성 시작 신호를 방해하는 등 기능적으로 중요한 변이들을 집중적으로 골라냈습니다[cite: 80, 154, 158, 159].

3.  [cite_start]**임상적 검토**: 선별된 변이들은 환자의 임상 증상과 연관성이 있는지 전문가의 면밀한 검토를 거쳤습니다[cite: 108, 111].

4.  [cite_start]**부담 테스트**: 또한, 희귀 질환 환자 그룹에서 비코딩 변이가 일반 대조군보다 더 많이 나타나는지 비교하는 **부담 테스트(burden testing)**를 진행했습니다[cite: 6, 9]. [cite_start]이 테스트를 통해 비코딩 변이들이 희귀 질환의 주요 원인인지 여부를 통계적으로 검증하고자 했습니다[cite: 9, 35].

---

### 연구 결과

* [cite_start]**새로운 진단 발견**: 연구팀은 분석을 통해 총 11개의 새로운 변이 후보를 찾아냈고, 이 중 10개(82%)가 환자의 증상과 매우 밀접하게 관련되어 있음을 확인했습니다[cite: 7, 8, 161]. [cite_start]특히, 이 중 6개는 이전에 보고되지 않은 새로운 변이였습니다[cite: 8]. [cite_start]이 연구를 통해 **GLUT1 결핍 증후군**과 같은 질환에 대해 새로운 진단이 이루어지기도 했습니다[cite: 166, 169].

* [cite_start]**전체적인 영향은 제한적**: 하지만, **부담 테스트** 결과 비코딩 영역의 변이가 희귀 질환 환자 전체에서 통계적으로 유의하게 많지는 않았습니다[cite: 9, 35]. [cite_start]이는 프로모터와 UTR 변이가 모든 희귀 질환의 주요 원인은 아니며, 이를 진단 과정에 포함하더라도 전체적인 진단율을 획기적으로 높이기는 어렵다는 것을 시사합니다[cite: 10, 35].

---

### 고찰 및 의의와 시사점

[cite_start]이 연구의 가장 중요한 의의는 바로 **비코딩 영역 변이 분석을 위한 체계적인 틀을 제시했다는 점**입니다[cite: 11, 36]. 기존의 복잡하고 해석이 어려웠던 비코딩 영역 변이를 효율적으로 분석하여 임상 진단에 적용할 수 있는 방법을 개발한 것입니다. [cite_start]이 방법은 기존에 원인을 알 수 없었던 소수의 희귀 질환 환자들에게 새로운 진단의 기회를 제공합니다[cite: 10, 36].

**이 연구가 중요한 이유**는 단순히 몇 개의 새로운 변이를 찾아낸 것을 넘어섭니다. 지금까지는 접근하기 어려웠던 유전체 영역을 탐구할 수 있는 길을 열어주었기 때문입니다. 비록 이 방법이 모든 미진단 환자의 문제를 해결하지는 못하더라도, 진단되지 않은 환자들에게 희망을 주고 유전학 연구의 범위를 확장하는 데 크게 기여할 것입니다. 이 연구는 미래의 정밀 의학이 나아가야 할 방향, 즉 유전체 전체를 폭넓게 이해하고 분석하는 것의 중요성을 강조합니다.


chatGPT

좋습니다. 업로드하신 논문 \*\*“Systematic identification of disease-causing promoter and untranslated region variants in 8040 undiagnosed individuals with rare disease” (Genome Medicine, 2025)\*\*을 바탕으로, 전공자가 아닌 일반 성인 독자도 이해할 수 있도록 블로그용 요약을 작성해드리겠습니다.

---

# 숨겨진 유전자 영역이 희귀질환 진단의 열쇠가 될까?

## 연구 배경

유전병을 진단할 때 보통 연구자들은 \*\*단백질을 만드는 핵심 유전자 영역(코딩 영역)\*\*만 집중적으로 살펴봅니다. 하지만 사실 유전자는 단백질 부분 외에도 \*\*앞뒤에 붙은 조절 구역(프로모터와 UTR, 즉 번역되지 않는 영역)\*\*이 있습니다. 이 조절 구역은 단백질이 얼마나, 언제, 어디서 만들어질지를 결정하는 중요한 ‘스위치’ 역할을 합니다. 그럼에도 불구하고 현재의 임상 유전자 검사에서는 해석이 어렵다는 이유로 이 부분이 거의 분석되지 않고 있습니다. 연구진은 “혹시 이 영역에서 놓치고 있는 희귀질환의 원인이 있지 않을까?”라는 질문을 던졌습니다.

## 연구 목적

영국의 \*\*100,000 게놈 프로젝트(Genomics England)\*\*에 참여한 수천 명의 희귀질환 환자 데이터를 분석해,

* 프로모터와 UTR 같은 비코딩 영역에서 **질환 원인이 될 수 있는 돌연변이**를 체계적으로 찾아내고,

* 실제로 진단에 도움이 되는지를 확인하는 것이 연구의 목표였습니다.

## 연구 방법

1. **대상자**: 8,040명의 희귀질환 환자(부모까지 포함된 가족 단위 데이터 활용).

2. **분석 구역**: 기존 검사에서 잘 보지 않는 **프로모터와 UTR(앞·뒤 번역되지 않는 구역)**.

3. **분석 과정**:

   * ‘질병과 확실히 연관된 유전자(1,536개)’만 선별.

   * 그 유전자의 프로모터·UTR에서 발견된 \*\*드 노보 변이(부모에게 없고 자식에서 새로 생긴 돌연변이)\*\*만 집중 분석.

   * 변이가 실제 질병 증상과 맞아떨어지는지 임상의와 함께 검토.

   * 일부 사례에서는 RNA 발현이나 DNA 메틸화 실험을 통해 기능적 영향을 확인.

## 연구 결과

* 전체 8,040명 환자 중, **10명에서 새로운 원인 변이**를 찾아냈습니다.

  * 예를 들어, **SLC2A1 유전자의 5′UTR 변이**는 뇌로 당을 운반하는 단백질 생성이 막혀 **GLUT1 결핍 증후군**을 일으켰습니다. 이 질환은 식이 요법(케톤 식이)으로 치료가 가능해, 실제 환자의 치료 방침이 바뀌었습니다.

  * **SETD5, NIPBL, ZBTB18** 등 여러 유전자에서도 새로운 비코딩 변이가 확인되어 발달장애, 지적장애, 희귀 증후군 환자의 진단이 가능해졌습니다.

* 하지만 전체적으로 보면, 프로모터와 UTR을 검사한다고 해서 **진단율이 크게 오르지는 않았습니다.** (약 0.12%의 환자에서만 새로운 진단 가능)

## 고찰

이 연구는 몇 가지 중요한 점을 보여줍니다.

1. **임상적 의미** – 비록 추가적인 진단율은 낮지만, 특정 환자에게는 **치료 방향을 바꿀 만큼 결정적**일 수 있습니다.

2. **기술적 난제** – 비코딩 영역은 해석이 쉽지 않고, 어떤 변이가 실제로 해로운지 판단할 도구가 아직 부족합니다.

3. **데이터 공유의 필요성** – 앞서 발견된 변이가 데이터베이스에 제때 공유되지 않아 환자가 몇 년간 진단을 받지 못한 사례도 있었습니다. 이는 국제적인 변이 데이터 공유의 중요성을 강조합니다.

## 의의와 시사점

* 임상 유전자 검사에 프로모터와 UTR을 포함한다고 해서 전체 진단 성공률이 확 뛰는 것은 아닙니다.

* 그러나 이 ‘숨겨진 영역’을 꼼꼼히 들여다봄으로써 **극소수 환자에게 결정적인 진단과 치료 기회**를 제공할 수 있습니다.

* 앞으로 더 많은 데이터와 새로운 분석 도구가 개발되면, 현재는 “의미 불명”으로 보이는 비코딩 변이들이 희귀질환 연구와 진단에 중요한 단서가 될 수 있습니다.

## 이 연구가 중요한 이유

희귀질환 환자와 가족들은 종종 수년간 원인을 찾지 못하는 \*\*“진단 방황(diagnostic odyssey)”\*\*을 겪습니다. 이 연구는 우리가 잘 보지 않던 유전자의 조절 영역을 체계적으로 분석하면, 일부 환자에게는 그 고통스러운 방황을 끝낼 수 있음을 보여주었습니다. 비록 그 비율은 낮지만, 진단이 이루어지는 순간 환자의 삶은 완전히 달라질 수 있습니다. **즉, 작은 성과라도 환자 개인에게는 ‘100%의 의미’를 가지는 것**이 이 연구의 가장 큰 가치라고 할 수 있습니다.


grok3

### 희귀 질환의 숨겨진 원인: 프로모터와 UTR 영역의 유전자 변이 탐색

#### 연구 배경

희귀 질환은 전 세계적으로 수백만 명을 괴롭히는 문제지만, 많은 환자들이 정확한 유전적 원인을 찾지 못합니다. 기존의 유전자 검사 방법은 주로 '단백질 코딩 영역'(유전자가 단백질을 만드는 부분)에 초점을 맞춥니다. 이는 유전자를 '레시피 책'으로 비유하면, 재료 목록(코딩 영역)만 보는 셈이에요. 하지만 유전자의 작동을 조절하는 '스위치'나 '지침서' 부분, 즉 프로모터(유전자 시작을 알리는 영역)와 UTR(번역되지 않는 영역)은 거의 무시되죠. 이 영역의 변이는 유전자가 제대로 작동하지 않게 만들어 질환을 일으킬 수 있지만, 해석이 어렵기 때문에 검사에서 제외되는 경우가 많아요. 이 연구는 영국 Genomics England 프로젝트의 데이터를 활용해, 이런 비코딩 영역이 희귀 질환 환자들의 '숨겨진 진단'을 얼마나 제공할 수 있는지 탐구합니다.

#### 연구 목적

연구자들은 프로모터와 UTR 영역의 잠재적 질환 유발 변이를 체계적으로 식별하고 분석하는 프레임워크를 개발했습니다. 이를 통해 8,040명의 진단되지 않은 희귀 질환 환자(부모-자녀 트리오)에서 de novo 변이(부모에게 없고 자녀에게 새로 생긴 변이)를 분석하고, 이 영역이 전체 진단에 얼마나 기여할지 평가하는 게 목표예요. 또한, 희귀 질환 환자와 건강한 대조군을 비교해 변이의 '부담'(희귀 변이가 더 많은지)을 테스트했습니다. 궁극적으로, 비코딩 영역을 임상 검사에 포함할 가치가 있는지 밝히려 했어요.

#### 연구 방법

먼저, 알려진 희귀 질환 유전자 1,536개를 선정했습니다(PanelApp 데이터베이스에서 '강한 연관성' 있는 유전자만). 이 유전자의 프로모터(전사 시작 지점 주변 200-400bp 영역)와 UTR(5'UTR: 시작 앞, 3'UTR: 끝 뒤)를 정확히 정의했어요. ENCODE 데이터로 프로모터를, MANE 전사체로 UTR를 매핑했습니다.

데이터는 Genomics England의 100,000 Genomes 프로젝트에서 가져왔어요. 8,040명 환자 트리오에서 de novo 변이를 필터링: 희귀하고(인구 빈도 <0.00005), 질환 유전자와 맞는 것만 남겼습니다. 변이 주석은 영역별로 다르게 했어요. 예를 들어:

- 5'UTR: 상류 시작 코돈 생성(uAUG)이나 Kozak 서열 방해(번역 시작 신호).

- 3'UTR: 미RNA 결합 사이트나 폴리아데닐레이션 신호(RNA 안정화) 파괴.

- 프로모터: 전사인자 결합 사이트 변화(FABIAN 도구).

- 모든 영역: 보존성(PhyloP), 해로움(CADD), 스플라이싱(SpliceAI) 점수로 우선순위화.

ClinVar 데이터로 방법의 정확성을 검증했고, 환자 7,862명과 대조군 6,371명을 매칭해 변이 부담 테스트(피셔 정확 검정)를 했어요. RNA 시퀀싱과 DNA 메틸화 분석으로 일부 변이 검증.

#### 연구 결과

de novo 변이 1,311개 중 11개를 우선순위화했어요. 이 중 10개(82%)가 환자 증상과 잘 맞았고, 6개는 새로 발견된 진단이었어요. 예:

- SLC2A1의 5'UTR 변이: GLUT1 결핍증 환자에서 발견, 이미 알려졌지만 GEL에서 놓침. 치료 시작.

- NIPBL의 스플라이싱 변이: Cornelia de Lange 증후군 유사 증상.

- SETD5의 5'UTR 변이: 두 환자에서 지적 장애 관련, DNA 메틸화로 확인.

- ZBTB18 프로모터 변이: 고보존성 위치, 지적 장애.

- GNAS의 스플라이싱 변이: 갑상선 기능 저하, RNA 분석으로 이상 확인.

ClinVar 테스트에서 병원성 변이 53.7%를 정확히 우선순위화(양성 변이 중 0.71%만 오탐). 부담 테스트에서는 환자 쪽 변이가 더 많았지만, 통계적으로 유의미하지 않았어요(OR=1.09, P=0.051). 자폐증 데이터(SSC)에서도 비슷한 결과.

#### 연구 고찰

이 접근법은 비코딩 영역 변이를 효과적으로 찾아내지만, 전체 희귀 질환 환자 중 0.0012%만 새 진단을 제공했어요. 부담 테스트의 무유의성은 샘플 크기 부족(파워 14.3%) 때문일 수 있어요. 더 큰 코호트(2만 명 이상)에서 재검증 필요. 프로모터 변이 주석이 약점(ClinVar에서 63% 놓침)으로, 더 나은 도구 개발이 요구돼요. 희귀 변이가 많아 임상 검토 부담이 커질 수 있지만, 고특이성 필터링으로 줄임.

#### 의의와 시사점

이 연구는 비코딩 영역을 검사에 포함하면 추가 진단(예: 치료 가능한 GLUT1 결핍)이 가능하다는 걸 보여줍니다. 프레임워크는 임상에서 재사용 가능해, 희귀 질환 진단율을 높일 수 있어요. 하지만 이 영역 추가가 전체 수율을 '극적으로' 증가시키진 않을 거예요. 시사점: 유전자 검사는 코딩 영역 너머로 확장해야 하며, 큰 데이터셋과 AI 도구로 해석을 개선하면 더 많은 환자가 혜택 볼 수 있음.

이 연구가 중요한 이유는 희귀 질환 환자들의 '미해결 사례'를 줄일 실마리를 제공하기 때문이에요. 유전자 전체를 보는 관점으로 전환하면, 더 정확한 진단과 맞춤 치료가 가능해져 환자와 가족의 삶을 바꿀 수 있습니다.


NotebookLM

다음은 업로드하신 논문의 내용을 생명과학을 전공하지 않은 일반 성인 독자분들이 이해하기 쉽도록 블로그 형식으로 요약한 내용입니다.

---

## **희귀 질환의 숨겨진 원인: 유전자 비번역 영역에서 답을 찾다**

### **들어가며: 희귀 질환 진단의 미스터리**

희귀 질환은 전 세계 수많은 사람들에게 영향을 미치지만, 여전히 많은 환자들이 명확한 유전적 진단을 받지 못하고 있습니다. 현재 유전 검사는 주로 우리 몸의 단백질을 만드는 설계도인 '단백질 코딩 영역'에 집중되어 있습니다. 하지만 우리 유전자의 98% 이상은 단백질을 만들지 않는 '비번역 영역'으로 구성되어 있으며, 이 영역들도 유전자 작동 방식에 매우 중요한 역할을 합니다.

마치 책의 본문 외에 제목, 목차, 각주 등이 중요한 정보인 것처럼, 유전자에도 단백질을 직접 만들지는 않지만 그 작동을 조절하는 중요한 부분이 있습니다. 바로 **프로모터(promoter)**와 **비번역 영역(UTR: Untranslated Region)**이 그렇습니다.

*   **프로모터**는 유전자의 '시작 버튼'과 같아서, 유전자가 언제, 어디서, 얼마나 많이 작동할지 결정합니다.

*   **비번역 영역(UTR)**은 단백질 코딩 영역의 앞(5' UTR)이나 뒤(3' UTR)에 위치하며, RNA 안정성, 위치, 단백질 생성 속도 등을 조절합니다.

이러한 비번역 영역에 생기는 작은 변화(변이)가 질병의 원인이 될 수 있음에도 불구하고, 지금까지는 이 부분의 변이를 해석하기 어려워 임상 유전 검사에서 대부분 제외되어 왔습니다. 그렇다면 이 숨겨진 비번역 영역에 희귀 질환의 진단서가 얼마나 많이 숨어 있을까요?

**이 연구의 목적**은 바로 이 질문에 답하기 위해, **희귀 질환을 앓고 있지만 아직 진단받지 못한 사람들에게서 질병을 유발하는 프로모터 및 UTR 변이를 체계적으로 찾아내고 분석하는 새로운 방법을 제시하는 것입니다**.

### **어떻게 연구했을까? (연구 방법)**

이 연구는 영국 지노믹스 잉글랜드(Genomics England)의 10만 게놈 프로젝트(100,000 Genomes Project)에 참여한 수많은 사람들의 데이터를 활용했습니다.

1.  **연구 대상자:**

    *   **새로 발생한 변이(de novo variants, DNVs) 분석:** 진단되지 않은 희귀 질환 환자 8,040명(환자, 부모로 구성된 3인 가족)을 대상으로 했습니다. 여기서 새로 발생한 변이란 부모에게는 없지만 자녀에게서 새로 발견된 변이를 의미합니다.

    *   **변이 부담(burden testing) 분석:** 7,862명의 희귀 질환 환자와 성별 및 유전적 조상이 일치하는 건강한 대조군을 비교하여 특정 변이가 환자 그룹에서 더 자주 나타나는지 확인했습니다.

2.  **관심 영역 정의:**

    *   **프로모터 및 UTR 영역:** 유전자의 '녹색' 패널(PanelApp) 유전자(질병과의 연관성이 높은 유전자)에 대해 MANE v1.0 데이터세트를 활용하여 프로모터와 UTR(비번역 엑손 및 인트론 포함) 영역을 정확하게 정의했습니다.

    *   이때, **프로모터 영역**은 유전자 전사 시작 부위(TSS)를 기준으로 ENCODE에서 얻은 후보 시스 조절 요소(cCRE)를 사용하여 최소 181bp 상류에서 67bp 하류까지, 최대 266bp 상류에서 139bp 하류까지 정의했습니다.

3.  **변이 식별 및 분석 (핵심 방법):**

    *   **엄격한 필터링:** 먼저, 환자들에게서 발견된 수많은 변이 중 이미 질병의 원인으로 알려진 코딩 영역 변이가 있는 사람은 제외했습니다. 또한, 일반 인구에서 흔하게 나타나는 변이(낮은 대립유전자 빈도 기준)도 걸러냈습니다.

    *   **영역별 맞춤 분석:**

        *   **5' UTR 변이:** UTRannotator를 사용하여 상류 시작 코돈(uAUG) 생성, 상류 오픈 리딩 프레임(uORF) 교란, 코작(Kozak) 서열 교란, 내부 리보솜 진입 부위(IRES) 또는 마이크로RNA(miRNA) 결합 부위 교란 등 번역 과정에 영향을 미치는 변이를 우선 선별했습니다.

        *   **3' UTR 변이:** 폴리아데닐화(polyadenylation) 신호 또는 RNA 결합 단백질(RBP) 결합 부위를 교란하는 변이를 우선 선별했습니다.

        *   **프로모터 변이:** FABIAN을 사용하여 전사 인자 결합 부위(TFBS)를 교란하는 변이를 예측했습니다.

        *   **모든 영역:** SpliceAI를 통해 스플라이싱(유전자 정보 편집)에 미치는 영향을 예측하고, CADD 및 PhyloP 점수를 사용하여 유전적 보존성 및 병원성을 예측했습니다.

    *   **임상 검토:** 선별된 후보 변이들을 환자의 표현형(나타나는 증상)과 잘 일치하는지 임상적으로 검토했습니다.

4.  **방법의 정확성 검증 (ClinVar 활용):**

    *   기존에 질병 유발 변이(병원성/가능성 있는 병원성) 또는 양성 변이(양성/가능성 있는 양성)로 분류된 ClinVar 데이터베이스의 변이들을 사용하여 이 방법의 정확도(민감도 및 특이도)를 평가했습니다.

### **놀라운 발견! (연구 결과)**

1.  **희귀 질환의 새로운 진단 발견:**

    *   엄격한 필터링 과정을 거쳐 **총 11개의 새로운 변이를 우선순위로 선정했고, 이 중 12개의 변이 중 10개(82%)가 해당 환자의 표현형과 강력하게 일치했습니다**.

    *   **특히 6개는 이전에 확인되지 않았던 새로운 진단**이었습니다.

    *   **구체적인 사례:**

        *   **SLC2A1 유전자 5'UTR uAUG 생성 변이:** GLUT1 결핍 증후군 환자에게서 발견되었으며, 이는 새로운 진단으로 이어져 환자의 치료 방침을 바꾸는 계기가 되었습니다. 이 변이는 상류에 시작 코돈을 만들어 정상적인 단백질 생산을 방해하여 유전자 기능을 상실하게 합니다.

        *   **NIPBL 유전자 스플라이싱 교란 변이:** 코넬리아 드 랑게 증후군과 유사한 증상을 보이는 환자에게서 발견되었습니다.

        *   **ZBTB18 유전자 프로모터 변이:** 지적 장애를 가진 환자에게서 고도로 보존된 위치에서 발견되었습니다.

        *   **SETD5 유전자 5'UTR 스플라이스 부위 변이:** 신경 발달 장애 환자 2명에게서 발견되었으며, 이 중 한 명은 DNA 메틸화 분석을 통해 진단이 확인되었습니다.

        *   **GNAS 유전자 숨겨진 스플라이스 변이:** 갑상선 기능 저하증 환자에게서 발견되었고, 비정상적인 스플라이싱과 유전자 발현 감소가 확인되었습니다.

    *   이 연구를 통해 이전에는 코딩 변이로 진단되지 않았던 8,040명의 환자 중 **총 10명(0.12%)에게서 질병을 유발하는 프로모터 및 UTR 변이를 발견했습니다**.

2.  **변이 부담 분석 결과:**

    *   이 연구에서는 **희귀 질환 환자 그룹에서 잠재적으로 해로운 프로모터 및/또는 UTR 변이가 대조군에 비해 통계적으로 유의하게 많다고는 결론짓지 못했습니다**.

    *   이는 변이 수가 적고 통계적 검정력이 부족했기 때문일 수 있다고 저자들은 설명합니다.

3.  **방법론의 정확성:**

    *   ClinVar 데이터를 사용하여 검증한 결과, 이 방법은 **매우 높은 특이도(99.29%의 양성 변이를 정확히 제외)와 합리적인 민감도(53.7%의 병원성 변이를 정확히 식별)**를 보였습니다. 이는 이 방법이 수많은 변이 중 진단 가능성이 높은 변이만을 효과적으로 선별하여 수동 검토 부담을 크게 줄일 수 있음을 의미합니다.

### **무엇을 알게 되었고, 앞으로는? (고찰, 의의 및 시사점)**

이 연구는 희귀 질환 진단에 있어 **비번역 영역 변이의 중요성을 다시 한번 강조합니다**. 비록 이러한 영역을 포함한다고 해서 진단율이 극적으로 증가하지는 않을 수 있지만, 여전히 **진단되지 않은 환자들에게 새로운 진단을 제공하고, 심지어 환자의 치료 방침을 변화시킬 수 있는 기회를 줍니다**.

**이 연구의 중요한 의미는 다음과 같습니다:**

*   **새로운 진단 기회 제공:** 희귀 질환 환자들에게 새로운 진단을 제공할 수 있는 **체계적인 분석 프레임워크를 제시했습니다**. 특히 SLC2A1 변이 사례처럼, 이 프레임워크를 통해 환자의 질병 원인을 밝혀내고 적절한 치료를 시작할 수 있었다는 점은 큰 의의가 있습니다.

*   **높은 정확성:** 이 방법은 진단 가능성이 낮은 수많은 변이들 사이에서 **실제 질병을 유발하는 변이를 높은 정확도로 선별해내는 능력**을 보여주었습니다. 이는 임상 현장에서 진단에 필요한 시간과 노력을 줄일 수 있게 합니다.

*   **비번역 게놈 연구의 발전:** 아직 비번역 게놈의 작동 원리에 대한 이해는 완벽하지 않습니다. 하지만 이러한 연구를 통해 **더 많은 질병 유발 비번역 변이를 식별하고 그 메커니즘을 이해함으로써, 궁극적으로 조절 생물학에 대한 우리의 이해를 높이고 더 나은 진단 도구를 개발할 수 있게 될 것입니다**.

*   **데이터 공유의 중요성:** SLC2A1 변이 사례는 전문 데이터베이스에 있었지만 널리 사용되는 데이터베이스에는 뒤늦게 등록되어, 환자가 몇 년간 진단을 받지 못했던 경우를 보여줍니다. 이는 **유전자 변이 데이터 공유의 중요성과 재분석의 필요성을 강조**하며, 희귀 질환 환자들의 '진단 오디세이'를 줄이는 데 기여할 수 있습니다.

물론 이 연구에는 한계점도 있습니다. 비번역 게놈의 복잡성 때문에 아직 많은 부분을 알지 못하고, 현재의 분석 도구로는 모든 병원성 변이를 포착하기 어려울 수 있습니다. 또한, 프로모터와 전사 시작 부위(TSS)의 사용은 조직마다 다르게 나타나는데, 이 연구에서는 이를 완전히 반영하지 못했습니다.

**결론적으로, 이 연구는 비번역 영역에 대한 우리의 이해가 아직 불완전하더라도, 현재의 지식과 도구를 활용하여 희귀 질환 환자들에게 매우 가치 있는 유전적 진단을 제공할 수 있음을 입증했습니다**. 이 프레임워크는 앞으로 비번역 게놈 생물학에 대한 이해가 깊어짐에 따라 더욱 발전하고, 전 세계 임상 현장에서 희귀 질환 진단을 개선하는 데 중요한 토대가 될 것입니다. 이는 궁극적으로 희귀 질환으로 고통받는 환자들의 삶의 질을 향상시키는 데 기여할 중요한 발걸음입니다.


perplexity.ai

이 논문은 유전체 분석을 통한 희귀질환 진단의 한계를 극복하고자, 기존에 잘 다루지 않았던 '프로모터(promoter)'와 '비번역 영역(UTR, Untranslated Region)'의 변이들이 희귀질환과 연관될 수 있음을 밝혀낸 연구입니다.[1]

## 연구 배경

유전체 분석 기술이 발전하면서 희귀질환 진단에 많은 도움이 되고 있지만, 대부분의 유전자 검사는 단백질을 만드는 '코딩 영역'에 국한되어 있습니다. 그러나 유전자 주변에 있는 프로모터와 UTR 역시 유전자 발현 조절에 중요한 역할을 하며, 이 부분의 변이가 질병을 유발할 수 있음이 점차 밝혀지고 있습니다. 그럼에도 불구하고, 이 영역의 변이는 진단 과정에서 해석이 어려워 거의 무시되곤 했습니다.[1]

## 연구 목적

저자들은 영국의 '10만 게놈 프로젝트(Genomics England 100,000 Genomes Project)' 데이터를 활용해, 진단이 되지 않은 희귀질환 환자 8040명을 대상으로 프로모터와 UTR의 변이가 실제로 질병 진단에 도움을 줄 수 있는지 체계적으로 검증하는 것을 목표로 했습니다.[1]

## 연구 방법

- 8040명의 환자 DNA 데이터를 분석하여, 프로모터와 UTR에 위치한 새로운(돌연변이) 유전자 변이를 선별하였습니다.[1]

- 이 변이들이 실제로 질환을 유발할 가능성을 가리키는 첨단 분석 도구(CADD, SpliceAI 등)와 데이터베이스(ClinVar, ENCODE 등)를 활용해 우선순위를 정했습니다.[1]

- 후보 변이에 대해 전문가 임상 검토와 필요한 경우 RNA 분석, DNA 메틸화 검사 등 추가적인 실험을 통해 실제 진단과 연결될지 검증했습니다.[1]

- 마지막으로, 해당 변이들이 환자 집단에서 더 많이 나타나는지 통계적 검증(부담 테스트)을 실시했습니다.[1]

## 주요 결과

- 총 11개의 중요 변이를 선별했고, 이 중 10개는 환자의 증상과 직접적으로 관련된 유전자에서 발견되어 '진단'으로 이어질 수 있음을 확인했습니다.[1]

- 이 가운데 6개 변이는 이전에 보고된 적이 없는 신규 진단이며, 한 명의 환자는 이러한 변이 발견 덕분에 적절한 치료를 받을 수 있었습니다.[1]

- 그러나 전체적으로 프로모터와 UTR 변이가 희귀질환 전체에서 차지하는 비율은 매우 낮아, 이 영역 변이만 추가로 검사한다고 해서 진단율이 크게 오르지는 않는다는 결론에 도달했습니다.[1]

- 정밀한 통계분석에서도 프로모터 및 UTR 내 잠재적으로 해로운 변이들이 환자 그룹에서 유의미하게 더 많지는 않았습니다.[1]

- 단, 본 연구에서 개발한 분석 프레임워크는 실제 임상진단 현장에서 활용 가능하다는 점을 데이터와 ClinVar 테스트를 통해 입증했습니다.[1]

## 논의 및 시사점

- 기존 진단 방법으로는 놓칠 수 있는 질병 유발 변이를 찾아내기 위해 비코딩 영역 분석이 중요할 수 있음을 보여줍니다.[1]

- 특히, 프로모터와 UTR의 변이는 유전자 발현에 직접적인 영향을 줄 수 있어, 특정 환자에서 맞춤형 진단과 치료법 제시에 도움을 줄 수 있습니다.[1]

- 다만 이런 비코딩 영역의 변이는 전체 진단률 향상에 큰 영향을 주지 않을 수 있으므로, 무분별한 확대 적용이 아니라 표적화된 분석 전략이 필요함을 시사합니다.[1]

- 연구팀이 개발한 변이 선별 프레임워크는 실제 임상현장 적용 가능성이 높으며, 향후 비코딩 영역 연구의 기반이 될 수 있습니다.[1]

- 무엇보다 환자 진단 및 치료 기회의 확대, 데이터 공유와 재분석의 중요성까지 환기시켰다는 점에서 의의가 있습니다.[1]

## 연구의 중요성

이 연구는 우리 유전체의 잘 알려지지 않은 영역들이 건강과 질병에 미치는 영향을 밝히는 데 중요한 실마리를 제공합니다. 단순히 단백질 코딩 부위만 보는 데 그치지 않고, 유전자 조절의 핵심인 비코딩 영역까지 분석한다면, 진단 사각지대에 놓여 있는 환자들에게도 새로운 기회를 제공할 수 있습니다. 궁극적으로, 유전체 기반 희귀질환 진단의 ‘경계’를 확장하고, 맞춤형 의료의 발전에 씨앗이 될 연구입니다.[1]



출처: @ye._.vely618