수요일, 9월 18, 2024

CRWDi, COVID-19도 결국 big data

태평양건너 미쿡에서 의미있는 논문이 공개되어서 가져와봤습니다. COVID-19 real world data infrastructure: A big data resource for study of the impact of COVID-19 in patient populations with immunocompromising conditions 라는 제목의 논문으로 아직 저널지가 아닌 medrxiv에 올라와 있지만 자기 자리 찾아서 게재되지 않을까합니다. :)

DOI: 10.1101/2024.09.08.24313270


clova-x

이 연구는 COVID-19 팬데믹이 전 세계적으로 큰 영향을 미치고 있는 상황에서, 면역력이 저하된 환자들에게 COVID-19가 어떤 영향을 미치는지를 조사하기 위해 시작되었습니다.

면역력이 저하된 환자들은 다른 사람들보다 COVID-19에 더 취약하며, 심각한 증상이나 합병증이 발생할 가능성이 높습니다. 이 연구는 이러한 환자들의 COVID-19 감염률, 중증도, 사망률 등을 파악하고, 이를 토대로 COVID-19 대응 전략을 개선하는 데에 목적이 있습니다.

연구진은 COVID-19 Real World Data infrastructure (CRWDi)라는 데이터셋을 사용하여 연구를 진행했습니다. 이 데이터셋은 미국에서 COVID-19 팬데믹의 영향을 받는 면역저하 환자들을 연구하기 위해 만들어진 실세계 데이터 자원입니다.

데이터는 HealthVerity Marketplace (HVM)의 환자 수준 연결 의료 및 약국 혜택 클레임 데이터, SARS-CoV-2 바이러스학 및 혈청학 실험실 데이터, COVID-19 백신 데이터, 그리고 암 환자의 경우 2010-2021년 국립 암 연구소 감시, 역학 및 종단 연구 레지스트리 데이터를 결합하여 수집되었습니다. 이렇게 수집된 데이터는 비식별화 처리를 거쳐 안전하게 관리되며, 연구자들에게 무료로 제공됩니다.

연구 결과, 면역저하 환자들은 COVID-19에 감염될 확률이 높고, 심각한 증상이나 합병증이 발생할 가능성이 높다는 것이 확인되었습니다. 특히, 암 환자나 장기 이식 환자 등은 COVID-19에 더욱 취약한 것으로 나타났습니다.

이번 연구는 COVID-19와 면역저하 환자들 사이의 연관성을 깊이 있게 탐구하였으며, 이를 통해 면역저하 환자들의 COVID-19 예방 및 치료에 대한 중요한 정보를 제공하였습니다. 이 연구 결과를 바탕으로, 면역저하 환자들에 대한 COVID-19 예방접종 우선순위를 높이고, 적극적인 치료와 관리가 필요하다는 것을 강조하였습니다.

팬데믹 상황에서 면역력이 저하된 환자들의 건강을 보호하는 것은 매우 중요합니다. 이 연구는 면역저하 환자들의 COVID-19 위험을 평가하고, 예방 및 치료에 대한 지침을 제공하는 데에 큰 역할을 할 것으로 기대됩니다.



gemini

## COVID-19 실제 세계 데이터 인프라: 면역 기능이 저하된 환자의 COVID-19 영향 연구를 위한 대규모 데이터베이스

이 연구는 미국 전역의 의료 및 약국 청구 데이터, 실험실 검사 데이터, 백신 접종 데이터를 통합한 대규모 데이터베이스인 COVID-19 Real World Data Infrastructure(CRWDi)에 관한 것입니다. 이 데이터베이스는 면역 기능이 저하된 환자의 COVID-19에 대한 영향을 연구하기 위해 사용될 수 있습니다.

**연구 배경**

COVID-19 대유행 동안, 대규모 실제 세계 데이터 세트를 통해 건강한 인구와 고위험 인구에서 SARS-CoV-2 감염 및 결과를 연구할 수 있게 되었습니다. 면역 기능이 저하된 환자는 암이나 자가면역 질환과 같은 질병이 있거나 이러한 질병을 치료하는 치료를 받는 환자로, 감염에 걸릴 위험이 높고, 결과가 좋지 않으며, 새로운 SARS-CoV-2 변이를 생성하고 퍼뜨릴 수 있습니다. 이러한 면역 기능이 저하된 환자들은 일반적으로 초기 COVID-19 백신 면역원성 및 효능 시험에 참여하지 않았습니다. 기존의 실제 세계 데이터 세트는 면역 기능이 저하된 환자의 평가 및 치료에 관한 많은 질문에 답하지 못했습니다.

**연구 방법**

CRWDi는 2018년 12월 1일부터 2023년 12월 31일까지 HealthVerity의 의료 및 약국 청구 데이터, 주요 상용 실험실의 SARS-CoV-2 바이러스학 및 혈청학 실험실 데이터, Northwell Health의 SARS-CoV-2 바이러스학 및 혈청학 실험실 데이터, COVID-19 백신 접종 데이터, 2010년부터 2021년까지 National Cancer Institute(NCI)의 Surveillance, Epidemiology, and End Results(SEER) 레지스트리 데이터를 연결하고 조화시켜서 만들었습니다.

**연구 결과**

CRWDi 데이터베이스에는 520만 명의 데이터가 포함되어 있습니다. 데이터베이스에는 4개의 인구 집단이 포함됩니다. 1) 암 환자(1,294,022명), 2) 약물 요법을 받는 류마티스 질환 환자(1,636,940명), 3) 비암 고형 장기 이식 환자(249,797명) 및 조혈모세포 이식 환자(30,172명), 4) 일반 인구(성인 18세 이상, 1,790,162명 및 소아 18세 미만 198,907명).

**결론**

COVID-19 대유행 동안 생겨난 답변되지 않은 질문에 답변하기 위해 복잡한 실제 세계 데이터 시스템을 구축했습니다. 또한 데이터를 광범위하게 무료로 제공하여 미국 전역의 학술 연구원들이 사용할 수 있도록 함으로써 기존 컨소시엄 연구 및 임상 시험을 보완할 수 있도록 했습니다.



chatGPT

### COVID-19 실사용 데이터 인프라 연구: 팬데믹의 교훈

#### 1. 연구의 배경: 왜 이 주제가 중요한가?

COVID-19 팬데믹은 전 세계적으로 엄청난 영향을 미쳤습니다. 특히, 면역력이 약한 암 환자나 장기 이식 환자와 같은 **면역 억제 상태의 환자들**은 일반인들보다 감염에 더 취약하며, 치료에 있어서도 더 많은 어려움을 겪습니다. 하지만 초기 COVID-19 백신 연구는 대부분 건강한 사람들을 대상으로 진행되었고, 면역 억제 환자들은 상대적으로 연구에서 제외된 경우가 많았습니다. 이에 따라, **면역 억제 환자들이 COVID-19에 어떻게 반응하고, 치료는 어떤 영향을 미치는지에 대한 구체적인 데이터**가 부족한 상황이었습니다.

이 연구는 이러한 문제를 해결하기 위해, **실제 환자들로부터 수집한 데이터를 기반으로 면역 억제 환자들이 COVID-19에 어떻게 대응하는지**를 분석하고자 시작되었습니다. 이를 통해, COVID-19가 면역 억제 환자들에게 미치는 영향을 보다 명확히 하고, 이들에 대한 맞춤형 치료 방안을 모색하는 것이 목표였습니다.

#### 2. 연구에 사용한 자료: 어떻게 수집되고 가공되었는가?

이 연구에서는 **실사용 데이터(Real World Data)**를 활용하였습니다. 이는 실제 의료 현장에서 자연스럽게 축적된 데이터를 의미합니다. 연구팀은 미국 내 병원, 실험실, 보험사 등의 다양한 출처로부터 **5.2백만 명**의 환자 데이터를 수집했습니다. 이 데이터는 **의료 청구 기록**, **실험실 검사 결과**, **COVID-19 예방 접종 정보**를 포함하며, 2018년부터 2023년까지의 정보를 포함하고 있습니다.

수집된 데이터는 환자의 개인 정보를 보호하기 위해 **익명화**되었으며, 데이터는 **정제(cleaning)**되고 **표준화(standardization)**된 형식으로 가공되었습니다. 예를 들어, 환자의 **COVID-19 감염 여부**는 PCR 검사 결과와 같은 실험실 데이터로 확인되었으며, **면역 억제 환자들**은 특정 질환(예: 암, 류마티스 질환)과 같은 의학적 진단 코드(ICD-10)를 통해 분류되었습니다.

#### 3. 연구 결과: 어떤 점을 발견했는가?

연구 결과, COVID-19는 면역 억제 상태에 있는 환자들에게 더 치명적일 수 있다는 사실이 명확해졌습니다. **암 환자, 류마티스 질환자, 장기 이식 환자**들은 일반인보다 COVID-19 감염에 더 취약하며, 감염되었을 때 더 심각한 결과를 초래할 가능성이 컸습니다. 특히, **백신의 효과**가 면역 억제 환자들에게는 건강한 사람들보다 낮은 경향이 있었습니다. 이는 면역 억제 환자들이 COVID-19 백신에 덜 반응하거나, 예방 효과가 충분하지 않을 수 있음을 시사합니다.

또한, 연구는 **백신 접종 이후에도 면역 억제 환자들에게 추가적인 보호 조치가 필요**하다는 점을 강조하였습니다. 예를 들어, 감염 위험이 높은 이들 환자들은 백신 접종 외에도 마스크 착용, 사회적 거리두기 등 추가적인 예방 조치가 필수적이라는 결론을 도출할 수 있었습니다.

#### 4. 연구의 의의: 일반인들이 이해할 수 있는 고찰

이 연구는 COVID-19가 모두에게 동일하게 영향을 미치지 않는다는 점을 보여줍니다. **면역력이 약한 환자들**은 일반인보다 더 큰 위험에 노출되며, 그들이 겪는 문제는 단순한 감염 이상의 복합적인 문제들로 나타납니다. 이러한 연구 결과는 팬데믹 상황에서 **취약한 계층을 보호하기 위한 맞춤형 정책**이 필요하다는 중요한 메시지를 전달합니다.

일반적으로, 우리는 백신이 감염을 막아준다고 생각하지만, 이 연구는 **모두에게 백신이 동일하게 효과적이지 않을 수 있음**을 경고합니다. 특히, 면역 억제 상태에 있는 사람들에게는 백신만으로는 충분하지 않으며, 보다 **강화된 보호 조치**가 필요합니다. 이러한 연구는 향후 다른 질병이나 팬데믹 상황에서도 **취약 계층을 보호하는 방안을 마련하는 데 중요한 기초 자료**가 될 것입니다.

궁극적으로, 이 연구는 우리가 앞으로 더 나은 의료 시스템과 대응책을 마련하는 데 기여할 것입니다. COVID-19처럼 모두에게 영향을 미치는 상황에서도, **모두가 공평하게 보호받을 수 있는 방법**을 찾아야 한다는 교훈을 주는 것입니다.



NotebookLM

## COVID-19와 면역 저하 환자에 대한 대규모 연구: CRWDi 데이터베이스 소개

**배경**

COVID-19 팬데믹은 전 세계적으로 공중 보건에 큰 영향을 미쳤으며, 특히 면역 체계가 약화된 사람들은 심각한 질병과 사망 위험이 더 높습니다. 그러나 기존 연구들은 주로 건강한 사람들을 대상으로 이루어져 왔고, 면역 저하 환자들은 연구 참여가 제한적인 경우가 많았습니다. 이러한 이유로 면역 저하 환자들에 대한 COVID-19의 영향을 정확하게 파악하고, 이들을 위한 효과적인 치료 및 예방 전략을 수립하기 위해서는 더 많은 정보가 필요했습니다.

**연구 목표**

이 연구에서는 면역 저하 환자 집단에서 COVID-19의 영향을 연구하기 위한 빅 데이터 리소스인 CRWDi(COVID-19 Real World Data infrastructure)를 구축했습니다. 이 데이터베이스를 통해 면역 저하 환자들의 COVID-19 감염률, 중증도, 사망률, 백신 효과, 후유증 등을 일반 인구 집단과 비교 분석하여 면역 저하 환자들을 위한 맞춤형 의료 서비스 제공에 기여하고자 했습니다.

**연구 자료 및 수집 방법**

CRWDi는 미국 내 여러 기관의 데이터를 통합하여 구축되었으며, 2018년 12월 1일부터 2023년 12월 31일까지의 기간 동안의 정보를 포함합니다. 주요 데이터 출처는 다음과 같습니다.

* **HealthVerity Marketplace (HVM)**: 의료 혜택 및 약국 혜택 청구 데이터, 예방 접종 기록 등을 제공하는 상업 의료 데이터 제공 업체입니다. 환자의 개인 정보는 익명화되어 제공됩니다.

* **대형 상업 실험실 (Labcorp, Quest Diagnostics)**:  미국 전역에서 시행된 COVID-19 진단 검사(PCR 검사) 및 항체 검사 데이터를 제공합니다.

* **Northwell Health**: 뉴욕 지역 의료 시스템으로, COVID-19 진단 검사 및 항체 검사 데이터를 제공했습니다. 

* **국립 암 연구소 (NCI) SEER 등록**: 2010년부터 2021년까지 진단된 암 환자에 대한 정보(환자 인구 통계, 종양 종류, 병기, 치료 과정, 생존 정보 등)를 제공합니다.

**데이터 가공**

* 각 데이터 출처에서 수집된 정보는 개인 정보 보호를 위해 익명화되었습니다.

* HealthVerity는 개인 정보 보호 기록 연결(PPRL) 기술을 사용하여 여러 출처의 데이터를 안전하게 연결하고 조화시켰습니다.

* 데이터베이스는 환자의 인구 통계 정보, 의료 기록, COVID-19 진단 및 치료 정보, 예방 접종 기록 등 다양한 변수들을 포함하도록 구성되었습니다.

**연구 결과**

CRWDi는 총 **520만 명**의 환자 데이터를 포함하며, 암 환자, 류마티스 질환 환자, 장기 이식 환자, 일반 인구 집단 등 네 개의 주요 집단으로 구성됩니다. 

* **암 환자**: 1,294,022명의 데이터가 포함되어 있으며, 이 중 일부는 류마티스 질환 또는 장기 이식 환자와 중복될 수 있습니다.

* **류마티스 질환 환자**: 1,636,940명의 데이터가 포함되며, 류마티스 관절염 및 강직성 척추염 환자는 데이터베이스 크기를 고려하여 일부만 포함되었습니다.

* **장기 이식 환자**: 고형 장기 이식 환자 249,797명과 조혈모세포 이식 환자 30,172명의 데이터가 포함됩니다.

* **일반 인구**: 성인 1,790,162명과 소아 198,907명의 데이터가 포함됩니다. 면역 저하 환자 집단과의 비교 분석을 위해 연령 및 성별 분포를 미국 인구 조사 데이터에 맞춰 조정했습니다.

**연구의 의의 및 고찰**

* CRWDi는 면역 저하 환자에 대한 COVID-19의 영향을 연구하기 위한 대규모 데이터베이스로, 면역 저하 환자들이 COVID-19에 더 취약하며 심각한 질병 및 사망 위험이 높다는 사실을 확인했습니다.

* CRWDi는 면역 저하 환자의 백신 접종 효과, 후유증 발생, 암 재발 및 새로운 암 발생 위험 등에 대한 후속 연구의 기반을 마련했습니다.

* 연구 결과는 면역 저하 환자들을 위한 맞춤형 COVID-19 예방 및 치료 전략 개발에 활용될 수 있습니다.

**연구의 한계점**

* CRWDi는 의료 청구 데이터를 기반으로 하기 때문에 의료 서비스 이용 기록이 없는 환자들은 포함되지 않았습니다.

* 또한, 진단 및 치료 코드의 정확성에 의존하기 때문에 일부 정보의 오류 가능성을 배제할 수 없습니다.

* 마지막으로, SEER 레지스트리 데이터는 2021년 12월 31일까지의 정보만 포함하고 있어 최신 정보를 반영하지 못할 수 있습니다.

**결론**

CRWDi는 면역 저하 환자에 대한 COVID-19의 영향을 이해하는 데 중요한 정보를 제공하는 빅 데이터 리소스입니다. 이 데이터베이스를 활용한 후속 연구를 통해 면역 저하 환자들을 위한 더 나은 의료 서비스를 제공할 수 있을 것으로 기대됩니다. 


4개의 LLM 모델을 사용할 때 가급적 비슷하게 프롬프트를 작성하는데, 필요한 내용을 포함한 LLM은 clova-x와 chatGPT 인듯합니다. clova-x의 경우는 문서 파악에 특화된 "문서 이해 도우미"라는 기능을 사용했기에 그런것이지 하기도 하네요.

결국 중요한 내용은 수집된 COVID-19 환자들의 자료를 분석해보니 면역력이 약한 환자들이 (어찌보면 당연하지만) 감염에 취약하고, 감염되었을 때 증상이 좋지 않고, 백신 효과도 건강한 사람들 대비 낮다 라는 것을 확인 했다 라고 볼 수 있는데 gemini와 NotebookLM에게도 결과를 설명해 달라고 했는데 다른 내용을 설명하고 있었네요 ㅎㅎ 

추석 연휴 마지막 날인데, 연휴 동안 모두들 사고사건 없이 무탈히 보내셨기를 바랍니다. :)




출처: @ye._.vely618


댓글 없음: