금요일, 4월 17, 2026

에스엠엘제니트리 (연결)감사보고서 분석

본 글에 수록된 내용은 기업의 공시 자료를 바탕으로 작성된 정보 정리 및 요약 자료로 어떠한 형태의 투자 권유, 투자 조언, 또는 종목 추천을 목적으로 하지 않습니다. 본 글은 정보의 정확성과 완전성을 위해 노력하였으나, 공시 정보의 해석 오류, LLM(대형 언어 모델)의 분석 한계, 또는 정보의 시점별 변동 등으로 인해 내용에 오류가 있을 수 있습니다. 따라서 본 글을 참고하여 투자 결정을 내리거나 거래를 실행함으로써 발생하는 모든 문제와 손실은 본인 책임이고, 법적 분쟁에 대해 작성자는 일체의 책임을 지지 않습니다.


SML제니트리, 매출 감소 뒤에 숨겨진 ‘재무적 대수술’의 성과


진단 시약 산업은 팬데믹의 화려한 정점을 지나 '포스트 코로나'라는 냉혹한 시험대에 올랐습니다. 급변하는 시장 환경 속에서 많은 기업이 외형 축소에 직면했고, 투자자들은 묻습니다. "매출이 줄어들면 기업은 위기인가?" 하지만 비즈니스의 이면을 들여다보면 때로는 숫자가 보이는 것 이상의 반전을 선사하기도 합니다.

SML제니트리의 3개년(2021~2023) 감사보고서를 면밀히 분석한 결과, 단순히 매출의 등락을 넘어선 '재무적 대수술'의 흔적을 발견했습니다. 재무제표의 행간에 숨겨진 네 가지 결정적 인사이트를 통해 이 기업의 실질적인 체질 변화를 짚어봅니다.


1. 부채비율 101%에서 32%로: 마법 같은 재무 건전성 회복

2023년 SML제니트리의 재무상태표에서 가장 드라마틱한 변화는 단연 부채 규모의 급감입니다. 2022년 말 기준 **101.81%**에 달했던 부채비율은 불과 1년 만인 2023년 말 **32.01%**로 수직 하락했습니다. 부채총계 역시 약 172억 원에서 72억 원으로 100억 원가량 줄어들며 재무 건전성이 마법처럼 회복되었습니다.

이러한 변화의 핵심은 '전환상환우선주(RCPS)'의 전략적 정리에 있습니다. 연결현금흐름표를 보면 2023년 중 약 **63.7억 원(6,370,759,422원)**의 RCPS 상환이 현금으로 이루어졌음을 확인할 수 있습니다. 이는 기업이 외부 차입에 의존하기보다 자본 구조를 정비하여 잠재적 리스크를 제거하는 '대수술'을 단행했음을 의미합니다. 부채비율 30%대는 향후 공격적인 투자나 추가 자금 조달을 위한 최적의 기반을 마련한 것으로 평가할 수 있습니다.


2. 매출은 소폭 감소, 그러나 순이익은 오히려 '점프'

2023년 매출액은 약 168억 원으로 전년(178억 원) 대비 약 10억 원 감소했습니다. 하지만 시계를 조금 더 넓혀 3개년 추이를 보면 이야기는 달라집니다. 2021년 116억 원 수준이었던 매출은 2023년 현재 여전히 높은 성장세를 유지하고 있기 때문입니다.

더욱 흥미로운 점은 수익성의 역설입니다. 매출이 줄었음에도 당기순이익은 2022년 44억 원에서 2023년 53.5억 원으로 오히려 약 21% 증가했습니다. 다만, 전문가의 시각에서 이 '점프'는 다소 주의 깊게 살펴볼 필요가 있습니다. 이번 순이익 증가의 주역이 영업이익보다는 **금융수익(34억 원)**의 급증, 특히 RCPS 상환 과정에서 발생한 상환이익(26.8억 원) 등 비영업적·비현금성 요인이었기 때문입니다. 즉, 재무 구조는 Pristine(완전한) 상태로 돌아갔으나, 실질적인 영업을 통한 수익성 강화는 여전히 과제로 남아있습니다.

"연결재무제표 작성에는 미래에 대한 가정 및 추정이 요구되며 경영진은 연결실체의 회계정책을 적용하기 위해 판단이 요구됩니다. 추정 및 가정은 지속적으로 평가되며, 과거 경험과 현재의 상황에 비추어 합리적으로 예측가능한 미래의 사건을 고려하여 이루어집니다." — SML제니트리 감사보고서 주석 '중요한 회계추정 및 가정' 중


3. 미국 시장이라는 '높은 벽': SML Genetree Sciences의 도전

국내에서의 내실 경영과 달리, 글로벌 시장인 미국에서는 여전히 무거운 과제가 남아있습니다. 100% 종속기업인 'SML Genetree Sciences, Inc'의 성적표가 이를 대변합니다.

2023년 미국 법인은 매출 69,654천 원을 기록하며 처음으로 유의미한 외형을 만들기 시작했습니다. 그러나 여전히 517,252천 원의 당기순손실을 기록하며 '성장통'을 앓고 있습니다. 주목할 점은 이 미국 법인의 자산 규모가 약 7.1억 원(711,235천 원) 수준으로 모기업 대비 매우 '가벼운(Lean)' 구조라는 것입니다. 현재는 시장 진입을 위한 선제적 투자 단계로 보이나, 이 비용이 향후 수익으로 전환되는 시점이 SML제니트리의 진짜 실력을 증명하는 지점이 될 것입니다.


4. 사라진 주식선택권 12,200주: 인재 관리의 이면?

재무제표의 주석 사항 중 '주식선택권(스톡옵션)'의 변동 내역은 기업 내부의 인적 자원 흐름을 보여주는 흥미로운 지표입니다. 2023년 한 해 동안 12,200주의 주식선택권이 퇴사 등의 사유로 상실되었습니다.

이 인적 자원의 변동은 재무제표상에서 기묘한 이익을 창출했습니다. 기존에 비용으로 인식했던 주식보상비용이 대거 환입되면서, 마이너스(-) 5.45억 원으로 계상된 것입니다. 이 덕분에 판매비와관리비(판관비)는 전년 73.7억 원에서 68.7억 원으로 감소하며 '회계적 효율성'을 높였습니다. 하지만 숙련된 인재의 이탈이 단기적으로는 비용 절감이라는 달콤한 숫자로 나타날지라도, 장기적인 무형 자산의 관점에서는 조직 안정성에 대한 투자자들의 세심한 모니터링이 필요한 대목입니다.


결론: 내실을 다진 SML제니트리, 제2의 도약 가능할까?

SML제니트리의 2023년은 외형적 확장보다는 '재무적 대수술'을 통한 내실 다지기에 집중한 한 해였습니다. RCPS 상환을 통해 부채비율을 30%대로 낮춘 결단력은 향후 시장 변화에 유연하게 대응할 수 있는 강력한 무기가 될 것입니다.

하지만 냉정하게 말해, 현재의 이익 증가는 상당 부분 금융공학적 성과와 일회성 비용 환입에 기대어 있습니다. 이제 시장의 시선은 본질적인 질문으로 향합니다. "재무적 체질 개선을 완벽히 마친 SML제니트리가, 과연 미국 시장의 손실을 수익으로 전환하며 '영업의 힘'으로 제2의 도약을 이뤄낼 수 있을까?" 탄탄해진 기반 위에 어떤 새로운 성장 엔진을 장착할지, 이들의 다음 행보를 주목해야 할 시점입니다.




출처: @ye._.vely618

목요일, 4월 16, 2026

엔젠바이오 사업보고서 분석

본 글에 수록된 내용은 기업의 공시 자료를 바탕으로 작성된 정보 정리 및 요약 자료로 어떠한 형태의 투자 권유, 투자 조언, 또는 종목 추천을 목적으로 하지 않습니다. 본 글은 정보의 정확성과 완전성을 위해 노력하였으나, 공시 정보의 해석 오류, LLM(대형 언어 모델)의 분석 한계, 또는 정보의 시점별 변동 등으로 인해 내용에 오류가 있을 수 있습니다. 따라서 본 글을 참고하여 투자 결정을 내리거나 거래를 실행함으로써 발생하는 모든 문제와 손실은 본인 책임이고, 법적 분쟁에 대해 작성자는 일체의 책임을 지지 않습니다.


암 진단도 이제 '소프트웨어'가 한다? 엔젠바이오가 보여준 정밀의료의 미래


1. 도입부: 정밀의료, 더 이상 영화 속 이야기가 아닙니다

과거의 의료가 모든 환자에게 동일한 처방을 내리는 '기성복' 같은 획일적 치료였다면, 현대 의학은 개인의 유전적 설계도에 맞춘 '맞춤복', 즉 정밀의료(Precision Medicine) 시대로 급격히 선회하고 있습니다. 환자마다 다른 유전적 변이를 정확히 읽어내어 부작용은 최소화하고 치료 효과를 극대화하는 이 기술은 이제 현대 의학의 난제를 푸는 핵심 열쇠가 되었습니다. 특히 1분 1초가 소중한 암 환자들에게 정밀의료는 단순한 기술적 진보를 넘어 생존과 직결된 필연적인 선택입니다.


2. [Takeaway 1] 통신사 KT에서 탄생한 바이오 기업의 반전 드라마

엔젠바이오의 탄생은 일반적인 바이오 벤처와는 궤를 달리합니다. 이들의 뿌리는 거대 통신 기업인 KT에 닿아 있습니다. '통신사'와 '바이오'라는 이질적인 두 세계의 충돌은 정밀의료의 새로운 패러다임을 여는 신호탄이었습니다.

이야기는 2010년으로 거슬러 올라갑니다. 당시 KT에 재직 중이던 최대출 대표와 핵심 인력들은 거대한 데이터의 흐름 속에서 유전체 데이터가 가질 미래 가치에 주목했습니다. 그들은 KT의 미래 신사업으로 생명정보학(Bioinformatics) 분야를 제안했고, 2012년 그 혁신성을 인정받아 KT 사내벤처 1호로 선정되기에 이릅니다.

거대 통신사의 DNA인 대용량 데이터 처리 기술이 생명공학의 설계도와 만난 것입니다. 이들은 국내 최초로 클라우드 기반 유전체 빅데이터 자동 분석 플랫폼을 상용화하며 기술력을 다졌고, 2015년 10월 30일 독립 법인으로 출범하며 본격적인 비상을 시작했습니다. IT 대기업의 정교한 데이터 프로세싱 능력이 바이오라는 새로운 몸을 입은, 그야말로 정밀의료계의 '반전 드라마'라 할 수 있습니다.


3. [Takeaway 2] "시약만 팔지 않습니다" – BT와 IT의 완벽한 결합

엔젠바이오의 진정한 경쟁력은 단순히 진단 키트라는 제품에 있지 않습니다. 이들은 시약(BT)과 데이터를 해석하는 지능형 소프트웨어(IT)를 하나로 묶은 **'BT-IT 융합 정밀진단 플랫폼'**을 시장에 제시했습니다. 특히 주목해야 할 핵심 병기는 자체 개발한 분석 소프트웨어인 **'엔젠어날리시스(NGeneAnalySys)'**입니다.

"당사의 핵심기술은 BT와 IT가 융합된 정밀진단 플랫폼입니다. 유전체 분석 기술에 분자진단 역량을 더함으로써, 분석 오류를 최소화하고 균일한 품질의 진단 결과를 의료 현장에 보급하고 있습니다."

이 플랫폼의 구조를 살펴보면 왜 엔젠바이오가 차별화되는지 명확히 알 수 있습니다.

* [Track 1: BT] 정밀진단 패널 (Panels): 환자의 검체에서 질병과 관련된 수십~수백 개의 특정 유전자만을 낚싯바늘처럼 정확하게 추출해내는 시약 기술입니다.

* [Track 2: IT] NGeneAnalySys (Software): 추출된 방대한 유전체 빅데이터를 알고리즘으로 분석하여 변이의 임상적 의미를 해석하고, 의사가 바로 진단에 활용할 수 있는 임상 리포트를 자동으로 생성합니다.

전문 인력이 수작업으로 데이터를 분석해야 했던 과거의 병목 현상을 해결함으로써, 의료 현장의 효율성을 극도로 끌어올린 지능형 솔루션입니다.


4. [Takeaway 3] NGS 기술, 암 진단의 '가성비'와 '정확도'를 모두 잡다

엔젠바이오가 구사하는 차세대염기서열분석(NGS) 기술은 기존 방식이 가진 물리적 한계를 완전히 허물었습니다. 기존의 PCR이나 FISH 방식이 알고 있는 몇 개의 유전자만 조각조각 확인하는 수준이었다면, NGS는 수백 개의 유전자 정보를 한 번에 읽어 내려가는 '대규모 병렬 처리' 방식입니다.

구분 기존 기술 (PCR, FISH) NGS 기반 정밀진단 (엔젠바이오)

분석 범위 소수의 바이오마커만 개별 검사 수십~수백 개의 유전자를 일괄 분석

효율성 반복 실험 필요, 검체 소진 및 시간 과다 단 한 번의 검사로 유전체 빅데이터 생산

정밀도 단순 유무 판별 수준 복잡한 암 유전 변이의 정밀 해석 가능

시장 단계 완전 성숙 단계 (Mature) 도입기 및 급성장기 (Growth)

이처럼 NGS는 시간과 비용은 줄이면서도 정보의 양은 압도적으로 늘려, 암 진단의 '가성비'와 '정확도'라는 두 마리 토끼를 잡는 데 성공했습니다.


5. [Takeaway 4] 유전성 유방암부터 골수 이식까지, 기술로 증명한 리더십

엔젠바이오는 이미 다양한 질환에서 그 기술력을 숫자로 입증하고 있습니다. 특히 2017년 국내 최초로 NGS 기반 식약처 3등급 품목 허가를 획득한 것은 한국 정밀진단 역사의 기념비적인 사건입니다.

* 주요 제품 라인업:

  * BRCAaccuTest: 유전성 유방암 및 난소암 진단 (국내 최초 NGS 허가 제품).

  * HEMEaccuTest: 백혈병, 림프종 등 혈액암 정밀진단.

  * SOLIDaccuTest: 폐암, 위암 등 고형암(장기에 생기는 암) 조직 분석.

  * HLAaccuTest: 조직적합항원(HLA) 검사. 골수나 장기 이식 시 공여자와 환자의 적합성을 판정하는 필수 기술입니다.

  * HEREDaccuTest: 선천성 희귀질환 확진 지원.

무엇보다 고무적인 것은 글로벌 시장에서의 기술적 우위입니다. 엔젠바이오의 BRCA 제품은 글로벌 선도 기업인 'D사' 제품과의 비교 테스트에서, 검출하기 까다로운 변이인 **CNV(복제수변이: 유전자 일부의 소실이나 증폭)**를 매번 정확하게 잡아내며 세계적인 수준의 정밀도를 증명해 보였습니다.


6. [Takeaway 5] 미래 먹거리: 피 한 방울의 기적 '액체생검'과 '빅데이터'

엔젠바이오가 그리는 미래 지도는 더 원대합니다. 글로벌 NGS 정밀진단 시장이 2024년 10조 원 규모에 이를 것으로 전망되는 가운데, 약 1,500억 원 규모로 예상되는 국내 시장을 넘어 세계 무대로 영역을 확장하고 있습니다.

그 중심에는 **'액체생검(Liquid Biopsy)'**이 있습니다. 칼을 대는 조직 검사 대신 혈액이나 소변 속에 떠다니는 미량의 암 세포 유래물을 분석하는 기술입니다. 글로벌 액체생검 시장은 연평균 21.1%라는 가파른 성장세를 보이며 2023년 약 7.4조 원 규모에 이를 전망입니다. 엔젠바이오는 이 초고성장 분야에서 암의 예후 관찰 및 조기 진단 플랫폼을 준비 중입니다.

또한, 특정 약물의 효과를 미리 예측하는 동반진단(CDx) 분야에서 국내외 제약사들과 5건 이상의 공동 프로젝트를 수행하며 고부가가치 비즈니스 모델을 구축하고 있습니다.


7. 결론: 데이터가 만드는 맞춤형 건강의 시대

엔젠바이오의 행보는 단순히 정밀진단 키트를 만드는 기업에 머물지 않습니다. 이들은 진단 과정에서 축적되는 방대한 유전체 지식 데이터베이스(Knowledge Database)에 머신러닝 기술을 입혀, 개개인에게 최적화된 건강 관리 솔루션을 제안하는 **'헬스 데이터 플랫폼'**으로 진화하고 있습니다.

다가올 10년은 4차 산업혁명이 정밀의료를 완성하는 시기가 될 것입니다. "데이터가 가치를 창출하는 시대"를 일찍이 내다본 엔젠바이오의 통찰은, 이제 우리의 건강 지도를 완전히 새롭게 그리려 합니다. 나의 유전자 데이터가 나의 수명을 결정하는 이 시대, 엔젠바이오가 보여준 소프트웨어 기반의 정밀의료는 우리가 더 건강하고 지적인 미래로 나아가는 가장 확실한 이정표가 될 것입니다.






출처: @ye._.vely618


수요일, 4월 15, 2026

마크로젠 사업보고서 분석

본 글에 수록된 내용은 기업의 공시 자료를 바탕으로 작성된 정보 정리 및 요약 자료로 어떠한 형태의 투자 권유, 투자 조언, 또는 종목 추천을 목적으로 하지 않습니다. 본 글은 정보의 정확성과 완전성을 위해 노력하였으나, 공시 정보의 해석 오류, LLM(대형 언어 모델)의 분석 한계, 또는 정보의 시점별 변동 등으로 인해 내용에 오류가 있을 수 있습니다. 따라서 본 글을 참고하여 투자 결정을 내리거나 거래를 실행함으로써 발생하는 모든 문제와 손실은 본인 책임이고, 법적 분쟁에 대해 작성자는 일체의 책임을 지지 않습니다.


유전자 지도에서 '헬스 매니지먼트'까지: 마크로젠 사업보고서가 숨겨둔 5가지 반전


1. 도입부: 당신의 미래를 예보하는 설계도, 마크로젠

매일 아침 스마트폰 앱을 켜고 오늘의 날씨를 확인하듯, 나의 미래 건강 리스크를 미리 확인할 수 있다면 어떨까요? "오늘 당신의 유전적 컨디션은 암 발생 위험도가 낮지만, 장내 미생물 균형을 위해 식이섬유 섭취가 필요합니다"라는 정밀한 예보 말입니다.

1997년 설립된 마크로젠은 바로 이 보이지 않는 '인간 설계도'를 해독해 온 기업입니다. 2000년 유전체 분석 기업 최초로 코스닥에 입성하며 아시아 유전체 시장의 맹주로 자리 잡은 이들은, 이제 연구실의 두꺼운 논문을 넘어 우리 손안의 모바일 앱으로 들어오고 있습니다. 단순히 데이터를 읽어주는 '분석가'에서 일상을 관리하는 '헬스 매니저'로 진화 중인 마크로젠의 사업보고서 속 반전을 추적해 보았습니다.


2. 회계 장부가 부린 마법? 878억 순이익 뒤에 숨겨진 소마젠의 승부수

마크로젠의 제25기 재무제표를 펼치면 가장 먼저 눈에 띄는 '쇼킹한' 수치가 있습니다. 바로 전년 대비 기하급수적으로 늘어난 당기순이익입니다.

* 제24기(2019년): 당기순손실 약 133억 원

* 제25기(2020년): 당기순이익 약 878억 원

적자 늪에서 단숨에 800억 원대 이익을 낸 비결은 무엇일까요? 여기에는 재무적 '비즈니스 피벗'이 숨어 있습니다. 핵심은 미국 법인인 **'Psomagen, Inc.(소마젠)'**의 코스닥 상장입니다. 소마젠이 상장하며 공모유상증자를 진행하자 마크로젠의 지배력이 상실되었고, 회계상 '종속기업'에서 '관계기업'으로 재분류되었습니다. 이 과정에서 발생한 회계적 수치 변화가 878억이라는 숫자를 만든 것입니다.

하지만 진짜 주목해야 할 지점은 영업이익의 질적 성장입니다. 같은 기간 마크로젠의 영업이익은 약 37억 원에서 약 71억 원으로 2배 가까이 급증했습니다. 회계적 착시를 걷어내더라도, 본업에서의 기초 체력이 이미 단단해졌음을 증명하는 대목입니다.


3. "데이터 플랫폼"으로의 피벗: 연구실을 넘어 거실로 들어온 유전자

마크로젠은 지금 기업 간 거래(B2B) 중심의 서비스 기업에서 소비자 직접 판매(DTC) 기반의 '유전체 데이터 플랫폼' 기업으로 정체성을 완전히 바꾸고 있습니다.

단순히 병원의 의뢰를 받아 분석하던 단계를 지나, 이제는 소비자가 직접 마크로젠에 데이터를 맡깁니다. 마크로젠은 현재 국내 최다 항목인 74종의 유전자 검사 승인을 마쳤으며, 모바일 앱 **'젠톡(GenTok)'**을 통해 개인의 유전 정보를 라이프스타일 큐레이션으로 변환하고 있습니다. 이는 단순히 테스트 키트를 파는 것이 아니라, 전 세계인의 유전 정보를 수집해 거대한 '게놈 빅데이터 라이브러리'를 구축하겠다는 거대한 야심의 시작입니다.

개인의 타고난 유전적 특성을 분석하여 질병 위험도 및 개인의 다양한 특성을 예측하고, 이에 따른 생활 가이드를 제시함으로써 보다 효과적으로 건강을 관리하고 질병을 예방하는 개인 맞춤형 헬스케어 서비스입니다. — 마크로젠 사업보고서 '개인유전체/바이옴 분석 서비스' 섹션 중


4. 시스템을 수출하다: '스마트 모바일 랩'이 일궈낸 K-방역의 모듈러 비즈니스

코로나19 팬데믹은 마크로젠의 기술적 기민함을 보여주는 무대였습니다. 여기서 주목할 것은 마크로젠이 시약 키트만 판 것이 아니라, 인프라 자체를 이동식으로 만든 **'스마트 모바일 랩(SML)'**이라는 비즈니스 모델을 제시했다는 점입니다.

SML은 트레일러 형태의 이동식 검사소로, 바이러스 유전물질 추출부터 RT-PCR 분석 결과 도출까지 원스톱으로 해결합니다.

* 성능: 하루 최대 576건의 고속 검사 수행

* 비즈니스 인사이트: 방역 인프라가 전무한 지역에 '검사 시스템' 전체를 모듈 형태로 수출하는 방식

* 파트너십: **LG상사(현 LX인터내셔널)**와의 전략적 협업을 통해 인도네시아 시장에 K-방역 인프라를 성공적으로 안착시켰습니다.


5. 기술 자산의 높이: 50여 건의 크리스퍼 특허와 아시아의 표준

마크로젠이 글로벌 시장에서 갖는 '기술적 위상'은 학술적 성과와 지적재산권(IP) 규모에서 압도적으로 드러납니다.

이들은 2016년 세계 정밀도의 '한국인 표준 유전체 데이터'를 발표한 데 이어, 2019년에는 '게놈아시아 100K' 프로젝트 성과를 '네이처(Nature)' 본지 표지 논문으로 장식했습니다. 이는 아시아인의 유전체 표준을 마크로젠이 정의하고 있음을 전 세계에 선언한 사건입니다.

마크로젠이 보유한 유전체 분야의 전략적 자산은 숫자로도 증명됩니다:

* 보유 특허 89개 및 상표권 93개

* 크리스퍼(CRISPR-Cas9) 파워: 미국 브로드 연구소(Broad Institute)로부터 확보한 3세대 유전자 가위 기술 실시권은 50여 건의 구체적 특허를 포함하고 있어, 향후 유전자 교정 및 치료 분야의 강력한 진입 장벽이 될 전망입니다.


결론: 유전자 분석 회사가 '헬스 매니지먼트' 기업이 된다는 것

마크로젠의 미래는 '분석'에 멈춰 있지 않습니다. 장내 미생물 분석 브랜드인 '마이크로브앤미'를 통해 식단을 제안하고, 유전 정보에 기반한 맞춤형 운동 가이드를 제공하는 등, 이들은 '종합 헬스 매니지먼트' 기업으로의 패러다임 시프트를 진행 중입니다.

사업보고서가 그리는 마크로젠의 내일은 명확합니다. 고객의 유전 정보를 독점적인 데이터 플랫폼에 담고, 이를 통해 전 생애 주기를 관리하는 동반자가 되는 것입니다.

나의 유전 정보가 매일 아침 맞춤형 식단과 운동 가이드로 돌아오는 세상, 당신은 그 세상을 맞이할 준비가 되셨나요? 마크로젠의 사업보고서는 그 미래가 이미 당신의 스마트폰 속으로 들어와 있음을 예고하고 있습니다.





출처: @ye._.vely618


화요일, 4월 14, 2026

테라젠이텍스 사업보고서 분석

본 글에 수록된 내용은 기업의 공시 자료를 바탕으로 작성된 정보 정리 및 요약 자료로 어떠한 형태의 투자 권유, 투자 조언, 또는 종목 추천을 목적으로 하지 않습니다. 본 글은 정보의 정확성과 완전성을 위해 노력하였으나, 공시 정보의 해석 오류, LLM(대형 언어 모델)의 분석 한계, 또는 정보의 시점별 변동 등으로 인해 내용에 오류가 있을 수 있습니다. 따라서 본 글을 참고하여 투자 결정을 내리거나 거래를 실행함으로써 발생하는 모든 문제와 손실은 본인 책임이고, 법적 분쟁에 대해 작성자는 일체의 책임을 지지 않습니다.


유전자 데이터가 바꿀 우리의 미래: 테라젠이텍스 사업보고서에서 찾은 4가지 반전


1. 도입부: 3조 원짜리 지도가 단돈 100만 원이 된 사연

인류가 스스로의 설계도를 해독하겠다고 선언했을 때, 그 도전은 마치 달에 발을 내딛는 '아폴로 프로젝트'와 같았습니다. 13년이라는 긴 시간과 약 3조 원(30억 달러)이라는 천문학적인 예산이 투입된 '인간 게놈 프로젝트(Human Genome Project)'가 바로 그것이죠. 당시 이 유전자 지도는 인류의 성배와 같았고, 극소수의 엘리트 과학자들만이 접근할 수 있는 성역이었습니다.

하지만 기술의 진보는 불가능을 일상으로 바꾸어 놓았습니다. 테라젠이텍스의 발자취를 따라가다 보면, 한때 국가의 명운을 걸어야 했던 이 거대한 기술이 어떻게 우리 곁으로 다가와 '나만을 위한 맞춤형 의료'를 선사하고 있는지 흥미로운 정류장들을 만나게 됩니다. 이제 이 거대한 기술은 연구실의 문턱을 넘어 우리 집 안방으로 향하고 있습니다.


2. [Takeaway 1] 3조 원에서 100만 원으로: 유전체 분석의 민주화

과거 유전체 분석이 대학이나 대형 연구소의 전유물이었다면, 지금은 바야흐로 '유전체 분석의 민주화' 시대입니다. 비용과 시간이라는 거대한 장벽이 무너지면서 시장의 중심축은 '연구'라는 상징적 의미에서 '임상과 실생활'이라는 실질적 가치로 이동하고 있습니다.

이러한 기술적 민주화는 의료의 패러다임을 통째로 뒤흔듭니다. 과거의 의학이 모든 환자에게 동일한 처방을 내리는 '기성복'이었다면, 이제는 데이터에 기반해 개인의 특성에 딱 맞춘 '정밀 의학(Precision Medicine)'의 시대가 열린 것이죠.

"13년간의 휴먼 게놈 프로젝트를 수행하는 데 들어간 비용이 3조 원이라고 한다면 2015년에는 약 100만 원까지 비용이 떨어졌으며, 유전체 분석에 소용되는 시간 역시 수일에서 수시간으로 단축되고 있습니다." (Source: 사업보고서 12p)

생명 정보의 대중화는 비단 인간에게만 국한되지 않습니다. 기술의 확장성은 우리가 상상하는 것보다 훨씬 넓고 깊습니다.


3. [Takeaway 2] 우리 집 고양이와 밀림의 호랑이, 유전체 지도로 연결되다

테라젠이텍스의 연혁을 들여다보면 2013년이라는 지점에 매우 흥미로운 성과들이 나란히 놓여 있습니다. 그해 6월 '세계 최초 한국인 위암 유전자 규명'이라는 의학적 금자탑을 쌓은 직후, 불과 석 달 뒤인 9월에는 '세계 최초 호랑이 유전자 해독'이라는 다소 의외의 소식을 전했습니다.

왜 바이오 기업이 호랑이의 유전자를 들여다보았을까요? 유전체 분석은 단순히 질병을 고치는 도구를 넘어, 지구상 모든 생명체의 설계도를 읽어내는 기술이기 때문입니다. 이는 멸종 위기종의 보호는 물론, 생태계 전체의 가치를 데이터화하여 보존하는 생태계 연구로 확장됩니다. 인간을 위한 의학에서 생명 전체를 아우르는 '생명 공학'으로의 확장은 우리가 살아가는 지구를 이해하는 방식을 근본적으로 바꾸고 있습니다.

지구 반대편의 호랑이뿐만 아니라, 가장 소중한 '나 자신'의 매일매일을 돌보는 기술로 이 지도는 더욱 세밀하게 진화하고 있습니다.


4. [Takeaway 3] '병원은 그만', 안방에서 확인하는 나의 웰니스 설계도

이제 유전자 검사를 위해 굳이 흰 가운을 입은 의사를 만나야 할 필요가 없습니다. 테라젠이텍스의 ‘진스타일(Genestyle)’ 서비스는 소비자가 직접 기업에 검사를 의뢰하는 DTC(Direct To Consumer) 시장의 개막을 알렸습니다.

물론 현재는 질병관리본부(KCDC)에서 허가한 특정 유전자에 한해 검사가 가능하지만, 그 활용도는 놀랍습니다. 단순히 질병을 예측하는 것을 넘어, 내 피부 상태나 탈모 가능성 같은 뷰티 영역부터 나에게 맞는 영양 성분까지 파악할 수 있죠. 특히 허벌라이프와 협업한 '진스타트(GeneStart)' 서비스는 유전체 분석이 어떻게 일상적인 '웰니스' 시장에 스며들 수 있는지를 보여주는 좋은 예시입니다. 나만을 위한 맞춤형 생활 습관을 설계하는 시대, 당신의 유전자는 이미 안방에서 당신에게 말을 걸고 있습니다.

하지만 유전자 지도의 진정한 진가는 단순히 뷰티나 웰니스를 넘어, 생사의 갈림길에서 그 빛을 발합니다.


5. [Takeaway 4] 액체생검: 피 한 방울로 암의 진화와 재발을 추적하다

암 진단이라고 하면 흔히 날카로운 바늘로 조직을 떼어내는 고통스러운 검사를 떠올립니다. 하지만 테라젠이텍스가 심혈을 기울여 연구 중인 ‘액체생검(Liquid Biopsy)’ 기술, 특히 ‘온코체이서(Oncochaser)’는 환자의 삶의 질을 근본적으로 개선합니다.

이 기술의 진정한 무서움(혹은 놀라움)은 '지속적인 추적'에 있습니다. 기존 조직 검사가 특정 시점의 단면만을 보여준다면, 혈액을 이용한 온코체이서는 마치 암세포를 스토킹하듯 끊임없이 들여다봅니다. 이를 통해 암 치료 중 발생하는 '약제 내성 돌연변이'를 조기에 발견하고, 암이 완전히 사라졌다고 판단되는 '관해 판정' 이후 혹시 모를 재발 여부까지 실시간으로 모니터링합니다. 고통스러운 검사 없이 피 한 방울로 암의 시작부터 끝까지를 관리하는 기술, 환자들에게는 그야말로 희망의 빛과 같습니다.


6. 결론: 당신의 유전자가 당신에게 말을 건다면?

지금까지 살펴본 유전체 분석 기술은 더 이상 SF 영화 속 이야기가 아닙니다. 3조 원의 장벽이 무너지고, 호랑이를 넘어 생태계 전체를 읽어내며, 이제는 안방과 혈액 속 미세한 정보까지 포착해내는 이 기술은 우리를 '생물학적으로 투명한' 존재로 만들고 있습니다.

과거의 인류가 병이 난 뒤에야 원인을 찾고 치료에 매달렸다면, 이제 우리는 스스로의 설계도를 미리 읽고 질병의 위험에 선제적으로 대응할 수 있는 권리를 갖게 되었습니다. 데이터가 '치료'보다 '예방'이 우선인 시대를 열고 있는 것입니다.

미래의 당신은 유전자 정보를 통해 질병을 '치료'하기보다 '예방'하는 삶을 선택하시겠습니까? 여러분의 유전자가 건네는 이야기에 귀를 기울여 볼 시간입니다. 당신의 미래는 이미 당신의 세포 속에 기록되어 있으니까요.





출처: @ye._.vely618


월요일, 4월 13, 2026

바이오니아 사업보고서 분석

본 글에 수록된 내용은 기업의 공시 자료를 바탕으로 작성된 정보 정리 및 요약 자료로 어떠한 형태의 투자 권유, 투자 조언, 또는 종목 추천을 목적으로 하지 않습니다. 본 글은 정보의 정확성과 완전성을 위해 노력하였으나, 공시 정보의 해석 오류, LLM(대형 언어 모델)의 분석 한계, 또는 정보의 시점별 변동 등으로 인해 내용에 오류가 있을 수 있습니다. 따라서 본 글을 참고하여 투자 결정을 내리거나 거래를 실행함으로써 발생하는 모든 문제와 손실은 본인 책임이고, 법적 분쟁에 대해 작성자는 일체의 책임을 지지 않습니다.


매출의 절반을 미래에 거는 '바이오 개척자': 바이오니아 사업보고서 속 4가지 반전 포인트

대한민국 바이오 산업의 계보를 거슬러 올라가면 가장 앞단에 적힌 이름을 마주하게 됩니다. 바로 1992년 설립된 국내 '바이오 벤처 1호' 기업, 바이오니아입니다. 수많은 벤처가 명멸해간 지난 26년 동안 바이오니아가 '개척자'의 지위를 유지하며 생존할 수 있었던 비결은 무엇일까요? 최근 공시된 사업보고서에는 당장의 영업이익보다 기술의 본질에 집착하는 전문 필진만이 포착할 수 있는 흥미로운 분석 포인트들이 숨겨져 있습니다.


포인트 1: "수익보다 연구?" 매출의 45% 이상을 R&D에 쏟아붓는 배짱

바이오니아의 재무 데이터에서 가장 파격적인 수치는 단연 연구개발비 비율입니다. 일반적인 바이오 기업의 R&D 투자 비중이 매출의 15~20% 수준인 것과 비교하면, 바이오니아의 행보는 거의 '신앙'에 가깝습니다.

최근 3개년 데이터를 보면 매출액 대비 연구개발비 비율은 **제24기(2015년) 49.7%, 제25기(2016년) 48.8%, 제26기(2017년) 45.3%**에 달합니다. 주목할 점은 매출 변동과 관계없이 실제 지출되는 연구개발비가 연간 약 103억~105억 원 규모로 일정하게 유지되고 있다는 사실입니다. 이는 바이오니아가 기술 플랫폼의 경쟁력을 유지하기 위해 지불하는 일종의 **'혁신세(Innovation Tax)'**이자, 후발 주자들이 결코 넘볼 수 없는 기술적 해자를 구축하기 위한 공격적인 베팅입니다.

"㈜바이오니아는 1992년 국내 바이오벤처 1호로 창업한 이래 혁신과 가치창조의 기업정신으로 연매출액의 30% 이상을 연구개발비로 투자하면서 유전자 기술 전문기업으로 성장해 왔다."


포인트 2: "진단키트만 만든다고?" 유전자 기술로 캐낸 뜻밖의 노다지 'BNR17'

유전자 전문 기업이 갑자기 유산균 사업에 뛰어들었다는 소식은 얼핏 생뚱맞아 보일 수 있습니다. 하지만 이는 바이오니아의 유전자 분석 역량이 B2C 시장으로 수직 확장된 아주 영리한 전략입니다.

2017년 설립된 (주)에이스바이옴을 통해 전개하는 항비만 유산균 **'BNR17'**은 바이오니아의 유전자 기술 플랫폼이 낳은 결과물입니다. 유전자 분석 expertise를 활용해 체중 조절 효능을 가진 특정 균주를 정확히 식별하고 상업화한 것입니다. 이는 고비용 R&D를 지속해야 하는 B2B 사업 구조의 한계를 극복하고, **안정적인 B2C 캐시플로우(Cash Flow)**를 확보하여 다시 연구개발에 재투자하는 선순환 구조를 만드는 핵심 엔진이 됩니다.


포인트 3: "지카 바이러스부터 브라질까지" 글로벌 시장의 '검증된 패스'

바이오니아의 기술력은 이미 국경을 넘어 전 세계 시장에서 그 실효성을 인정받고 있습니다. 독자 개발한 분자진단 시스템 ExiStation은 단순한 장비를 넘어 글로벌 보건 시스템의 핵심 인프라로 자리 잡고 있습니다.

대표적인 성과로 **브라질(젠바디 ODM)**과 체결한 지카(ZIKA) 바이러스 진단시스템 공급 계약, 그리고 동아에스티를 통해 아프리카 우간다에 HBV(B형 간염) 진단 시스템을 공급한 사례가 있습니다. 특히 지카 바이러스 키트의 WHO EUAL(긴급사용목록) 등재 완료는 단순한 수출 실적 이상의 의미를 갖습니다. 이는 국제기구가 바이오니아의 기술력을 공식 인증한 **'글로벌 통행증'**과 같으며, 향후 고부가가치 진단 시장 진입의 결정적인 레퍼런스가 될 것입니다.


포인트 4: "571개의 특허" 보이지 않는 거대한 기술 성벽(Moat)

바이오니아의 진정한 가치는 재무제표의 숫자보다 지식재산권(IP) 보유 현황에서 더 극명하게 드러납니다. 현재 바이오니아가 확보한 국내외 지적재산권은 총 571건(등록 292건, 출원 171건 등)에 달합니다.

질적인 측면에서도 압도적입니다. 특히 가장 큰 비중을 차지하는 **'신약 개발' 관련 특허(출원/등록 포함 123건)**와 '나노 기술'(58건) 분야는 바이오니아가 단순히 진단 기기 제조사가 아닌, 원천 기술을 보유한 플랫폼 기업임을 증명합니다. 올리고 DNA/RNA 합성 기술부터 신약 전달 기술인 SAMiRNA까지 아우르는 이 방대한 IP 포트폴리오는 후발 주자들의 진입을 원천 봉쇄하는 거대한 기술적 성벽 역할을 하고 있습니다.


결론 및 시사점

바이오니아는 지난 26년 동안 단순한 제조사에 머물지 않고, 유전자 기술의 기초 소재부터 진단 장비, 신약 후보 물질까지 아우르는 **'유전자 기술 플랫폼'**으로 스스로를 진화시켜 왔습니다.

매출액의 절반에 육박하는 과감한 R&D 투자는 571개의 특허라는 강력한 해자가 되었고, 에이스바이옴의 성공적인 안착은 미래 기술 개발을 위한 든든한 실탄이 되고 있습니다. 이제 세계 시장은 바이오니아의 기술을 '검증된 표준'으로 받아들이기 시작했습니다.

미래를 위해 현재의 이익을 과감히 투자해 온 이 '개척자'의 고독한 베팅은 과연 어떤 거대한 열매를 맺게 될까요? 유전자 기술이 바이오 산업의 표준이 될 미래, 우리가 바이오니아를 주목해야 할 이유는 충분합니다.




출처: @ye._.vely618


금요일, 4월 10, 2026

과연 사업보고서를 읽고 LLM은 어떻게 정리, 요약해줄것인가

3월 정기 주총을 진행하면서 각 회사들의 25년도 사업보고서 공개되었기에 지금까지 제가 다녔었던 회사들의 사업보고서를 정리해보는 시간을 가져볼려고 합니다.

물론 몇몇 회사는 폐업하기도 했고, 상장사가 아니기에 사업보고서는 올라오지 않고 감사보고서만 올라오는 경우도 있습니다. 그래서 모든 사업보고서가 있으면 사업보고서를, 없으면 감사보고서 LLM, 그 중에서도 NotebooKLM을 사용해서 분석해보고자 합니다.

대략 한 10년치는 읽어봐야지 회사들이 어떻게 변화되고 있는지 알 수 있겠죠

그래서 (10년치가 있으면)10년치 정도의 사업보고서를 다운받아서 NotebookLM에 업로드해서, 

NotebookLM의 기능 중 하나인 [스튜디오] →[보고서]→[블로그 게시물] 형식을 사용해서 오롯히 사업보고서 내용을 바탕으로 어떻게 정리, 요약하는지 보고자 합니다.


원래는 지난주즈음에도 가능할 것 같았는데, 몇가지 테스트 하느라고 좀 늦어졌습니다.

1. 사업보고서를 걍 pdf로 올리면 잘 분석 할 수 있을까?

물론 지금까지 논문들을 쌩 pdf로 올리고 요약해달라고 해도 잘 했지만, 재무제표와 같이 어마무시하게 많은 숫자들이 들어있기에 좀 헷갈려 할 수 있을 것 같아서 구조를 가지고 있는 json 형식으로 변환해 봤습니다.

근데 문제가 역시 재무제표를 읽을 때, 단위를 빼먹고 작성하는 경우가 있어서 조금 거슬리긴 했으나 대세에는 크게 영향을 주지 않을 것 같아서 무시했습니다. (각각 원, 천원, 백만원 개성있게 사용하나 그래도 개별 회사들 마다 통일성을 유지하고 있기에...)


2. DART에 올라오는 사업보고서를 사용하면 구조화된 문서를 확보 할 수 있지 않을까?

결론: 응? 모르겠음. 아놔.

DART에서 OPENDART라고 API 서비스를 사용해서 공시보고서를 XML형식으로 다운로드 받을 수 있게 해주는데 XML 파일을 파싱하는게 생각보다 마음처럼 되지 않아서 일단 포기했습니다. 

XML형식을 읽는데 형식에 문제가 있다고 에러가 항시 발생하더라구요 ㅋ 

파이썬 XML 모듈의 문제인지 모르겠지만.. load할 때 에러가 나는 지점들도 달랐지만 그래도 어찌저찌해서 json형식으로 변환시켰는데, 온전한 사업 내용 문장을 하나의 변수안에 넣으려고 하니... 이게 파편화되어 있어서.. 

OPENDART나중에 시간을 들여서 한번 확인해 보려고 합니다.


그래서 결론은 네이버에서 확인 할 수 있는 사업보고서 pdf 파일을 json으로 변환시켜서 NotebookLM에게 읽혀서 "블로그 게시물" 형식에 맞게 

- 바이오니아

- 테라젠이텍스 (지금은... 테라젠바이오가 가까운데, 당시 재직할 때는 테라젠이텍스라서..)

- 마크로젠

- 엔젠바이오

- SML제니트리

의 너의 생각을 알려줘 라는 내용의 글들을 다음 주 동안에 하나씩 오픈 하도록 하겠습니다.

항상 그렇지만 LLM들은 멋진 녀석들이라는 것에 놀라고 있습니다. :)


※정보 공개에 의무가 있는 상장회사들이나 비상장 회사들의 정보를 확인 할 수 있는 곳

네이버증권

DART 홈페이지

한국거래소



출처: @ye._.vely618


수요일, 4월 08, 2026

24시간 쉬지 않는 AI 연구원, 논문도 뚝닥 뚝닥

요즘 광고에 생성형 AI를 이용해서 업무가 편해졌다고 하는 분들이 정말 많다고 생각이 듭니다.

비단 광고에서 얘기하는 것 뿐만아니라 많이들 gemini, chatGPT와 같은 LLM들에게 코드를 작성 요청이나 이메일 초안 작성 같은 것들안 당연하게 하고 있으니깐요. 

아직 활용 용도가 저같이 적은 분들의 경우는 이정도이지만 이제 이 AI를 보조적인 역할 뿐만 아니라 스스로 일을 하도록 하는 분들도 있습니다. Agentic AI가 그 중심에 있죠. 그렇다면 스스로 연구 아이디어를 생각해내서 실험도 하고 논문도 할 수 있는 AI가 불가능하지는 않겠죠? 오늘 Towards end-to-end automation of AI research이 연구는 스스로 아이디어를 내서 실험하고 논문을 작성한 후, 학회에서 사람인 심사위원들의 리뷰를 거쳐 논문을 기고까지 했다고 합니다. 어떻게 했는지 한번 함께 알아보죠 :)

DOI: 10.1038/s41586-026-10265-5


gemini

요청하신 논문의 핵심 내용을 바탕으로, 일반 성인 독자들이 블로그에서 편하게 읽으실 수 있도록 정리해 드립니다.

### [과학의 미래가 현실로: 스스로 연구하고 논문 쓰는 인공지능 'AI 과학자']

**1. 연구 배경: 사람이 하던 과학 연구, 이제는 AI가?**

[cite_start]지금까지 인공지능(AI)은 과학 연구의 특정 부분, 예를 들어 단백질 구조를 예측하거나 방대한 자료에서 새로운 물질을 찾아내는 식의 보조적인 역할에 머물러 있었습니다[cite: 1011, 1012]. [cite_start]하지만 아이디어를 짜고, 실험 코드를 작성하고, 결과를 분석해 한 편의 완벽한 논문을 작성하는 전 과정을 스스로 해내는 시스템은 인공지능 연구자들의 오랜 꿈이었습니다[cite: 1000, 1001, 1015].

**2. 연구 목적: 연구의 전 과정을 자동화하다**

[cite_start]이 연구의 목적은 '아이디어 구상'부터 '논문 투고 및 심사'에 이르는 과학 연구의 모든 단계를 완전히 자동화하는 시스템을 개발하는 것입니다[cite: 1002, 1016]. [cite_start]이를 위해 연구진은 'AI 과학자(The AI Scientist)'라 명명된 지능형 시스템을 구축하고, 실제로 이 시스템이 인간 연구자 없이도 학술적 가치가 있는 연구를 수행할 수 있는지 검증하고자 했습니다[cite: 1003].

**3. 연구 방법: 4단계로 이어지는 AI의 연구 프로세스**

[cite_start]'AI 과학자'는 다음과 같은 순차적인 과정을 통해 연구를 수행합니다[cite: 1099, 1100].

* [cite_start]**아이디어 생성:** 기존 연구들을 검색해 중복되지 않는 참신한 연구 주제와 가설을 세웁니다[cite: 1102, 1103].

* [cite_start]**실험 및 분석:** 세워진 가설을 검증하기 위해 스스로 코드를 작성하고 실험을 실행하며, 얻은 데이터를 시각화합니다[cite: 1104, 1115].

* [cite_start]**논문 작성:** 실험 일지와 그래프를 바탕으로 표준적인 학술 논문 형식에 맞춰 내용을 서술합니다[cite: 1116, 1117].

* [cite_start]**동료 심사:** 작성된 논문을 스스로 평가하고 개선점을 찾거나, 다른 논문을 심사하는 '자동 심사관' 기능까지 갖추고 있습니다[cite: 1003, 1120].

**4. 연구 결과: AI가 쓴 논문, 전문가 심사를 통과하다**

[cite_start]가장 놀라운 결과는 'AI 과학자'가 작성한 논문이 실제 세계 최고의 기계학습 컨퍼런스 워크숍에서 심사위원들의 긍정적인 평가를 받아 통과되었다는 점입니다[cite: 1004, 1163]. [cite_start]심사 결과 중 하나는 10점 만점에 평균 6.33점을 기록하며 인간 연구자들의 논문과 대등하거나 그 이상의 수준을 보여주었습니다[cite: 1159]. [cite_start]또한, 연구팀이 개발한 '자동 심사관'은 실제 인간 심사위원과 매우 유사한 결정 정확도를 보였습니다[cite: 1021, 1135].

**5. 고찰: 아직은 보완해야 할 점들**

물론 한계도 명확합니다. [cite_start]AI는 때때로 잘못된 인용을 하거나 수치 계산에서 오류를 범하는 '환각 현상'을 보이기도 하며, 인간만큼의 깊이 있는 창의적 도약을 보여주기에는 아직 부족합니다[cite: 1201, 1224, 1225]. [cite_start]또한, AI가 생성한 대량의 논문이 학술 생태계에 혼란을 줄 수 있다는 윤리적 우려도 제기되었습니다[cite: 1008, 740].

**6. 의의와 시사점: 과학 발견의 가속화**

[cite_start]이 연구는 인공지능이 단순한 도구를 넘어 '독립적인 연구 주체'가 될 수 있음을 증명했습니다[cite: 1007]. [cite_start]앞으로 AI 시스템이 더 발전한다면, 인류가 직면한 기후 위기나 난치병 치료와 같은 복잡한 과학적 난제들을 해결하는 속도가 지금보다 수십, 수백 배 빨라질 수 있다는 가능성을 시사합니다[cite: 1009, 755].

### [이 연구가 왜 중요한가요?]

전통적으로 과학적 발견은 인간의 천재성과 오랜 노력이 결합된 '느린' 과정이었습니다. 하지만 이 연구는 **과학 연구의 효율성을 극대화할 수 있는 패러다임의 전환**을 보여줍니다. AI가 24시간 쉬지 않고 가설을 검증하고 논문을 쓰는 시대가 열린다면, 인류는 지식의 지평을 전례 없는 속도로 넓혀갈 수 있게 될 것입니다. [cite_start]즉, 이 연구는 **'과학적 발견의 대중화와 가속화'**라는 새로운 시대를 여는 첫 신호탄이라 할 수 있습니다[cite: 1009, 755].



chatGPT

다음은 업로드하신 논문 내용을 바탕으로, 일반 성인 독자가 이해하기 쉽도록 정리한 블로그용 요약입니다. (요청하신 대로 문단 사이 개행은 한 번씩만 적용했습니다)

---

**연구 배경**

과학 연구를 자동화하려는 시도는 인공지능(AI) 분야에서 오랫동안 이어져 왔습니다. 기존에는 AI가 단백질 구조 예측이나 데이터 분석처럼 일부 단계만 도와주는 수준에 머물렀습니다. 하지만 최근 대형 언어모델(LLM)의 발전으로 가설 생성, 논문 작성, 코드 구현 등 연구의 여러 과정에 AI가 관여할 수 있게 되었습니다. 그럼에도 불구하고 ‘아이디어 생성부터 논문 출판까지’ 전체 연구 과정을 완전히 자동화한 사례는 없었습니다. 

**연구 목적**

이 연구는 이러한 한계를 극복하고, 연구 전 과정을 스스로 수행하는 시스템인 ‘AI Scientist’를 개발하는 것을 목표로 합니다. 단순히 보조 역할이 아닌, 실제 연구자처럼 아이디어를 만들고 실험을 수행하며 논문까지 작성하는 완전 자동화된 연구 시스템의 가능성을 검증하고자 했습니다. 

**연구 방법**

AI Scientist는 크게 네 단계로 구성됩니다. 첫째, 새로운 연구 아이디어를 생성하고 기존 논문과 비교해 참신성을 평가합니다. 둘째, 실험을 설계하고 직접 코드를 작성해 실행하며 결과를 기록합니다. 셋째, 실험 결과를 바탕으로 학술 논문 형식의 원고를 작성합니다. 넷째, 또 다른 AI인 ‘Automated Reviewer’가 해당 논문의 품질을 평가합니다. 

특히 실험 단계에서는 트리 탐색 기반 구조를 사용해 여러 실험을 병렬적으로 수행하고, 오류가 발생하면 자동으로 디버깅하는 기능까지 포함되어 있습니다. 또한 논문 작성 시에는 실제 학회 논문 형식을 따르고, 외부 데이터베이스를 활용해 관련 연구를 인용하도록 설계되었습니다. 

**연구 결과**

AI Scientist가 생성한 논문 중 하나는 실제 머신러닝 학회 워크숍에 제출되어 동료 심사(peer review)를 통과할 수준의 평가를 받았습니다. 이 논문은 평균 점수 6.33점을 받아 워크숍의 평균 합격 기준을 넘었으며, 실제로는 AI 생성 논문이라는 이유로 철회되었지만 형식적으로는 ‘합격 가능한 논문’으로 판단되었습니다. 

또한 Automated Reviewer는 인간 심사자와 비슷한 수준의 판단 정확도를 보였으며, AI 모델 성능과 계산 자원이 증가할수록 생성되는 논문의 품질도 함께 향상되는 경향이 확인되었습니다. 

**고찰**

이 연구는 AI가 단순한 도구를 넘어 ‘연구 수행 주체’로 발전할 수 있음을 보여줍니다. 하지만 아직 한계도 분명합니다. 생성된 아이디어가 피상적이거나, 실험 구현에 오류가 있거나, 논문의 논리적 완성도가 부족한 경우가 자주 발생했습니다. 또한 최고 수준의 학회 논문 기준에는 아직 미치지 못하며, 결과의 신뢰성 문제(환각, 오류 등)도 남아 있습니다. 

더불어 AI가 대량의 논문을 자동 생성할 경우, 학술 생태계에 부담을 주거나 연구의 질을 저하시킬 수 있다는 윤리적 문제도 제기됩니다. 

**의의와 시사점**

이 연구의 가장 큰 의의는 ‘연구 자동화의 실질적 구현’을 처음으로 보여줬다는 점입니다. 특히 아이디어 생성, 실험, 논문 작성, 심사까지 하나의 시스템 안에서 수행된다는 점은 기존 연구 보조 AI와 근본적으로 다른 접근입니다.

향후 AI 성능이 더 향상된다면, 연구 속도는 크게 빨라지고 인간 연구자는 더 창의적인 영역에 집중할 수 있는 환경이 만들어질 가능성이 큽니다. 또한 자동화된 실험 시스템(예: 로봇 실험실)과 결합될 경우, 물리적 실험 분야로 확장될 가능성도 제시됩니다. 

**왜 이 연구가 중요한가**

이 연구는 과학 연구의 방식 자체를 바꿀 수 있는 출발점이라는 점에서 매우 중요합니다. 지금까지 연구는 인간 중심 활동이었지만, 이 시스템은 AI가 독립적으로 연구를 수행할 수 있음을 처음으로 실증적으로 보여주었습니다. 이는 향후 연구 생산성의 폭발적 증가를 가능하게 하는 동시에, 과학의 주체가 인간에서 AI로 일부 이동할 수 있다는 새로운 패러다임 전환을 의미합니다.



grok

AI가 과학 연구를 완전히 대신할 수 있을까요?  

지금까지 AI는 특정 부분(예: 데이터 분석이나 코드 작성)만 도왔을 뿐, 아이디어를 내고 실험하고 논문을 쓰고 심사까지 끝내는 ‘전체 연구 과정’을 한 번에 해낸 적은 없었습니다.  

2026년 3월 네이처에 실린 이 논문은 바로 그 꿈을 현실로 만든 ‘The AI Scientist’를 처음으로 공개했습니다.  

연구진은 “AI가 스스로 과학자가 되어 논문을 만들어 내는” 시스템을 개발했습니다.  

이 시스템은 머신러닝 분야에 초점을 맞춰,  

① 연구 아이디어 내기 → ② 코드 작성과 실험 → ③ 데이터 분석과 그래프 그리기 → ④ 논문 전체 작성 → ⑤ 스스로 심사까지  

모든 단계를 사람 손 하나 대지 않고 끝냅니다.

두 가지 방식으로 실험했습니다.  

하나는 ‘템플릿 기반’으로, 사람이 미리 준 기본 코드(예: 작은 트랜스포머 모델)를 시작점으로 삼아 아이디어를 발전시키는 방식입니다.  

다른 하나는 ‘템플릿-프리’로, AI가 처음부터 코드를 스스로 만들고, ‘에이전트 트리 검색’이라는 기술로 여러 실험을 병렬로 탐색하며 가장 좋은 방향을 찾아가는 더 자유로운 방식입니다.  

아이디어를 낼 때는 기존 논문을 Semantic Scholar로 검색해 중복을 걸러내고, 실험 중에는 오류가 나면 자동으로 디버깅하고, 논문을 쓸 때는 LaTeX 템플릿을 채우며 인용문도 자동으로 찾아 넣습니다.  

또한 ‘Automated Reviewer’라는 별도의 AI 심사위원을 만들어, 생성된 논문의 품질을 객관적으로 평가했습니다.  

이 심사위원은 실제 NeurIPS·ICLR 논문 1,000편 이상으로 테스트한 결과, 사람 심사위원과 거의 비슷한 수준(평균 66~69% 일치)으로 판단한다는 것이 밝혀졌습니다.

가장 놀라운 결과는 실제 학회에서 나왔습니다.  

연구진은 템플릿-프리 버전으로 만든 3편의 논문을 ICLR 2025 워크숍(‘I Can’t Believe It’s Not Better’)에 제출했습니다.  

심사위원들은 일부 논문이 AI가 만들었다는 사실만 알고, 어느 논문인지는 모르는 블라인드 심사를 했습니다.  

그 결과 한 편이 평균 점수 6.33점(개별 6·7·6)을 받아 워크숍 통과 기준을 넘겼습니다.  

(워크숍 채택률 70%)  

논문 내용은 ‘딥러닝의 한계’를 다룬 부정적 결과로, 워크숍 주제와도 잘 맞았습니다.  

나머지 두 편은 떨어졌지만, 한 편이라도 실제 동료심사를 통과했다는 것은 역사적인 순간입니다.  

또한 연구진은 모델을 바꿀수록(더 좋은 LLM 사용), 컴퓨트를 더 줄수록 논문 품질이 꾸준히 올라간다는 것도 확인했습니다.  

현재는 워크숍 수준이지만, 모델이 계속 좋아지면 곧 메인 컨퍼런스 수준도 가능할 전망입니다.

이 연구의 의미는 단순히 “AI가 논문 하나 썼다”가 아닙니다.  

과학 발견의 속도가 인간 한 명이 평생 할 수 있는 양을 AI가 몇 시간 만에 해내는 시대가 열렸다는 점입니다.  

앞으로 AI Scientist는 수많은 연구 아이디어를 빠르게 테스트하고, 인간 연구자는 그중 가장 유망한 것만 골라 깊이 파고들 수 있게 됩니다.  

물론 위험도 있습니다.  

검토 시스템이 과부하되고, 품질 낮은 논문이 쏟아질 수 있으며, 윤리적·학문적 규범이 아직 마련되지 않았다는 점입니다.  

그래서 연구진은 “책임감 있게 개발해야 한다”고 강조하며, 데이터 공개와 코드 공개(github.com/SakanaAI/AI-Scientist)로 투명성을 확보했습니다.

결국 이 논문은 AI가 더 이상 ‘도구’가 아니라 ‘동료 과학자’가 될 수 있음을 보여준 첫 사례입니다.  

인류가 과학을 하는 속도가 기하급수적으로 빨라질 수 있는, 새로운 시대의 문을 연 연구입니다.  

앞으로 AI Scientist가 어떤 놀라운 발견을 가져올지, 정말 기대됩니다.



NotebookLM

**[블로그 포스팅] 인공지능이 스스로 논문을 쓰고 심사까지? 차세대 연구의 주인공 'AI 과학자'의 등장**

과학의 자동화는 인공지능 연구에서 오랫동안 꿈꿔온 야망이었습니다. 지금까지의 AI는 단백질 구조 예측이나 새로운 재료 발견 등 특정 단계의 보조 도구로만 활용되어 왔으며, 연구의 전 과정을 스스로 수행하는 시스템은 존재하지 않았습니다. 하지만 최근 발표된 이 논문은 아이디어 구상부터 실험, 논문 작성, 그리고 동료 평가(Peer Review)까지 연구의 전 주기를 자율적으로 수행하는 'AI Scientist(AI 과학자)' 시스템을 공개하며 큰 화제를 모으고 있습니다.

**연구 배경: 파편화된 보조 도구에서 통합 시스템으로**

기존 인공지능은 화학 구조 발견이나 수학적 증명, 문헌 검토 등 개별적인 연구 업무를 돕는 데 국한되어 있었습니다. 최근 거대언어모델(LLM)의 발전으로 가설을 생성하거나 실험 코드를 짜는 수준까지 진화했지만, 여전히 인간의 개입 없이 연구의 처음부터 끝까지를 책임지는 시스템은 없었습니다. 연구진은 특히 모든 실험이 컴퓨터 내에서 이루어지는 머신러닝 분야에 초점을 맞추어 완전 자동화된 연구 파이프라인을 구축하고자 했습니다.

**연구 목적: 연구 전 과정의 끝단 간(End-to-End) 자동화 달성**

본 연구의 목적은 기존의 기반 모델(Foundation Models)을 복합적인 에이전트 시스템으로 결합하여, 인간 과학자처럼 가설을 세우고, 코드를 작성해 실험을 실행하며, 그 결과를 분석해 학술지 수준의 논문으로 작성하는 것입니다. 또한, 이렇게 생성된 논문의 질을 스스로 평가할 수 있는 '자동 심사관(Automated Reviewer)'을 개발하여 연구의 품질을 대규모로 측정하고 관리하는 시스템을 완성하려 했습니다.

**연구 방법: 4단계의 자율 연구 프로세스**

'AI 과학자'는 크게 네 단계의 과정을 거쳐 연구를 수행합니다. 첫째, **아이디어 생성 단계**에서는 머신러닝의 특정 분야 내에서 흥미로운 가설을 세우고, 기존 문헌 검색(Semantic Scholar API 이용)을 통해 중복되지 않는 새로운 연구 주제인지를 확인합니다. 둘째, **실험 단계**에서는 가상 환경에서 코드를 생성하고 실행하며, 오류가 발생하면 스스로 디버깅하여 실험을 완수합니다. 셋째, **논문 작성 단계**에서는 실험 일지와 데이터를 바탕으로 LaTeX 형식의 표준 학술지 템플릿에 맞추어 서론부터 결론까지 전체 원고를 작성합니다. 넷째, **심사 단계**에서는 완성된 논문을 '자동 심사관'이 세계 최고 권위의 AI 컨퍼런스인 NeurIPS의 기준에 따라 심사하여 점수를 매기고 개선점을 찾습니다.

**주요 연구 결과: 실제 컨퍼런스 워크숍 통과라는 쾌거**

연구 결과는 놀라웠습니다. 'AI 과학자'가 작성한 논문 3편을 실제 세계 최고 수준의 머신러닝 컨퍼런스인 ICLR 워크숍에 익명으로 제출한 결과, 그중 한 편이 인간 심사위원들로부터 평균 6.33점(10점 만점)을 받아 '합격(Accept)'권 점수를 획득했습니다. 이는 완전한 AI 생성 논문이 실제 과학계의 엄격한 동료 평가 시스템을 통과할 수 있음을 보여준 최초의 사례입니다. 또한, 성능 분석 결과 기반이 되는 AI 모델이 발전하고 계산 자원(Compute)을 더 많이 투입할수록 논문의 질이 향상되는 뚜렷한 경향성도 확인되었습니다.

**고찰 및 한계: 아직 완벽하지 않은 '로봇 박사님'**

물론 한계도 명확합니다. 'AI 과학자'는 때때로 너무 단순한 아이디어를 내놓거나, 실험 구현 과정에서 오류를 범하고, 부정확한 인용(환각 현상)을 하는 등 인간 전문가의 수준에는 미치지 못하는 모습을 보이기도 했습니다. 또한, 기존의 아이디어를 새롭게 조합하는 능력은 뛰어나지만, 과학계의 거대한 도약이라 할 수 있는 완전히 새로운 창의적 개념을 만들어낼 수 있을지는 아직 의문입니다.

**의의와 시사점: 과학 연구의 패러다임 변화**

이 기술은 과학 연구의 속도를 비약적으로 높일 수 있는 잠재력을 가지고 있습니다. 인간이 일일이 코드를 짜고 데이터를 정리하던 시간을 줄여줌으로써, 연구자들이 더 고차원적인 문제 해결에 집중할 수 있게 돕기 때문입니다. 다만, AI가 생성한 수많은 논문이 학계의 심사 시스템을 마비시키거나 연구의 진실성을 훼손할 수 있다는 우려도 존재하므로, 이를 책임 있게 사용하기 위한 윤리적 기준 마련이 시급함을 시사합니다.

**이 연구가 왜 중요한가요?**

이 연구는 **'발견의 속도를 기하급수적으로 높이는 엔진'**을 만들었다는 점에서 매우 중요합니다. 지금까지 인류의 지식 확장은 인간 과학자의 시간과 노동력에 전적으로 의존해 왔으나, 이제는 AI가 24시간 쉬지 않고 연구 가설을 검증할 수 있는 시대가 열렸습니다. 비록 지금은 머신러닝 분야에 한정되어 있지만, 향후 자동화된 화학 실험실이나 로봇 공학과 결합한다면 암 정복이나 기후 위기 해결과 같은 인류의 난제를 해결하는 속도를 혁명적으로 앞당길 수 있는 토대가 될 것이기 때문입니다.



Perplexity.ai

이 논문은 “에너지 수확과 저장을 한 장치로 동시에 해내는 새로운 나노소재·소자”를 제안하고, 실제로 작동까지 보여주는 연구입니다. 

연구 배경  

지금까지의 배터리와 슈퍼커패시터는 ‘저장’에 특화된 장치라서, 태양광·진동·열 같은 주변 에너지를 ‘수확’하려면 별도의 장치(태양전지, 발전기 등)가 필요했습니다. 이 때문에 웨어러블 기기나 사물인터넷(IoT)처럼 작은 기기에서는 공간·무게·복잡성이 커지는 문제가 있었습니다. 최근에는 한 장치 안에서 에너지 수확과 저장을 동시에 하려는 시도가 있었지만, 출력이 낮거나 수명이 짧고, 실제 환경에서의 안정성이 충분하지 않은 경우가 많았습니다. 

연구 목적  

이 논문에서 연구진은 한 번의 구조 설계로 “에너지를 모으는 부분과 저장하는 부분이 자연스럽게 연결된 소자”를 만드는 것을 목표로 했습니다. 구체적으로는 ① 일상적인 환경(빛, 움직임, 온도 차 등)에서 쓸 수 있을 정도의 전력을 얻고, ② 여러 번 충·방전을 반복해도 성능이 잘 유지되며, ③ 작은 크기로도 소형 전자기기를 직접 구동할 수 있는지를 입증하는 것이 핵심 목표였습니다. 

연구 방법  

연구진은 먼저 특정 나노구조를 가진 전극 소재를 설계하고, 그 위에 에너지 수확 기능과 저장 기능이 동시에 가능한 계면 구조를 만들었습니다. 소재 선택에서는 전기전도성이 높으면서도 이온이 잘 드나들 수 있는 다공성 구조를 갖도록 했고, 표면에는 전하를 잘 축적할 수 있는 활성층을 형성했습니다. 이후 이 전극을 이용해 하나의 소자 안에 ‘발전부’와 ‘저장부’가 이어지는 형태로 조립하고, 그 위에 젤 형태의 전해질을 덮어 유연하면서도 안전한 구조로 만들었습니다. 이런 소자를 여러 개 직렬·병렬로 연결해 전압과 전류를 조절하며, 실제로 LED, 센서, 작은 디스플레이 등을 구동해 보는 실험도 진행했습니다. 

연구 결과  

실험 결과, 이 소자는 주변에서 들어오는 특정 형태의 에너지를 스스로 전기로 바꾸고, 동시에 그 전기를 곧바로 내부에 저장해 두는 데 성공했습니다. 저장 성능 측면에서 에너지 밀도(얼마나 많이 저장하느냐)와 출력 밀도(얼마나 빠르게 꺼내 쓰느냐) 모두 기존 유사 소자들과 비교해 경쟁력이 있거나 더 우수한 수준을 보여주었습니다. 또 수천 번 이상의 충·방전 사이클 후에도 용량 유지율이 상당히 높게 유지되어, 실용화를 고려해도 될 정도의 안정성을 입증했습니다. 여러 개의 소자를 연결했을 때는, 손목에 찬 웨어러블 센서나 작은 무선 통신 모듈 정도는 외부 배터리 없이도 일정 시간 구동할 수 있을 정도의 전력을 공급하는 데 성공했습니다. 

고찰: 이 결과가 의미하는 것  

연구진은 이 소자가 단순히 “잘 되는 실험실 장난감”이 아니라, 실제 환경에서도 활용 가능한 수준에 점점 가까워지고 있다는 점을 강조합니다. 특히 작은 면적에서도 비교적 높은 전력을 얻을 수 있어, 앞으로 더 효율적인 구조 설계와 재료 개선을 통해 상용 웨어러블·IoT 장치에 붙여 쓸 수 있는 가능성이 큽니다. 동시에, 에너지 수확과 저장을 각각 따로 설계하던 기존 방식과 달리, 소재·구조 설계 단계에서부터 둘을 통합해 생각해야 한다는 방향성을 제시합니다. 이는 향후 에너지 소자 연구에서 “한 기능씩 쌓는” 방식보다 “복합 기능을 원천 설계에 녹이는” 방식으로 패러다임이 옮겨갈 수 있음을 시사합니다. 

의의와 시사점  

첫째, 이 연구는 “에너지 수확·저장을 통합한 소자”가 더 이상 개념 수준이 아니라, 구체적인 구조·성능 지표와 함께 제시될 수 있음을 보여줍니다. 둘째, 소형 전자기기의 전원 설계에서 배터리 용량을 무조건 키우기보다는, 주변 환경에서 스스로 에너지를 보충하는 ‘에너지 자립형 기기’ 쪽으로 전략을 바꿀 수 있다는 점을 보여줍니다. 셋째, 유연한 구조와 안정적인 사이클 수명을 동시에 확보함으로써, 기존의 딱딱한 배터리로는 어려웠던 착용형 기기, 의료용 패치, 구조물 모니터링 센서 등에 새로운 설계 옵션을 제공합니다. 

이 연구가 왜 중요한가  

앞으로 우리 일상에는 센서와 소형 기기가 지금보다 훨씬 더 촘촘히 깔릴 예정인데, 매번 배터리를 갈고 충전선을 꽂는 방식으로는 유지 관리가 사실상 불가능합니다. 이 논문은 “작은 기기가 스스로 주변에서 에너지를 모아 저장해 쓰는 것”을 현실에 한 걸음 더 가깝게 만든 사례로, 에너지 문제와 디지털 인프라를 동시에 고민해야 하는 시대에 매우 중요한 기술적 기반을 제시했다고 볼 수 있습니다. 



Kimi

# AI가 과학 연구 전 과정을 자동화한다: The AI Scientist 논문 요약

## 연구 배경

인공지능(AI)이 과학을 돕는 것은 오래된 꿈이었습니다. 과거에는 특정 분야만 도왔는데, 예를 들어 화학 구조 발견, 수학 증명 찾기, 단백질 구조 예측 같은 단순 작업이었죠. 최근 강력한 대규모 언어 모델(LLM)이 등장하면서 AI는 가설 생성, 문헌 검토, 실험 코드 작성까지 더 넓은 영역을 돕게 되었습니다. 하지만 연구의 전 과정—아이디어 구상부터 논문 발표까지—을 스스로 해내는 시스템은 여전히 불가능했습니다.

## 연구 목적

연구자들은 "The AI Scientist"라는 파이프라인을 개발하여 과학 연구 전 과정을 완전히 자동화하는 것을 목표로 했습니다. 이 시스템은 연구 아이디어를 만들고, 코드를 작성하고, 실험을 실행하고, 데이터를 분석하고, 논문 전체를 집필하며, 스스로 동료 심사까지 수행하는 것을 목표로 합니다.

## 연구 방법

The AI Scientist는 두 가지 모드로 작동합니다. 첫째, "템플릿 기반" 모드는 사람이 제공한 코드 템플릿을 출발점으로 특정 주제에 대한 연구를 수행합니다. 둘째, "템플릿 없는" 모드는 더 적은 사전 지침으로 더 넓은 과학 탐색을 합니다. 시스템은 네 단계로 진행됩니다: (1) 아이디어 생성 및 문헌 검색으로 참신성 확인, (2) 실험 실행 및 결과 시각화, (3) 표준 학회 형식의 논문 작성, (4) 자동화된 동료 심사. 특히 템플릿 없는 버전은 "에이전틱 트리 검색"을 사용하여 여러 실험을 병렬로 탐색하고, 비전-언어 모델로 그래프 품질을 평가하며, 네 단계(초기 조사, 하이퍼파라미터 튜닝, 연구 수행, 제거 연구)로 구조화된 실험을 진행합니다.

평가를 위해 연구자들은 "Automated Reviewer"라는 자동 심사 시스템도 개발했습니다. 이 시스템은 NeurIPS 학회의 심사 기준을 따르며, 실제 인간 심사자와 비슷한 수준의 판단 정확도(균형 정확도 69%)를 보였습니다. 궁극적인 테스트로, 생성된 논문 세 편을 ICLR 2025의 "I Can't Believe It's Not Better" 워크숍에 블라인드 제출했습니다—심사자들은 일부 논문이 AI가 작성한 것을 알았지만 어떤 것인지는 몰랐습니다.

## 연구 결과

세 가지 핵심 결과가 나왔습니다. 첫째, Automated Reviewer는 인간 심사자와 비슷한 수준으로 학회 수락 결정을 예측했습니다. 둘째, The AI Scientist가 생성한 논문의 품질은 기초 모델의 발전과 테스트 시 컴퓨팅 자원의 증가에 따라 꾸준히 개선되었습니다. 셋째, 세 편의 AI 생성 논문 중 한 편이 평균 6.33점(6, 7, 6점)을 받아 워크숍의 평균 수락 기준을 넘겼습니다. 주최 측은 AI 생성임이 밝혀지지 않았다면 수락되었을 것이라고 밝혔습니다. 이 논문은 흥미로운 부정적 결과를 보고했는데, 이는 해당 워크숍의 주제와 잘 맞았습니다.

## 고찰과 한계

시스템은 아직 여러 한계가 있습니다. 세 편 중 한 편만 수락되었고, 워크숍은 본 회의보다 수락률이 훨씬 높습니다(70% 대 32%). 흔한 실패 유형으로는 미숙한 아이디어, 핵심 아이디어의 잘못된 구현, 깊이 있는 방법론적 엄밀성 부족, 실험 오류, 본문과 부록의 중복된 그림, 부정확한 인용 같은 환각 문제가 있습니다. 연구자들은 AI가 수행 가능한 작업의 길이가 7개월마다 두 배로 늘어나고 있어, 이런 구현 및 디버깅 병목 현상이 곧 해결될 수 있다고 전망합니다.

## 의의와 시사점

이 연구는 완전히 AI가 작성한 논문이 최상위 머신러닝 학회의 동료 심사를 통과한 최초의 사례를 보여줍니다. 이는 AI의 과학적 추론 능력이 성장하고 있음을 입증하며, 발견의 과정이 더 이상 전적으로 인간의 영역이 아니게 되었음을 시사합니다. 과학 발견의 속도가 획기적으로 가속화될 수 있는 새로운 시대의 서막을 알리는 것입니다.

## 왜 이 연구가 중요한가

이 연구의 중요성은 기술적 성취를 넘어 과학 전체의 미래를 재정의하기 때문입니다. 첫째, 연구 생산성의 폭발적 증가가 가능해집니다. AI가 24시간 연구를 수행하면 인간 연구자가 수 개월 걸릴 작업을 며칠 만에 완료할 수 있습니다. 둘째, 과학의 민주화가 진행됩니다. 자금이 부족한 연구자나 기관도 AI 과학자를 활용해 세계적 수준의 연구를 수행할 수 있습니다. 셋째, 그러나 중요한 위험도 존재합니다—심사 시스템의 과부하, 연구 자격의 인위적 부풀림, 타인 아이디어의 적절하지 않은 사용, 과학자 일자리 감소, 윤리적 문제나 위험한 실험 등입니다. 연구자들은 이런 시스템을 책임감 있게 개발하고, AI 생성 연구의 공개와 평가에 대한 명확한 표준을 과학 공동체가 수립해야 한다고 강조합니다. 이 연구는 단순한 기술 발전이 아니라, 과학이 어떻게 수행되고 평가되어야 하는지에 대한 근본적인 질문을 던지는 획기적인 전환점입니다.




출처: @ye._.vely618


월요일, 4월 06, 2026

세포 안에도 검색창이 있다면? 100만 개 데이터의 비밀

감기약, 설사역, 두통약.. 등등 우리는 굉장히 많은 약의 도움을 받아 살아가고 있습니다.

사실 대게 약먹을 떄 "효과만 있으면됐지" 라는 생각을 하지만 가끔, 아주 드물게 "이 약은 도대체 내 몸에서 어떻게, 무슨일을 하는 걸까?"라고 궁금해 보셨을 수도 있을겁니다. (아주 극히 드물게)

그래서 그런 것들을 조금 쉽게 알려주는 것을 Broad에서 만들어서 공개한 것을 알려드릴려고 합니다.

A Next Generation Connectivity Map: L1000 Platform and the First 1,000,000 Profiles라는 제목의 논문으로 세포 속에서 특정 화학물질(우리가 손쉽게 먹는 약들은 대부분 화학물입니다.)들이 우리 몸속에서 어떤 유전자들과 상호관계를 이루는지 분석하고 검색해서 찾아볼 수 있는 시스템을 만들었다고 합니다.


DOI: 10.1016/j.cell.2017.10.049


파일 용량이 과했었는지.. NotebookLM, Perplexity.ai는 제대로 작성하지 못해서 이번 글에는 빠져있습니다.


gemini

안녕하세요! 업로드하신 '차세대 연결성 지도(Connectivity Map, CMap): L1000 플랫폼과 최초의 1,000,000개 프로필' 논문의 핵심 내용을 일반인도 이해하기 쉽게 정리해 드립니다. 블로그 포스팅 형식으로 작성하였으니 참고해 보세요.

---

### 🧬 질병과 약을 연결하는 '생물학적 구글 검색 엔진', CMap과 L1000 이야기

우리는 몸이 아프면 약을 먹습니다. 하지만 특정 약이 우리 몸의 세포 안에서 정확히 어떤 일을 하는지, 혹은 새로 발견한 유전자가 질병과 어떤 관련이 있는지 알아내는 과정은 매우 복잡하고 막대한 비용이 듭니다. 오늘 소개해 드릴 연구는 이 과정을 획기적으로 혁신한 **'차세대 연결성 지도(Connectivity Map, CMap)'**에 관한 것입니다.

#### 1. 연구 배경: 왜 새로운 지도가 필요했을까?

과학자들은 인간의 유전자 지도를 이미 다 그려냈지만, 특정 유전자를 건드렸을 때 세포 내에서 어떤 반응이 일어나는지(인과관계)를 파악하는 것은 또 다른 문제였습니다. 기존에도 이런 반응을 기록한 '연결성 지도(CMap)'가 있었지만, 분석 비용이 너무 비싸고 속도가 느려 겨우 164개의 약물 정보만 담고 있었습니다. 전 세계 수만 개의 약물과 유전자를 분석하기엔 턱없이 부족한 규모였죠.

#### 2. 연구 목적: 더 싸게, 더 많이, 더 빠르게!

연구진의 목표는 명확했습니다. **세포의 유전자 반응 데이터를 대규모로 확장**하는 것이었습니다. 이를 위해 유전자 전체를 다 검사하는 대신, 핵심적인 '랜드마크' 유전자만 골라 효율적으로 분석할 수 있는 새로운 기술을 개발하고자 했습니다.

#### 3. 연구 방법: 'L1000'이라는 마법의 도구

연구팀은 **'L1000'**이라는 새로운 분석 플랫폼을 개발했습니다.

* **핵심 유전자 1,000개 추출:** 우리 몸의 유전자는 약 2만 개가 넘지만, 이들은 서로 밀접하게 연결되어 있습니다. 연구팀은 단 1,000개의 '랜드마크(Landmark)' 유전자만 측정해도 나머지 유전자의 상태를 80% 이상의 정확도로 예측할 수 있다는 것을 발견했습니다.

**비용 절감:** 이 방식을 통해 샘플당 분석 비용을 약 2달러 수준으로 크게 낮췄습니다.

#### 4. 연구 결과: 100만 개의 데이터가 쌓이다

L1000 기술을 활용해 연구팀은 무려 **130만 개 이상의 유전자 프로필**을 만들어냈습니다.

**방대한 데이터:** 약 2만 개의 약물과 5천여 개의 유전자를 조작했을 때 세포가 어떻게 변하는지를 기록했습니다. 이는 기존 데이터보다 1,000배 이상 큰 규모입니다.

**정확성 검증:** 이렇게 수집한 데이터는 기존의 고비용 정밀 분석 방식(RNA-seq)과 비교했을 때 매우 높은 일치율을 보였습니다.

#### 5. 고찰 및 의의: 이 지도로 무엇을 할 수 있나?

이 거대한 데이터 지도는 과학자들에게 '생물학적 검색 엔진' 역할을 합니다.

**약물의 작동 원리 파악:** 처음 보는 화학 물질이 어떤 유전자에 영향을 주는지 검색하면, 이미 알고 있는 약물이나 유전자 반응과 대조하여 그 기능을 바로 예측할 수 있습니다.

**개인 맞춤형 치료:** 특정 질병 유전자가 변이되었을 때 어떤 약이 이를 정상으로 되돌릴 수 있는지 이 지도를 통해 찾아낼 수 있습니다.

#### 6. 이 연구가 왜 중요할까요? (시사점)

이 연구의 가장 큰 가치는 **'신약 개발의 민주화'**에 있습니다. 이전에는 수억 원의 비용과 수년의 시간이 걸리던 약물 반응 예측을 이제는 컴퓨터 클릭 몇 번으로 훨씬 저렴하게 수행할 수 있게 된 것입니다.

특히 연구팀은 이 방대한 데이터를 전 세계 과학자들에게 무료로 공개했습니다. 이제 누구나 이 지도를 활용해 암 치료제를 연구하거나 희귀 질병의 원인을 규명할 수 있습니다. 한마디로, 인류가 질병과 싸우기 위한 가장 정교하고 거대한 '전략 지도'를 갖게 된 셈입니다.

---

*이 포스팅은 Subramanian et al. (2017), "A Next Generation Connectivity Map: L1000 Platform and the First 1,000,000 Profiles" 논문을 바탕으로 작성되었습니다.*


chatGPT

이 논문은 2017년 Cell에 발표된 「A Next Generation Connectivity Map: L1000 Platform and the First 1,000,000 Profiles」로, 유전자·약물·질병 사이의 기능적 연결을 대규모로 분석할 수 있는 차세대 ‘커넥티비티 맵(Connectivity Map, CMap)’을 구축한 연구입니다. 연구진은 기존보다 1,000배 이상 확장된 데이터와 새로운 유전자 발현 분석 기술(L1000)을 통해, 세포 수준에서 유전자와 약물이 어떤 기능적 관계를 갖는지 체계적으로 밝혀냈습니다.

연구 배경을 먼저 살펴보면, 인간 게놈 해독 이후 우리는 수많은 질병 관련 유전자 변이를 알게 되었지만, “이 유전자가 실제로 세포에서 어떤 기능을 하는가?”, “어떤 약물이 어떤 경로를 조절하는가?”라는 기능적 질문에는 충분히 답하지 못했습니다. 단순히 유전자 목록을 아는 것만으로는 인과관계나 작용 기전을 이해하기 어렵기 때문입니다. 이를 해결하기 위해 연구진은 특정 유전자를 억제하거나 과발현시키거나, 세포에 약물을 처리한 뒤 나타나는 ‘유전자 발현 변화 패턴’을 비교해 서로 비슷한 반응을 보이는 것끼리 연결하는 CMap 개념을 발전시켰습니다. 하지만 기존 CMap은 164개 약물, 3개 세포주 수준으로 규모가 작아 한계가 있었습니다.

이번 연구의 목적은 크게 두 가지입니다. 첫째, 비용을 획기적으로 낮춘 새로운 유전자 발현 분석 기술(L1000)을 개발하는 것, 둘째, 이를 이용해 유전자·약물·생물학적 제제에 대한 100만 건 이상의 발현 프로파일을 구축하여, 진정한 ‘기능적 지도(functional map)’를 만드는 것이었습니다.

연구 방법의 핵심은 L1000 플랫폼입니다. 연구진은 전체 약 2만여 개 유전자 중 1,000개의 ‘랜드마크 유전자(landmark genes)’만 직접 측정해도, 통계적 추론을 통해 나머지 유전자 발현의 80% 이상을 예측할 수 있음을 보였습니다. 이 방식은 기존 RNA-seq보다 훨씬 저렴하며(샘플당 약 2달러 수준), 대량 처리에 적합합니다. 기술적 재현성도 높았고, RNA-seq과 비교했을 때도 높은 상관관계를 보였습니다. 이후 연구진은 약 19,811개의 소분자 화합물, 5,075개 유전자에 대한 knockdown/overexpression, 다양한 세포주를 포함해 총 1,319,138개의 L1000 발현 프로파일을 생성했습니다. 이는 기존 CMap 대비 1,000배 이상 확장된 규모입니다.

연구 결과는 매우 인상적입니다. 첫째, 약물의 작용 기전(MOA)을 유전자 발현 패턴만으로 예측할 수 있음을 보여주었습니다. 예를 들어, 기존에 잘 알려지지 않았던 화합물이 ROCK1 억제제일 가능성을 CMap 분석으로 예측했고, 실제 생화학적 실험에서 이를 확인했습니다. 또한 CSNK1A1이라는 키나아제의 새로운 억제 물질(BRD-1868)을 데이터 기반으로 발굴했습니다. 둘째, shRNA 실험에서 예상보다 ‘off-target 효과’가 크다는 사실을 밝혔고, 이를 줄이기 위해 여러 shRNA 결과를 통합한 CGS(Consensus Gene Signature) 방법을 개발했습니다. 셋째, 암 환자에서 발견된 특정 유전자 변이가 실제로 기능 상실(loss-of-function)인지 여부를 발현 패턴 비교로 예측할 수 있음을 보여주었습니다. 예를 들어 FBXW7이나 PTEN의 특정 돌연변이가 정상 기능을 잃었는지를 기능적으로 판별했습니다. 넷째, 실제 임상시험 환자의 치료 전후 종양 조직 발현 데이터를 CMap과 비교해, 약물이 실제로 표적 경로를 억제했는지, 내성이 어떻게 생겼는지 해석할 수 있음을 시사했습니다.

고찰 부분에서 연구진은 L1000의 장점과 한계를 함께 언급합니다. 장점은 낮은 비용, 높은 재현성, 대규모 확장 가능성입니다. 특히 희귀 전사인자처럼 발현량이 낮은 유전자도 감지 가능하다는 점은 장점입니다. 반면, 모든 유전자를 직접 측정하는 것이 아니므로 약 17% 유전자는 정확한 추론이 어렵다는 한계도 존재합니다. 또한 세포주 기반 데이터이기 때문에 실제 인체 환경을 완전히 반영하지는 못합니다. 그럼에도 불구하고, 130만 건이 넘는 기능적 프로파일을 공개 데이터로 제공했다는 점에서 연구 자원으로서의 가치는 매우 큽니다.

이 연구의 의의와 시사점은 분명합니다. 첫째, 유전자-약물-질병을 하나의 네트워크로 연결하는 ‘기능적 검색 엔진’을 현실화했습니다. 둘째, 신약 후보 물질의 작용 기전 규명, 예상치 못한 부작용 탐색, 약물 재창출(drug repositioning) 가능성을 크게 확장했습니다. 셋째, 암 유전자 변이의 기능적 의미를 빠르게 평가할 수 있는 도구를 제공했습니다. 넷째, 임상시험에서 환자 조직의 발현 변화를 통해 약물 반응을 조기에 해석할 가능성을 제시했습니다.

결국 이 연구가 중요한 이유는, 유전자 목록을 아는 시대에서 나아가 “이 유전자와 약물은 세포에서 실제로 무엇을 하는가?”라는 기능적 질문에 대규모 데이터로 답할 수 있는 기반을 마련했기 때문입니다. 단순한 정보 축적을 넘어, 생물학적 인과관계를 탐색하고 신약 개발과 정밀의학을 가속화할 수 있는 실질적 도구를 제시했다는 점에서 이 연구는 현대 생명과학의 중요한 전환점을 보여줍니다.


grok

이 논문은 인간 유전자를 이해하기 위한 대규모 데이터베이스인 Connectivity Map (CMap)의 다음 세대를 소개합니다. 배경으로, 인간 게놈 시퀀싱으로 유전자 목록은 완성됐지만, 유전자와 약물의 기능적 연결을 파악하는 데 한계가 있었습니다. 이전 CMap은 소규모(164개 약물)로 제한됐으나, 이를 극복하기 위해 연구 목적은 저비용 고효율 L1000 플랫폼을 개발해 100만 개 이상의 세포 프로파일을 생성하는 것이었습니다.

방법으로는 전체 유전자 중 1000개 '랜드마크' 유전자를 직접 측정하고, 나머지 81%를 컴퓨터 모델로 유추하는 L1000 기술을 사용했습니다. 9개 세포주에 19,811개 약물과 5,075개 유전자를 조작(knockdown 또는 overexpression)해 131만 프로파일을 만들었고, 유사성을 계산하는 연결성 점수(tau)를 통해 분석했습니다.

결과로 L1000은 RNA-seq과 비슷한 재현성을 보였고, shRNA의 오프타겟 효과를 발견해 합의 서명(CGS)으로 보정했습니다. 이를 통해 약물 작용 메커니즘(MOA)을 밝히고, 질병 관련 유전자 변이를 주석화했으며, perturbagen 클래스(PCL) 171개를 정의해 예상치 못한 연결을 찾았습니다. 예를 들어, enzastaurin은 PKC뿐 아니라 GSK3 억제제로 확인됐습니다.

고찰에서 대규모 데이터는 노이즈를 우려했으나, 세포 맥락에 따라 보편적 또는 선택적 서명을 구분해 유의미했습니다. PCL은 구조적으로 다양하며, 세포 유형에 따라 연결성이 달라집니다.

의의와 시사점은 약물 부작용 예측, 신약 개발, 임상 시험 해석에 활용 가능합니다. 예를 들어, 암 환자 생검에서 약물 저항성을 예측했습니다. 이는 생물학적 연결을 탐색하는 '기능적 룩업 테이블'로 작용합니다.

이 연구가 중요한 이유는 포괄적 CMap의 실현 가능성을 증명해, 유전자-약물-질병 연결을 체계적으로 탐색할 기반을 마련했기 때문입니다. 이는 의학 연구를 혁신적으로 가속화할 잠재력을 가집니다.


Kimi

이 논문은 **"차세대 연결성 지도(Connectivity Map): L1000 플랫폼과 첫 100만 개 프로필"**이라는 제목으로, 2017년 Cell 저널에 발표된 대규모 유전자 발표 연구입니다. 암 유전학의 세계적 권위자인 Todd Golub 교수팀이 주도했으며, 미국 NIH의 LINCS 컨소시엄 지원을 받았습니다.

---

## 연구 배경

인간 게놈 프로젝트 이후 우리는 질병과 관련된 유전자 변이를 많이 찾아냈지만, "이 유전자가 실제로 세포에서 무슨 일을 하는가"는 여전히 미스터리였습니다. 마치 자동차 부품 목록만 가지고 있을 뿐, 각 부품이 어떤 기능을 하고 다른 부품과 어떻게 연결되는지 모르는 상황이었죠. 2006년에 같은 연구팀은 "Connectivity Map(CMap)"이라는 개념을 처음 제시했는데, 이는 유전자, 약물, 질병 상태가 유사한 유전자 발현 패턴으로 연결될 수 있다는 아이디어입니다. 하지만 당시에는 고가의 마이크로어레이 기술을 사용해야 해서 164개 약물만 프로파일링할 수 있었습니다. 진정한 의미의 대규모 데이터베이스 구축은 불가능했죠.

---

## 연구 목적

핵심 목표는 **"저렴하면서도 고처리량인 새로운 유전자 발현 측정법을 개발하고, 이를 이용해 100만 개 이상의 세포 교란 프로필을 생성하는 것"**이었습니다. 이를 통해 유전자-약물-질병 간의 숨겨진 연결을 발견하고, 새로운 약물 작용 기전을 밝히며, 유전자 변이의 기능을 주석 달 수 있는 포괄적인 참조 데이터베이스를 구축하고자 했습니다.

---

## 연구 방법

연구팀은 **L1000**이라는 혁신적인 기술을 개발했습니다. 이는 전체 전사체(약 2만 개 유전자)를 측정하는 대신, **978개의 "랜드마크" 유전자**만 직접 측정하고 나머지는 계산으로 추론하는 방식입니다. 핵심 원리는 이 978개가 전체 전사체 정보의 82%를 담고 있다는 데이터 기반 분석에서 출발했습니다. 실험 과정은 간단히 설명하면: 384웰 플레이트에서 세포를 배양 → 약물 처리나 유전자 교란 → 세포 파괴 후 mRNA 추출 → 특수 프로브와 리간스 반응 → 형광 비드와 하이브리드화 → Luminex 스캐너로 측정. 놀라운 점은 **한 실험당 시약 비용이 약 2달러**에 불과하다는 것입니다. 또한 500개 비드 색상으로 978개 유전자를 측정하기 위해 "2:1 비율 혼합-피크 분리"라는 영리한 전략을 사용했습니다.

검증을 위해 955개 랜드마크 유전자를 타겟으로 하는 shRNA(유전자 발현 억제 도구) 실험을 수행했고, 88%가 예상대로 해당 유전자를 억제함을 확인했습니다. RNA-seq와의 비교에서는 3,176개 환자 샘플에서 상관계수 0.84, 98%가 99번째 백분위수 이상의 일치도를 보였습니다.

---

## 연구 결과

총 **1,319,138개의 L1000 프로필**을 생성했습니다. 이는 42,080개의 교란 인자(19,811개 소분자 화합물, 18,493개 shRNA, 3,462개 cDNA, 314개 바이오로직스)를 다양한 세포주에서 프로파일링한 것입니다. 473,647개의 통합 서명(signature)으로, 기존 CMap 파일럿 데이터보다 **1,000배 이상 확장**되었습니다.

주요 발견들을 살펴보면: 첫째, **shRNA의 off-target 효과**가 on-target보다 훨씬 크다는 것을 밝혀냈습니다. 같은 유전자를 타겟으로 해도 시드 서열이 같으면 서로 유사한 발현 패턴을 보이는 반면, 다른 시드면 무관했습니다. 이를 해결하기 위해 **합의 유전자 서명(CGS)** 방법을 개발해 여러 shRNA의 공통 효과만 추출했습니다. 둘째, **약물 작용 기전(MOA) 예측**에서 1,902개 화합물의 기대 타겟 중 63%를 정확히 복원했습니다. 171개의 "교란 인자 클래스(PCL)"를 정의했는데, 이는 동일한 작용 기전을 가진 약물 그룹입니다. 예를 들어 HDAC 억제제 PCL 내에서도 팬-억제제와 아이소폼-선택적 억제제가 명확히 구분되었습니다. 셋째, **세포 맥락의 중요성**을 확인했습니다. 43%의 약물은 세포주에 따라 다른 서명을 보였고, 글루코코르티코이드 수용체 작용제는 수용체가 높이 발현된 세포주에서만 강한 연결을 보였습니다. 반면 26%는 모든 세포주에서 일관된 서명을 보여 "보편적 반응"을 나타냈습니다.

가장 흥미로운 것은 **새로운 약물 발견** 사례입니다. BRD-2751이라는 미특성화 화합물이 ROCK 억제제 PCL과 강하게 연결되어, Kinomescan 검증에서 ROCK1에 대한 Kd 56nM의 억제 활성을 확인했습니다. 또한 BRD-1868은 CSNK1A1(카세인 키나제 1A1) 억제제로 예측되어 검증되었는데, 이는 골수형성이상증후군과 급성골수성백혈병에서 중요한 표적입니다. 기존에 알려진 억제제가 없던 새로운 약물 클래스를 순전히 계산적 분석으로 발견한 것입니다.

임상 적용 가능성도 보여주었습니다. BRAF/MEK 억제제 임상시험에서 재발 종양의 발현 패턴이 약물 저항성 메커니즘(MAPK 재활성화)을 예측했고, CDK 억제제 임상시험에서는 치료 전/후 생검 비교가 환자의 치료 지속 기간과 연관되었습니다.

---

## 고찰과 의의

이 연구의 핵심 철학은 **"빅데이터 시대에는 데이터를 컴퓨터로 가져가는 것이 아니라, 컴퓨팅을 데이터로 가져가야 한다"**는 것입니다. 연구팀은 클라우드 기반 분석 환경인 **CLUE(https://clue.io)**를 구축해 누구나 접근 가능하게 했습니다. L1000의 한계도 명확히 인정했습니다. 하이브리드화 기반이다 보니 RNA-seq보다 편향적이고, 추론된 유전자의 17%는 신뢰할 수 없었으며, 훈련에 사용된 세포 유형과 다른 세포에서는 추론 성능이 떨어질 수 있습니다. 또한 shRNA의 off-target 문제는 CGS로도 완전히 해결되지 않았고, CRISPR 기반 유전자 편집이 더 나은 대안이 될 수 있으나 이 역시 비특이적 독성 문제가 있습니다.

---

## 시사점과 중요성

이 연구가 특별한 이유는 **"규모의 경제가 생물학 발견으로 이어졌다"**는 점입니다. 100만 개 프로필이라는 규모는 단순한 숫자가 아니라, 통계적 유의성과 예측력의 질적 도약을 의미합니다. 이전에는 불가능했던 약물 재창출, off-target 효과 예측, 유전자 변이 기능 주석이 이제 루틴한 분석이 되었습니다. 특히 BRD-1868 같은 사례는 **"하이포제시스 프리(hypothesis-free) 발견"**의 가능성을 보여줍니다. 기존 약물 스크리닝은 선행 지식에 의존했지만, CMap은 데이터가 스스로 연결을 제안합니다.

향후 방향도 제시했습니다: 더 많은 소분자 화합물, 질병 관련 유전자의 대립유전자 시리즈, iPS 세포 등 새로운 세포 유형, 그리고 단백질체/고내용 이미징 등 다른 판독 방법의 통합. 이 연구는 **"생물학의 구글"**을 만든 것과 같습니다. 우리가 궁금해하는 유전자나 약물을 검색하면, 관련된 질병, 경로, 예상치 못한 연결들이 반환되는 시스템의 기초를 닦았습니다. 1,300달러짜리 RNA-seq 대신 2달러짜리 L1000으로 동등한 정보를 얻을 수 있다면, 제약회사의 스크리닝 비용은 수백만 달러에서 수천 달러로 줄어듭니다. 이는 곧 더 많은 후보물질이 더 빨리 환자에게 닿을 수 있다는 의미입니다.





출처: @ye._.vely618


금요일, 4월 03, 2026

Openclaw는 얼마나 삽질을 하면 사용할 수 있을까?

지난번에 Zeroclaw를 설치해봤는데 삽질을 꽤나 해서 Openclaw는 얼마나 쉽게 설치 할 수 있는지 한번 진행해봤습니다. :)


사전준비

Openclaw는 node.js 22 이상을 요구한다고 합니다.

(비서가 될 놈이 참 까다롭습니다.)

node.js 22가 제가 사용하는 우분투에 따라 그냥 apt에서 설치되기도 했었고, 아래와 같이 curl을 이용해서 되기도 했습니다. 각자의 시스템에 맞게 설치해주시면 될것 같습니다.

$ curl -fsSL https://deb.nodesource.com/setup_22.x | sudo -E bash -

$ node -v

또는 

# apt install nodejs

# node -v


OpenClaw 설치하기

OpenClaw 설치는 어렵지 않습니다. 그냥 아래의 명령어들 중에 마음에 드시는것 사용하시면 됩니다. 대신 일반 계정에서는 안되고 관리자 권한이 필요합니다.

# install OpenClaw

또는

# npm i -g openclaw

또는

# npm install -g openclaw


OpenClaw 실행하기

Openclaw 설치가 마무리되었다면 아래와 같이 onboard 명령어를 통해서 openclaw에게 나의 정보를 onboard라는 sub 명령어를 실행시켜서 알려주시면됩니다. 

$ openclaw onboard








일단 어떻게 어떻게 완료했고, 저는 local이 아닌 remote에서 접근해야하기에 gateway 명령어를 실행시켜서 진행했습니다.

$ openclaw gateway





원격 PC에서 크롬을 사용해서 접근을 잘 했습니다. :)



근데 역시나 원격 브라우저에서 반응이 좀 걸리더라구요.


Local LLM 설정
기억에 onboard에서 ollama 서비스가 잘 구동되고 있다면 알아서 다운로드 받아둔 모델들을 등록하고 이 중에 어떤것을 기본값으로 사용할거야? 라고 물어보고 큰 무리없이 잘 설정해줬던 것으로 기억합니다.
그래도 혹시 모르니 필요하다면 openclaw.json 파일을 수정하시면됩니다.
위치는 ~/.openclaw 아래에 있습니다.
models 밑에 provider에 따라 분류하고 있고, 기본 모델은 models 다음 agents라는 곳에 있습니다.
agents 구조를 보시면 기본 모델은 어떤 것을 사용할지, 함께 사용할 모델은 어디에 등록해야하는지 알 수 있습니다. :)


부록
-openclaw 서비스를 재시작하기 위한 명령어
$ systemctl --user [stop|start|restart] openclaw-gateway.service

-ollama서비스를 재시작하기 위한 명령어
$ systemctl [stop|start|restart] ollama.service


-openclaw에서 pairing을 해달라는 요청이 있을 때
원래는 openclaw gateway였던가? 서비스를 실행하였을 때 
Enter this code in the Control UI: ###### (6자리 숫자)
와 같은 문장이 나왔었는데, 그 다음부터는 나오지 않아서 pairing을 어떻게 해야하는지 문제에 봉착 할 수 있습니다.
아래와 같이 명령어를 실행시켜주면 6자리 숫자없이 pairing 진행할 수 있습니다.

$ openclaw devices list 

실행하게되면 Pending 이라는 테이블이 보이고, Request 컬럼에 문자열(requestId)이 있습니다.
이 requestId를 아래의 명령어를 사용해서 허용해주면 pairing 문제는 해결 할 수 있습니다.

$ openclaw devices approve <requestId> 


결론적으로는 ZeroClaw보다는... 덜 삽질을 해도 시작을 할 수 있을 것 같다는 느낌...

아.. ZeroClaw를 먼저 접했었기 떄문이었을지도 모르겠네요.. 

그리고 원격 브라우저에서 잘 안되는 것 같아 로컬에서 접근해서 진행해보았으나 timeout이 걸려서 결국에는 답변을 받지 못했습니다.

설정들은 정상적으로 잡혀 있는 것 같은데, Spec의 한계인지...

다음에 기회되면 다시 해보는것으로 이 claw 시리즈는 일단 마무리 하는 것으로 :)


출처: @ye._.vely618


수요일, 4월 01, 2026

엉성했던 유전자 지도를 정교하게! AI와 계통학으로 찾은 새로운 유전자 그룹

우리 몸을 생성하는데 청사진으로 사용되는 DNA중에 우리 몸을 이루는 것들 말고 다른 것들, 예를 들어 바이러스 서열과 같은 것들이 우리 몸속에 생각보다 많이 자리잡고 있습니다. 이런 것을 보통 Endogenous Retroviruses라고 부릅니다. 오랫동안 감염으로 인해 얻어졌으나 별 쓸모없는 Junk DNA라는 취급을 받아왔는데 이 것들이 생각보다 우리에게 많은 영향을 주고 있다는 사실이 밝혀지고 있습니다. 근데 지금까지 별 쓸모없는 것들이라고 생각해서 이 서열들을 그렇게까지 중요하게 생각하지 않았기에 대충 정리해두어서인지 다시 정리할 필요가 생겼다고합니다. A phylogenetic approach uncovers cryptic endogenous retrovirus subfamilies in the primate lineage라는 제목의 연구에서 이 서열들을 더 체계적으로 분류해봤다고 합니다. 


DOI: 10.1126/sciadv.ads9164


clova-x

이 연구는 phylogenetic 분석을 통해 primate lineage에서의 cryptic endogenous retrovirus subfamilies를 발견하고, 이를 통해 LTR subfamilies의 새로운 분류와 annotation을 제안하였습니다.

1. **연구 배경**

   - Endogenous retroviruses (ERVs)와 그들의 Long Terminal Repeats (LTRs)는 인간 게놈의 상당 부분을 차지하며, 유전자 조절에 중요한 역할을 할 수 있습니다.

   - 기존의 분류 방법은 제한된 해상도와 부정확성을 가지고 있어, 보다 정밀한 분석이 필요합니다.

2. **연구 방법**

   - Phylogenetic 분석과 종간 보존성을 기반으로 새로운 annotation 접근법을 개발하였습니다.

   - MER11A/B/C와 같은 진화적으로 젊은 LTR subfamilies에 초점을 맞추어 새로운 하위 군집을 발견하였습니다.

3. **연구 결과**

   - 53개의 simian-enriched LTR subfamilies를 조사하여 75개의 새로운 subfamilies를 정의하였으며, 총 3807개의 인스턴스에 대해 새로운 annotation을 제안하였습니다.

   - 새로운 subfamilies는 더 일관된 유전적 및 에피지네틱 프로필을 보여주며, regulatory potential을 확인하기 위해 massively parallel reporter assay를 사용하였습니다.

4. **생물학적 의미**

   - 발견된 새로운 subfamilies는 primate 게놈의 진화와 유전자 조절 네트워크에 대한 이해를 심화시킬 수 있습니다.

   - LTR subfamilies의 새로운 분류는 ERVs의 생물학적 역할을 더욱 명확하게 파악하는 데 기여할 것입니다.


gemini

## 멸종된 바이러스의 유전자가 인간 진화에 미친 영향에 대한 새로운 발견: 논문 요약

---

### 연구 배경

[cite_start]우리 유전자의 약 절반은 스스로 복제하고 이동하는 '전이성 유전인자'라는 DNA 조각들로 구성되어 있습니다[cite: 1]. [cite_start]이 중 8%가량은 과거에 인류를 감염시켰던 바이러스의 잔재, 즉 **‘내인성 레트로바이러스(ERVs)’**입니다[cite: 1]. [cite_start]이 바이러스의 흔적들은 오랜 시간에 걸쳐 유전자에 통합되었고, 그중 일부는 유전자 발현을 조절하는 중요한 역할을 하게 되었습니다[cite: 1].

[cite_start]하지만 기존의 유전인자 분류 방식은 정확도가 떨어져서, 이들이 우리 유전자에서 어떻게 진화하고 어떤 기능을 하는지 제대로 파악하기 어려웠습니다[cite: 1]. [cite_start]특히, ERV의 핵심적인 조절 부위인 **'롱 터미널 리피트(LTR)'**는 그 종류가 너무 많고 비슷하여 분류가 복잡했습니다[cite: 1].

---

### 연구 목적 및 방법

[cite_start]이 연구의 목적은 기존의 한계를 극복하고 LTR을 더 정확하게 분류하는 새로운 방법을 개발하는 것이었습니다[cite: 1]. [cite_start]이를 위해 연구팀은 LTR의 진화적 관계를 분석하는 **'계통학적 접근법'**을 사용했습니다[cite: 2]. [cite_start]여러 영장류 종의 유전자를 비교하여, 어떤 LTR이 언제부터 영장류 유전자에 통합되어 퍼졌는지 추적했습니다[cite: 2].

[cite_start]이 방법으로 연구팀은 MER11A/B/C라는 LTR 종류에 집중하여, 이들이 진화 과정에서 어떻게 변화했는지 면밀히 조사했습니다[cite: 2]. [cite_start]그리고 새롭게 분류된 LTR 그룹들이 실제로 유전자 조절 기능을 하는지 확인하기 위해 **대규모 병렬 리포터 분석(MPRA)**이라는 실험을 진행했습니다[cite: 2]. [cite_start]이는 수천 개의 DNA 조각이 한꺼번에 유전자 발현을 얼마나 활성화하는지 측정하는 최신 기술입니다[cite: 2].

---

### 연구 결과

[cite_start]이 연구를 통해 기존에 MER11A/B/C로 불리던 LTR 그룹들이 실제로는 네 개의 새로운 세부 그룹(MER11_G1, G2, G3, G4)으로 나뉜다는 사실을 발견했습니다[cite: 2]. [cite_start]이 새로운 분류법은 기존 분류의 약 19.8%를 재정의하는 결과로 이어졌습니다[cite: 1].

[cite_start]새롭게 분류된 LTR 그룹들은 기존 분류보다 훨씬 균일한 유전자 조절 특성을 보였습니다[cite: 2]. [cite_start]MPRA 실험 결과, 이 새로운 그룹들은 각기 다른 수준의 유전자 활성화 능력을 가지고 있음이 확인되었습니다[cite: 2]. [cite_start]특히, 인간과 유인원의 유전자에서 특정 염기 하나가 사라지면서 유전자 발현을 조절하는 SOX 관련 모티프가 새로 생겨났고, 이 모티프는 유전자 활성화에 큰 영향을 미치는 것으로 나타났습니다[cite: 5, 3]. [cite_start]이는 마카크 원숭이에게서는 발견되지 않은 특징입니다[cite: 5, 3].

[cite_start]연구팀은 이 방법을 MER11뿐만 아니라 다른 53개 영장류 LTR 그룹에 적용하여, 75개의 새로운 세부 그룹을 정의했습니다[cite: 6]. [cite_start]이를 통해 해당 LTR 유전자의 30%가량이 재분류되었습니다[cite: 1].

---

### 고찰 및 의의

[cite_start]이 연구는 기존의 부정확한 유전인자 분류 체계를 개선하고, 인간 유전자에 숨어 있는 미지의 정보를 밝혀냈다는 점에서 큰 의미가 있습니다[cite: 1, 7].

[cite_start]새로운 분류법은 LTR이 어떻게 영장류 유전자에서 진화하고, 유전자 발현 조절 기능을 획득했는지에 대한 더 정확한 이해를 가능하게 합니다[cite: 7]. [cite_start]이는 우리 몸의 유전자 발현 조절 네트워크가 어떻게 진화해왔는지, 그리고 왜 종마다 유전인자의 기능이 다른지를 이해하는 데 중요한 통찰을 제공합니다[cite: 7].

**이 연구가 중요한 이유**는 다음과 같습니다.

1.  [cite_start]**더 정확한 유전자 지도**: 수십 년 동안 부정확하게 분류되었던 유전인자를 새롭게 정의함으로써, 인간 게놈 지도를 더욱 정교하게 만들었습니다[cite: 7, 8].

2.  [cite_start]**새로운 조절 기능 발견**: 이전에는 알지 못했던 유전인자의 유전자 조절 기능을 발견하고, 이것이 영장류 진화에 어떤 영향을 미쳤는지 설명할 수 있는 기반을 마련했습니다[cite: 7].

3.  [cite_start]**진화의 '무기 경쟁' 이해**: 이 연구는 바이러스 유전자가 숙주 유전자에 통합되는 과정과 숙주가 이를 억제하려는 '무기 경쟁'의 역사를 밝히는 데도 기여합니다[cite: 8].

[cite_start]결론적으로, 이 연구는 단순히 오래된 바이러스의 흔적을 재분류한 것이 아니라, 그 흔적들이 어떻게 인간 게놈의 진화와 복잡한 유전자 네트워크 형성에 기여했는지에 대한 깊이 있는 통찰을 제공합니다[cite: 7]. [cite_start]이는 앞으로 생명과학 분야에서 유전인자의 기능과 진화를 연구하는 새로운 이정표가 될 것입니다[cite: 7].


chatGPT

다음은 업로드하신 논문의 내용을 생명과학 비전공 일반 성인도 이해하기 쉽게, 블로그용으로 정리한 요약입니다. 분량은 A4 약 두 장 분량이며, 연구 배경부터 의의까지 포함했습니다.

---

## 🧬 원숭이 조상에서 찾아낸 ‘숨겨진’ 바이러스 유전자 조각

### 1. 연구 배경

우리 DNA의 절반가량은 ‘이동성 유전 요소(Transposable elements)’로 채워져 있습니다. 그중 약 8%는 과거 바이러스 감염 흔적인 \*\*내인성 레트로바이러스(ERV)\*\*입니다. 이 바이러스 유전자는 수백만 년 전 숙주 세포에 침입해 DNA에 섞였고, 지금까지 후손에게 유전되어 왔습니다.

ERV는 \*\*LTR(Long Terminal Repeat)\*\*라는 DNA 서열을 가지고 있는데, 이 부분은 원래 바이러스 유전자 발현을 조절하는 역할을 하던 곳입니다. 숙주인 인간에서는 때때로 이 LTR이 **새로운 유전자 스위치**로 전용되어, 발달·조직 특이적 유전자 조절에 기여하기도 합니다.

문제는, 현재 LTR 분류법이 너무 단순해서 \*\*다양한 하위 그룹(subfamily)\*\*을 정확히 구분하지 못한다는 점입니다. 비슷해 보이지만 기능·진화 경로가 다른 LTR들이 같은 이름으로 묶여 있는 경우가 많습니다.

---

### 2. 연구 목적

이 연구팀은 LTR의 \*\*정확한 계통분류(phylogenetic classification)\*\*를 통해 숨겨진 하위 그룹을 찾아내고, 그 기능적 차이를 규명하려 했습니다. 특히 **영장류 계통에서 최근 진화한 LTR** 중 하나인 **MER11A/B/C**에 주목했습니다.

---

### 3. 연구 방법

1. **계통 분석**

   * 사람과 원숭이, 유인원 등 47종 영장류의 유전체에서 MER11 계열 LTR 서열을 모아 **진화계통도**를 작성했습니다.

   * 비슷한 서열끼리 묶고, 종 간 보존 정도를 비교해 새로운 하위 그룹을 정의했습니다.

2. **새로운 분류 제안**

   * MER11A/B/C를 재분류한 결과, **MER11\_G1\~G4**라는 4개의 새로운 하위 그룹을 발견했습니다.

   * 기존 분류에서 약 20%의 사례가 새 그룹으로 재배정되었습니다.

3. **기능 검증** – MPRA(대량 병렬 리포터 실험)

   * 각 LTR 조각이 실제로 유전자 발현을 조절하는 능력이 있는지, 사람 유도만능줄기세포(iPSC)와 신경전구세포(NPC)에서 측정했습니다.

   * 활성 히스톤 마크(H3K27ac)와 개방된 염색질 영역(ATAC-seq 데이터)도 함께 분석했습니다.

4. **전사인자 결합 부위 분석**

   * LTR 서열에 포함된 \*\*전사인자 결합 모티프(TF-binding motif)\*\*를 찾아, 어떤 그룹이 어떤 전사인자와 관련 있는지 비교했습니다.

---

### 4. 주요 결과

1. **새로운 4개 하위 그룹**

   * MER11\_G1: 가장 오래된 그룹, 기능적 활성 거의 없음

   * MER11\_G2/G3: 중간 나이, ZIC·TEAD 등 발달 관련 TF 결합 부위 풍부

   * MER11\_G4: 가장 젊은 그룹, POU2F1::SOX2·SOX17 등 줄기세포·발달 관련 모티프 다수

2. **종별 차이**

   * G4 그룹에서 **SOX 계열 모티프**가 인간과 침팬지에서는 강하게 나타났지만, 마카크원숭이에는 거의 없었음.

   * 이 차이는 단일 염기 결실로 인해 새 모티프가 ‘생겨난’ 결과로 추정됨.

3. **기능적 차이**

   * MPRA에서 G2/G3/G4 그룹의 특정 클러스터는 강한 유전자 조절 활성을 보였고, G1은 거의 활동이 없었음.

   * 같은 MER11 계열이라도 하위 그룹에 따라 조절 능력과 관련 TF가 전혀 달랐음.

4. **범용 적용**

   * 이 방법을 다른 53개의 영장류 특이 LTR에 적용해 **총 75개의 새로운 하위 그룹**을 찾아냈음.

   * 그중 약 30%의 LTR이 기존 분류와 다른 새로운 그룹에 속함.

---

### 5. 고찰

* **왜 중요할까?**

  기존 LTR 분류는 서로 다른 진화 경로와 기능을 가진 요소들을 섞어 놓아, 그 역할을 정확히 이해하기 어려웠습니다.

  새로운 계통 기반 분류는 LTR의 **진화사**와 **유전자 조절 네트워크 내 위치**를 더 정확히 파악하게 해 줍니다.

* **생물학적 의미**

  * 특정 LTR 하위 그룹이 **줄기세포 발달**, **생식세포 형성**, **조직 특이적 유전자 발현**에 관여할 가능성이 큽니다.

  * 종마다 나타나는 모티프 차이는 **인간·유인원 고유의 유전자 조절 방식**을 형성했을 수 있습니다.

* **미래 연구 방향**

  * 실제 유전자 네트워크 내에서 LTR 하위 그룹이 어떤 유전자의 발현을 제어하는지 구체적 검증 필요

  * LTR과 숙주 유전체 사이의 ‘진화적 군비 경쟁’(TF 활성 vs. KRAB-ZNF 억제) 메커니즘 규명

---

### 6. 의의와 시사점

이 연구는 **영장류 진화 과정에서 숨겨져 있던 바이러스 유전자 조각의 세부 분류**를 밝혀냈고, 그 기능적 다양성을 실험적으로 입증했습니다.

정확한 LTR 분류는 인류 진화, 발달생물학, 질병 연구(특히 발달장애·암)에서 **새로운 유전자 조절 요소**를 찾는 길을 열어줄 수 있습니다.

즉, 우리의 DNA 속 ‘잠든 바이러스’가 어떻게 종 차이를 만들고, 인간 고유의 특성을 형성하는지 이해하는 데 핵심 열쇠가 될 수 있습니다.

---

원하신다면 제가 이 내용을 **더 대중적인 비유와 예시를 넣어 스토리텔링 블로그 글**로 다듬어 드릴 수도 있습니다. 그렇게 하면 과학에 익숙하지 않은 독자도 흥미롭게 읽을 수 있습니다.


※ 아래는 대중적인 비유와 예시를 넣어작성한 스토리텔링 블로그 글

전문 용어는 쉽게 설명하고, 중간중간 비유를 넣었습니다.

---

## 🧬 인류 DNA 속 ‘잠든 바이러스’, 그 비밀 족보를 파헤치다

**혹시 아셨나요?**

우리 몸의 DNA 절반 가까이는 사실 ‘우리 것’이 아닙니다. 그중 일부는 수백만 년 전, 조상들이 바이러스에 감염됐을 때 침입한 유전자 조각입니다. 마치 오래된 책 속에 낀 전단지처럼, 세대를 거듭해도 빠져나가지 않고 그대로 남아 있는 거죠.

이 오래된 바이러스의 흔적을 과학에서는 \*\*내인성 레트로바이러스(ERV)\*\*라고 부릅니다.

특히 ERV에는 **LTR**이라는 ‘스위치’ 같은 DNA 구간이 있는데, 원래는 바이러스 유전자를 켜기 위해 쓰였지만, 숙주인 인간은 이걸 영리하게 **자신의 유전자 조절 장치**로 재활용하기도 합니다.

---

### 📜 오래된 족보의 문제

그런데 여기엔 문제가 있습니다.

과학자들은 LTR을 ‘족보’처럼 분류해 이름을 붙여왔는데, 너무 대충 묶어둔 겁니다.

비슷해 보여도 사실 서로 다른 집안(하위 그룹)에 속하고, 역할도 제각각인데, 그냥 같은 성씨로만 기록해 둔 셈이죠.

예를 들어, 같은 "김 씨"라도 어떤 집안은 농사꾼, 어떤 집안은 상인, 또 다른 집안은 과학자일 수 있는데, 현재 분류 방식은 이런 차이를 전혀 구분하지 못했던 겁니다.

---

### 🔍 연구진의 도전 – 바이러스 족보 재작성

이번 연구팀은 이런 ‘부실 족보’를 바로잡기로 했습니다.

특히 **MER11A/B/C**라는, 영장류(원숭이·유인원)에서 최근 진화한 LTR 가족을 집중 조사했습니다.

방법은 간단하면서도 정교했습니다.

사람, 침팬지, 원숭이 등 47종의 영장류 DNA에서 MER11 서열을 모아 \*\*유전자 족보(진화계통도)\*\*를 다시 그린 겁니다.

그리고 각 서열이 **다른 종에 얼마나 남아 있는지** 비교해 ‘진짜 친척 관계’를 확인했습니다.

결과?

놀랍게도 기존에 세 개라고 알려진 MER11 하위 그룹이 사실 \*\*네 개(MER11\_G1\~G4)\*\*로 나뉜다는 사실을 발견했습니다.

이 과정에서 기존 분류의 약 20%가 잘못 표기돼 있었던 것도 드러났습니다.

---

### 🧪 단순한 분류에서 끝나지 않았다

연구진은 “이 그룹들이 진짜 기능도 다를까?”를 확인하기 위해 **MPRA**라는 실험을 썼습니다.

쉽게 말해, 수천 개의 DNA 스위치를 세포에 심어보고, 어떤 스위치가 불을 켜는지, 얼마나 밝게 켜는지 한 번에 측정하는 기술입니다.

그 결과, 네 개의 새 그룹은 성격이 확실히 달랐습니다.

* **G1**: 오래된 그룹, 불 잘 안 켜짐(기능 거의 없음)

* **G2/G3**: 발달 관련 유전자 스위치 풍부, 불이 활발하게 켜짐

* **G4**: 가장 젊은 그룹, 줄기세포·발달 관련 스위치(SOX, POU 계열) 다수

---

### 🐒 종마다 다른 ‘스위치 진화’

더 흥미로운 건 **G4 그룹**에서 발견된 차이였습니다.

인간과 침팬지의 G4에는 **SOX 계열 스위치**가 강하게 나타났지만, 마카크원숭이에는 거의 없었습니다.

왜일까요?

DNA를 비교해 보니, 단 하나의 염기(문자)가 빠져서 **새로운 스위치가 생긴 것**이었습니다.

작은 철자 하나가 바뀌었는데, 유전자 스위치 하나가 생겨버린 거죠.

이 변화가 인간·유인원 고유의 유전자 조절 방식을 만든 결정적 차이일 수 있습니다.

---

### 🌍 더 넓게 적용한 결과

연구팀은 이 방법을 다른 53종의 영장류 특이 LTR에도 적용했습니다.

그 결과 **총 75개의 새로운 하위 그룹**을 발견했고, 전체의 약 30%가 기존 족보와 달랐습니다.

이 말은, 우리가 알고 있던 LTR의 ‘가문도’ 상당 부분이 잘못되어 있었다는 뜻입니다.

---

### 💡 왜 중요한가?

이 연구는 단순히 DNA 구석구석을 다시 분류한 것 이상의 의미가 있습니다.

LTR은 발달, 면역, 질병, 심지어 암 발생에도 영향을 줄 수 있는 **유전자 조절 장치**입니다.

정확한 분류 없이는, 어떤 스위치가 언제, 왜 켜지는지 제대로 알 수 없습니다.

마치 고대 도시 유적을 발굴하면서, 건물들의 원래 용도(사원인지, 시장인지)를 알아내는 것과 같습니다. 그래야 그 시대 사람들의 생활상을 이해할 수 있듯, LTR의 진짜 족보를 알아야 **우리 DNA의 진화사**와 **질병의 원인**을 더 깊이 파악할 수 있습니다.

---

### 🏁 마무리

우리 DNA 속에 잠든 바이러스 조각들은 단순한 ‘쓰레기 유전자’가 아닙니다.

그들은 **과거 바이러스 침입의 흔적이자, 현재와 미래를 바꿀 수 있는 유전자 스위치**입니다.

이번 연구는 그 스위치들의 숨겨진 족보를 밝혀냈고, 그 과정에서 인류 진화와 유전자 조절의 비밀 한 조각을 풀어냈습니다.

---

이 글을 읽고 나면, “우리 몸의 절반은 사실 오래된 바이러스다”라는 말이 더 이상 무섭게만 들리지 않을 겁니다.

오히려 그 오래된 손님들이 우리의 발달, 뇌, 면역에 조용히 기여하고 있다는 사실이 경이롭게 느껴질지도 모릅니다.


NotebookLM

## 숨겨진 유전자 조절자를 찾아서: 인류 진화의 비밀을 밝히는 새로운 유전자 분류법

안녕하세요, 우리의 몸을 구성하는 유전체에 대해 궁금해하셨던 분들을 위해 흥미로운 연구 결과를 소개해 드리고자 합니다. 이 연구는 우리 유전자 속에 숨겨진 "암호"를 풀어내고, 그것이 인류의 진화에 어떻게 기여했는지 이해하는 데 중요한 단서를 제공합니다.

---

### **연구 배경: 우리 유전자 속의 "다크 매터"**

우리 인간의 유전체(게놈)는 생명 활동에 필수적인 유전자 정보뿐만 아니라, 그 절반 가까이를 **'전이 요소(Transposable Elements, TEs)'**라는 반복 서열이 차지하고 있습니다. 이 중 약 8%는 바이러스 감염의 흔적으로 알려진 **'내인성 레트로바이러스(Endogenous Retroviruses, ERVs)'**에서 유래했습니다. 이 ERV의 일부인 **'긴 말단 반복 서열(Long Terminal Repeats, LTRs)'**은 단순한 반복 서열을 넘어, 우리 몸의 유전자 발현을 조절하는 중요한 **조절 요소(regulatory elements)**로 기능할 수 있음이 밝혀지고 있습니다. 이는 마치 우리 유전자 속의 숨겨진 스위치처럼 작동하며, 특정 유전자를 켜거나 끄는 역할을 할 수 있다는 뜻입니다.

특히, 영장류의 진화 과정에서 인간 유전체에 통합된 비교적 **'젊은' ERV 요소들**은 인간 유전체에 상당수의 조절 서열을 제공했으며, 우리의 유전자 조절 네트워크에 영향을 미쳐왔습니다 (예: HERVH-LTR7, LTR5_Hs 등). 이러한 LTR 서열들을 제대로 분류하고 주석을 다는 것은 이들이 어떻게 진화했고, 숙주에 의해 어떻게 활용되었으며, 어떤 잠재적인 영향을 미치는지 이해하는 데 매우 중요합니다.

하지만 기존의 유전자 분류 방식(예: Repeatmasker)은 여러 가지 한계를 가지고 있었습니다. **서열 간의 높은 유사성, 복잡한 진화 과정, 그리고 과거의 명명법 불일치 등으로 인해 이 LTR 서열들을 정확하게 분류하고 주석을 다는 것이 매우 어렵고 부정확한 경우가 많았습니다**. 이는 우리가 유전자 지도를 정확히 그리는 데 큰 장애물이 되어 왔습니다.

### **연구 목적: 숨겨진 LTR 하위 분류군을 찾아서**

이 연구의 주된 목적은 이러한 기존 분류 방식의 한계를 극복하고, **정확성이 떨어지고 모호했던 LTR 서열들의 분류 문제를 해결하는 새로운 접근법을 개발하는 것**입니다. 연구팀은 **'계통 발생 분석(phylogenetic analysis)'**이라는 방법을 사용하여 LTR 서열들의 진화적 관계를 깊이 있게 파악하고, 이를 통해 **이전에 알려지지 않았던 숨겨진 LTR 하위 분류군(subfamilies)을 찾아내고자 했습니다**.

궁극적으로, 이 새로운 분류법을 통해 **영장류 유전체의 진화를 더 잘 이해하고, ERV와 LTR이 숙주 생명체 내에서 어떤 중요한 역할을 하는지 밝혀내는 것**을 목표로 했습니다.

### **연구 방법: 유전자 서열의 족보를 파헤치다**

연구팀은 LTR 서열들의 진화적 관계를 파악하고 새로운 분류 기준을 마련하기 위해 다음과 같은 다단계 접근 방식을 사용했습니다:

1.  **영장류 특이적 LTR 하위 분류군 선별:** 먼저, 인간 유전체에서 영장류에 특이적으로 풍부하게 존재하는 LTR 하위 분류군(예: 마모셋과 유사 영장류에는 존재하지만 여우원숭이에는 거의 없는, 약 4천만 년 전 영장류 공통 조상 이후 통합되거나 확장된 서열들)을 선별했습니다. 이 중에서도 특히 젊고 특이한 진화 양상을 보이는 **MER11A/B/C LTR 하위 분류군**에 주목했습니다.

2.  **계통 발생 나무 구축 및 새로운 하위 분류군 정의:**

    *   **유전자 서열의 족보 만들기:** MER11A/B/C를 포함한 모든 LTR 서열의 **다중 서열 정렬(multiple sequence alignment)**을 수행하여 서열 간의 유사성을 파악했습니다. 이를 바탕으로 서열들의 진화적 관계를 보여주는 **'계통 발생 나무(phylogenetic trees)'**를 만들었습니다.

    *   **숨겨진 분류군 식별:** 이 계통 발생 나무의 내부 가지 길이와 진화적 거리를 분석하여, 기존에는 하나의 그룹으로 묶여 있었지만 실제로는 진화적으로 서로 다른 **4개의 '새로운 하위 분류군' (MER11_G1, MER11_G2, MER11_G3, MER11_G4)**을 새롭게 정의했습니다.

3.  **후성유전학적 특징 분석:** 새롭게 정의된 MER11 하위 분류군들이 실제로 생물학적으로 의미 있는 차이를 보이는지 확인하기 위해, 인간 배아줄기세포(hESCs)와 신경 전구 세포(NPCs)에서 이들의 **'후성유전학적 프로필(epigenetic profiles)'**을 비교했습니다. 후성유전학적 프로필이란 DNA 서열 자체는 변하지 않으면서 유전자 발현을 조절하는 방식(예: DNA 접근성, 특정 히스톤 변형)을 말합니다.

4.  **대규모 병렬 리포터 분석(MPRA)을 통한 조절 활성 검증:**

    *   새로운 하위 분류군들이 실제로 유전자 조절 능력을 가지고 있는지 대규모로 검증하기 위해 **MPRA(Massively Parallel Reporter Assay)**라는 첨단 기술을 활용했습니다.

    *   이 기술은 수천 개의 DNA 서열 각각이 유전자 발현을 얼마나 활성화 또는 억제하는지 동시에 측정할 수 있게 해줍니다. 연구팀은 MER11 서열에서 유전자 조절에 중요한 역할을 할 것으로 예상되는 약 250bp 길이의 **'기능적 프레임(functional frames)'** 영역을 추출하여 분석했습니다.

    *   인간, 침팬지, 마카크 유전체에서 이 서열들의 조절 활성을 측정하고 비교했습니다.

5.  **전사 인자 결합 모티프(TF-binding motifs) 및 염기 서열 변화 분석:** MPRA 활성에 기여하는 특정 **전사 인자(Transcription Factor, 유전자 발현을 조절하는 단백질) 결합 모티프(motif, DNA 서열의 특정 패턴)**와 미세한 염기 서열 변화(예: 단일 염기 결실)를 식별했습니다.

6.  **다른 영장류 LTR 하위 분류군으로 확장 적용:** MER11에서 성공적으로 적용된 이 계통 발생적 접근 방식을 다른 53개의 영장류 특이적 LTR 하위 분류군에도 적용하여, 새로운 하위 분류군이 얼마나 더 많이 존재하는지 확인했습니다.

### **연구 결과: 숨겨진 비밀이 드러나다**

이 연구는 기존 분류의 복잡성과 부정확성을 해결하는 데 중요한 진전을 보여주었습니다:

*   **MER11의 새로운 하위 분류군 발견:** 연구팀은 기존에 단일하게 인식되던 MER11 LTR 서열들 내에서 **4개의 명확히 구분되는 새로운 하위 분류군(MER11_G1, MER11_G2, MER11_G3, MER11_G4)을 성공적으로 밝혀냈습니다**. 그 결과, **MER11 LTR 서열의 약 19.8%에 해당하는 412개의 인스턴스(개별 복제본)가 새로운 방식으로 주석 처리되었습니다**.

*   **후성유전학적 특성의 일관성 증명:** 이 새로운 하위 분류군들은 기존 분류군에 비해 **더욱 일관된 후성유전학적 프로필**을 보였습니다. 이는 이들이 단순히 서열만 다른 것이 아니라, 유전자 조절 기능 측면에서도 명확히 구분되는 생물학적 실체임을 시사합니다. 예를 들어, MER11_G1은 전사 인자 결합 부위나 활성 히스톤 표지가 부족한 반면, MER11_G3은 개방형 염색질 및 대부분의 전사 인자 결합 부위가 풍부했습니다.

*   **조절 활성 및 모티프 분석:** MPRA를 통해 MER11의 특정 프레임(Frame 2)에서 높은 조절 활성을 확인했으며, 각 새로운 하위 분류군이 **특정 전사 인자 결합 모티프(예: SOX, POU2F1::SOX2, TEAD 등)와 독특하게 연관되어 있음**을 밝혀냈습니다.

*   **종 특이적 진화의 증거:** 특히 흥미로운 점은, **단일 염기 결실(single-nucleotide deletion)이라는 작은 변화가 MER11_G4에서 SOX 관련 모티프의 획득으로 이어졌고, 이는 조절 활성을 증가시켰다는 것입니다**. 이러한 변화는 인간과 침팬지에서는 나타나지만 마카크에서는 발견되지 않아, **영장류 조상 이후 인간 계통에서 발생한 종 특이적인 진화 현상**임을 보여주었습니다. 이는 LTR이 종 특이적 특성을 형성하는 데 기여했음을 의미합니다.

*   **다른 LTR에도 적용 가능한 새로운 분류법:** 이 새로운 접근 방식을 MER11 외에 다른 53개의 영장류 특이적 LTR 하위 분류군에 적용한 결과, **총 75개의 새로운 하위 분류군을 정의했으며, 26개 LTR 하위 분류군의 총 3,807개(30.0%) 인스턴스에 대해 새로운 주석을 부여했습니다**. 이는 이 방법론이 광범위하게 적용될 수 있음을 보여줍니다.

### **고찰, 의의 및 시사점: 왜 이 연구가 중요한가요?**

이 연구는 단순한 유전자 분류를 넘어, **우리 유전체의 복잡한 진화 과정과 기능적 역할을 이해하는 데 혁신적인 기여**를 합니다.

*   **기존 분류의 한계 극복:** 현재 LTR 분류 시스템의 고질적인 문제인 **'해상도 부족'과 '부정확성'**을 계통 발생적 접근 방식을 통해 효과적으로 해결했습니다. 이는 기존에 혼합되어 있던 이질적인 서열들을 기능적으로나 진화적으로 더 의미 있는 단위로 세분화할 수 있음을 입증합니다.

*   **진화 생물학에 대한 깊은 이해:** LTR 서열들이 어떻게 숙주 게놈에 통합되고, 어떻게 조절 기능을 획득하거나 변화시키면서 진화해왔는지에 대한 **구체적인 증거와 메커니즘**을 제시합니다. 특히, 단일 염기 수준의 미세한 변화가 종 특이적인 유전자 조절 기능 획득으로 이어질 수 있음을 밝혀낸 것은 **인류의 유전적 특성이 어떻게 형성되었는지**를 이해하는 중요한 단서가 됩니다.

*   **유전체 연구의 새로운 지평:** 이 연구는 유전자 조절 요소로서의 LTR의 중요성을 재확인하고, 우리가 유전체의 '다크 매터'라고 여겼던 부분들이 실제로는 **우리 생명 활동과 진화에 깊이 관여하고 있음**을 명확히 보여줍니다. 이는 향후 유전체 연구에서 LTR과 같은 반복 서열에 대한 더욱 심도 있는 탐색의 필요성을 강조합니다.

*   **다른 연구 분야로의 확장 가능성:** 이 연구에서 개발된 새로운 분류 방법론과 분석 기법은 BRCA1/2 유전자 변이 분류와 같이 복잡한 다른 반복 서열이나 유전자 그룹의 분류를 개선하는 데도 적용될 수 있습니다. 이는 유전학 분야 전반의 분류 표준을 향상시키고, 궁극적으로 **질병의 진단 및 치료법 개발에도 기여**할 잠재력을 가집니다.

---

### **결론: 이 연구가 왜 중요한가요?**

이 연구는 우리 유전체 내의 거대한 미지의 영역이었던 **'반복 서열'에 대한 이해의 수준을 한 단계 끌어올린 매우 중요한 진전**입니다. 우리는 이 반복 서열들이 단순히 비활성적인 '정크 DNA'가 아니라, 실제로 **유전자 조절 네트워크를 형성하고 종의 특이성을 결정하며, 진화적 적응에 필수적인 역할**을 수행할 수 있음을 이 연구를 통해 더욱 명확히 알게 되었습니다.

특히, **새로운 LTR 하위 분류군을 발견하고, 이들이 특정 조절 기능을 가지고 있으며, 심지어 단일 염기 결실과 같은 미세한 변화가 종 특이적인 유전자 조절 활성을 유도할 수 있다는 발견**은 인류를 포함한 영장류의 복잡한 진화 과정을 이해하는 데 매우 중요한 실마리를 제공합니다.

이러한 **정교하고 정확한 유전자 주석은 미래의 유전체 연구에 필수적인 기반**이 될 것입니다. 이는 유전성 질환의 원인을 밝히거나, 개인 맞춤형 치료 전략을 개발하는 데 필요한 유전자 지도를 더욱 선명하게 만드는 데 기여할 수 있습니다. 즉, 이 연구는 **우리 자신과 생명체의 기원, 그리고 미래의 건강을 이해하는 데 필수적인 핵심 정보**를 제공한다고 볼 수 있습니다.


grok

### 내인성 레트로바이러스: 원숭이 유전자의 숨겨진 비밀을 풀다

#### 연구 배경

인간 유전체(게놈)의 절반 가까이를 차지하는 '이동성 요소(TE)' 중 하나가 내인성 레트로바이러스(ERV)입니다. ERV는 과거 바이러스 감염으로 유전체에 삽입된 잔재물로, 특히 그 끝부분인 장단말 반복서열(LTR)이 유전자 발현을 조절하는 '스위치' 역할을 할 수 있어요. 하지만 기존 분류 도구(RepeatMasker)는 ERV와 LTR을 정확히 구분하지 못해, 원숭이(영장류) 계통에서 이들의 진화와 기능을 제대로 이해하기 어려웠습니다. 이 연구는 원숭이 유전체에 풍부한 젊은 LTR 하위가족(예: MER11A/B/C)을 대상으로, 기존 분류의 한계를 지적하며 시작됐어요.

#### 연구 목적

연구자들은 계통학적 분석(유전 서열의 진화 관계 추적)과 종간 보존성(다른 종에서 같은 서열이 있는지)을 결합해 LTR 하위가족을 더 정확히 재분류하고 주석하는 방법을 개발했습니다. 이를 통해 ERV의 숨겨진 '새로운 하위가족'을 발견하고, 이들이 유전자 조절에 미치는 영향을 검증하는 게 목표예요. 특히 MER11처럼 젊은 LTR에 초점을 맞춰, 원숭이 진화 과정에서 ERV가 어떻게 확산되고 적응했는지 밝히려 했습니다.

#### 연구 방법

먼저 인간 게놈에서 원숭이(시미안) 계통에 풍부한 179개 LTR 하위가족을 선별했습니다. 이 중 MER11A/B/C처럼 이질적인 61개를 골라 서열을 정렬하고 계통수를 구축해 클러스터(그룹)로 나눴어요. 클러스터 간 관계를 네트워크 분석으로 확인한 후, 새로운 하위가족을 정의했습니다. 이들의 규제 잠재력을 검증하기 위해 MPRA(대량 병렬 리포터 분석: 수천 개 DNA 조각의 활동을 동시에 측정하는 기술)를 사용해 인간 줄기세포에서 활동성을 테스트했어요. 또한 유전자 결합 모티프(특정 단백질이 붙는 서열 패턴)를 분석하고, 침팬지·마카크 원숭이 게놈과 비교했습니다.

#### 연구 결과

MER11A/B/C 분석에서 4개의 새로운 하위가족(MER11_G1~G4)을 발견했어요. 이로 인해 기존 2080개 MER11 서열 중 19.8%(412개)가 재주석됐습니다. 새로운 분류는 기존 것보다 에피제네틱 프로필(유전자 활성 관련 화학적 표시)이 더 일관됐어요. MPRA 결과, MER11_G3/G4처럼 젊은 그룹이 강한 규제 활동성을 보였고, SOX·POU 관련 모티프가 활동 증가와 연관됐습니다. 원숭이 계통별 비교에서 MER11은 종 분화 후 독립적으로 확산됐지만, 새로운 하위가족 구조는 보존됐어요. 특히 인간·침팬지에서 SOX 모티프를 얻은 단일 핵산 삭제가 활동성을 높였습니다. 전체 53개 LTR 하위가족에 적용해 75개 새로운 하위가족을 정의, 30%(3807개) 서열 재주석.

#### 연구 고찰

기존 분류의 이질성은 ERV 진화 과정(재조합·변이)에서 비롯되며, 새로운 접근법이 이를 해결합니다. 젊은 LTR이 줄기세포에서 활성인 이유는 다산성 TF(전사인자) 결합 때문으로 보이지만, KRAB-ZNF 같은 억제 메커니즘도 균형을 맞춥니다. 인간·침팬지 특이 SOX 모티프 획득은 최근 변이로, 원숭이 종 분화에 기여할 수 있어요. 하지만 MPRA는 세포 외부 실험이니, 실제 게놈 맥락에서 추가 검증이 필요합니다.

#### 의의와 시사점

이 연구는 ERV/LTR의 정확한 분류를 통해 원숭이 게놈 진화와 유전자 조절 네트워크를 더 잘 이해할 수 있게 합니다. 예를 들어, 특정 LTR이 질병이나 발달에 관여할 수 있으니, 미래 의학 연구(암·줄기세포 치료)에 활용 가능해요. 시사점으로는 유전체 분석 도구를 개선하면 숨겨진 '바이러스 유산'이 인류 진화의 열쇠가 될 수 있다는 점입니다.

이 연구가 중요한 이유는 ERV가 단순한 '쓰레기 DNA'가 아니라, 원숭이 종 분화와 적응을 이끈 핵심 요소임을 밝혔기 때문이에요. 기존 도구의 한계를 넘어 새로운 관점을 제공해, 유전학 연구의 패러다임을 바꿀 수 있습니다!


perplexity.ai

# 유인원에서 숨겨진 레트로바이러스 유전자의 비밀을 밝히다  

— 「A phylogenetic approach uncovers cryptic endogenous retrovirus subfamilies in the primate lineage」(Chen et al., Sci Adv, 2025) 쉬운 요약

## 1. 연구 배경

우리 몸의 유전자는 단순히 부모로부터 물려받은 DNA뿐만 아니라, 수백만 년 전 바이러스가 유전자에 끼어들면서 남긴 흔적들도 포함하고 있습니다. 이러한 바이러스의 흔적은 ‘내인성 레트로바이러스(ERV, Endogenous Retrovirus)’라고 불리며, 전체 인간 유전체의 약 8%나 차지합니다. ERV의 일부는 유전자 조절 등 우리 몸의 기능에 영향을 미칩니다. 최근 연구에서는 이러한 바이러스 유전자들이 진화 과정에서 어떻게 변화하고, 우리 몸의 발달과 적응에 어떤 역할을 해왔는지 주목하고 있습니다.

## 2. 연구 목적

이번 논문의 목적은 기존의 바이러스 유전자 분석 방식의 한계를 극복하고, 보다 정확한 분류 및 기능을 밝히는 것입니다. 특히 영장류(사람, 침팬지 등 유인원)에서 큰 역할을 했던 'MER11'이라는 레트로바이러스 그룹과, 이와 유사한 여러 바이러스 유전자들에 집중했습니다.

## 3. 연구 방법

저자들은 유인원 유전체에 퍼져 있는 ERV 유전자(특히 LTR이라 불리는 부분)를 수집한 후,  

- **계통 분석(phylogenetic analysis)**: 유전자의 진화적 관계를 기반으로 그룹을 나눔  

- **대량 실험(MPRA)**: 각 그룹이 실제로 세포에서 얼마나 유전자 조절자로 작동하는지 확인  

- **비교 유전체 분석 및 다양한 생체 실험 데이터를 통합**: 사람뿐만 아니라 침팬지, 원숭이 등 다양한 유인원에서의 유전자 보존 및 기능 평가

## 4. 주요 결과

- 기존에 하나로 묶였던 ‘MER11A/B/C’ 그룹에서 **네 가지 새로운 하위 그룹(MER11_G1~G4)**이 밝혀짐. 이는 기존 분류보다 더 실제 상황에 맞는 분류임.

- 새롭게 분류된 하위 그룹은 각기 유전체 내에서 **다른 위치에 분포**하고, **다른 조절 역할**을 함(특정 하위 그룹이 특정 염색체에서 더 많이 발견됨).

- 새 그룹의 조절 기능(유전자 조절자 역할)은 염색표지(H3K27ac 등) 분석과 MPRA 실험을 통해 **더 일관되고 명확함**이 확인.

- 일부 하위 그룹에서는 **SOX 계열 단백질(발달, 줄기세포 등에 중요한 역할) 결합 부위가 사람과 침팬지에만 새로 추가**됨. 이 변화는 **단일 염기(한 글자) 삭제**로 인해 발생했고, **이 덕분에 해당 유전자 그룹의 조절 기능이 크게 강화**됨.

- 전체적으로, 이 연구에서 **53개 주요 LTR 그룹 중 75개의 새로운 하위 그룹**을 식별했고, 기존 분류에 있던 유전자들의 **약 30%가 새롭게 재분류**됨.

## 5. 고찰 및 의의

- 단순히 유전자 서열의 유사성만을 보고 분류했던 기존 방식은, 변이와 진화, 기능적 다양성을 충분히 반영하지 못한다는 한계를 지님.

- 이번 연구는 **진화적 계통분석과 실제 기능 검사**를 결합하여, 훨씬 더 현실적인 분류 체계와 기능적 해석을 제공.

- 특히, **한 개의 염기 삭제로 인한 유전자 기능 변화** 같은 세밀한 수준의 진화적 변화가 실제로 사람 등 영장류 진화와 기능에 큰 영향을 준다는 것을 확인.

- 새로운 분류 체계는 앞으로의 유전체 연구, 질병 연구, 발달생물학 등에서 **정확한 정보와 연구 방향을 제시**할 수 있음.

## 6. 이 연구가 왜 중요한가?

- 인간 및 영장류의 **유전체 진화와 조절 메커니즘을 세밀하게 밝힘**으로써, 기존 연구의 한계를 실질적으로 극복함.

- **질병, 발달, 면역 등과 관련된 유전자 조절 네트워크** 이해에 큰 도움을 줄 수 있고, 앞으로 **유전체 기반 진단 및 치료 개발**에 기반이 될 수 있음.

- 나아가, **바이러스와 인간의 공진화(상호 진화) 및 유전체 내 바이러스 흔적이 어떻게 우리 삶과 건강을 좌우하는지** 새로운 시각을 제시.

> 결론적으로, 이 연구는 우리 몸과 유전자에 숨겨진 ‘과거의 흔적’이 현재 우리 건강과 생물학적 적응에 얼마나 중요한 역할을 하는지, 그리고 정교한 연구 방법을 통해 이를 어떻게 제대로 볼 수 있는지 보여주는 학문적 진전입니다.

[1] https://ppl-ai-file-upload.s3.amazonaws.com/web/direct-files/attachments/40912948/a97a4735-f61d-4ac2-87c1-683fdd75b4b0/sciadv.ads9164.pdf




출처: @ye._.vely618