레이블이 benign인 게시물을 표시합니다. 모든 게시물 표시
레이블이 benign인 게시물을 표시합니다. 모든 게시물 표시

수요일, 10월 11, 2023

Interpretation도 이제는 AI가 해야지

간만에 지난달에 출판된 따끈따끈한 논문 하나 읆어보는 시간 가져보도록 하겠습니다.

AlphaGo와 AlphaFold로 유명한 DeepMine에서 나온 논문으로 제목은 "Accurate proteome-wide missense variant effect prediction with AlphaMissense" 입니다.

DOI: 10.1126/science.adg7492

한 줄로 요약하자면 단백질 기능에 영향을 줄 수 있는 Missense Mutation가 발생하였을 경우 이 돌연변이가 질병을 유발할 수 있는 pathogenic 변이인지 알려주는 모델이라고 보시면 되겠습니다.

단, Missense Mutation 즉 아미노산이 바뀌는 유전적 변이에 대해서 pathogenic 정도를 알려 줄 수 있습니다. 아직 절반의 성공이긴 하죠. 

그래도 지금까지 인류는 missense mutation에 대해서 inpterpretation작업을 진행하였을 때 극소수, 논문에서는 0.1% 정도만 확인 하였다 라고 하고 있을 정도 극히 일부만 알 수 있었으나 이 AlphaMissense는 가능한 missense mutation 중 89%에 대해서 benign이나 pathogenic 을 구분할 수 있다고 합니다.

사실 AlphaMissense 모델이 나올 수 있었던데에는 AF, aka AlphaFold가 있었기에 가능했다고합니다. AlphaFold가 지구상에 있는 가능한 모든 단백질 구조를 예측하였고, 이 단백질 구조들을 바탕으로 정상적인 단백질 구조와 이상한 단백질 구조(질병과 관련있거나, 질병을 일으킬 수 있는)를 구분 할 수 있는 기초 자료가 되었다는 것이겠죠.

그리고 AlphaMissense에서 활용하는 정보들이 단순히 모델을 통해서 뚝딱뚝딱 만들어지긴 하였지만 수십년동연 연구하면서 쌓은 단백질 구조 정보와 진화적인 정보와도 일치하기도 하였다고 합니다. 1992년도에 발표되었던 BLOSUM인데, AlphaMissense가 학습한 아미노산 치환으로 병원성을 예측 하였을 때와 BLOSUM62 행렬을 바탕으로 병원성을 예측 할 때와 상관관계가 있었다고 합니다. BLOSUM은... 크... 

여튼 오늘 간만에 옛날 논문이 아닌 나름 따끈따끈한 논문을 읽어봤는데, 100% 이해하지는 못하나 그래도 이제는 머신러닝이나 AI를 사용하지 않고는 일을 하기 어려운 시대가 되어 가는 듯합니다. 모델을 구현하고 생성할지는 못할지언정 평가하고 활용은 해야지 다가올 미래에 밥벌이는 할 수 있지 않을까 합니다.

그리고 안타깝게도 AlphaMissense Code는 아파치 라이센스로 사용에 문제가 없으나 AlphaMissense 예측 코드는 BY-NC-SA 4.0으로 상용적으로 활용이 어렵겠네요..

저런저런... Orz


출처 : @ye._.vely618