레이블이 Database인 게시물을 표시합니다. 모든 게시물 표시
레이블이 Database인 게시물을 표시합니다. 모든 게시물 표시

월요일, 9월 04, 2023

NCBI에서 제공하는 ribosomal RNA Database

때는 바야흐로 2020년 초

NCBI에 Blog에 새로운 ribosomal RNA 데이터베이스가 출시되었다는 글이 하나 떴었네요...


사실 그 전부터 BLAST용 ribosomal RNA 서열은 제공하고 있었습니다.

다만 그 전까지는 NCBI에 수집된 nucleotide 서열을 모아놓은 수준이었던것 같은데,

2020년에 공개된 데이터는 단순히 모아놓는 부정확한 정보 수준이 아닌 각 서열을 정확하게 식별하고 분류할 수 있도록 엄선하였다고 하네요 

rRNA뿐만 아니라 ITS 서열까지.. 2020년즈음에는 microbiome에 이어 mycobiota도 관심이 증가하고 있었던 시기였던터라 이전에 ITS 서열을 제공하지 않았던것 같은데, 역시 NCBI 훃님들은 페달 밟으면 아주 시원하게 뽑아주는듯 합니다.

여튼 요즘에는 16S, 18S, ITS 서열들을 잘 정리해서 식별할 수 있도록 (aka taxonomy 정보가 잘 정리되어 있다는 것이겠죠) 제공하고 있습니다.


>여기< 에 우리가 알고 있는 nt db와 nr db 말고도 다양한 local용 blast database들이 제공되고 있으니 잘 다운로드 받아 잘 사용하면 좋을 것 같습니다. 


또 유익한 정보를 가지고 블로그에 글을 적어보도록 하겠습니다. 





출처: @ye._.vely618




월요일, 4월 25, 2022

Forensic Microbiome Database


Forensic Microbiome Database: A Tool for Forensic Geolocation Meta-Analysis Using Publicly Available 16S rRNA Microbiome Sequencing

DOI : 10.3389/fmicb.2021.644861



간만에 재미난 제목의 논문이 있어 올려봅니다.

Microbiom Database인데 법의학을 위한...

미생물검체를 시퀀싱한 결과를 분석툴에 돌리고나면 이 미생물검체가 어디서 채취되었는지.. 사람의 어느 부위 또는 지리적 위치와 같은 것을 알려줄수 있는 DB가 있다면 범죄추적에 갱장히 많은 도움을 주겠죠?

그래서 결론은 다양한 분야와 연구자들의 지속적인 데이터 공유로 DB의 업데이트가 필요하니 굽신굽신 (가능하면 다양한 샘플을 정교하게 분류하고 tag 달아서)




미생물을 이용한 법의학하니 옛날에 CSI에서 신발바닥이나 바지밑단 뭍은 물질을 바탕으로 범인의 행동반경이나 직업들을 유추하거나 시체에서 애벌래나 성충이 되는 벌레들을 가지고 대략적인 사망시간 추정 또는 시체가 다른곳에서 유기되었는지도 추측하는 장면이 나왔었는데 만약 미생물 정보를 활용하여 사건 장소나 범인에 대한 정보를 예측할 수 있는 좋은 도구가 될것 같네요

다만 시퀀싱할때마다 시퀀싱되는 종들의 편차가 잘못된 결과를 도출 할 수 있으니 이런 편차나 문제를 극적으로 줄여 줄 수 있는 실험방법이나 분석방법이 나오면 참 좋을듯하네요

간단하게 생각나는 건...
임의의 장소에서 채취된 A검체를 시퀀싱한 결과를 DB에 대고 샘플링(100번 혹은 1000번정도)해서 비교해서 가장 비슷한 DB의 결과를 확률적으로 보여주는 방법 정도?

그리고 Microbiom을 더 정확하게 분류해놓은 DB가 필요하다는.. (사실 모 이건 모든 Microbiom 서비스를 하는 곳에서 요구되는 사항이긴 하지만..)

그리고 이 흥미진진한 내용을 보고 싶으시면 >이곳< 을 방문하시면 될것 같습니다.




그럼 4월 마지막 주를 활활 불태워 보고자 흥미진진한 논문 한번 올려봤습니다. :)




출처: @candyz_hyojung


수요일, 8월 29, 2018

Microbiome Database를 만들어 볼까?

Microbiome분석을 위해서 여기저기 기웃거려봤다면
여러가지 16S rRNA 데이터베이스가 있다는것을 아실겁니다.

보통 microbiome분석에 입문해서 사용하는 것이라면
대게 처음 분석하는 tool에따라 결정되는데
우리 롭횽님의 qiime를 접한다면 greengene을, mothur을 접하게된다면 silva를 database로 만나게됩니다.

사실 대부분의 연구 결과들이 greengene과 silva로 나오기 떄문에 이 두 database를 사용하면 당연히 그 누구도 갠세이 놓지 않습니다.
-아니면 에디터나 리뷰어에게 외쳐보자. Drop the DB, yo!

근데 매번 분석하다보면 family수준 밑에만 내려가면 unknown은 왜이리 많을걸까..

그렇다면 그냥 우리가 손수 microbiome분석을 위한 db를 만들어보면 어떨까?

당근 이렇게 만들경우 실제 연구에 사용하기는 마뜩치 않다는걸 미리 말씀드립니다.

일단 tree를 만들기가;;; 녹녹치 않습니다. (물론 서열수를 줄이면 수십G 메모리를 가지는 워크스테이션이 있으면 가능합니다.)
그리고 제가 분류학자도 아니고 제가 서열보고도 얘가 몬지 알지도 못하고
서열에 taxonomy 붙여도 제대로 연결시킨건지 확인이 되지 않는다는 큰 문제가 있습죠
#물론_이사진을보면_누군지_압니다, 출처:SM Town

그럼에도 불구하고 왜하냐? 그냥 재미삼아, 경험삼아 만들어보는것입니다.

내가 사용하는 DB를 만드는데 얼마나 많은 고민이 녹아있고
얼마나 많은 생각들이 들어가 있는지 이해를 해보는것도 나쁘지 않을듯하고요 ㅎㅎ ;)

일단 이런걸 하겠다고 블로그에 띄워놨으니 언젠가는 후속글을 올리지 않을까요?
따라가능하도록 소스같은것은 각 글이나 github에 업로드하는 걸로 :)
jupyter notebook으로 올리면 더더욱 좋겠지만 제가 아직 notebook이 익숙치가 않아서..

우선 다음 글에서는 Custom Microbiome Database에 필요한 기초 자료 수집에 관련된 내용들을 올리도록 하겠습니다. :)