오늘은 서열 검색할 때 대게는 similarity를 얘기해야 하나 homology로 혼용해서 생각하는 경우가 흔해서 2013년.. 와.. 10년전 논문을 가져와 봤습니다.
물론 이 두 개를 혼용하는 주인공은 접니다. ㅋ
여튼 제목도 그에 걸맞게 "An Introduction to Sequence Similarity (“Homology”) Searching" 입니다.
DOI: 10.1002/0471250953.bi0301s42
논문 내용을 봐보니 이건 claude에 (공짜로) 물어봐도 해줄 것 같아서 claude와 clova-x에 물어보았습니다.
claude
1. 논문 업로드 요약문
이 논문은 서열 유사성 검색과 상동성(유전적 공통 조상) 추론에 대해 소개하고 있습니다. 주요 내용은 다음과 같습니다:
1. BLAST, FASTA, SSEARCH 등의 서열 유사성 검색 프로그램은 통계적으로 유의미한 유사성을 발견할 경우 두 서열이 공통 조상에서 유래했다고 추론할 수 있습니다.
2. 단백질 서열 비교가 DNA 서열 비교보다 5-10배 더 민감하므로 단백질 서열 검색이 선호됩니다.
3. 30% 이상의 서열 일치도 규칙은 지나치게 보수적입니다. 20% 미만의 낮은 일치도에서도 통계적으로 유의미한 상동성을 보일 수 있습니다.
4. 서열 유사성에서 기대값(E-value)과 bit 스코어가 일치도보다 상동성 추론에 더 유용합니다.
5. 상동 서열이 발견되면 기능 예측을 위해 보존된 활성 부위 잔기 등을 확인하는 것이 중요합니다.
6. 단일 서열 비교보다 다중서열정렬이 진화적, 구조적, 기능적 정보를 더 잘 제공합니다.
7. 상동성은 공통 조상을 나타내지만 반드시 기능적 유사성을 의미하지는 않습니다. 정밀한 기능 예측에는 주의가 필요합니다.
요약하면 서열 유사성 검색 도구와 통계값을 사용하여 신뢰성 있게 상동성을 추론할 수 있지만, 기능 예측 시에는 추가 분석이 필요하다는 내용입니다.
2. homology(상동성)와 similarity(유사성)를 설명해줘
이 논문에서는 homology(상동성)와 similarity(유사성)의 관계를 다음과 같이 설명하고 있습니다:
1. 상동성(homology)은 두 서열이 공통의 조상에서 유래했음을 의미합니다. 반면 유사성(similarity)은 단순히 두 서열 사이에 비슷한 부분이 있음을 나타냅니다.
2. 유의미한 통계적 유사성이 관찰되면, 그 초과 유사성(excess similarity)이 두 서열이 독립적으로 생겨난 것이 아니라 공통 조상에서 유래했기 때문이라고 추론할 수 있습니다. 즉, 유의미한 유사성은 상동성을 암시합니다.
3. 하지만 상동 서열이라도 항상 유의미한 서열 유사성을 보이는 것은 아닙니다. 일부 상동 서열은 구조 유사성이나 중간 서열과의 유사성으로 상동성이 입증됩니다.
4. 반대로 유의미한 서열 유사성이 있다고 해서 반드시 상동성이 있는 것은 아닙니다. 우연히 높은 유사 점수가 나올 수 있기 때문입니다.
요약하면, 유의미한 통계적 유사성은 상동성을 강력하게 시사하지만, 유사성과 상동성은 개념적으로 구분된다고 설명하고 있습니다. 상동성 추론을 위해서는 유사성 외에 추가적인 증거가 필요할 수 있습니다.
3. (항상 그러하듯이) 블로그에 게시할 글 좀 써줘
안녕하세요. 생명공학을 전공하지 않은 분들에게 homology와 similarity에 대해 설명드리겠습니다.
생물학에서 서로 다른 생물체 사이의 유사성을 발견하는 것은 매우 중요합니다. 이러한 유사성은 두 가지 주요 개념인 homology(상동성)와 similarity(유사성)로 나뉩니다. 먼저 similarity(유사성)은 두 생물체가 외형이나 구조, 서열 등에서 비슷한 모습을 보이는 것을 말합니다. 예를 들어 개와 늑대는 외형이 서로 비슷하고, 사람과 침팬지의 DNA 서열도 상당 부분 유사합니다. 이렇게 겉보기에 닮은 점이 많다면 두 생물체 사이에 similarity가 있다고 합니다. 하지만 단순히 겉모습이 비슷하다고 해서 두 생물이 진화적으로 가까운 관계는 아닙니다. 닮은 꼴을 한 생물이라도 실제로는 전혀 다른 조상에서 비롯되었을 수 있죠. 이처럼 단순한 유사성만으로는 두 생물의 진화적 관계를 설명할 수 없습니다. 이때 필요한 개념이 바로 homology(상동성)입니다. 상동성이란 두 생물체가 같은 공통조상에서 유래했음을 의미합니다. 예를 들어 사람과 침팬지는 DNA 서열이 매우 유사할 뿐 아니라, 실제로 공통조상에서 갈라져 나온 한 계통의 생물입니다. 이처럼 공통된 기원을 가진 경우 두 생물은 상동적(homologous) 관계에 있다고 말합니다.
생물학자들은 서열 분석과 다양한 진화 연구를 통해 생물체 간의 상동성 여부를 가려냅니다. 상동성이 입증되면 두 생물이 가진 유사성의 기원을 설명할 수 있게 됩니다. 즉, 유사성은 관찰 가능한 현상이지만, 상동성은 그 유사성의 진화적 근원을 나타내는 것입니다. 때로는 우연히 닮은 듯한 similarity를 보이는 생물체들도 있지만, 엄밀한 분석을 통해 그들이 실제로는 상동적 관계가 아니라는 것을 알아낼 수 있습니다. 생물학 연구에서 이 두 가지 개념을 정확히 구분하는 것이 매우 중요한 이유입니다.
이렇게 homology와 similarity는 닮은 듯 보이지만 개념적으로 큰 차이가 있습니다. 생물체 간의 유사성을 발견하고, 그 기원이 공통조상에서 비롯된 진화적 연관성인지 아니면 단순한 우연의 일치인지를 구분하는 것이 생명과학 연구의 핵심입니다.
clovr-x
1. 논문 업로드 요약문
이 논문은 유사성 검색이 효과적이고 신뢰할 수 있는 방법이며, homology와 similarity의 개념이 종종 오해를 불러일으킨다는 것을 밝히고 있다.
1. 유사성 검색은 진화적 조상을 공유하는 시퀀스를 찾는 데 효과적이다.
2. Homology는 protein과 DNA sequences의 computational analyses에 중심이 되는 개념이다.
3. Homologous sequences는 statistically significant sequence similarity를 찾을 때 homologous가 된다.
4. Homology는 excess similarity로부터 추론되며 excess similarity는 statistical estimates로부터 인식된다.
5. 유사성 점수 행렬과 alignment overextension의 관계는 Unit 3.5에서 논의된다.
6. 대부분의 연구자들은 homology를 "percent identity"의 관점에서 설명하는 것을 더 선호한다.
2. homology(상동성)와 similarity(유사성)를 설명해줘
homology와 similarity는 다음과 같이 설명할 수 있습니다.
1. Homology
- 공통 진화적 조상을 의미하는 용어로, 두 개의 시퀀스나 구조가 독립적으로 발생하지 않고 공통 조상으로부터 발생했을 때 homology가 있다고 판단됩니다.
- Homologous sequences는 statistically significant sequence similarity를 찾을 때 homologous가 됩니다.
2. Similarity
- 두 개의 시퀀스나 구조가 유사한 정도를 나타내는 용어입니다.
- 유사성은 주로 sequence similarity나 structural similarity를 기반으로 측정됩니다.
- 유사성 검색은 두 개의 시퀀스나 구조가 얼마나 유사한지를 측정하여, 유사성이 높은 경우에는 homologous일 가능성이 높다는 것을 추론합니다.
Homology와 similarity는 생물학에서 중요한 개념으로, 유전자 분석이나 단백질 구조 분석 등에서 많이 사용됩니다. 유사성 검색은 이러한 분석에서 매우 중요한 역할을 합니다. 하지만, 유사성 검색이 항상 정확한 것은 아니며, 여러 가지 요인에 따라 결과가 달라질 수 있습니다. 따라서, 유사성 검색 결과를 해석할 때는 주의가 필요합니다.
3. 블로그에 게시할 글 좀 써줘
생명공학을 전공하지 않은 일반인이 homology와 similarity를 이해하기 어려울 수 있습니다. 이 경우에는 다음과 같은 방법으로 설명할 수 있습니다.
1. Homology와 similarity의 개념을 설명합니다.
- Homology는 공통 진화적 조상을 의미하는 용어로, 두 개의 시퀀스나 구조가 독립적으로 발생하지 않고 공통 조상으로부터 발생했을 때 homology가 있다고 판단됩니다.
- Similarity는 두 개의 시퀀스나 구조가 유사한 정도를 나타내는 용어입니다.
2. Homology와 similarity의 활용 분야를 설명합니다.
- Homology와 similarity는 생물학에서 중요한 개념으로, 유전자 분석이나 단백질 구조 분석 등에서 많이 사용됩니다.
3. 유사성 검색의 중요성을 설명합니다.
- 유사성 검색은 두 개의 시퀀스나 구조가 얼마나 유사한지를 측정하여, 유사성이 높은 경우에는 homologous일 가능성이 높다는 것을 추론합니다.
위의 방법을 참고하여, 생명공학을 전공하지 않은 일반인에게 homology와 similarity와 관련된 내용을 설명하는 글을 작성할 수 있습니다.
게시할 글을 써달라고 하니 이렇게 작성하면 된다고 하네요;;
그렇다고 합니다.
역시 claude가 잘 알아 먹고 잘 정리하는 듯 합니다.
출처: @ye._.vely618 |
댓글 없음:
댓글 쓰기