genpept는 무슨 파일인고?
자세한 설명은 >여기<
간단히 얘기하자면 예전에 사용하셨던 genbank 파일 포맷입니다.
이름만 바꾼건지 모 그렇습니다. ㅎㅎ
biopython에서도 genpept가 아니라 genbank를 사용해서 접근하면 잘 parsing됩니다.
import os,sys
from Bio import SeqIO
try:
inFile = sys.argv[1]
except:
print ''
exit(1)
for seq_record in SeqIO.parse(inFile, "genbank"):
print (seq_record.id)
print (seq_record.name)
seq_anno = seq_record.annotations
print (seq_anno['accessions'])
print (seq_record.seq)
이렇게 코드 짜서 사용하시면 됩니다. annotations안의 정보는 dict형식이라서 dict사용하는방식으로 확인 할 수 있습니다.
간만에 gp파일 다운받아서 정리하는 김에 biopython의 genbank 사용법 정리해보았습니다. :)
크.. WSL이 있으니 참 편하긴 합니다.
출처: @sana_twice.09 |