Biopyton에서 ClustalW2를 사용하여 계통 나무 만들기

Biopyton에서 ClustalW2를 사용하여 계통 나무를 만드는 방법에 대해 자신을 위해 메모.
라고 해도 내용은 대부분Biopython Tutorial and Cookbook에 쓰여져 있는 것을 일본어로 번역했을 뿐.

ClustalW2 설치



먼저 ClustalW2를 다운로드합니다. Mac의 경우 .dmg를 마운트하여 얻은 bin 파일을/bin 아래에 넣습니다.



계통수를 만들고 싶은 주식을 준비



그런 다음 ClustalW2를 사용하는 균주의 데이터를 준비합니다. 이번에는 메탈리듐 (Metarhizium)의 계통수를 Ribosome biogenesis protein YTM1을 바탕으로 작성한다. 파일은 UniProt에서 다운로드했습니다.
사용한 균주는 다음과 같다.
  • Metarhizium acridum (strain CQMa 102)
  • Metarhizium anisopliae BRIP 53293
  • Metarhizium guizhouense ARSEF 977
  • Metarhizium album ARSEF 1941
  • Metarhizium robertsii
  • Metarhizium rileyi RCEF 4871

  • Basket에 추가 한 후 FASTA 형식으로 다운로드합니다. 이번에는 uniprot-yourlist.fasta라는 이름으로 저장했습니다.

    Biopython에서 ClustalW2 실행



    준비된 균주의 데이터에 Biopython에서 ClustalW2를 적용합니다.
    from Bio.Align.Applications import ClustalwCommandline
    
    clustalw_cline = ClustalwCommandline("clustalw2", infile="uniprot-yourlist.fasta")
    stdout, stderr = clustalw_cline()
    

    그런 다음 uniprot-yourlist.aln과 uniprot-yourlist.dnd라는 두 개의 파일이 생성됩니다. 따라서 Biopython의 Phylo 모듈을 사용하여 dnd 파일을 읽고 계통 나무를 그립니다.
    from Bio import Phylo
    
    tree = Phylo.read("uniprot-yourlist.dnd", "newick")
    Phylo.draw(tree)
    



    draw 함수 대신 draw_ascii 함수를 사용하면 계통수를 아스키 아트로 출력합니다.
      _ tr|E9E7T1|E9E7T1_METAQ
     |
     | , tr|A0A0D9P3B0|A0A0D9P3B0_METAN
     |,|
    _||| tr|A0A0A1USL4|A0A0A1USL4_9HYPO
     ||
     || tr|A0A0B4H3C6|A0A0B4H3C6_9HYPO
     |
     |      ______________________________________ tr|A0A0B2X7N3|A0A0B2X7N3_9HYPO
     |_____|
           |______________ tr|A0A167BRY5|A0A167BRY5_9HYPO
    
    Exited with code=0 in 1.1
    

    참고문헌



    Peter J. A. Cock, Tiago Antao, Jeffrey T. Chang, Brad A. Chapman, Cymon J. Cox, Andrew Dalke, Iddo Friedberg, Thomas Hamelryck, Frank Kauff, Bartek Wilczynski, Michiel J. L. de Hoon: “Biopython: freely availabley computational molecular biology and bioinformatics”. Bioinformatics 25 (11), 1422–1423 (2009). doi:10.1093/bioinformatics/btp163,

    Eric Talevich, Brandon M. Invergo, Peter J.A. Cock, Brad A. Chapman: “Bio.Phylo: A unified toolkit for processing, analyzing and visualizing phylogenetic trees in Biopython”. BMC Bioinformatics 13: 209 (2012). 1471-2105-13-209

    좋은 웹페이지 즐겨찾기