python 통계sam 파일의 비교 정보

966 단어
이 프로그램은 유닛 비례 시퀀스 길이 분포 정보를 얻습니다.
from collections import Counter
Fileout = open('unique.sam','r')
Filein = open('unique_static.txt','w')
dic, arr = {}, []
for line in Fileout.readlines():
    if len(line.split()) >3 :
        arr.append(len(str(line.split('\t')[9])))
    if not line:
        break
dic = Counter(arr)for k,v in dic.iteritems():
    print>>Filein, k, ',', v

위의 프로그램은 프로세스를 처리할 수 없습니다.python의sys를 호출하여 프로세스를 실현할 수 있습니다.
samtools view *.sam | grep  "\bNH:i:1\b" | python pyproj.py
#grep  unique     ,        python  
import sys
from collections import Counter
lines = sys.stdin.readlines()
dic, arr = {}, []
for line in lines:
    if len(line.split()) >9 :#   >12    
        arr.append(len(str(line.split('\t')[9])))
dic = Counter(arr)
for k,v in dic.iteritems():
    print k, ',', v

좋은 웹페이지 즐겨찾기