cram/bam 파일 을 fastq 파일 로 변환 합 니 다.

1528 단어 생물 정보
NCBI 가 다운로드 한 cram 파일 은 직접 사용 할 수 없습니다.먼저 bam/sam 파일 로 전환 해 야 합 니 다.홈 페이지 설명 에 따라 cramtools 를 다운로드 한 결과 유지 보수 가 없 는 것 을 발 견 했 습 니 다.오 류 는 다음 과 같 습 니 다.
$ java -jar cramtools-3.0.jar
Error: Invalid or corrupt jarfile cramtools-3.0.jar

그래서 samtools 로 직접 전환 하지만 직접 전환 하면 오류 가 발생 합 니 다.
$ samtools view -b NA12878.final.cram > NA12878.bam &
Failed to populate reference for id 0
Slice ends beyond reference end.
Unable to fetch reference #0 9996..35879
Failure to decode slice
[E::hts_close] Failed to decode sequence.
samtools: error closing "NA12878.final.cram": -1

게놈 을 참고 하고 게놈 을 참고 하려 면 cram 과 일치 해 야 합 니 다.일치 하지 않 으 면 일치 하지 않 는 곳 으로 잘못 보고 할 수 있 습 니 다.
$ samtools view -T /database/human/hg38/hg38.fa -b NA12878.final.cram > NA12878.bam &
ERROR: md5sum reference mismatch for ref 0 pos 248747869..248786716
CRAM: 720250455f7998c0d906314e9aae3434
Ref : 5e868f1c3be1506207b2097a2371c4c5
Failure to decode slice
[E::hts_close] Failed to decode sequence.
samtools: error closing "NA12878.final.cram": -1

그래서 NCBI 에서 cram 에 대응 하 는 ref 파일 을 찾 아야 합 니 다.천인 게놈 의 참고 파일 경 로 는?https://ftp.ncbi.nlm.nih.gov/1000genomes/ftp/technical/reference/GRCh38_reference_genome/,다운로드 하여 다시 실행 하면 bam 파일 이 생 성 됩 니 다.그리고 bam 파일 을 fastq 로 변환 합 니 다.
samtools fastq -1 NA12878_R1.fastq -2 NA12878_R2.fastq -0 NA12878_single.fastq -n NA12878.bam

fastq 파일 을 받 으 면 다른 버 전의 게놈 으로 다시 비교 하고 후속 분석 을 할 수 있 습 니 다.

좋은 웹페이지 즐겨찾기