Bayes Linux Galaxy에서 RNA-seq 분석

소개



여기서 Bayes Linux에는 Galaxy가 설치되어 있습니다. Galaxy에는 RNA-seq 분석 워크 플로우가 내장되어 있습니다. 여기에서는 데모 데이터를 이용하여 RNA-seq 해석을 실시하는 방법을 설명합니다.

워크플로 개요



RNA-seq로 얻은 서열로부터 유전자 발현을 정량한다. 발현량의 정량에는 두 가지 방법이 있습니다. 하나는 게놈에 배열을 매핑하는 방법이고 다른 하나는 transcriptome에 매핑하는 것입니다. Galaxy에는 후자의 방법을 채택한 워크플로우가 등록되어 있습니다. 데모 데이터는 마우스 ES 세포의 1 세포 RNA-seq의 데이터가됩니다.

데모 데이터 얻기



먼저 다음 중 하나를 읽고 Bayes Linux를 시작합니다.
  • Bayes Linux를 완성된 가상 머신 이미지에서 시작
  • Bayes Linux에서 바이오인포매틱스 분석 환경을 쉽게 재현 좋게 구축

  • 그런 다음 데모 데이터를 설치합니다. 데모 데이터는 RIKEN의 서버에서 얻을 수 있습니다. 환경에 따라 몇 시간 정도 걸립니다.

    Bayes Linux에 로그인하거나 VirtualBox에서 다음 명령을 입력합니다.
    curl -ssL https://bioinformatics.riken.jp/bayes/vm/dl.sh | bash -s
    

    이 명령은 /data에 데이터를 저장합니다.
    저장된 데이터는 다음과 같습니다.
  • adapter_primer (오염이 예상되는 PCR 프라이머 서열)
  • bowtie2_index (Ensembl transcript의 bowtie2 인덱스 파일)
  • quartz_div100_rename (RNA-seq 데이터, fastq)
  • sailfish_index (Ensembl transcript의 sailfish 인덱스 파일)
  • transcriptome_ref_fasta (Ensembl transcript, FASTA)

  • Galaxy에 데이터 배치



    데모 데이터를 Galaxy의 데이터 라이브러리에 등록합니다.
  • Galaxy에,
    ID: 아 dmin @ 가 xy. 오 rg
    암호: admin
    로 로그인하십시오
  • 상단의 Admin을 클릭합니다.
  • 왼쪽 메뉴에서 Data Library를 클릭합니다.
  • 오른쪽 상단의 Create new data library를 클릭합니다.
  • Name에 adapter_primer를 입력하고 Create를 클릭합니다.
  • 오른쪽 상단 Add datasets를 클릭합니다.
  • 다음 정보를 입력하고 Upload to library를 클릭합니다.
  • Upload: directory of files를 선택
  • File Format: fasta 선택
  • Server Directory: adapter_primer 선택
  • Copy Data into Galaxy?: Link to files without copying into Galaxy를 선택

  • transcriptome_ref_fasta의 데이터를 넣기 위해 다시 한번 3에서 7까지 작업한다. 그러나 5로 입력하는 이름은 transscriptome_ref_fasta입니다.

    7에서 입력하는 내용은 다음과 같습니다.
  • Upload options: Upload direcoty of files를 선택
  • File Format: fasta 선택
  • Server Directory: transcriptome_ref_fasta 선택
  • Copy Data into Galaxy?: Link to files without copying into Galaxy를 선택

  • quartz_div100_rename의 데이터를 넣기 위해서, 다시 한번, 3에서 7까지 작업한다. 단, 5로 입력하는 내용은, qurtz_div100_rename, 7로 입력하는 내용은 이하와 같다.
  • Upload options: Upload direcoty of files를 선택
  • File Format: fastqsanger 선택
  • Server Directory: quartz_div100_rename 선택
  • Copy Data into Galaxy?: Link to files without copying into Galaxy를 선택

  • Galaxy에서 워크플로 실행



    계속한다.

    좋은 웹페이지 즐겨찾기