갤럭시 트레인 추가 "Introduction to Genomics and 갤럭시"
3867 단어 Galaxy
"정말 이해하기 어렵다."
"레슨처럼 되지 않을 거야!"
이렇게 될 것 같아서 추가 설명.
자습서의 정의
강좌에서 용어의 정의를 총결해 보자.
유전자 그룹: 생물 고유의 모든 DNA의 집합.
염색체: 생물 중 DNA의 최대 단위.인류는 두 쌍의 23개의 염색체를 가지고 있다.
트렌트: 염색체는 두 개의 사슬로 이'쇠사슬'을 가리킨다.하나는 법화 자물쇠이고, 다른 하나는 역방향 체인이다.
유전자: 이 강좌에서 염색체에 있는 생물이 사용하는 분자의 DNA 부분을 가리킨다.
참고 유전자 그룹: 철저하게 연구하고 조사한 단일 개체의 유전자 그룹으로 DNA의 대부분이 정확하게 밝혀진 유전자 그룹을 말한다.이것은 참고한 유전자 그룹이다.참고 유전자 그룹은 이 생물을 연구하는 연구원들이 유전자 조도의 형식으로 공유한 것이다.참고 유전자는 정기적으로 갱신된다.
서열: AC TG(단일 뉴클레오티드)는 각각 존재하는 정확한 위치를 포함하는 게놈에 있는 DNA를 말한다.
유전자조/유전자유전자유전자: 서열(배열)은 어디에 어떤 DNA가 있는지 알 수 있지만 이 DNA의 기능은 모른다.유전자 변형은 유전자, 추진기, 세인트 로미아 등 특정 유전자 그룹의 영역이 어디에 있는지 보여주는 추가 정보다.
게놈 범위(genomic interval): 이 강좌에서 게놈 범위는 염색체의 일부분을 가리킨다.예를 들어 유전자와 염색체도 유전자 그룹의 범위에 속한다.
준분자: 분자를 만들 수 있는 DNA 부분을 가리킨다.
먼저 염색체 두 개의 체인에 존재하는 유전자의 몇 퍼센트가 두 개의 체인이 겹쳐 있는 것을 조사한 다음에 분석을 통해 exson 부분의 데이터에서만 exson의 몇 퍼센트가 두 개의 체인이 겹쳐 있는 것을 도출했다.
위의 그림에서 보듯이 붉은 사선 구역처럼 겹치는 엑슨은 도대체 어떤 비율로 존재하는지 최종 조사를 진행하고 있다.
본 강좌의 대략적인 절차로 삼다
데이터 가져오기(UCMC Main 도구 사용)
↓
가져온 데이터를 전방향 및 역방향 체인으로 분할하는 데이터 세트(Filter 도구를 사용하여 2회)
↓
염색체 두 체인 사이의 유전체 중첩 검사하기(Intersect 도구 2회 사용)
↓
전방향 체인과 반방향 체인이 중첩된 유전자의 데이터 집합을 하나로 정리합니다. (Concenter datasets 도구를 사용합니다.)
↓
염색체 브라우저로 데이터 보이기
↓
워크플로우 작성
↓
새 히스토리 작성 및 현재 히스토리에서 데이터 이동
↓
준분자의 데이터를 얻다
↓
작성된 워크플로우 실행
그렇습니다.
최종적으로 아래 그림과 같이 28개의 Exson 데이터가 표시되면 튜토리얼이 완성됩니다.
Intersect 도구를 두 번 실행하는 이유
반복 부분을 검사할 때 Intersect 도구를 두 번 사용하면 다음 그림과 같이 반복 부분이 나타납니다.(갤럭시 도구를 클릭하면 비슷한 그림이 나온다)
위의 그림에서 보듯이 이 도구의 이번 설정에서 두 번째 데이터 집합이 중복되는 첫 번째 데이터 집합을 추출했다.
따라서 첫 번째 인터셉트 도구는 역체인의 유전자와 중첩된 전방 체인의 유전자를 추출하고, 두 번째 인터셉트 도구는 전방 체인의 유전자와 중첩된 역체인의 유전자를 추출한다.
Introduction to Genomics and 갤럭시의 추가 설명입니다.
또 다른 모르는 점이 있으면 댓글을 남기거나 참가갤럭시 워크숍해 주세요.
링크 등
Reference
이 문제에 관하여(갤럭시 트레인 추가 "Introduction to Genomics and 갤럭시"), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/Atsushi_A/items/a3b9fe5ea9c573f411d5텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)