장내 세균 덤불에서 건강 상태를 추측하는 GMHI를 사용해 보세요.
4818 단어 Microbiomemetagenome
장내 세균 덤불과 질병의 연관성은 각양각색의 연구에서 명확해졌다.생활 습관병부터 자기 면역 질환까지 숙주의 생리 기능에 광범위한 영향을 미친다.
최근 메타게놈 분석 등 네트워크적인 분석 기술 향상과 대규모 홀트 연구 등에 따라 개별 질환 중 장내 세균총의 시스템 구성과 다양성의 특징과 변동성을 명확히 하고, 장내 세균총의 시간 서열을 관측해어떤 사람은 질병의 전조를 장내 세균 덤불을 통해 확인할 수 있다고 암시한다.
장 세균 숲에서 숙주의 건강 상태를 조사할 때 가장 이해하기 쉬운 방법은 건강과 관련된 미생물과 질병과 관련된 미생물의 균형을 계량화하는 것이다.
본고는 비교적 건강한 그룹과 불건전한 그룹 사이의 빈도가 높은 미생물 종류와 검출 빈도가 낮은 미생물 종류의 계산 공식을 제시했다.
GMHI 정보
저자논문는 장내 세균 덤불의 종류 수준에 따른 시스템 구성 정보를 토대로 건강 상태(질병 진단 유무)를 평가할 수 있는 안정적 지표인'더 가트 마이크로비메 헬스 인덱스(GMHI)'를 개발했다.
비만, 대장선종, 크론병 등의 발현형을 포함한 분변 4천347종을 활용한 쇼트가원 게놈 서열 데이터팀은 건강 상태가 양호하고 좋지 않은 상태와 관련된 미생물 종류 2종을 확인하고 GMHI를 제작해 679개 샘플의 데이터집을 사용해 제작된 모델을 검증했다.
보급률을 기초로 하는 미물종의 특정 전략
우선 건강한 사람(healthy;H)과 건강하지 않은 사람(nonhealthy;N)으로 정의할 때 각각 H, N에 포함된 미생물 종류(m)의 보급률을 결정한다.
p_{H,m}
p_{N,m}
이어서 H, N의 보급률을 비교하기 위해- 보급률의 fold change$fm^{H,N}$
- 보급률 차이 $dm^{H,N}$
의 두 데이텀을 각각 다음과 같이 정의합니다.
\frac{{p_{H,m}}}{{p_{N,m}}}
p_{H,m}-p_{N,m}
HN에서 유효환병률의 효과는 두 기준 모두 보급률을 충족시키는 foldchange($\theta f$)와 보급률의 차이($\theta d$)의 최소 한도값에 존재하는 것으로 여겨진다.f_m^{H,N} \ge \theta_f
d_m^{H,N} \ge \theta_d
만족, N보다 높은 주파수로 검출된 미생물종'헬스-prevalent'는 $MH$로 정의합니다.f_m^{N,H} \ge \theta_f
d_m^{N,H} \ge \theta_d
한편, 상기 검출 가능한 모든 종류를 만족시키는 중 검출되는 빈도가 N보다 낮은 미생물 종류인'헬스-sscarce'는 $M이다N$으로 정의합니다.설치 방법
Github에서 스크립트를 다운로드합니다.
R 스크립트입니다. 컴파일할 필요가 없습니다.
$ git clone https://github.com/jaeyunsung/GMHI_2020
$ cd GMHI_2020/
실행 예다음 R 버전을 사용하여 수행합니다.
$ R --version
R version 4.0.4 (2021-02-15) -- "Lost Library Book"
샘플별 GMHI 계산Github에서 공개된 테스트 데이터와 스크립트를 테스트합니다.
그나저나 GMHI를 사용할 때 장내 세균 덤불의 캡처 암원 게놈 서열은 MetaPhlAn2에서 분류군의 분배가 필요하다.
먼저 경로 확인
GMHI.R
을 엽니다.MH, MN의 미생물군은 이미 정의되어 있으며,
species_relative_abundance_file
에서 MetaPhlAn2가 분배한 파일을 지정하여 계산할 수 있다.분류 그룹의 파일에서만 검색하면 16S rRNA 증폭기 리모컨 시퀀스도 가능하다.종자급으로 분류되는 경우는 드물지만...
GMHI.R
species_relative_abundance_file <- "./species_relative_abundances.csv"
MH_species_file <- "./MH_species.txt"
MN_species_file <- "./MN_species.txt"
output_file = 'GMHI_output.csv'
tidyverse가 필요하기 때문에 들어가지 않은 상태에서 R로 프로그램 라이브러리를 설치합니다.install.packages("tidyverse")
# スクリプトの実行
$ Rscript GMHI.R
각 견본의 GMHI는 다음과 같이 계산됩니다.GMHI〃0은 건강으로, GMHI〃0은 불건강으로 분류됩니다.
GMHI
Sample1
-0.631363762
Sample2
-2.345899453
Sample3
-2.705520798
Sample4
-1.217423513
Sample5
1.74314722
Sample6
-0.294056833
Sample7
-3.740412863
Sample8
0.454787851
HDL 콜레스테롤 및 GMHI
논문의 Figure 2에는 GMHI가 좋은 사람의 콜레스테롤로 알려진 HDL 콜레스테롤 표시와 상관이 있다는 보고가 있는데, 이는 github의 스크립트로 도표를 계산하고 그릴 수도 있다.
$ Rscript Fig2_TableS1_Table2.R
건강한 조합(GMHI〃0)도 건강하지 않은 조합(GMHI〃0)에서 HDL 콜레스테롤의 존재량이 현저히 많다는 것을 보여준다.
Reference
이 문제에 관하여(장내 세균 덤불에서 건강 상태를 추측하는 GMHI를 사용해 보세요.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/kohei-108/items/30b150ef97baece366ea텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)