사용하는 소프트웨어

RStudio 사용합니다.
데이터가 있는 디렉토리를 작업 디렉토리로 설정하십시오.
탭의 Session > Set Working Directory > Choose Directory에서 설정할 수 있습니다.

아래 준비

데이터를 처리하기 전에 아래 준비가 필요합니다.
읽고 처리할 대상 파일을 보여줄 필요가 있습니다.

↓이런 느낌

열 이름
내용

SlideNumber
어레이 데이터 일련 번호

이름
각 어레이 데이터의 통칭. 알기 쉬운 이름으로.

FileName
어레이 데이터가 포함된 파일의 이름

Target
어레이 데이터의 그룹화. 3군 이상이라도 가능

Excel 등으로 만들어 Targets.txt로 탭으로 구분하여 저장합시다.
(작업 디렉토리에서)

패키지 인스코

데이터를 읽거나 정규화하는 데 사용하는 Limma 패키지를 BiocManager에서 설치합니다.

if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")

BiocManager::install("limma")

설치한 Limma 패키지를 로드합니다.

library(limma)

데이터 로드

원시 txt 파일을 사용합니다.

↓Excel에서 열면 이런 느낌의 녀석

방금 만든 대상을 지정하는 파일을 사용하여 데이터를 읽습니다.

targets <- readTargets("Targets.txt", row.names="Name")
RG <- read.maimages(targets, source="agilent",
green.only=TRUE,other.columns="gIsWellAboveBG")

데이터 정규화

배경을 보정하고 정규화합니다.

boxplot(RG$E,ylim=c(0,300))
RGcor <- backgroundCorrect(RG, method="normexp")
boxplot(RGcor$E,ylim=c(0,300))
RGnorm <- normalizeBetweenArrays(RGcor, method="quantile")

※정규화
마이크로 어레이에서는 어레이 데이터마다 전체적인 신호 강도에 차이가 나온다.
그렇다면 어레이간의 비교를 할 수 없기 때문에, 시그널 강도를 맞추려고 하는 처리.
다양한 방법을 이해하려면이 슬라이드가 도움이되었습니다.
htps //w w. s에서 멋지다. 네 t / 안치 p ぁ s 치 cs / r 마자 치온 - f- 미 c 로라 y

백그라운드 보정의 method="normexp"와 정규화의 method="quantile"에서 보면 RMA법에 상당하는 처리를 하고 있는 것 같다.

유전자 필터링

신호 강도가 배경 이하인 프로브, Gene Symbol(Gapdh와 같은 유전자의 통칭)이 없는 프로브는 제외한다.

Control <- RGnorm$genes$ControlType==1L
NoSymbol <- is.na(RGnorm$genes$GeneName)
IsExpr <- rowSums(RGnorm$other$gIsWellAboveBG > 0) >= 1
RGfilt <- RGnorm[!Control & !NoSymbol & IsExpr, ]

각 어레이 데이터를 그룹에 할당

처음 사용한 Targets.txt의 Target 열을 사용하여 각 어레이 데이터를 그룹으로 나눕니다.

lev <- c("WT","KO")
f <- factor(targets$Target,levels=lev)
design <- model.matrix(~0+f)
colnames(design) <- lev
fit <- lmFit(RGfilt,design)

1행째는 설정한 군에 따라 재기록해 주십시오.

분석 및 플롯

contrast.matrix <- makeContrasts(KO-WT,levels=design)
fit2 <- contrasts.fit(fit, contrast.matrix)
plotMD(fit2)

1행째의 「KO-WT」의 곳이 키모입니다.

이 단계까지 각 그룹의 신호가 log2 변환되어 있으므로, 그 차이에 의해 어레이간의 비교를 실시합니다. 그 뺄셈을 여기서 하고 있는 것입니다.
다군의 경우에는 「(A-B)-(C-D)」등으로 할 수도 있습니다.

실험 디자인에 따라 다시 작성하여 사용하십시오.

나오는 산포도는 가로축이 발현량의 평균, 세로축이 발현 변화량이 되어 있습니다.
특정 유전자를 플롯하는 것은 또한 이번에 씁니다.

보충

각 그룹이 둘 이상의 데이터를 포함하는 경우fit2 <- eBayes(fit2)로 하는 것으로 베이즈 통계적으로 p값 등을 구할 수 있는 것 같습니다.

끝

끝입니다.
바이오인포적인 것에 접하는 것은 처음이었기 때문에 실수가 있을지도 모릅니다.
실수라든가 이러한 편이 좋다든가 있으면, 가르쳐 주시면 매우 매우 고맙습니다.
앞으로 조금씩 패스웨이 해석 등도 쓸까라고 생각합니다.

Reference

이 문제에 관하여(Agilent MicroArray(1색법) 해석 비망록 1), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/Aiuthss/items/215b18b8ae34c9892458

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다