python 분산 검사 의 의미 및 용법

1785 단어 python분산 검사
설명 하 다.
1.분산 검 사 는 두 개 또는 여러 개의 변수 데 이 터 를 비교 하 는 샘플 로 그들의 차 이 를 간단하게 랜 덤 으로 확인 하거나 과정 간 의 현저 한 통계 차이 로 인해 발생 한 것 이다.
2.독립 변수 X 는 분 산 된 데이터 이 고 독립 변수 Y 는 연속 데이터(x 는 여러 가지 유형 일 수 있 음)이다.만약 에 데이터 의 정상 적 인 분포 가 있 으 면 방 차 는 차례 가 있어 야 한다.
실례

import pandas as pd
import numpy as np
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
data = pd.DataFrame([[1, 1, 32],
[1, 2, 35],
[1, 3, 35.5],
[1, 4, 38.5],
[2, 1, 33.5],
[2, 2, 36.5],
[2, 3, 38],
[2, 4, 39.5],
[3, 1, 36],
[3, 2, 37.5],
[3, 3, 39.5],
[3, 4, 43]],
columns=['x1', 'x2', 'y'])
#         ,          
model = ols('y~C(x1) + C(x2)', data=data[['x1', 'x2', 'y']]).fit()
anovat = anova_lm(model)
anovat
지식 포인트 보충:
분산 분석 은 한 가지 또는 여러 가지 요소 가 그 상태 변화 에 있 을 때 그 요소 의 수준 이나 상호작용 이 실험 기준 에 현저 한 영향 을 미 칠 수 있 는 지 를 추정 할 수 있다.주로 단일 요소 분산 분석,다 중 요소 무 중복 분산 분석 과 다 중 요소 중복 분산 분석 으로 나 뉜 다.
수리 통계 수업 후 문 제 를 풀 었 는데 분산 분석 계산 이 비교적 번 거 로 운 것 을 발견 하고 Python 으로 바 꾸 어 실현 하려 고 합 니 다.그러나 대부분의 튜 토리 얼 이 매개 변수 에 대한 설명 을 잘 모 르 고 기록 한 것 으로 나 타 났 다.
주로 사용 되 는 라 이브 러 리 는 pandas 와 statsmodels 입 니 다.간단 한 절 차 는 먼저 pandas 라 이브 러 리 의 DataFrame 데이터 구조 로 입력 데이터 형식 을 구성 하 는 것 이다.그리고 statsmodels 라 이브 러 리 의 ols 함수 로 최소 2 곱 하기 선형 회귀 모델 을 얻 습 니 다.마지막 으로 statsmodels 라 이브 러 리 의 anovalm 함수 분산 분석.

import pandas as pd
import numpy as np
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
python 분산 검사 의 의미 와 용법 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 python 분산 검사 가 무슨 뜻 인지 에 관 한 내용 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 조회 하 시기 바 랍 니 다.앞으로 많은 응원 바 랍 니 다!

좋은 웹페이지 즐겨찾기