python 분산 검사 의 의미 및 용법
1.분산 검 사 는 두 개 또는 여러 개의 변수 데 이 터 를 비교 하 는 샘플 로 그들의 차 이 를 간단하게 랜 덤 으로 확인 하거나 과정 간 의 현저 한 통계 차이 로 인해 발생 한 것 이다.
2.독립 변수 X 는 분 산 된 데이터 이 고 독립 변수 Y 는 연속 데이터(x 는 여러 가지 유형 일 수 있 음)이다.만약 에 데이터 의 정상 적 인 분포 가 있 으 면 방 차 는 차례 가 있어 야 한다.
실례
import pandas as pd
import numpy as np
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
data = pd.DataFrame([[1, 1, 32],
[1, 2, 35],
[1, 3, 35.5],
[1, 4, 38.5],
[2, 1, 33.5],
[2, 2, 36.5],
[2, 3, 38],
[2, 4, 39.5],
[3, 1, 36],
[3, 2, 37.5],
[3, 3, 39.5],
[3, 4, 43]],
columns=['x1', 'x2', 'y'])
# ,
model = ols('y~C(x1) + C(x2)', data=data[['x1', 'x2', 'y']]).fit()
anovat = anova_lm(model)
anovat
지식 포인트 보충:분산 분석 은 한 가지 또는 여러 가지 요소 가 그 상태 변화 에 있 을 때 그 요소 의 수준 이나 상호작용 이 실험 기준 에 현저 한 영향 을 미 칠 수 있 는 지 를 추정 할 수 있다.주로 단일 요소 분산 분석,다 중 요소 무 중복 분산 분석 과 다 중 요소 중복 분산 분석 으로 나 뉜 다.
수리 통계 수업 후 문 제 를 풀 었 는데 분산 분석 계산 이 비교적 번 거 로 운 것 을 발견 하고 Python 으로 바 꾸 어 실현 하려 고 합 니 다.그러나 대부분의 튜 토리 얼 이 매개 변수 에 대한 설명 을 잘 모 르 고 기록 한 것 으로 나 타 났 다.
주로 사용 되 는 라 이브 러 리 는 pandas 와 statsmodels 입 니 다.간단 한 절 차 는 먼저 pandas 라 이브 러 리 의 DataFrame 데이터 구조 로 입력 데이터 형식 을 구성 하 는 것 이다.그리고 statsmodels 라 이브 러 리 의 ols 함수 로 최소 2 곱 하기 선형 회귀 모델 을 얻 습 니 다.마지막 으로 statsmodels 라 이브 러 리 의 anovalm 함수 분산 분석.
import pandas as pd
import numpy as np
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
python 분산 검사 의 의미 와 용법 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 python 분산 검사 가 무슨 뜻 인지 에 관 한 내용 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 조회 하 시기 바 랍 니 다.앞으로 많은 응원 바 랍 니 다!
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
로마 숫자를 정수로 또는 그 반대로 변환그 중 하나는 로마 숫자를 정수로 변환하는 함수를 만드는 것이었고 두 번째는 그 반대를 수행하는 함수를 만드는 것이었습니다. 문자만 포함합니다'I', 'V', 'X', 'L', 'C', 'D', 'M' ; 문자열이 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.