3가지 대표치

3619 단어 통계학

기본 통계량



기본 통계량은 표본의 분포 상태와 특징을 대표적으로 나타내는 수치입니다. 요약 통계량 및 설명 통계량이라고도 합니다.
평균치・중앙치・최빈치의 3개의 대표치나 범위, 분산, 표준편차, 사분위점, 왜도, 첨도등이 해당합니다.

3가지 대표치


  • 평균값(mean) ▶︎ 모든 데이터를 더하여 그 개수로 나눈 값
  • 중앙값 (median) ▶︎데이터를 작은 쪽에서 큰 쪽으로 정렬했을 때 중앙에 위치하는 값
  • 최빈값(mode) ▶︎데이터 중 가장 많이 존재하는 값

  • 평균값과 중앙값


  • 평균값 ▶︎ 모든 데이터를 사용하기 위해 정보를 유효하게 사용할 수 있다 · 이상치의 영향을 강하게 받는다
  • 중앙값 ▶︎ 많은 데이터가 사용되지 않은 상태로 유지됨 · 이상치의 영향을받지 않음 (저항성)

  • 세 가지 대표 값 분포



    데이터가 단봉성 분포를 할 때 평균값, 중앙값, 최빈값의 대소관계를 정리하면 다음과 같이 됩니다.


    이미지 인용문 : 그래프와 산술 평균, 중앙값, 최빈값 : 통계 - 그 기본 및 응용 -

    ① 오른쪽에 밑단이 긴 분포에서는 "평균값> 중앙값> 최빈값"
    ②좌우 대칭 분포에서는 「평균값=중앙값=최빈값」
    ③ 왼쪽에 옷자락이 긴 분포에서는 「평균치<중앙치<최빈치」가 됩니다.

    ※오른쪽으로 왜곡된 분포는 「소득・저축・체중」, 좌우 대칭인 분포는 「신장・자연 현상・사회 현상」, 왼쪽으로 왜곡된 분포는 「간단한 테스트의 채점 결과」등을 구체예로서 들 수 있다 됩니다.

    평균값 유형



    평균값은 산술 평균(상가 평균), 기하 평균(상승 평균), 조화 평균, 가중 평균, 트림 평균, 이동 평균 등의 다양한 유형의 평균을 포함합니다.

    산술평균(상가평균)


    \bar{x}=\frac{x_1+x_2+…+x_n}{n}=\frac{1}{n}\sum_{i=1}^{n}x_i
    

    기하 평균(시너지 평균)



    기하 평균은 n개의 데이터를 곱하여 n승근을 취한 값으로, 시계열 데이터의 성장률과 같은 지수함수적으로 증감하는 평균으로 이용됩니다.
    x_g=\sqrt[n]{x_1 \times x_2 \times …\times x_n}
    

    조화 평균



    조화 평균이란, 「역수의 산술 평균의 역수」이며, 속도의 평균이라고 하는 반비례적으로 증감하는 평균으로서 이용됩니다.
    x_h=\frac{n}{\sum_{i=1}^{n} \frac{1}{x_i}}
    

    가중평균



    가중 평균은 데이터의 각 중요도에 따라 가중치를 곱하고 평균하는 방법입니다.
    (예. 슈트의 종류별 가격과 판매수를 바탕으로 전체 슈트 1착당 평균 가격을 구한다)
    x_w=\frac{w_1x_1+w_2x_2+…+w_nx_n}{w_1+w_2+…+w_n}=\frac{\sum_{i=1}^{n}w_ix_i}{\sum_{i=1}^{n}w_i}
    

    트림 평균



    트림 평균이란, 데이터를 작은 쪽으로부터 차례로 늘어놓고, 작은 쪽으로부터와 큰 쪽으로부터의 양단의 5%, 10%, 20%등의 지정된 부분을 삭제해, 나머지의 산술 평균을 구하는 방법 입니다. 트림 평균으로 지정된 부분을 삭제하여 이상값의 영향을 제거할 수 있습니다. 깎는 평균, 조정 평균이라고도합니다.

    이동 평균



    이동 평균이란 주가, 기온, 매출 등의 시계열 데이터에 대해 전후의 데이터의 평균을 구함으로써 우연 변동이나 계절 변동을 제거하고, 그 데이터의 장기간에 걸친 변동의 경향을 알기 위해 사용하는 방법입니다. .


    이미지 인용문 : 이동 평균 계산 방법 | 블로그 | 통계 웹

    이동 평균의 계산은 홀수 항이 간단하며, 3항 이동 평균과 5항 이동 평균의 정의는 다음과 같습니다.
    3項移動平均=\frac{x_{t-1}+x_t+x_{t+1}}{3}
    
    5項移動平均=\frac{x_{t-2}+x_{t-1}+x_t+x_{t+1}+x_{t+2}}{5}
    

    짝수항인 분기 데이터의 경우 먼저 4항 이동 평균을 2개 구하고 다시 그 산술 평균을 구하는 방법을 채택합니다. 이것을 이동 평균의 중심화라고 하며 중심화 4항 이동 평균을 정의하면 다음과 같이 됩니다.
    中心化4項移動平均=\frac{\frac{x_{t-2}+x_{t-1}+x_t+x_{t+1}}{4}+\frac{x_{t-1}+x_t+x_{t+1}+x_{t+2}}{4}}{2}
    
    =\frac{x_{t-2}+2x_{t-1}+2x_t+2x_{t+1}+x_{t+2}}{8}
    
    =\frac{0.5x_{t-2}+x_{t-1}+x_t+x_{t+1}+0.5x_{t+2}}{4}
    

    참고문헌


  • 예제로 배우는 초보로부터의 통계학 제2판
  • 좋은 웹페이지 즐겨찾기