히스토그램 (도수 분포표)

히스토그램 (도수 분포표)



  • 문제 제기
  • 히스토그램(도수 분포표)이란 무엇일까?
  • 무엇에 사용하는 것?


  • 히스토그램의 용도
  • 데이터의 분포를 시각화하고 싶을 때에 사용한다.
  • 가시화함으로써, 각종 통계치(평균이나 분산 등)보다 상세하게 데이터의 분포를 알 수 있다.



  • 히스토그램 사양 예 (데이터는 임시 것)
  • 데이터 설명
  • 20개의 냄비에서 같은 종류의 꽃을 키웠다.
  • 피는 꽃의 수의 데이터를 취했다.
  • 꽃의 수 분포를 히스토그램으로 시각화하면 무엇을 알 수 있습니까?

  • 데이터




  • 냄비 No
    꽃의 수


    1
    10

    2
    9

    3
    12

    4
    10

    5
    10

    6
    9

    7
    7

    8
    14

    9
    11

    10
    12

    11
    18

    12
    17

    13
    15

    14
    15

    15
    16

    16
    16

    17
    15

    18
    14

    19
    13

    20
    15



  • 위 데이터에서 작성한 히스토그램
  • 가로축 : 피는 꽃의 수

  • 세로축: 피는 꽃의 수의 빈도

  • 10개의 꽃이 피는 포트는 3개, 15개의 꽃이 피는 포트는 4개 있다.



  • 파이썬에서 히스토그램을 만드는 코드 예제
      import matplotlib.pyplot as plt
      x = [10, 9, 12, 10, 10, 9, 7, 14, 11, 12, 18, 17, 15, 15, 16, 16, 15, 14, 13, 15]
      fig = plt.figure()
      ax = fig.add_subplot(1, 1, 1)
      ax.hist(x)
      fig.show()
      plt.savefig('sample_histogram.png')
    
  • 많은 히스토그램을 만들 때 등 파이썬은 유용합니다.


  • 히스토그램에서 읽을 수 있음
  • 같은 종류의 꽃을 키웠는데 히스토그램에는 두 개의 산이 존재한다.
  • 10 개 정도의 꽃이 피는 포트와 15 개 정도의 꽃이 피는 포트가 많다.

  • 왜일까?
  • 혹시, 생육 환경 등, 조건이 다른 것이 아닌가?

  • 통계량과의 차이
  • 평균값이나 표준편차로부터는 이런 의문을 가질 수 없다.
  • 시각화하는 것으로 처음으로 알 수 있다.

  • 조사 결과, 분포의 차이의 이유를 알 수 있다.
  • 예를 들어,이 20 개의 냄비는 다른 재배 조건 하에서 자랐습니다.
  • 냄비 1~10은 병아리에 두고 키웠다.
  • 냄비 1~10은 그늘에 두고 키웠다.
  • 요약



  • 히스토그램은 데이터 분포를 시각화하는 데 사용할 수 있습니다.
  • 시각화를 통해 평균 및 표준 편차보다 자세한 데이터를 알 수 있습니다.
  • 좋은 웹페이지 즐겨찾기