통계적 데이터 분석-데이터 간 통계 정보

데이터 간 통계 정보

df_data.head()

변수들 간 공분산 산출

df_data.cov()

공분산이란? 2개의 확률변수의 선형관계를 나타내는 값

  • 양수의 공분산 : 2개의 변수 중 하나의 값이 상승하는 경향을 보일 때, 다른 값도 상승하는 경향의 상관관계일 경우
  • 음수의 공분산 : 2개의 변수 중 하나의 값이 상승하는 경향을 보일 때, 다른 값은 하강하는 경향의 상관관계일 경우

변수들 간 상관관계 산출

상관관계란? 두 변량 중 한 쪽이 증가함에 따라, 다른 한 쪽이 증가 혹은 감소할 때 두 변량과의 관계를 말함

  • 상관관계의 유형
  1. 명목척도 상관관계

  2. 서열척도 상관관계

  • 상관관계의 유형별 상관계수
  1. 명목척도에 대한 상관계수 : 피어슨 상관계수 등
  2. 서열척도에 대한 상관계수 : 스피어만 상관계수, 켄달 순위 상관계수 등

피어슨 상관계수 : 변인 X와 변인 Y간의 선형 관계성의 정도를 -1과 1사이의 척도 상에서 기술해주는 통계치
스피어만 상관계수 : 데이터가 서열척도인 경우 사용하는 상관계수
켄달 순위 상관계수 :

좋은 웹페이지 즐겨찾기