실제 업무 장면 에서 유래 한 데이터 집합 실례 를 통 해 서로 다른 시각 화 방안 을 비교 하고 시각 화 목적, 데이터 집합 특징 에 따라 도표 유형의 일반적인 방법 을 선택한다.도표 비교 부분 은 흔히 볼 수 있 고 헷 갈 리 기 쉬 운 도표 유형 을 선택 하여 비교 하고 '시각 화 목표 → 데이터 세트 준비 → 도표 선택 과 대비 → 경험 총화' 방식 으로 글 을 짓 는 다.
막대 그래프 vs 막대 그래프
공통점: 막대 그래프 와 막대 그래프 의 데이터 구 조 는 똑 같 고 모두 '하나의 분류 필드 + 하나의 연속 수치 필드' 로 구성 된다. 데이터 의 기록 수가 12 개 보다 크 지 않 고 분류 필드 의 문자 길이 가 5 보다 작 을 때 막대 그래프 와 막대 그래프 는 교환 할 수 있다. 차이 점: 막대 그래프: 필드 를 분류 하면 마침 '시간 서열' 입 니 다. 이때 막대 그래프 를 사용 하 는 것 을 권장 합 니 다. 막대 그래프 는 데이터 가 시간 에 따라 변화 하 는 상황 을 잘 나 타 낼 수 있 기 때 문 입 니 다. 막대 그래프: 분류 필드 의 문자 길이 가 비교적 길 고 데이터 의 기록 수가 12 보다 많 으 면 막대 그래프 를 사용 하 는 것 을 권장 합 니 다.한편, 비스듬히 설 치 된 문 자 는 사용자 가 읽 는 습관 과 어 긋 나 는 동시에 페이지 공간 을 차지 하여 시각 화 된 도표 의 미 적 감각 에 영향 을 미친다. 막대 그래프 VS 직사 도
총결산
공통점: 기둥 모양 그림 과 직사 도 의 데이터 구 조 는 똑 같 고 모두 '하나의 분류 / 그룹 필드 + 하나의 연속 수치 필드' 로 구성 된다. 모두 기둥 모양 으로 구성 되 어 있다. 차이 점: 분석 목적 과 적용 장면 이 다르다.'기둥 모양 그림' 은 주로 데이터 의 크기 를 비교 하고 '직사 도' 는 데이터 의 분 포 를 보 여 주 는 데 사용 된다. X 축 에 비 친 데이터 속성 이 다르다.막대 그래프 에서 X 축의 변 수 는 서로 다른 휴대 전화 브랜드, 점포 또는 사이트 가 상품 을 판매 하 는 분류 데이터 이다.직사 각도 에서 X 축 은 연속 적 인 조별 구간 으로 이 구간 들 은 보통 숫자 로 나타 나 며, 일반적으로 조 거 리 는 동일 하 다. 예 를 들 어 판매 상품 의 가격 구간 을 '0 - 10 원, 10 - 20 원...' 으로 나 누 는 것 이다. 너 비 는 의미 가 다르다.기둥 모양 의 그림 에서 기둥 의 너 비 는 실제 적 인 의미 가 없고 보통 미관 과 정연 을 위해 너비 가 같 아야 한다.직사 도 에서 기둥 의 너 비 는 구간 의 길이 (즉, 그룹 거리) 를 대표 하고 구간 에 따라 기둥 의 너 비 는 다 를 수 있 지만 그 너 비 는 원칙적으로 그룹 거리의 전체 배 여야 한다. 데이터 크기 를 나타 내 는 방식 이 다르다.기둥 모양 그림 은 기둥 모양 의 높이 를 통 해 데이터 의 크기 를 나타 내 고 기둥 사이 에 간격 이 있 습 니 다.직사 도 는 높이 (주파수 직사 도) 나 면적 (주파수 직사 도) 을 통 해 데이터 의 크기 를 나타 내 고 기둥 간 에 밀접 하 게 연결 되 어 간격 이 없다. 중첩 막대 그래프 VS 백분율 중첩 막대 그래프
공통점: 기둥 모양 그림 과 백분율 로 기둥 모양 그림 을 쌓 으 면 분류 데이터 의 구성 대비 나 시간 에 따라 변화 하 는 추 세 를 보 여 주 는 데 적합 하 다. X 축 에 비 친 데이터 가 시간 서열 일 때 이 때 는 중첩 면적 도 or 백분율 중첩 면적 도 로 대체 할 수 있다. 차이 점: 중첩 기둥 모양 도: 각 구성 부분의 수치 차 이 를 비교 할 수 있 을 뿐만 아니 라 각 그룹의 데이터 의 전체적인 차 이 를 관찰 할 수 있다. 백분율 중첩 주 상도: 전체 중의 각 구성 부분의 비례 차이 만 비교 할 수 있 고 서로 다른 전체적인 차 이 를 비교 할 수 없다. 접선 도 VS 면적 도
공통점: 접선 도와 면적 도 는 데이터 가 시간 에 따라 변화 하 는 추 세 를 보 여 주 므 로 X 축 에 비 친 데이터 유형 은 보통 '시간 / 날짜' 이다. 두 사람 은 모두 하나 또는 여러 개의 변수 와 시간의 관 계 를 나 타 낼 수 있다. 이런 관 계 는 주기 적 변화, 계절 적 변화, 이상 변동 등 을 포함한다. 대부분의 경우 접선 도와 면적 도 는 교환 할 수 있다. 차이 점: 접선 도: 데이터 점 의 세로 좌 표를 통 해 수치의 크기 를 나타 내 고 보통 데이터 의 추 세 를 나타 내 는 데 만 사용 된다. 면적 도: 면적 을 통 해 수치의 크기 를 나타 내 고 '면적 도' 는 접선 도 를 교체 할 수 있 을 뿐만 아니 라 전체 와 그 구성 부분 이 시간 에 따라 변화 하 는 추 세 를 나 타 낼 수 있다. 주의 점: 면적 도 를 사용 하여 여러 계열 의 추 세 를 나 타 낼 때 서로 다른 계열 을 대표 하 는 면적 블록 색상 에 투명 도 를 설정 해 야 한다. 투명 도 는 서로 다른 계열 간 의 커버 를 줄 이 고 서로 다른 서열 간 의 중첩 관계 와 더 많은 정 보 를 볼 수 있 도록 도와 준다. 한 도표 에서 시리즈 의 가치 가 너무 많 을 때 접 는 선 도 는 면적 도 보다 더욱 직관 적 이다. 시리즈 의 커버 와 중첩 을 줄 이 고 각 시리즈 의 추세 변 화 를 더욱 뚜렷하게 볼 수 있 기 때문이다. 중첩 면적 도 VS 백분율 중첩 면적 도
공통점: 중첩 면적 도와 백분율 중첩 면적 도 는 X 축 에 비 친 것 이 모두 [시간 서열] 이다. 두 가 지 는 모두 각 구성 부분 을 보 여줄 수 있 고 시간의 변화 추세 에 따라 '중첩 면적 도' 는 구성 부분의 실제 값 이 시간 에 따라 변화 하 는 추세 일 뿐 '백분율 중첩 면적 도' 는 구성 부분의 비례 가 시간 에 따라 변화 하 는 추 세 를 보 여 준다. 차이 점: 중첩 면적 도: 각 구성 부분 이 시간 에 따라 변화 하 는 추 세 를 보 여줄 수 있 을 뿐만 아니 라 전체적인 시간 에 따라 변화 하 는 추 세 를 보 여줄 수 있다. 백분율 중첩 면적 도: 각 구성 부분 이 전체 에서 차지 하 는 비례 가 시간의 변화 에 따라 전체 시간 에 따라 변화 하 는 추 세 를 관찰 할 수 없다.그 밖 에 그 어떠한 시간 노드 에서 세로 로 자 르 면 각 부분 이 차지 하 는 비례 의 합 은 반드시 100% 이 어야 한다. 즉, 반드시 이 노드 의 전체 와 같 아야 한다. 중첩 면적 도 VS 중첩 막대 그래프
공통점: 중첩 면적 도 는 기둥 모양 도 를 쌓 는 데이터 세트 형식 과 유사 하 며 모두 '하나의 분류 필드 + 여러 개의 연속 수치 필드' 로 구성 되 고 여러 개의 연속 수치 필드 는 하나의 전체적인 구성 부분 이다. 둘 다 특정한 노드 의 전체 수치 와 각 구성 부분의 구체 적 인 수 치 를 관찰 할 수 있 고 모두 데이터 대비 기능 이 있다. 차이 점: 중첩 면적 도: 중첩 면적 도의 분류 필드 는 보통 시간 서열 이다.전체 가 시간 에 따라 변화 하 는 추 세 를 분석 해 야 할 뿐만 아니 라 전체적인 각 구성 항목 이 시간 에 따라 변화 하 는 상황 도 알 아야 할 때 [중첩 면적 도] 를 사용 해 야 한다.그 목적 을 통 해 알 수 있 듯 이 면적 도 를 쌓 는 분류 필드 (즉 시간 서열) 는 시간의 선후 순서에 따라 배열 한 것 이다. 중첩 막대 그래프: 중첩 막대 그래프 의 분류 필드 는 일반적으로 비 시간 유형의 분류 데이터 입 니 다.서로 다른 전체적인 데이터 크기 를 비교 해 야 할 뿐만 아니 라 전체 구성 항목 의 데이터 가 큰 시간 을 관찰 하려 면 [중첩 막대 그래프] 를 사용 해 야 한다.만약 에 전체적인 구성 항목 이 너무 많 으 면 중점 을 강조 하기 위해 구성 항목 을 다시 분류 하고 TOP 5 의 분 류 를 보 여 주 며 나머지 는 '기타' 로 분류 해 야 한다. 산 점도 VS 기포 도
공통점: 산 점도 와 기포 도 는 모두 데이터 분포 상황 을 보 여 주 는 도형 이다. 산 점도 와 기포 도 는 모두 두 필드 를 x, y 축의 위치 에 투사 하고 (x, y) 의 수치 로 원점 이나 기포 가 직각 좌표계 에 있 는 위 치 를 확인한다. 차이 점: 산 점도: 보통 2 차원 데이터 (x,y)
의 분 포 를 보 여 주 는 데 사용 되 고 2 차원 데이터 의 두 변수 x, y 간 의 상관 성, 예 를 들 어 키 와 체중 간 의 상관 관 계 를 연구 하 는 데 중심 을 둔다.산 점도 에서 여러 조 의 데이터 시리즈 의 대 비 를 보 여줄 수 있다. 예 를 들 어 남성의 신장 체중 과 여성의 신장 체중 분포 규칙 에 대한 대조 도 볼 수 있다. 기포 도: 보통 3 차원 데이터 (x, y, z) 의 분포 상황 을 보 여 주 는 데 사용 되 는데 산 점도 에 비해 기포 도 는 한 차원 의 데 이 터 를 추가 하여 보 여 주 었 고 그 수 치 를 기포 의 크기 에 투사 했다.기포 도 는 여러 조 의 데이터 시리즈 의 분 포 를 보 여 주 며 서로 다른 계열 의 분포 규칙 과 차 이 를 발견 할 수 있다. 주의 점: 일반적으로 산 점 도 는 주로 데이터 세트 의 분포 규칙 과 상관 성 을 연구 하 는 데 사용 되 고 모든 데이터 점 의 구체 적 인 수 치 를 보 는 데 중심 을 두 지 않 는 다.데이터 세트 의 수량 이 너무 많 을 때 모든 데이터 점 을 산 점도 에 보 여 주 는 것 이 적합 하지 않다. 이때 전체 에 대해
표 시 를 해 야 한다. 보통 층 을 나 누 어 표본 을 추출 하 는 방법 으로 진행 하지만 층 을 나 누 어 표본 을 추출 하 는 근거 와 영향 요 소 는 구체 적 인 업무 장면 에 따라 정 해 야 한다. 산 점도 에 비해 기포 도 는 데이터 용량 이 너무 많은 경우 에 적합 하지 않 고 기포 가 너무 많 으 면 도 표를 읽 기 어렵다.그 밖 에 기포 도 에 숨겨 진 데이터 정보 에 대해 서 는 아이콘 정 보 를 읽 기 위해 상호작용 을 할 수 있다. 예 를 들 어 서 스 펜 션 에 상세 한 데 이 터 를 표시 하고 가 려 진 데이터 점 을 확대 관찰 하 는 등 이다. 시각 화 되 기 전에 가장 중요 한 것 은 시각 화 된 목적 이 무엇 인지, 데이터 의 어떤 규칙 을 보 여주 거나 탐색 하 기 를 원 하 는 지 알 아 내 는 것 이다.어떤 유형의 도 표를 선택해 야 하 는 지, 데이터 세트 를 어떻게 통계 하고 조립 해 야 하 는 지, 시각 화 된 결과 가 기대 하 는 목 표를 달성 할 수 있 는 지 를 결정 하기 때문이다.