어떤 파 이 썬 라 이브 러 리 가 데이터 시각 화 에 가장 적합 한 지 말씀 드 리 겠 습 니 다.

데이터 시각 화 는 모든 탐색 적 데이터 분석 이나 보고의 관건 적 인 절차 로 우 리 는 데이터 세트 를 한눈 에 통찰 할 수 있다.현재 Tableau,googledatastudio,PowerBI 등 아주 좋 은 상업 스마트 도구 가 많 습 니 다.그들 은 우리 로 하여 금 쉽게 도형 을 만 들 수 있 습 니 다.
그러나 데이터 분석가 나 데이터 과학자 들 은 Python 을 사용 하여 Jupyter notebook 에서 시각 화 효 과 를 만 드 는 데 익숙 하 다.현재 가장 유행 하 는 데이터 시각 화 에 사용 되 는 Python 라 이브 러 리:Matplotlib,Seaborn,plotly express 와 Altair.모든 시각 화 라 이브 러 리 는 자신의 특징 을 가지 고 완벽 한 시각 화 라 이브 러 리 가 없다.우 리 는 모든 데이터 시각 화의 장단 점 을 알 고 자신 에 게 맞 는 것 을 찾 는 것 이 관건 이다.
준비 하 다.
우선 중요 한 라 이브 러 리 를 모두 가 져 옵 니 다.아마도 당신 의 컴퓨터 에 Matplotlib 와 Seaborn 이 설치 되 어 있 을 것 입 니 다.하지만 당신 은 Plotly Express 와 Altair 가 없 을 수도 있 습 니 다.현재 pip install plotly=4.14.3 과 pip install altair 데이터 세트 를 사용 하여 쉽게 설치 할 수 있 습 니 다.

import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import altair as alt
import plotly.express as px
지금 우 리 는 데이터 세트 를 가 져 올 것 이다.시연 의 목적 으로 우 리 는 미국 에서 인구 가 가장 많은 15 개 도 시 를 포함 하 는 데이터 프레임 워 크 만 만 만 들 었 다.나 는 또 도시 명칭 의 대문자 도 수정 할 것 이다.시각 화 효 과 를 만 들 때 편집 과정 을 촉진 합 니 다.

df = pd.read_csv('worldcitiespop.csv')
us = df[df['Country'] == 'us']
us['City'] = us['City'].str.title()
cities = us[['City', 'Population']].nlargest(15, ['Population'], keep='first')
지금 우 리 는 모든 라 이브 러 리 를 분석 할 준 비 를 해 야 한다.준비 됐어 요?
난이도 와 초기 결과 설정
우승자:Plotly Express
실패자:Matplotlib,Altair,Seaborn
이런 종류 중에서 모든 라 이브 러 리 가 양호 하 다.그것들 은 모두 쉽게 설정 할 수 있 고 기본 적 인 편집 결 과 는 대부분의 분석 에 충분 하지만 우 리 는 승자 와 패자 가 있어 야 한다.그렇지?
Matplotlib 는 코드 를 쉽게 설정 하고 기억 합 니 다.그러나 이 도 표 는 보기 에는 좋 지 않다.그것 은 데이터 분석 을 마 칠 수 있 지만 비 즈 니스 회의 에서 의 결 과 는 이상 적 이지 않다.

Seaborn 은 더 좋 은 도 표를 만 들 었 다.x 축 과 y 축 라벨 을 자동 으로 추가 합 니 다.x 기 호 는 더 좋아 보이 지만 기본 도표 에 있어 서 이것 은 Matplotlib 보다 훨씬 좋다.

Plotly Expres,아주 잘 했 어 요.아주 적은 코드 로 보기 좋 고 전문 적 인 막대 그래프 를 만 들 수 있 습 니 다.그림 이나 글꼴 크기 를 설정 할 필요 가 없습니다.그것 은 심지어 x 축 라벨 을 회전 시 킬 수 있다.이 모든 것 은 코드 한 줄 만 필요 합 니 다.아주 인상적 이 야!

Altair 도표 가 양호 하 다.그것 은 보기 좋 은 도형 을 제공 하지만 더 많은 코드 가 필요 하 다.알파벳 순 으로 하 는 것 은 무 섭 지 않 고 많은 상황 에서 도움 이 될 것 이다.그러나 나 는 이것 이 사용자 가 결정 해 야 한다 고 생각한다.

편집 및 사용자 정의
우승자:Plotly Express,Seaborn,Matplotlib
실패자:Altair
나 는 이 네 개의 창고 가 모두 승자 가 될 수 있다 고 믿는다.사용자 정의 도표 가 모든 표현 에 있어 서 는 다 르 지만,나 는 네가 충분 한 공 부 를 한다 면,너 는 어떻게 아름 다운 시각 화 를 창조 하 는 지 배 울 수 있 을 것 이 라 고 생각한다.그러나 나 는 새로운 사용자 로 상상 하기 위해 어떻게 쉽게 편집 하고 사용자 정의 할 것 인 가 를 고려 하고 있다.
Matplotlib 와 Seaborn 은 맞 춤 형 제작 이 쉽 고 문서 가 아주 좋 습 니 다.문서 에서 찾 을 정 보 를 찾 지 못 하 더 라 도 Stack Overflow 에서 쉽게 찾 을 수 있 습 니 다.그들 은 아직 합작 의 우세 가 있다.Seaborn 은 Matplotlib 기반 입 니 다.따라서 하 나 를 편집 하 는 방법 을 알 고 있다 면 다른 하 나 를 편집 하 는 방법 을 알 게 될 것 이다.이것 은 매우 편리 하 다.하면,만약,만약...

sns.set_style('darkgrid')
Seaborn 테 마 를 설정 하면 Matplotlib 에 영향 을 줄 것 입 니 다.이것 은 Matplotlib 와 Seaborn 이 더 유행 하 는 데이터 시각 화 라 이브 러 리 인 이유 일 수 있 습 니 다.


plotly express 는 처음부터 예 쁜 도 표를 제공 했다.예 를 들 어 Matplotlib 에 비해 적은 편집 만으로 도 매우 좋 은 시각 화 효 과 를 얻 을 수 있다.문 서 는 쉽게 이해 할 수 있 습 니 다.Shift+Tab 를 통 해 문 서 를 제공 하 는 것 이 편리 합 니 다.내 가 시도 한 모든 라 이브 러 리 에서 가장 많은 맞 춤 형 옵션 도 제공 했다.글꼴,태그 색상 등 모든 것 을 편집 할 수 있 습 니 다.가장 좋 은 부분 은 힘 들 지 않 습 니 다.그것 의 문서 에는 예 가 가득 하 다.

나 는 알 테 어의 파일 이 매우 혼 란 스 러 운 것 을 발견 했다.다른 라 이브 러 리 와 달리 Altair 에는 Shift+Tab 단축 키 가 없습니다.초보 자 에 게 이것 은 매우 문제 가 있 고 곤 혹 스 러 운 것 이다.나 는 편집 을 좀 할 수 있 지만,그것 에 관 한 정 보 를 찾 는 것 은 스트레스 를 받는다.편집 에 있어 서 저 는 Matplotlib 와 plotly express 에 쓴 시간 에 비해 초보 자 에 게 Altair 는 좋 은 선택 이 아 닙 니 다.
추가 기능
수상자:Plotly Express 와 Altair
실패자:Matplolib 와 Seaborn
이런 종류 에 대해 나 는 우리 가 코드 를 통 해 실현 할 수 있 는 기능 을 제외 한 다른 기능 을 고려 할 것 이다.Matplotlib 와 Seaborn 은 이런 종류 에서 매우 기본 적 이다.코드 를 제외 하고 추가 편집 이나 대화 옵션 을 제공 하지 않 습 니 다.그러나 플 로 틀 리 익 스프 레 스 는 이런 종류 에서 크게 빛 을 발 했다.우선 도 표 는 상호작용 이다.그림 에 마 우 스 를 걸 면 정 보 를 볼 수 있 습 니 다.
在这里插入图片描述
Altair 는 파일 을 저장 하거나 Vega 편집 기 를 통 해 JSON 파일 을 열 수 있 는 옵션 을 제공 합 니 다.

문서 와 사이트
수상자:Plotly Express,Altair,Seaborn,Matplotlib
이 라 이브 러 리 의 모든 문 서 는 매우 좋다.Plotly Express 는 코드 와 시각 화 된 프 리 젠 테 이 션 이 있 는 예 쁜 사이트 가 있 습 니 다.그것 에 관 한 정 보 를 읽 고 찾기 쉽다.나 는 그들의 사이트 가 얼마나 정교 하고 정성 들 여 설계 되 었 는 지 를 좋아한다.너 는 심지어 도표 와 상호작용 할 수 있다.
在这里插入图片描述
알 테 어 홈 페이지 에서 잘 했 어 요.그들의 맞 춤 형 문 서 는 가장 좋 은 것 은 아니 지만 사이트 가 좋아 보 여서 코드 예 시 를 쉽게 찾 을 수 있다.나 는 이것 이 놀 라 운 것 이 라 고 말 하 지 는 않 겠 지만,그것 은 확실히 작용 을 했다.
在这里插入图片描述
Seaborn 사 이 트 는 괜 찮 습 니 다.어떤 사람 은 코드 예 시 를 포함 한 가장 좋 은 파일 이 있다 고 말한다.맞 춤 형 옵션 을 찾 고 있다 면 까다 로 워 질 수 있 지만 그 밖 에 깨끗 한 사이트 이 고 문서 도 상당히 완전 합 니 다.

Matplotlib 에는 완전한 사이트 가 있 습 니 다.내 가 보기에,그것 은 너무 많은 문자 가 있어 서,약간의 정 보 를 찾 는 것 은 좀 까다 로 울 것 이다.하지만 정 보 는 거기에 있다.그들 은 PDF 형식의 문서 도 제공한다.

총결산
내 가 본 논문 에서 분석 한 네 개의 현재 모두 매우 좋 은 창고.모든 시각 화 라 이브 러 리 는 장단 점 이 있 으 니 자신 에 게 맞 는 것 을 찾 는 것 이 관건 이다.내 가 가장 좋아 하 는 것 은 Plotly Express 이다.왜냐하면 그것 은 모든 유형 에서 뛰 어 나 기 때문이다.하지만 Matplotlib 와 Seaborn 은 더 인기 가 많 고 대부분 컴퓨터 에 설치 합 니 다.알 테 어 는 내 가 제일 싫어 하 는 사이 야.당신 이 가장 좋아 하 는 데이터 시각 화 라 이브 러 리 는 무엇 입 니까?
어떤 Python 라 이브 러 리 가 데이터 시각 화 에 가장 적합 한 지 에 대한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 관련 Python 데이터 시각 화 내용 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 찾 아 보 세 요.앞으로 많은 응원 바 랍 니 다!

좋은 웹페이지 즐겨찾기