초보자를 위한 Python을 사용한 데이터 시각화
2832 단어 datasciencebeginnerspythondata
데이터 시각화가 중요한 이유
데이터 시각화는 다음과 같은 이유로 중요합니다.
데이터 시각화는 데이터가 긍정적이든 부정적이든 어떤 형태의 상관 관계가 있는지 알 수 있도록 도와줍니다.
데이터 시각화는 어떤 것이 왜 그런 것인지 합리적인 질문을 던질 수 있도록 도와줍니다. 데이터를 이해하기 쉽게 해줍니다. 아래 그림에서 크기가 4인 테이블이 가장 높은 팁을 지불한다는 것을 알 수 있습니다.
데이터가 시각화되면 의사 결정자가 데이터에서 유용한 통찰력을 얻는 데 도움이 됩니다. 예를 들어, 아래 도표에는 토요일 등에 더 많은 고객이 있습니다. 이것은 어떤 요일에 더 많은 웨이터가 있어야 하는지 등을 아는 데 도움이 됩니다.
데이터에서 파생된 유용한 통찰력을 통해 의사 결정자는 수익성 있는 비즈니스 의사 결정을 내릴 수 있습니다.
시각화를 그릴 때 데이터 유형이 연속인지 범주인지를 기록해야 합니다.
연속 데이터 또는 연속 변수는 광범위한 숫자 또는 값 집합을 가질 수 있는 양적 데이터 유형입니다. 연속 데이터의 예로는 시험에서 학생의 점수, 일정 기간 동안 집값이 있습니다. 우리는 이러한 종류의 데이터에 대해 특정 플롯을 사용합니다.
범주형 데이터 또는 범주형 변수는 가능한 값이 불연속적이거나 그룹화될 수 있는 변수/데이터 유형입니다. 범주형 데이터의 예로는 성별, 요일, 인종, 눈/머리 색깔, 최고 교육 자격 등이 있습니다. 이러한 플롯 중 일부는 범주형 데이터를 시각화하는 데 사용할 수 있습니다.
우리는 왜 파이썬을 사용하는가
프로그래밍 언어로서의 Python은 다르게 사용될 수 있습니다. 데이터를 시각화하는 데 사용할 수 있는 놀라운 라이브러리가 있습니다. 이 라이브러리의 예는 matplotlib 및 seaborn입니다. 이러한 라이브러리에는 포괄적인 시각화 기능이 있습니다.
시각화를 위해 가장 많이 사용되는 IDE(통합 개발 환경) 중 하나는 anaconda에서 설치할 수 있는 Jupyter 노트북입니다. Jupyter 노트북은 사용자 친화적이고, 더 안전하고, 인터넷 연결 등이 필요하지 않기 때문에 사용되었습니다. Jupyter 노트북 대신 사용할 수 있는 다른 IDE는 Pycharm, spyder 등입니다.
시각화를 생성하기 위해 먼저 이러한 라이브러리를 노트북으로 가져옵니다.
import pandas as pd #used for data analysis
import matplotlib.pyplot as plt
import seaborn as sns
우리는 간단한 시각화를 할 것입니다
#this is what the syntax for making visualization looks like
x = [2, 3, 6]
y = [10, 30, 50]
plt.plot(x, y)
데이터 시각화에 대해 자세히 알아보려면 이 동영상video을 보거나 이 동영상course을 볼 수 있습니다.
Google이 당신의 친구임을 항상 기억하십시오.
Reference
이 문제에 관하여(초보자를 위한 Python을 사용한 데이터 시각화), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/adachime/data-visualization-with-python-for-beginners-35ad텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)