Pandas로 데이터 로드: Excel , CSV , SQL 및 모든 데이터 파일 로드

데이터 분석을 시작하든, 유용한 정보를 가져오든, 데이터에서 무언가를 예측하든, 첫 번째 단계는 항상 pandas 라이브러리를 사용할 데이터 로드입니다.
pandas라는 Python 도구를 사용하여 Excel 테이블이나 SQL 데이터베이스에서 데이터를 가져올 것입니다.
데이터를 로드하기 전에 데이터를 로드하는 플랫폼에 pandas가 설치되어 있어야 합니다.
나는 Jupyter Notebook을 사용할 것입니다. Anaconda에서 쉽게 얻을 수 있습니다.
pandas를 설치하려면 Jupyter Notebook 셀에서 다음 명령을 실행합니다.

!pip install pandas


그렇지 않으면 Python 환경에도 설치할 수 있지만 오늘의 초점은 아닙니다.
이것은 우리가 코드를 만지는 첫 번째 클래스이므로 함께 코딩하려면 Jupyter Notebook을여십시오.
CSV 및 Excel 파일이 있습니다.
처음에는 설치된 라이브러리 pandas를 가져와야 합니다.

import pandas


이렇게 작성하면 충분하지만 일반적으로 팬더를 많이 사용할 것이기 때문에 일반적으로 일부 별칭에 대한 약칭을 제공합니다.

import pandas as pd


pd는 사람들이 가장 일반적으로 사용하는 것으로 이제 셀을 실행하여 Python에 Pandas가 있습니다.
데이터를 가져오거나 읽으려면
노트북에 pd.read를 입력하고 탭을 누르면 데이터를 로드할 수 있는 다양한 방법을 볼 수 있으며 데이터를 로드하는 다양한 방법을 확인할 수 있습니다. 여기에서 가장 일반적인 방법을 살펴보겠습니다.
Excel 파일 가져오기

pd.read_excel("data/crypto.xlsx")


괄호 안에 파일이 저장된 위치를 지정합니다.
이제 로드가 완료되었으므로 pandas 데이터 프레임에 데이터가 있음을 알 수 있습니다.
변수에 저장하지 않았습니다.
그러나 데이터를 변수에 저장할 수도 있습니다.

data=pd.read_excel("data/crypto.xlsx")


CSV 파일 가져오기
CSV 파일은 원시 데이터를 포함하기 때문에 약간 다릅니다.

pd.read_csv("data/crypto.csv")


SQL에서 데이터 로드
데이터를 저장하고 데이터 과학자가 사용할 수 있도록 하는 가장 좋은 방법은 SQL 데이터베이스를 이용하는 것입니다.
대부분의 기업에서는 Excel 파일이 복제될 수 있으므로 사용을 기피합니다.
팬더 외에도 SQLAlchemy를 가져와야 합니다.
SQLAlchemy는 Python 프로그램이 데이터베이스와 통신하는 데 도움이 되는 패키지입니다.

import sqlalchemy as sql


아래에서 엔진이라고 하는 연결을 생성합니다. PostgreSQL 데이터베이스가 있는 경우 데이터베이스의 위치여야 합니다.

connect=sql.create_engine("postgresql://scott:tiger@localhost/test")


여기서 우리는 SQL 테이블을 읽습니다.

data = pd.read_sql_table("sales", connect)


모든 데이터 파일 로드
Pandas는 구조화된 데이터에서 훌륭하게 작동하지만 때때로 데이터가 이상한 형식으로 제공됩니다. 이것은 Python에서 데이터 파일을 사용하는 일반적인 방법입니다.

with open("data/crypto.csv", mode='r') as cryptocurr:
    data = cryptocurr.read()



데이터를 읽기만 하고 변경하지 않으려면 이를 표시합니다. 모드='r'
그런 다음 파일에 열 이름을 지정합니다. 여기서는 파일 이름을 cryptocurr로 지정합니다.
이제 파일이 열려 있는 블록이 있습니다. 이 블록 내에서 변수를 만들고 셀을 실행한 후 읽기 기능을 사용하고 변수를 호출하여 실행합니다.

data


만세 우리가 해냈어!!!!!
pandas에 데이터를 로드하는 것은 매우 쉽습니다.
자신의 데이터로 시도해 보십시오. 컴퓨터에 Excel 파일이 있는 경우 컴퓨터에 데이터가 있는지 확인하여 데이터를 pd.read하고 데이터를 가져와서 가지고 놀 수 있습니다.

좋은 웹페이지 즐겨찾기