너는 어디 출신이야

Pandas에서 두 개의 데이터를 로드하고 결합할 때 이런 일이 없습니까?

데이터 로드

import pandas as pd

sample001 = pd.read_excel("sample_excel_001.xlsx")
sample001.head()

sample002 = pd.read_excel("sample_excel_002.xlsx")
sample002.head()

두 데이터를 데이터 프레임(sample001, sample002)에 로드했습니다.
"data001"열에서 두 개의 데이터를 결합할 수 있습니다.

데이터 조인

merge_data = pd.merge(sample001, sample002, on="data001", how="left")
merge_data.head()

"data001"은 조인 키워드 열이고 "data003"은 sample002의 데이터임을 알 수 있습니다. "data002_x", "data002_y"는 왠지 얘기예요. 「어디 출신의 데이터입니까?」라고 되어 버립니다군요? (아니 사실은 알겠어요? merge의 제1 인수로 지정한 데이터 프레임이 x 첨부) 봐주지 않기 때문에, 적어도 어디 출신의 데이터인가는 확실히 알고 싶어요.

출신을 자칭하는 방법

suffixes 옵션을 사용하면 조인 키 이외의 열 이름이 중복 될 때 새 열 이름의 끝에 추가 할 문자열을 지정할 수 있습니다.

merge_data_new = pd.merge(sample001, sample002, on="data001", how="left", suffixes=[".sample001", ".sample002"])
merge_data_new.head()

오, 이것으로 어디 출신의 데이터인지 확실히 판별할 수 있게 되었어요!

마지막으로

할 수 있으면 됩니다만, 말미가 아니고 선두에 캐릭터 라인을 붙일 수 있으면 좋네요. (SQL처럼 할 수 있기 때문에)

Reference

이 문제에 관하여(너는 어디 출신이야), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/Tusnori/items/b80010a3f767f12e92d4

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다