너는 어디 출신이야

Pandas에서 두 개의 데이터를 로드하고 결합할 때 이런 일이 없습니까?
  • 데이터 로드
  • import pandas as pd
    
    sample001 = pd.read_excel("sample_excel_001.xlsx")
    sample001.head()
    


    sample002 = pd.read_excel("sample_excel_002.xlsx")
    sample002.head()
    



    두 데이터를 데이터 프레임(sample001, sample002)에 로드했습니다.
    "data001"열에서 두 개의 데이터를 결합할 수 있습니다.
  • 데이터 조인
  • merge_data = pd.merge(sample001, sample002, on="data001", how="left")
    merge_data.head()
    


    "data001"은 조인 키워드 열이고 "data003"은 sample002의 데이터임을 알 수 있습니다. "data002_x", "data002_y"는 왠지 얘기예요. 「어디 출신의 데이터입니까?」라고 되어 버립니다군요? (아니 사실은 알겠어요? merge의 제1 인수로 지정한 데이터 프레임이 x 첨부) 봐주지 않기 때문에, 적어도 어디 출신의 데이터인가는 확실히 알고 싶어요.

    출신을 자칭하는 방법



    suffixes 옵션을 사용하면 조인 키 이외의 열 이름이 중복 될 때 새 열 이름의 끝에 추가 할 문자열을 지정할 수 있습니다.
    merge_data_new = pd.merge(sample001, sample002, on="data001", how="left", suffixes=[".sample001", ".sample002"])
    merge_data_new.head()
    



    오, 이것으로 어디 출신의 데이터인지 확실히 판별할 수 있게 되었어요!

    마지막으로



    할 수 있으면 됩니다만, 말미가 아니고 선두에 캐릭터 라인을 붙일 수 있으면 좋네요. (SQL처럼 할 수 있기 때문에)

    좋은 웹페이지 즐겨찾기