pandasmerge 오류 해결 방안
df22 = pd.merge(df1,df2,left_on='company_name',right_on = 'name',how='left') Process finished with exit code 137
이유를 알아봤더니:
두 개의 시계가 너무 커서 메모리가 부족할 수도 있다.
추가: Pandas:merge 함수 사용 주의사항 (pandas의merge 함수는 대량의 오류를 발생)
Pandas의merge 함수를 사용한 적이 있는 사람들은 모두merge가 연결 기능을 가지고 있으며 왼쪽 연결은 데이터 처리에서 가장 자주 사용하는 연결 방식이라는 것을 알고 있다.merge를 사용하는 과정에서
이런 경우가 종종 있습니다.
dataframe1:
a b
1 1
2 2
3 3
dataframe2:
b c
1 2
2 3
dataframe = pd.merge(dataframe1, dataframe2, on='b', how='left') 후 획득
dataframe:
a b c
1 1 2
2 2 3
3 3 nan
하지만 데이터 프레임2는
b c
1 2
2 3
3 4
dataframe = pd.merge(dataframe1, dataframe2, on='b', how='left') 후 획득
dataframe:
a b c
1 1 2
2 2 3
3 3 nan
왜 이러지?
왜냐하면 통상적으로 우리의 데이터 프레임워크의 데이터는 csv 파일이나 xls 파일에서 읽은 것이기 때문이다. excel에서 b에 대응하는 데이터를 열면 똑같아 보이지만pandas로 읽을 때
서로 다른 csv 파일이나 xls 파일의 같은 열의 데이터와 같은 데이터는 정형과 부점형의 차이가 있음을 발견할 수 있습니다. 이로 인해 연결할 때 3과 3.0은 다르고 3줄에 연결할 수 없습니다.
따라서merge를 사용하여 연결하기 전에 연결된 키워드를 문자화하거나 정형화해야 합니다.
이상의 개인적인 경험으로 여러분께 참고가 되었으면 좋겠습니다. 또한 많은 응원 부탁드립니다.만약 잘못이 있거나 완전한 부분을 고려하지 않으신다면 아낌없이 가르침을 주시기 바랍니다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
【Pandas】DatetimeIndex란? no.29안녕하세요, 마유미입니다. Pandas에 대한 기사를 시리즈로 작성하고 있습니다. 이번은 제29회의 기사가 됩니다. 에서 Pandas의 시간에 대한 모듈에 대해 씁니다. 이번 기사에서는, 「DatetimeIndex」...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.