pandasmerge 오류 해결 방안

1439 단어 pandasmerge
pandas가 merge를 할 때 이 오류를 보고합니다.
df22 = pd.merge(df1,df2,left_on='company_name',right_on = 'name',how='left') Process finished with exit code 137

이유를 알아봤더니:


두 개의 시계가 너무 커서 메모리가 부족할 수도 있다.
추가: Pandas:merge 함수 사용 주의사항 (pandas의merge 함수는 대량의 오류를 발생)
Pandas의merge 함수를 사용한 적이 있는 사람들은 모두merge가 연결 기능을 가지고 있으며 왼쪽 연결은 데이터 처리에서 가장 자주 사용하는 연결 방식이라는 것을 알고 있다.merge를 사용하는 과정에서

이런 경우가 종종 있습니다.


dataframe1:
a b
1 1
2 2
3 3

dataframe2:
b c
1 2
2 3
dataframe = pd.merge(dataframe1, dataframe2, on='b', how='left') 후 획득

dataframe:
a b c
1 1 2
2 2 3
3 3 nan
하지만 데이터 프레임2는

b c
1 2
2 3
3 4 
dataframe = pd.merge(dataframe1, dataframe2, on='b', how='left') 후 획득

dataframe:
a b c
1 1 2
2 2 3
3 3 nan

왜 이러지?


왜냐하면 통상적으로 우리의 데이터 프레임워크의 데이터는 csv 파일이나 xls 파일에서 읽은 것이기 때문이다. excel에서 b에 대응하는 데이터를 열면 똑같아 보이지만pandas로 읽을 때
서로 다른 csv 파일이나 xls 파일의 같은 열의 데이터와 같은 데이터는 정형과 부점형의 차이가 있음을 발견할 수 있습니다. 이로 인해 연결할 때 3과 3.0은 다르고 3줄에 연결할 수 없습니다.
따라서merge를 사용하여 연결하기 전에 연결된 키워드를 문자화하거나 정형화해야 합니다.
이상의 개인적인 경험으로 여러분께 참고가 되었으면 좋겠습니다. 또한 많은 응원 부탁드립니다.만약 잘못이 있거나 완전한 부분을 고려하지 않으신다면 아낌없이 가르침을 주시기 바랍니다.

좋은 웹페이지 즐겨찾기