R에서 mac의 csv 파일을 읽고 실행하면 "xxx는 잘못된 멀티 바이트 문자입니다"오류가 발생하는 경우의 해결책

소개



R로 csv를 읽는 스크립트를 달리고 있었지만, 이전에 문제없이 움직이고 있던 스크립트가 최근 작성한 csv 파일을 읽었을 때 갑자기 움직이지 않게 되어, 그 트러블 슛으로 2시간 이상 걸려 버렸습니다.

현상



현상은 최근 Office mac를 업데이트해 버렸고, csv로 파일을 CSV UTF-8 형식으로 저장되어도, 깨짐이 발생하게 되었습니다.



오류 메시지가 "xxx는 잘못된 멀티 바이트 문자입니다"라는 오류이지만이 오류는 콘솔에 표시되지 않으며 warning ()을 실행하지 않으면 표시되지 않았습니다.

그건 그렇고, 오류가 발생하면 R 콘솔에
エラー: Stopping
 追加情報:  11 件の警告がありました (警告を見るには warnings() を使って下さい) 

라고 표시되었습니다.
이 경고 메시지에 따라 콘솔에서
warnings()

을 실행하면 xxx는 잘못된 멀티 바이트 문자입니다 오류 메시지를 확인할 수 있었지만 그것을 확인하지 않고 스크립트의 데이터 프레임이나 csv 파일을 다양하게 괴롭히고있었습니다.

회피법



이 문제는 이전 Wordcloud 기사에서 언급했듯이 csv를로드 할 때 다음과 같이 fileEncoding = "CP932"를 csv로드 옵션에 추가하여 해결할 수있었습니다.
, fileEncoding="CP932"

어떤 버전의 mac 용 Excel에서이 사양이 되었는지 모르겠지만, 2020 년 1 월에 동일한 환경에서 만든 csv 파일에서는 이러한 일이 없었기 때문에 최근 업데이트 (버전 16.34 (20020900) )에서 새롭게 발생한 문제일까 생각합니다.



교훈



트러블 슛의 대부분의 시간은 에러 메세지를 확인하지 않고 아무것도 아니고, 그렇지 않으면 csv 파일이나 스크립트를 괴롭혔습니다.
오류 메시지를 확인한 후 이전 Wordcloud에서의 경험이 있었기 때문에 10 분 안에 해결책을 찾을 수있었습니다.

설마 엑셀의 버전에서 발생하지 않는다고 하는 생각이 있던 것도 원인의 하나라고 생각합니다.

서둘러 돌아다니는 말대로, 한 번 걸립니다만 에러 메세지나 경고 메세지를를 제대로 확인하는 것이 중요하다, 라고 다시 통감했습니다.

좋은 웹페이지 즐겨찾기