SPSS Modeler on Windows에서 UTF-8 처리

SPSS Modeler on 한국어 Windows는 기본적으로 Shift JIS 문자 코드를 사용합니다. UTF-8 데이터를 읽고 쓰려면 설정이 필요합니다.

■ 시도한 환경
Modeler 18.1.1
Windows 10

1. UTF-8 데이터를 읽는 경우



플랫 파일의 가져오기 노드에서 UTF-8의 데이터를 열면 다음과 같이 깨집니다.



인코딩을 UTF-8로 변경하면 문자 손상이 제거됩니다.


2. UTF-8의 데이터를 작성하는 경우



플랫 파일의 내보내기 노드에서 다시 인코딩을 UTF-8로 만듭니다.


출력 결과를 바이너리 에디터로 보면 UTF-8로 출력되고 있는 것을 알 수 있습니다.


3.입력도 출력도 UTF-8의 경우



입력도 출력도 모두 UTF-8이라고 하는 경우에는 스트림의 디폴트 설정을 바꾸는 것이 편리합니다.
도구의 스트림 속성 옵션을 엽니다.


옵션의 일반 안의 인코딩으로 UTF-8을 선택합니다.


이 설정이 되어 있으면 이 스트림의 디폴트가 UTF-8이 되기 때문에, UTF-8의 파일을 열어도 문자화가 되지 않습니다.


샘플 스트림



참고



IBM Knowledge Center - IBM SPSS Modeler에서 유니코드 지원
htps //w w. 이 bm. 코 m / 쏘 rt / k w wd d 센 / r / 그 / s 3 등 7_18.1. 에서 _ 꼬리 rt. HTML

덧붙여 Mac판의 Modeler에서는 「시스템의 디폴트」도 UTF-8이 되기 때문에, 읽고 쓰기는 UTF-8이 됩니다. 반대로 ShiftJIS의 데이터는 미리 UTF-8로 변환해 둘 필요가 있습니다.

좋은 웹페이지 즐겨찾기