Java UTF-8에 대한 문자 코드 변환 문제 요약(전각 대시)

UTF에서 일본어를 처리할 때 피할 수 없는 Java의 SJIS ⇔ UTF 문자 코드 변환에 대한 요약입니다.

SJIS->UTF의 문자 코드로 글꼴 변환


Java의 변환기에서는 MS932와 CP 943C의 변환 결과가 다릅니다.

Encode by MS932/Windows-31J(Windows 일본어)



Encode by CP 943C(IBM 확장 SJIS)



위 표에서 보듯이 변환 결과가 다릅니다.
유니코드의 변환 사양에 따라 모양이 다른 CP943C의 변환 결과가 정확합니다.
그러나 Windows의 모양을 보면 MS932가 적절합니다.

대응법


일반 시스템에서 Java를 통해 문자 코드 변환을 실행하는 경우 MS932를 이용하는 것이 가장 좋은 목표 방법이다.
JDBC 드라이버로 SJIS의 DB를 검색할 때도 주의해야 한다.
특히 DB2에서는 CP 943C 기반 전환이 이뤄지기 때문에 MS 932 기반 전환 결과를 얻으려면 일부 대응이 필요하다.이것은 부기된 일로 총결산한다.

좋은 웹페이지 즐겨찾기