진짜 무서운 CP932

3441 단어 문자 코드

먼저 결론


  • CP932는 Shift_JIS의 자체 구현
  • 인코딩 된 문자 집합이 여러 가지로 확장되었습니다
  • 확장 문자의 유무로, Shift_JIS로 판별 가능

  • CP932는 무엇입니까?



    실은 여러가지
  • Microsoft 코드 페이지 932
  • IBM 코드 페이지 932
  • PC-9800 사양 OEM 코드 페이지 932
  • Windows-31J(MS932)

  • Microsoft 코드 페이지 932


  • Microsoft가 MS-DOS 용으로 만든 Shift_JIS 구현

  • IBM 코드 페이지 932PC-9800 사양 OEM 코드 페이지 932


  • IBM, NEC가 만든 Microsoft 코드 페이지 932 확장

  • Windows-31J(MS932)



    Microsoft가 호환성을 위해 IBM, NEC 확장을 흡수한 Windows용 CP932
  • CP932라고하면 거의 거의 이것을 가리킨다
  • MS932는 Java에서 호출됩니다.

    요약



    CP932 ≒ Windows-31J = MS932

    Shift_JIS는 원래 무엇을 가리키는가?



    인코딩 문자 집합 JIS X 0208을 사용한 문자 인코딩 방법

    인코딩 문자 집합



    문자열 집합과 일대일로 연결된 코드 모음

    인코딩 문자 세트 JIS X 0208


  • 일본 공업 규격 (JIS)으로 정해진 일본어의 부호화 문자 집합
  • 7 비트 또는 8 비트로 표현할 수있는 94 (구) x 94 (점) 문자 모음

  • 분류는 이런 느낌


  • 1~2구 : 기호
  • 3구 : 숫자·로마자
  • 4구 : 히라가나
  • 5구 : 카타카나
  • 6~7구 : 그리스 키릴 문자
  • 8구 : 괘선
  • 9~15구 : 미정의
  • 16~47구 : 제1수준한자
  • 48~84구 : 제2수준 한자
  • 85-94 구 : 정의되지 않음

  • 문자 인코딩 방식


  • 인코딩 된 문자 집합을 코드로 변환하는 방법
  • Shift_JIS는 다음 링크에 작성된 규칙으로 JIS X 0208을 코드로 변환합니다.

    문자 코드(UTF-8, Shift_JIS, EUC-JP, ISO-2022-JP)에 대한 사적 정리 - 오늘도 스미마센.
  • EUC-JP도 문자 인코딩 방법
  • Shift_JIS와는 다른 방식으로 JIS X 0208을 인코딩합니다.

    CP932는 Shift_JIS와 어떻게 다른가요?


  • 인코딩 방법은 함께
  • 그러나 인코딩 된 문자 집합이 다릅니다

  • 인코딩 문자 집합의 차이



    호환성을 위해 다양한 물건을 담고있다.
  • NEC 확장 문자
  • IBM 확장자
  • NEC 선택 IBM 확장 문자

  • NEC 확장 문자


  • PC-9800 사양 OEM 코드 페이지 932에 추가 된 NEC 고유의 문자 집합
  • JIS X 0208의 정의되지 않은 13 구에 정의



  • IBM 확장 문자


  • IBM 코드 페이지 932에 추가 된 IBM 고유의 문자 세트
  • JIS X 0208 뒤에 115구~119구를 마음대로 추가하여 정의(!)



  • NEC 선정 IBM 확장 문자


  • IBM 확장자는 JIS X 0208 범위를 벗어나 정의되었으므로 NEC가 싫어하는 89-92 구역으로 재정의되었습니다



  • 혼돈



    확장 문자 안에 쓰는 문자가 없거나

    그러나 구별하는 방법은 간단합니다.



    확장 문자를 사용하면 CP932, 사용하지 않으면 Shift_JIS

    참고


  • Shift-JIS 문자 코드 표
  • 시프트 JIS - 통신 용어의 기초 지식
  • 문자 코드(UTF-8, Shift_JIS, EUC-JP, ISO-2022-JP)에 대한 사적 정리 - 오늘도 스미마센.
  • 좋은 웹페이지 즐겨찾기