파일의 바이트 순서 기호

914 단어 unix브라우저
바이트 순서 기호는 U+FEFF 로 인코딩된 통일 부호 문자 ('0 너비 무단 공백') 이다.UCS 또는 유니코드 문자를 UTF-16 또는 UTF-32로 인코딩할 때 이 문자는 바이트 순서를 표시하는 데 사용됩니다.이것은 자주 표시 파일이 UTF-8, UTF-16 또는 UTF-32 인코딩 형식의 파일 기호로 사용된다.
UTF-8은 바이트 순서의 개념이 없다.UTF-8에서 인코딩된 바이트 순서 기호는 UTF-8의 파일임을 표시하는 데 사용된다.이것은 바이트 순서를 설명하는 대신 UTF-8을 표시하는 파일에만 사용됩니다.많은 응용 프로그램 (메모장 포함) 에서 바이트 순서 기호를 UTF-8 파일에 추가합니다.그러나 일부 Unix 시스템에서는 이러한 방식이 권장되지 않습니다.바이트 순서 기호는 UTF-8에서 시퀀스EF BB BF로 표시되며, UTF-8을 처리할 준비가 되지 않은 대부분의 텍스트 편집기와 웹 브라우저에 ISO-8859-1 환경이 표시됩니다.
부호화
표현(16진수)
표현(10진수)
UTF-8 EF BB BF 239 187 191
UTF-16(대단위 시퀀스)FE FF 254 255
UTF-16(소규모 시퀀스)FF FE 255 254
UTF-32(대단위 시퀀스)00 00 FE FF 0 0 254 255
UTF-32(소규모 시퀀스)FF FE 00 00 255 254 0 0

좋은 웹페이지 즐겨찾기