'원더래빗걸'의 캐릭터 깨짐 복원
형이 남긴 리스트 중 한 여자의 성버릇이 글자 깨져서, 자꾸 곤란했어, 라고 하는 것이 여기 2화의 스토리. 곤란하기 때문에 복원해 보자.

점프 SQ 2015년 12월호부터
우선, 문자를 화상으로부터 읽지 않으면 시작되지 않는다. 최근의 IME라면 필기 입력으로 검색할 수 있다.

열심히 입력하면 다음과 같다.
3年A組 緑ノ 柊
性癖
┗髴イ蜃コ迢�‥
繧ュ繧キ繝� 繝ァ繝�繝・
이 중
�
는 해석할 수 없었던 문자 대신에 표시되는 것으로, 실제로 어떤 바이트열이었는지는 모른다. 참조 .한자, 반각 가나, 한자, 반각 가나, ...와 늘어선 것은 UTF-8로 쓰여진 텍스트를 Shift_JIS로 해석한 경우의 특징이다. 대체로의 일본어는 UTF-8에서는 3바이트로 표현되고, Shift_JIS에서는 한자는 2바이트로 반각 가나는 1바이트이기 때문에, 이렇게 된다.
문자열을 UTF-8로 인코딩하고 Shift_JIS로 디코딩하는 처리는 Python이라면 다음과 같다.
�
은 아마 1 바이트의 문자일 것이기 때문에 , 우선 ?
로서 뒀다.# coding: utf-8
x = u"""髴イ蜃コ迢?‥
繧ュ繧キ繝? 繝ァ繝?繝・"""
print (x
.encode("shift_jis", errors="replace")
.decode("utf-8", errors="replace")
.encode("shift_jis", errors="replace"))
첫 번째 줄의 utf-8은 스크립트의 문자 코드이고 마지막 줄의 shift_jis는 화면의 문자 코드이므로 적절하게. encode와 decode의 디폴트의 동작에서는 변환에 실패하면 예외를 토해 버리므로,
errors="replace"
(을)를 지정해 실패한 문자를 다른 문자에 옮겨놓아 처리를 속행시키고 있다. 실행 결과는 다음과 같다.露出???d
キシ?? ョ??ュ
이번 달(2015년 1월)호에서, 「이 아이의 성 버릇은 노출 버릇(엑시비조니즘)――!?」이라는 대사가 나오고 있으므로, 맞을 것 같다.
"버릇"이 제대로 복원되지 않았습니다. UTF-8의 「버릇」은. 글자화를 하기 위해 수정이 가해지고 있을지도 모른다. 2행째의 카타카나도 수수께끼. 지금까지, 이 만화에서 성버릇 이외에 무엇인가 설명이 써 있는 것은 있었을까… 어딘가에서 문자 코드를 바꾸면 읽을 수 있게 될 것이므로, 다음 호 이후의 주인공에 기대하자.
표에 정리했다.
Shift_JIS
髴
이
신
코코
迢
�
‥
바이트열
E9
9C
B2
E5
87
BA
E7
8B
??
81
64
UTF-8
이슬
출
?
Shift_JIS
繧
ュ
繧
·
고치
�
고치
ァ
고치
�
고치
・
바이트열
E3
82
AD
E3
82
B7
E3
83
3F
20
E3
83
A7
E3
83
3F
E3
83
A5
UTF-8
키
시
?
오
?
류
실제 파일을 h tp://사야. 음, t, t.んふぉ / 뭉쳐서 r_나비 t_기 rl. txt에 넣었다. 헤더로 Shift_JIS를 지정하고 있다. 브라우저의 인코딩을 UTF-8로 하면, 지금까지의 설명과 같이 어느 정도 읽을 수 있을 것이다.
추가
Hi-king
미친 (E78B82)
확실히. ShiftJIS라면 E7 99 96
뿐이라면 문자가 되지 않기 때문에 辻虄가 맞는다.
Hi-king씨 왈, 카타카나는 「(에)키시비조니즘이 아닌가?」라는 것. 확실히 그대로라고 생각한다. 「엑시비조니즘」을 UTF-8로 표현하면,
문자
바이트열
E
E3 82 A8
키
E3 82 AD
시
E3 82 B7
비
E3 83 93
지
E3 82 B8
오
E3 83 A7
니
E3 83 8B
즈
E3 82 BA
무
E3 83 A0
Reference
이 문제에 관하여('원더래빗걸'의 캐릭터 깨짐 복원), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/kusano_k/items/65dce1a82ce0604dd4c2
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
Reference
이 문제에 관하여('원더래빗걸'의 캐릭터 깨짐 복원), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/kusano_k/items/65dce1a82ce0604dd4c2텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)