【비망록】C#에서 Shift-JIS의 문자열을 다룬다

Shift-JIS의 문자열을 읽을 때 조금 빠져서 자신의 비망록으로 메모.

자세히 보기 "Shift-JIS"의 문자열 쓰기 코드



통상, C#로 텍스트 파일등에 문자 코드를 지정해 기입하는 경우는,
기입의 스트림 생성시에 문자 코드를 "System.Encoding"클래스를 사용해 지정합니다.

System.Encoding 문서
htps : // / cs. mic로소 ft. 이 m / 그럼 jp / t 네 t / 아피 / sys m. xt. 엔코 ぢ g?ゔ ぃ w = 네 t 이것 3.1

Shift-JIS를 사용하는 경우, 잘 보이는 샘플이라고 이런 식으로 선언하고 있습니다.

CodeConverter.cs
StreamWriter writer = new StreamWriter(
    File.Open(@"C:\hogehoge.txt", FileMode.Create),
    Encoding.GetEncodings("shift-jis")
);

무엇이 문제인가?



이대로 빌드하면 다음과 같은 오류가 발생합니다.
※2020/5/1 추기:.NET Framework에서는 표준으로 서포트되고 있으므로 이 에러는 나오지 않으며, 이 기사에서 다루고 있는 문제도 일어나지 않습니다.

System.ArgumentException: ''SHIFT-JIS' is not a supported encoding name. For information on defining a custom encoding, see the documentation for the Encoding.RegisterProvider method. '
(내용 화역) "SHIFT-JIS"는 지원되는 문자 코드 이름이 아닙니다. 임의의 문자 코드를 지정하는 방법에 대한 자세한 내용은 Encoding.RegisterProvider 메서드 문서를 참조하십시오.

즉, 프로젝트 생성 상태에서는 Shift-JIS 정의가 포함되어 있지 않으므로 문자 코드 변환이 실패합니다.
(참고) 아무것도하지 않고 지원되는 문자열
제 환경의 경우, 아무것도 하지 않은 상태에서 지원되고 있던 문자 코드는 아래와 같았습니다.
* "utf-16"
* "utf-16BE"
* "utf-32"
* "utf-32BE"
* "us-ascii"
* "iso-8859-1"
* "utf-7"
* "utf-8"

어떻게 해야 하는가?



NuGet에서 필요한 패키지를 설치하고 찾아보면 해결할 것입니다.

구체적인 절차



(1) NuGet에서 "System.Text.Encoding.CodePages"를 프로젝트에 추가한다.



NuGet System.Text.Encoding.CodePages 프로젝트 페이지
htps : // 기주 b. 이 m / t t t / 이것 fx


(2) EncodingProvider 클래스를 선언한 후 Shift-JIS 인코딩을 읽는다.



CodeConverter.cs
EncodingProvider provider = System.Text.CodePagesEncodingProvider.Instance;
var encoding =  provider.GetEncoding("shift-jis");

(3) (2)에서 취득한 인코딩을 Stream의 생성자에 건네준다.



처음에 든 "잘 보는 샘플"을 다시 쓰면 아래와 같습니다.

CodeConverter.cs
EncodingProvider provider = System.Text.CodePagesEncodingProvider.Instance;
var encoding =  provider.GetEncoding("shift-jis");
StreamWriter writer = new StreamWriter(
    File.Open(@"C:\hogehoge.txt", FileMode.Create),encoding
);

수정 기록



(a) 2020/05/01 … .NET Framework에서는 표준으로 지원되는 것 같습니다. (정보를 주신 albireo님, 감사합니다.)

좋은 웹페이지 즐겨찾기