임의 한자

1568 단어 한자.
public static String getChineseCharacter(long seed) throws Exception { 
String str = null; 
int highPos, lowPos; 
Random random = new Random(seed); 
highPos  =  176 + random.nextInt(39); 
lowPos = 161 + random.nextInt(93); 
byte[] b = new byte[2]; 
b[0] = (new Integer(highPos)).byteValue(); 
b[1] = (new Integer(lowPos)).byteValue(); 
str = new String(b, "GBK"); 
return str; 
} 

 
원리는 한자의 위치 코드에 근거한 것이다. 그 중에서 본 사례의 높은 위치는 176위치에서 취하고 낮은 위치는 161위치에서 취한다
 
이른바 한자 인코딩이란 컴퓨터가 식별하고 수신하며 처리하기 위해 과학적으로 실행 가능한 방법을 채택하는 것이다.여기서 소개한 것은 《국가표준정보교환한자인코딩》이다.이런 인코딩은 가공과 정리를 거쳐 일률적으로 중국어 병음의 자모를 순서로 하고 음절이 같은 글자는 사용 빈도를 순서로 하며 그 검색 방법은 일반 중국어 사전의 한자 병음 음절 색인 검색법과 같다.모든 한자가 전국적으로 통일된 코드를 가지도록 1980년에 중국은 첫 번째 한자 인코딩 국가 표준인 GB2312-80의 기본집을 발표했다. 이 문자집은 중국 중국어 정보 처리 기술의 발전 기초이자 현재 국내 모든 한자 시스템의 통일 기준이다.국표 코드는 4위 16진법이기 때문에 교류에 편리하도록 모두가 자주 사용하는 것은 4위 10진법의 위치 코드이다.모든 국표 한자와 기호가 하나로 구성되어 94×94의 행렬.이 방진에서 한 줄마다'구'라고 하고 열마다'위'라고 부른다. 따라서 이 방진은 실제적으로 94개의 구(구 번호는 각각 01~94), 구마다 94개의 위(위 번호는 각각 01~94)의 한자 문자 집합을 구성한다.한 한자가 있는 지역번호와 위치번호를 간단하게 조합하면 이 한자의'위치번호'를 구성한다.한자의 위치 코드에서 높은 두 자리는 지역 번호이고, 낮은 두 자리는 위치 번호이다.위치 코드에서 01-09구는 682개의 특수 문자이고 16~87구는 한자 구역으로 6763개의 한자를 포함한다.그 중에서 16-55구는 1급 한자(3755개의 가장 자주 사용하는 한자, 병음 자모의 순서에 따라 배열), 56-87구는 2급 한자(3008개의 한자, 부의 첫 번째 순서에 따라 배열)이다.그래서 우리가 n개의 임의의 한자를 필요로 할 때 우리는 모든 한자표를 만들 필요가 없고 위치 코드를 이용하여 상용 한자를 추출할 수 있다.

좋은 웹페이지 즐겨찾기