java 고급 프로그래밍 고급 텍스트 처리 (1)
1 문자 인코딩 (1): - 문자 0, a 나 1... 등 - 컴퓨터는 0과 1로만 표시 - ASCII 코드 - 미국 정보 교환 표준 코드, 컴퓨터 기초 확인 - 1바이트(1Byte=8bits)로 a-z, A-Z, 0-9와 자주 사용하는 기호 - 영어와 서구어 2문자 인코딩 표시에 사용(2): - ASCII 인코딩은 1byte, 8bits 최대 256바이트 - ASCII로 다른 곳에 적응할 수 없음.예를 들어 한자의 수량은 수십만 - 확장 코드: - ISO8859 서유럽어 - GB2132, GBK, GB18030, ASII+ 중국어 - Big5 ASII+ 번체 중국어 - shiftJIS ASCII + 일본어 - 유니코드 인코딩
unicode
:
GB2132:1980 ,7445 , , , 682
GBK: 1995 , 21886
GB18030:70244
Unicode( ):
- ,
:
UTF-8 ASCII , (1-4 ),
UTF-16 2-4
UTF-32 32 bits
2 자바의 문자 인코딩과 파일의 입력 출력
// GBK
charset c = charset .defaulteCharset();
//
SortedMap sm = Charset.availableCharsets();
Set keyset = sm.keySet();
System.out.println("java ");
for (String s: keyset){
System.out.println(s);
}
java 국제화 프로그래밍
1java는 처음으로 국제화 언어를 지원하는 프로그래밍 언어로 설계되었다.util.언어를 로드하는 데 사용되는 ResourceBundle국가 언어의 패키지 자바.util.local 정의 언어 2 새 메시지zh.properties 중요 알림: 이 설정 파일에서 한자를 ASII 코드로 바꾸거나 읽을 때 바꾸십시오!
public class ByteCode2 {
public static void main(String[] args) {
//
Locale loc = Locale.getDefault();
System.out.println(loc);
//
ResourceBundle bundle = ResourceBundle.getBundle("message_zh");
System.out.println(" "+bundle.getString("hello"));
}
}
java 고급 문자열 처리
1 정규 표현식은 2의 다른 문자열을 나타내는 작업 - 집합과 문자열의 상호작용 - 문자열의 의미 - 변수 이름 포맷 - 문자열에서 입력 흐름까지 정규 표현식을 배우는 곳을 추천합니다.https://github.com/ziishaned/learn-regex
public class ByteCode3 {
private static final String REGX = "\\bdog\\b";
private static final String INPUT = "dog dog ddog";
public static void main(String[] args) {
Pattern pattern = Pattern.compile(REGX);
Matcher matcher = pattern.matcher(INPUT);
int count = 0;
while (matcher.find()){
count++;
System.out.println(count);
}
}
}
바꾸기:
string str = "abC";( )
Pattern p = Pattern.compile(str);
Matcher m = p.matcher(" , "abC");
while(m.find){
m.replaceAll("abC",“123”); // abc 123
}
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
다양한 언어의 JSONJSON은 Javascript 표기법을 사용하여 데이터 구조를 레이아웃하는 데이터 형식입니다. 그러나 Javascript가 코드에서 이러한 구조를 나타낼 수 있는 유일한 언어는 아닙니다. 저는 일반적으로 '객체'{}...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.