자바 String 과 유 니 코드

자바 String 과 유 니 코드
java.nio.charset.Charset
public static Charset defaultCharset()
이 방법의 역할: 자바 가상 컴퓨터 의 기본 문자 집합 을 되 돌려 줍 니 다. 기본 문자 집합 은 운영 체제 의 문자 집합 에 달 려 있 습 니 다.
java.lang.String
public byte[] getBytes()
이 방법의 역할: 인 코딩 문자열 이 바이트 흐름 시퀀스 에 있 습 니 다. 이 때 사용 하 는 인 코딩 은 플랫폼 의 기본 인 코딩 입 니 다. 지정 한 인 코딩 바이트 시퀀스 를 얻 으 려 면 다음 방법 을 사용 하 십시오.
public byte[] getBytes(String charsetName)
지정 한 인 코딩 에 따라 이 문자열 의 인 코딩 형식 을 되 돌려 줍 니 다.
증 거 는 다음 과 같다.
 
String str = "I";
System.out.println(Integer.toHexString(codePoint));
byte[] bs = str.getBytes();
System.out.println(Charset.defaultCharset());
for (int i=0; i    System.out.print(bs[i] + " ");

System.out.println();
6211
GBK
-50 -46
UTF - 8 인 코딩 을 지정 할 때:
6211
GBK
-26 -120 -111
 
UTF - 16 로 지정 되 었 을 때:
-2 -1 98 17
이 곳 에서 네 개의 바이트 가 출력 되 었 습 니 다. 앞의 두 바이트 가 문 자 를 나타 내 는 인 코딩 시퀀스 이기 때 문 입 니 다.
public int codePointAt(int index)
지정 한 색인 에 있 는 문자 (Unicode 코드 점) 를 되 돌려 줍 니 다. 이 색인 은 char 값 (Unicode 코드 셀) 을 참조 합 니 다. 범 위 는 0 에서 length () - 1 입 니 다.
메모리 에 문자열 이 유 니 코드 코드 점 으로 저장 되 어 있 음 을 주의 하 십시오.
 
public String(byte[] bytes, String charsetName)
    throws UnsupportedEncodingException
새로운 String 을 만 드 는 방법 은 지정 한 문자 집합 을 사용 하여 지정 한 바이트 배열 을 디 코딩 하 는 것 입 니 다. 새로운 String 의 길 이 는 문자 집합 함수 이기 때문에 바이트 배열 의 길이 와 같 을 수 없습니다.
 
public String[] split(String regex)
주어진 정규 표현 식 의 일치 에 따라 이 문자열 을 분리 합 니 다.
이 방법 은 주어진 표현 식 과 제한 매개 변수 0 을 사용 하여 두 가 지 를 호출 하 는 것 과 같 기 때문에 결과 배열 에는 엔 딩 빈 문자열 이 포함 되 지 않 습 니 다.
예 를 들 어 문자열 "boo: and: foo" 는 다음 표현 식 을 가 진 결 과 를 만 듭 니 다.
Regex
결실
:
{ "boo", "and", "foo" }
o
{ "b", "", ":and:f" }
 
시험 증명:
String str = "boo:and:foo";
String[] tr = str.split(":");
for (String s : tr) {
    System.out.println(s);
}
출력 결과:
boo
and
foo
 
public String[] split(String regex,
                      int limit)
주어진 정규 표현 식 과 일치 하 는 문자열 을 나 눕 니 다.
limit 는 문자 배열 의 길이 에 영향 을 줍 니 다. 최대 limit 를 초과 할 수 없습니다.
시험 증명:
String str = "boo:and:foo";
String[] tr = str.split(":", 2);
    for (String s : tr) {
       System.out.println(s);
    }
출력 결과:
boo
and:foo
문자열 배열 의 최대 길 이 는 2 입 니 다.   
 
경험 치 공유:
1. 구분자 가 "." (출력 없 음), "|" (정확 한 결 과 를 얻 을 수 없 음) 전의 문자 일 때 "*", "+" 일 때 오류 가 발생 하여 이상 을 던 집 니 다. 모두 앞 에 "/ /" 를 추가 해 야 합 니 다. 예 를 들 어 split (/ |);
2. "/" 를 구분 으로 사용 하려 면 이렇게 써 야 합 니 다: String. split ("/ / /"). 자바 에 서 는 "/" 로 "/" 를 표시 하기 때문에 문자열 은 이렇게 써 야 합 니 다: String Str = "a / / b / / c".
 전의 문 자 는 '/' 를 추가 해 야 합 니 다.
3. 한 문자열 에 여러 개의 구분자 가 있다 면 "|" 을 연결 문자 로 사용 할 수 있 습 니 다. 예 를 들 어 String str = "Java string - plit \ # test" 는 Str. split ("| - | \ #") 로 모든 문자열 을 분리 할 수 있 습 니 다.
시험 증명:
String str="Java str//in.g-split#test";
String[] t = str.split(" |-|#|////|//.");
for (String temp : t) {
       System.out.println(temp);
}
출력 결과:
Java
str
in
g
split
test
 
public String replace(char oldChar,
                      char newChar)

이 문자열 에 나타 난 모든 newCharoldChar 로 바 꾸 어 만 든 새로운 문자열 을 되 돌려 줍 니 다.oldCharString 대상 이 표시 하 는 문자 시퀀스 에 나타 나 지 않 으 면 이 String 대상 에 대한 인용 을 되 돌려 줍 니 다. 그렇지 않 으 면 이 String 대상 이 표시 하 는 문자 시퀀스 와 같은 문자 순 서 를 나타 내 는 새로운 String 대상 을 만 듭 니 다. 나타 나 는 oldChar 을 제외 하고 모두 하나의 newChar 로 바 뀌 었 습 니 다.
예시:
"mesquite in your cellar".replace('e', 'o')
         returns "mosquito in your collar"
 "the war of baronets".replace('r', 'y')
         returns "the way of bayonets"
 "sparring with a purple porpoise".replace('p', 't')
         returns "starring with a turtle tortoise"
 "JonL".replace('q', 'x') returns "JonL" (no change)
 
 

String str = "tst";
String str2 = str.replace('y', 'z');
System.out.println(str == str2);
출력 결과:
true
문자 가 바 뀌 었 을 때:
String str = "tst";
String str2 = str.replace('t', 'z');
System.out.println(str == str2);
출력 결과:
false
 
replaceAll
public String replaceAll(String regex,
                         String replacement)

주어진 replacement 문자열 을 사용 하여 주어진 정규 표현 식 의 모든 하위 문자열 을 대체 합 니 다.
 
시험 증명:
String str = "tst";
String str2 = str.replaceAll("ts", "y");
System.out.println(str2);
출력 결과:
yt
 
indexOf
public int indexOf(String str)
처음 나타 난 지정 한 하위 문자열 의 색인 을 되 돌려 줍 니 다. 되 돌아 오 는 정 수 는?
시험 증명:
String str = "tstdddwz";
System.out.println(str.indexOf("wz"));
출력 결과
6
이때 아래 표 시 는 0 에서 시작 되 는 것 을 주의 하 세 요.
    
 
 
 

좋은 웹페이지 즐겨찾기