Java 정규 표현 식 의 String. split () 방법

4932 단어
split () 방법 은 주어진 정규 표현 식 과 일치 하 는 문자열 을 나 눕 니 다.
public String[] split(String regex,int limit)
limit 매개 변수 제어 모드 의 응용 횟수 는 소득 배열 의 길이 에 영향 을 줍 니 다.
4. 567917. 이 제한 n 이 0 보다 크 면 모델 은 n - 1 회 까지 적용 되 고 배열 의 길 이 는 n 보다 크 지 않 으 며 배열 의 마지막 항목 은 마지막 에 일치 하 는 경계선 을 초과 하 는 모든 입력 을 포함한다
4. 567917. n 이 비정 상 이 라면 모델 은 가능 한 한 많은 횟수 를 사용 할 것 이 고 배열 은 모든 길이 일 수 있다
4. 567917. n 이 0 이면 모드 는 가능 한 한 많은 횟수 로 적 용 됩 니 다. 배열 은 모든 길이 가 될 수 있 고 마지막 빈 문자열 은 버 려 집 니 다
public String[] split(String regex)
이 방법 은 주어진 표현 식 과 제한 매개 변수 0 을 사용 하여 두 매개 변수 split 방법 을 호출 하 는 것 과 같 습 니 다.따라서 소득 배열 에는 엔 딩 빈 문자열 이 포함 되 지 않 습 니 다.
정규 표현 식 의 컴 파일 표시 형식
문자열 로 지정 한 정규 표현 식 은 먼저 이러한 인 스 턴 스 로 컴 파일 되 어야 합 니 다.그리고 얻 은 모드 를 Matcher 대상 을 만 드 는 데 사용 할 수 있 습 니 다. 정규 표현 식 에 따라 이 대상 은 임의의 문자 시퀀스 와 일치 할 수 있 습 니 다.일치 하 는 모든 상 태 를 일치 기 에 저장 하기 때문에 여러 일치 기 는 같은 모드 를 공유 할 수 있 습 니 다.
따라서 전형 적 인 호출 순 서 는?
Pattern p = Pattern.compile("a*b");
Matcher m = p.matcher("aaaaab");
boolean b = m.matches();
//            ,            matches   。                        。   

boolean b = Pattern.matches("a*b", "aaaaab");
          ,                ,              。 
          ,            。Matcher              。 

정규 표현 식 의 구조 요약
구조 매 칭
문자
x 문자 x
\ \ 역 사선 문자
\ 0 n 8 진수 0 을 가 진 문자 n (0 < = n < = 7)
\ 0 n 8 진수 0 을 가 진 문자 nn (0 < = n < = 7)
\ \ 0mnn 8 진수 0 의 문자 mnn (0 < = m < = 3, 0 < = n < = 7)
\ xhh 16 진수 0x 문자 hh
\ uhhhh 16 진수 0x 문자 hhhh
\ t 탭 문자 ('\ u0009')
새 줄 (줄 바 꿈) 문자 ('\ u000A')
\ r Enter 문자 (\ \ u000D ')
\ \ f 페이지 바 꾸 기 ('\ u000C')
\ \ a 경고 (bell) 문자 ('\ u0007')
\ \ e 전의 부호 ('\ u001B')
\ cx x x 에 대응 하 는 제어 문자
문자 클래스
[abc] a, b 또는 c (단순 클래스)
[^ abc] a, b 또는 c 를 제외 한 모든 문자
[a - zA - Z] a 에서 z 또는 A 에서 Z 까지 두 글자 가 포함 되 어 있 습 니 다 (범위)
[a - d [m - p] a 에서 d 또는 m 에서 p: [a - dm - p] (집합)
[a - z & & [def] d, e 또는 f (교차)
[a - z & & [^ bc] a 에서 z 까지 b 와 c: [ad - z] (빼 기)
[a - z & & [^ m - p] a 에서 z, m 에서 p: [a - lq - z] (빼 기)
미리 정 의 된 문자 클래스
. 모든 문자 (줄 끝 문자 와 일치 할 수도 있 고 일치 하지 않 을 수도 있 습 니 다)
\ d 숫자: [0 - 9]
\ \ D 비 숫자: [^ 0 - 9]
\ s 공백 문자: [\ t \ x0B \ f \ r]
\ \ S 비 공백 문자: [^ \]
\ \ w 단어 문자: [a - zA - Z 0 - 9]
\ W 비 단어 문자: [^ \ w]
POSIX 문자 클래스 (US - ASCI 만)
\ \ p {Lower} 소문 자 문자: [a - z]
\ \ p {Upper} 대문자: [A - Z]
\ \ p {ASCII} 모든 ASCII: [\ x00 - \ x7F]
\ p {Alpha} 알파벳 문자: [\ p {Lower} \ \ p {Upper}]
\ \ p {Digit} 10 진수: [0 - 9]
\ p {Alnum} 알파벳 숫자 문자: [\ p {Alpha} \ p {Digit}]
\ \ p {Punct} 문장 부호:!"#$%&'()*+,-./:;<=>?@[]^_`{|}~
\ p {Graph} 보 이 는 문자: [\ p {Alnum} \ p {Punct}]
\ p {Print} 인쇄 가능 한 문자: [\ p {Graph} \ \ x20]
\ p {Blank} 스페이스 바 또는 탭 문자: [\ t]
\ \ p {Cntrl} 제어 문자: [\ x00 - \ x1F \ x7F]
\ \ p {XDigit} 16 진수: [0 - 9a - fA - F]
\ \ p {Space} 공백 문자: [\ t \ x0B \ \ f \ r]
java. lang. Character 클래스 (간단 한 자바 문자 형식)
\ \ p {javaLowerCase} 은 java. lang. Character. isLowerCase () 와 같 습 니 다.
\ \ p {javaUpperCase} 은 java. lang. Character. isUpperCase () 와 같 습 니 다.
\ \ p {javaWhitespace} 은 java. lang. Character. isWhitespace () 와 같 습 니 다.
\ p {javaMirrored} 은 java. lang. Character. isMirrored () 와 같 습 니 다.
유 니 코드 블록 과 클래스
\ p {InGreek} 그리스 블록 (단일 블록) 의 문자
\ p {Lu} 대문자 (간단 한 분류)
\ \ p {Sc} 통화 기호
\ P {InGreek} 모든 문자, Greek 블록 제외 (부정)
[\ p {L} & & [^ \ p {Lu}] 모든 자모, 대문자 제외 (빼 기)
경계 정합 기
^ 줄 의 첫머리
$줄 의 끝
단어 경계
\ B 비 단어 경계
\ A 입력 의 시작
\ G 이전 일치 하 는 끝
\ Z 입력 의 끝 은 마지막 끝 에 만 사 용 됩 니 다 (있 으 면)
\ z 입력 의 끝
Greedy 수량 어
X? X, 한 번, 한 번 도 없어 요.
X * X, 0 회 또는 여러 번
X + X, 한 번 또는 여러 번
X {n} X, 마침 n 회
X {n,} X, 최소 n 회
X {n, m} X, 적어도 n 번 이지 만 m 번 을 초과 하지 않 습 니 다.
Reluctant 수량 어
X?? X, 한 번 또는 한 번 도 없어 요.
X *? X, 0 회 또는 여러 번
X +? X, 한 번 또는 여러 번
X {n}? X, 마침 n 회
X {n,}? X, 적어도 n 회
X {n, m}? X, 적어도 n 번 이지 만 m 번 을 초과 하지 않 습 니 다.
Possessive 수량 어
X? + X, 한 번 또는 한 번 도 없어 요.
X * + X, 0 회 또는 여러 번
X + + X, 한 번 또는 여러 번
X {n} + X, 마침 n 회
X {n,} + X, 최소 n 회
X {n, m} + X, 적어도 n 회, 하지만 m 회 를 초과 하지 않 습 니 다.
논리 연산 자
XY X 뒤축 Y
X | Y X 또는 Y
(X) X, 포획 그룹 으로
뒤로 인용
일치 하 는 nth 포획 그룹
인용 하 다.
\ 아무것도 없 지만 다음 문 자 를 참조 하 십시오.
\ \ Q 아무것도 없 지만 \ \ E 까지 모든 문 자 를 참조 합 니 다.
\ E Nothing, 하지만 \ Q 에서 시작 하 는 인용 을 끝 냅 니 다.
특수 구조 (비 포획)
(?: X) X, 비 포획 그룹 으로
(? idmsux - idmsux) 아무것도 없 지만 표지 i d m s u x on - off 와 일치 합 니 다.
(? idmsux - idmsux: X) X, 주어진 표지 i d m s u x on - off 가 있 는 비 포획 그룹 (? = X) X 로 서 0 너비 의 정 lookahead 를 통 해
(?! X) X, 0 너비 의 네 거 티 브 룩 헤드 를 통 해
(? < = X) X, 0 너비 의 정 lookbehind 를 통 해
(?
(? > X) X, 독립 된 비 포획 그룹 으로

좋은 웹페이지 즐겨찾기