정규 표현 식 속사 표

문자

x    x
\\   
\0n    0 n (0 <= n <= 7)
\0nn    0 nn (0 <= n <= 7)
\0mnn    0 mnn(0 <= m <= 3、0 <= n <= 7)
\xhh    0x hh
\uhhhh    0x hhhh
\t    ('\u0009')

    ( ) ('\u000A')
\r    ('\u000D')
\f    ('\u000C')
\a    (bell) ('\u0007')
\e    ('\u001B')
\cx    x
문자 클래스

[abc]    a、b c( )
[^abc]    , a、b c( )
[a-zA-Z]    a z A Z, ( )
[a-d[m-p]]    a d m p:[a-dm-p]( )
[a-z&&[def]]    d、e f( )
[a-z&&[^bc]]    a z, b c:[ad-z]( )
[a-z&&[^m-p]]    a z, m p:[a-lq-z]( )
미리 정 의 된 문자 클래스

.    ( )
\d    :[0-9]
\D    : [^0-9]
\s    :[ \t
\x0B\f\r]
\S    :[^\s]
\w    :[a-zA-Z_0-9]
\W    :[^\w]
POSIX 문자 클래스(US-ASCI 만)

\p{Lower}    :[a-z]
\p{Upper}    :[A-Z]
\p{ASCII}    ASCII:[\x00-\x7F]
\p{Alpha}    :[\p{Lower}\p{Upper}]
\p{Digit}    :[0-9]
\p{Alnum}    :[\p{Alpha}\p{Digit}]
\p{Punct}    :!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
\p{Graph}    :[\p{Alnum}\p{Punct}]
\p{Print}    :[\p{Graph}\x20]
\p{Blank}    :[ \t]
\p{Cntrl}    :[\x00-\x1F\x7F]
\p{XDigit}    :[0-9a-fA-F]
\p{Space}    :[ \t
\x0B\f\r]
java.lang.Character 클래스(간단 한 자바 문자 형식)

\p{javaLowerCase}    java.lang.Character.isLowerCase()
\p{javaUpperCase}    java.lang.Character.isUpperCase()
\p{javaWhitespace}    java.lang.Character.isWhitespace()
\p{javaMirrored}    java.lang.Character.isMirrored()
유 니 코드 블록 과 클래스

\p{InGreek}    Greek ( )
\p{Lu}    ( )
\p{Sc}   
\P{InGreek}    ,Greek ( )
[\p{L}&&[^\p{Lu}]]     , ( )
경계 정합 기

^   
$   
\b   
\B   
\A   
\G   
\Z    , ( )
\z   
Greedy 수량 어

X?    X,
X*    X,
X+    X,
X{n}    X, n
X{n,}    X, n
X{n,m}    X, n , m
Reluctant 수량 어

X??    X,
X*?    X,
X+?    X,
X{n}?    X, n
X{n,}?    X, n
X{n,m}?    X, n , m
Possessive 수량 어

X?+    X,
X*+    X,
X++    X,
X{n}+    X, n
X{n,}+    X, n
X{n,m}+    X, n , m
논리 연산 자

XY    X Y
X|Y    X Y
(X)    X,
뒤로 인용


    nth
인용 하 다.

\    Nothing,
\Q    Nothing, , \E
\E    Nothing, \Q
특수 구조(비 포획)

(?:X)    X,
(?idmsux-idmsux)     Nothing, i d m s u x on - off
(?idmsux-idmsux:X)      X, i d m s u x on - off
(?=X)    X, lookahead
(?!X)    X, lookahead
(?<=X)    X, lookbehind
(?<!X)    X, lookbehind
(?>X)    X,
반사 선,전의 와 인용
역 사선 문자('\')는 전의 구 조 를 참조 하 는 데 사 용 됩 니 다.위 표 에서 정의 한 것 과 같이 비 전의 구조 로 해 석 될 다른 문 자 를 참조 하 는 데 도 사 용 됩 니 다.따라서 표현 식\\는 하나의 반사 선 과 일치 하고\{는 왼쪽 괄호 와 일치 합 니 다.
전의 구 조 를 나타 내지 않 는 어떤 자모 문자 앞에서 반사 선 을 사용 하 는 것 은 잘못된 것 이다.그것들 은 앞으로 정규 표현 식 언어 를 확장 하기 위해 보존 되 어 있 습 니 다.이 문자 가 비 전의 구조의 일부분 이 든 아니 든 비 자모 문자 앞에서 반사 선 을 사용 할 수 있다.
자바 Language Specification 의 요구 에 따라 자바 소스 코드 의 문자열 의 반사 선 은 유 니 코드 전의 나 다른 문자 전의 로 해 석 됩 니 다.따라서 문자열 의 액면가 에 두 개의 역 사선 을 사용 해 야 합 니 다.정규 표현 식 이 보호 되 고 자바 바이트 컴 파일 러 에 의 해 해석 되 지 않 음 을 표시 합 니 다.예 를 들 어 정규 표현 식 으로 해 석 될 때 문자열 의 액면가'\b'는 하나의 퇴 격 문자 와 일치 하고'\\b'는 단어 경계 와 일치 합 니 다.문자열 글자 액면가"\(hello\)"는 불법 입 니 다.컴 파일 시 오류 가 발생 할 수 있 습 니 다.문자열(hello)과 일치 하려 면 문자열 글자 액면가'\\(hello\\'를 사용 해 야 합 니 다.
문자 클래스
문자 류 는 다른 문자 류 에 나타 날 수 있 으 며,병렬 연산 자(암시 적)와 교차 연산 자(&&)를 포함 할 수 있 습 니 다.병렬 연산 자 는 최소한 하나의 조작 수 클래스 에 있 는 모든 문 자 를 포함 하 는 클래스 를 표시 합 니 다.교 집합 연산 자 는 두 개의 연산 자 클래스 에 있 는 모든 문 자 를 포함 하 는 클래스 를 표시 합 니 다.
문자 클래스 연산 자의 우선 순 위 는 다음 과 같 습 니 다.가장 높 은 순서 에서 가장 낮은 순서 로 배열 합 니 다.
       글자 액면가 전의        \x
       패 킷    [...]
       범위.    a-z
       모으다    [a-e][i-u]
       교차 하 다    [a-z&&[aeiou]]
메타 문자 의 서로 다른 집합 은 문자 류 의 외부 가 아 닌 문자 류 의 내부 에 있 습 니 다.예 를 들 어 정규 표현 식 은 문자 류 내부 에서 특별한 의 미 를 잃 었 고 표현 식-원 문 자 를 형성 하 는 범위 가 되 었 습 니 다.
줄 끝 기호
줄 끝 자 는 하나 또는 두 글자 의 시퀀스 로 입력 문자 시퀀스 의 줄 끝 을 표시 합 니 다.다음 코드 는 줄 끝 문자 로 인식 되 었 습 니 다.
새 줄(줄 바 꿈)문자('),
뒤에 새 줄 에 붙 어 있 는 리 턴 부호("\r"),
단독 리 턴 문자('\r'),
다음 줄 문자('\u0085'),
줄 구분자('\u2028')또는
단락 구분자('\u2029).
UNIX 를 활성화 하면LINES 모드 에 서 는 새 줄 문자 가 유일 하 게 인식 되 는 줄 끝 문자 입 니 다.
DOTALL 로고 가 지정 되 지 않 으 면 정규 표현 식 입 니 다.모든 문자(줄 끝 문자 제외)와 일치 할 수 있 습 니 다.
기본 적 인 상황 에서 정규 표현 식^와$는 줄 끝 자 를 무시 하고 전체 입력 시퀀스 의 시작 과 끝 만 일치 합 니 다.MULTILINE 모드 를 활성화 하면^입력 의 시작 과 줄 의 끝 이 일치 합 니 다.MULTILINE 모드 에 있 을 때$는 줄 끝 문자 이전 이나 입력 시퀀스 의 끝 에 만 일치 합 니 다.
그룹 과 캡 처
포획 조 는 왼쪽 에서 오른쪽으로 괄호 를 계산 해서 번 호 를 매 길 수 있다.예 를 들 어 표현 식(A)(B(C)))에 다음 과 같은 그룹 이 네 개 있 습 니 다.
       ((A)(B(C)))
       \A
       (B(C))
       (C)
그룹 0 은 항상 전체 표현 식 을 대표 합 니 다.
캡 처 그룹 이 라 고 명명 한 이 유 는 일치 하 는 그룹 과 일치 하 는 입력 시퀀스 의 모든 하위 시퀀스 를 저장 하기 때 문 입 니 다.캡 처 된 하위 시퀀스 는 나중에 Back 참조 로 표현 식 에서 사용 할 수 있 으 며,일치 하 는 작업 이 끝 난 후에 일치 하 는 장치 에서 가 져 올 수 있 습 니 다.
그룹 과 연 결 된 캡 처 입력 은 항상 그룹 과 최근 에 일치 하 는 하위 시퀀스 입 니 다.계량 화 된 이유 로 그룹 을 다시 계산 하면 두 번 째 계산 에 실 패 했 을 때 이전에 캡 처 한 값(있 으 면)을 유지 합 니 다.예 를 들 어 문자열'aba'와 표현 식(a(b)?)+일치 하면 두 번 째 그룹 을'b'로 설정 합 니 다.일치 하 는 시작 마다 캡 처 된 입력 이 버 려 집 니 다.
으로시작 하 는 그룹 은 순수한 비 포획 그룹 으로 텍스트 를 포획 하지 않 고 조합 계 에 대해 계산 하지 않 습 니 다.
이상 에서 말 한 것 이 본문의 전부 이 니 여러분 들 이 좋아 하 시 기 를 바 랍 니 다.

좋은 웹페이지 즐겨찾기