정규 표현 식 속사 표
x x
\\
\0n 0 n (0 <= n <= 7)
\0nn 0 nn (0 <= n <= 7)
\0mnn 0 mnn(0 <= m <= 3、0 <= n <= 7)
\xhh 0x hh
\uhhhh 0x hhhh
\t ('\u0009')
( ) ('\u000A')
\r ('\u000D')
\f ('\u000C')
\a (bell) ('\u0007')
\e ('\u001B')
\cx x
문자 클래스
[abc] a、b c( )
[^abc] , a、b c( )
[a-zA-Z] a z A Z, ( )
[a-d[m-p]] a d m p:[a-dm-p]( )
[a-z&&[def]] d、e f( )
[a-z&&[^bc]] a z, b c:[ad-z]( )
[a-z&&[^m-p]] a z, m p:[a-lq-z]( )
미리 정 의 된 문자 클래스
. ( )
\d :[0-9]
\D : [^0-9]
\s :[ \t
\x0B\f\r]
\S :[^\s]
\w :[a-zA-Z_0-9]
\W :[^\w]
POSIX 문자 클래스(US-ASCI 만)
\p{Lower} :[a-z]
\p{Upper} :[A-Z]
\p{ASCII} ASCII:[\x00-\x7F]
\p{Alpha} :[\p{Lower}\p{Upper}]
\p{Digit} :[0-9]
\p{Alnum} :[\p{Alpha}\p{Digit}]
\p{Punct} :!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
\p{Graph} :[\p{Alnum}\p{Punct}]
\p{Print} :[\p{Graph}\x20]
\p{Blank} :[ \t]
\p{Cntrl} :[\x00-\x1F\x7F]
\p{XDigit} :[0-9a-fA-F]
\p{Space} :[ \t
\x0B\f\r]
java.lang.Character 클래스(간단 한 자바 문자 형식)
\p{javaLowerCase} java.lang.Character.isLowerCase()
\p{javaUpperCase} java.lang.Character.isUpperCase()
\p{javaWhitespace} java.lang.Character.isWhitespace()
\p{javaMirrored} java.lang.Character.isMirrored()
유 니 코드 블록 과 클래스
\p{InGreek} Greek ( )
\p{Lu} ( )
\p{Sc}
\P{InGreek} ,Greek ( )
[\p{L}&&[^\p{Lu}]] , ( )
경계 정합 기
^
$
\b
\B
\A
\G
\Z , ( )
\z
Greedy 수량 어
X? X,
X* X,
X+ X,
X{n} X, n
X{n,} X, n
X{n,m} X, n , m
Reluctant 수량 어
X?? X,
X*? X,
X+? X,
X{n}? X, n
X{n,}? X, n
X{n,m}? X, n , m
Possessive 수량 어
X?+ X,
X*+ X,
X++ X,
X{n}+ X, n
X{n,}+ X, n
X{n,m}+ X, n , m
논리 연산 자
XY X Y
X|Y X Y
(X) X,
뒤로 인용
nth
인용 하 다.
\ Nothing,
\Q Nothing, , \E
\E Nothing, \Q
특수 구조(비 포획)
(?:X) X,
(?idmsux-idmsux) Nothing, i d m s u x on - off
(?idmsux-idmsux:X) X, i d m s u x on - off
(?=X) X, lookahead
(?!X) X, lookahead
(?<=X) X, lookbehind
(?<!X) X, lookbehind
(?>X) X,
반사 선,전의 와 인용역 사선 문자('\')는 전의 구 조 를 참조 하 는 데 사 용 됩 니 다.위 표 에서 정의 한 것 과 같이 비 전의 구조 로 해 석 될 다른 문 자 를 참조 하 는 데 도 사 용 됩 니 다.따라서 표현 식\\는 하나의 반사 선 과 일치 하고\{는 왼쪽 괄호 와 일치 합 니 다.
전의 구 조 를 나타 내지 않 는 어떤 자모 문자 앞에서 반사 선 을 사용 하 는 것 은 잘못된 것 이다.그것들 은 앞으로 정규 표현 식 언어 를 확장 하기 위해 보존 되 어 있 습 니 다.이 문자 가 비 전의 구조의 일부분 이 든 아니 든 비 자모 문자 앞에서 반사 선 을 사용 할 수 있다.
자바 Language Specification 의 요구 에 따라 자바 소스 코드 의 문자열 의 반사 선 은 유 니 코드 전의 나 다른 문자 전의 로 해 석 됩 니 다.따라서 문자열 의 액면가 에 두 개의 역 사선 을 사용 해 야 합 니 다.정규 표현 식 이 보호 되 고 자바 바이트 컴 파일 러 에 의 해 해석 되 지 않 음 을 표시 합 니 다.예 를 들 어 정규 표현 식 으로 해 석 될 때 문자열 의 액면가'\b'는 하나의 퇴 격 문자 와 일치 하고'\\b'는 단어 경계 와 일치 합 니 다.문자열 글자 액면가"\(hello\)"는 불법 입 니 다.컴 파일 시 오류 가 발생 할 수 있 습 니 다.문자열(hello)과 일치 하려 면 문자열 글자 액면가'\\(hello\\'를 사용 해 야 합 니 다.
문자 클래스
문자 류 는 다른 문자 류 에 나타 날 수 있 으 며,병렬 연산 자(암시 적)와 교차 연산 자(&&)를 포함 할 수 있 습 니 다.병렬 연산 자 는 최소한 하나의 조작 수 클래스 에 있 는 모든 문 자 를 포함 하 는 클래스 를 표시 합 니 다.교 집합 연산 자 는 두 개의 연산 자 클래스 에 있 는 모든 문 자 를 포함 하 는 클래스 를 표시 합 니 다.
문자 클래스 연산 자의 우선 순 위 는 다음 과 같 습 니 다.가장 높 은 순서 에서 가장 낮은 순서 로 배열 합 니 다.
글자 액면가 전의 \x
패 킷 [...]
범위. a-z
모으다 [a-e][i-u]
교차 하 다 [a-z&&[aeiou]]
메타 문자 의 서로 다른 집합 은 문자 류 의 외부 가 아 닌 문자 류 의 내부 에 있 습 니 다.예 를 들 어 정규 표현 식 은 문자 류 내부 에서 특별한 의 미 를 잃 었 고 표현 식-원 문 자 를 형성 하 는 범위 가 되 었 습 니 다.
줄 끝 기호
줄 끝 자 는 하나 또는 두 글자 의 시퀀스 로 입력 문자 시퀀스 의 줄 끝 을 표시 합 니 다.다음 코드 는 줄 끝 문자 로 인식 되 었 습 니 다.
새 줄(줄 바 꿈)문자('),
뒤에 새 줄 에 붙 어 있 는 리 턴 부호("\r"),
단독 리 턴 문자('\r'),
다음 줄 문자('\u0085'),
줄 구분자('\u2028')또는
단락 구분자('\u2029).
UNIX 를 활성화 하면LINES 모드 에 서 는 새 줄 문자 가 유일 하 게 인식 되 는 줄 끝 문자 입 니 다.
DOTALL 로고 가 지정 되 지 않 으 면 정규 표현 식 입 니 다.모든 문자(줄 끝 문자 제외)와 일치 할 수 있 습 니 다.
기본 적 인 상황 에서 정규 표현 식^와$는 줄 끝 자 를 무시 하고 전체 입력 시퀀스 의 시작 과 끝 만 일치 합 니 다.MULTILINE 모드 를 활성화 하면^입력 의 시작 과 줄 의 끝 이 일치 합 니 다.MULTILINE 모드 에 있 을 때$는 줄 끝 문자 이전 이나 입력 시퀀스 의 끝 에 만 일치 합 니 다.
그룹 과 캡 처
포획 조 는 왼쪽 에서 오른쪽으로 괄호 를 계산 해서 번 호 를 매 길 수 있다.예 를 들 어 표현 식(A)(B(C)))에 다음 과 같은 그룹 이 네 개 있 습 니 다.
((A)(B(C)))
\A
(B(C))
(C)
그룹 0 은 항상 전체 표현 식 을 대표 합 니 다.
캡 처 그룹 이 라 고 명명 한 이 유 는 일치 하 는 그룹 과 일치 하 는 입력 시퀀스 의 모든 하위 시퀀스 를 저장 하기 때 문 입 니 다.캡 처 된 하위 시퀀스 는 나중에 Back 참조 로 표현 식 에서 사용 할 수 있 으 며,일치 하 는 작업 이 끝 난 후에 일치 하 는 장치 에서 가 져 올 수 있 습 니 다.
그룹 과 연 결 된 캡 처 입력 은 항상 그룹 과 최근 에 일치 하 는 하위 시퀀스 입 니 다.계량 화 된 이유 로 그룹 을 다시 계산 하면 두 번 째 계산 에 실 패 했 을 때 이전에 캡 처 한 값(있 으 면)을 유지 합 니 다.예 를 들 어 문자열'aba'와 표현 식(a(b)?)+일치 하면 두 번 째 그룹 을'b'로 설정 합 니 다.일치 하 는 시작 마다 캡 처 된 입력 이 버 려 집 니 다.
으로시작 하 는 그룹 은 순수한 비 포획 그룹 으로 텍스트 를 포획 하지 않 고 조합 계 에 대해 계산 하지 않 습 니 다.
이상 에서 말 한 것 이 본문의 전부 이 니 여러분 들 이 좋아 하 시 기 를 바 랍 니 다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
awk 상용 명령awk 는 모든 입력 줄 을 하나의 기록 으로 인식 하고 그 줄 의 모든 단어 도 메 인 을 하나의 필드 로 인식 합 니 다. ARGC 명령 줄 에 awk 스 크 립 트 가 들 어 오 는 매개...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.