python 정규 표현 식 의 로그 인 편

정의
정규 표현 식 은 문자열 작업 에 대한 논리 적 공식 으로 미리 정 의 된 특정한 문자 와 이 특정한 문자 의 조합 으로'규칙 문자열'을 구성 하 는 것 입 니 다.이'규칙 문자열'은 문자열 에 대한 여과 논 리 를 표현 합 니 다.이러한 규칙 에 맞 는 문자열 을 찾 으 면 일치 하지 않 으 면 일치 하지 않 는 다 고 말 합 니 다.
일치 규칙
1.문법 규칙
 
2.관련 주해
질문
텍스트 에 있 는 문자"\"가 필요 하 다 면 프로 그래 밍 언어 로 표 시 된 정규 표현 식 에 4 개의 역 슬 래 쉬"\\\\"가 필요 합 니 다.앞의 두 개 와 뒤의 두 개 는 각각 프로 그래 밍 언어 에서 역 슬 래 쉬 로 바 꾸 고 두 개의 역 슬 래 쉬 로 바 꾼 다음 정규 표현 식 에서 역 슬 래 쉬 로 바 꿉 니 다.그 일치 과정 은 다음 과 같다.
문자
정합 과정
\\\\abc
문자열 의 실제 값 을 위해 역 슬 래 쉬 바 꿈 을 취소 합 니 다.
\\abc
re.com pile()을 위해 역 슬 래 쉬 전의 취소
\abc
일치 하 는 대상 문자열
네 개의"\"를 입력 하 는 번 거 로 움 을 해결 하기 위해 서 는 python 의 네 이 티 브 문자열(raw string),즉 문자열 앞 에 r 를 추가 할 수 있 습 니 다.다음 과 같다.

import re 
 print(re.search(r"\\abc","123\\abc"))
위 에서 알 수 있 듯 이 원본 문자열 을 사용 하면 문자열 의 실제 값 에서 re 컴 파일 러 로 의 문자열 전의 과정 을 줄 이 고 컴 파일 러 가 컴 파일 할 때 도 의 미 를 바 꿔 야 합 니 다.
b.탐욕 매 칭 과 비 탐욕 매 칭
탐욕 일치:정규 표현 식 은 일반적으로 최대 길이 의 일치,즉 탐욕 일치 로 향 합 니 다.예:

 import re
print(re.match("ab.*c","abcdfghc"))
일치 하 는 결 과 는 전체 문자열 입 니 다.탐욕 이 아 닌 결과 에 맞 는 것 이 좋 습 니 다.최소한 문자 와 일치 합 니 다.python 기본 값 은 탐욕 모드 입 니 다.양사 뒤에 바로 물음 표를 붙 일 까요?비 탐욕 모드 야.

 import re
 print(re.match("ab.*?c","abcdfghc"))
이렇게 일치 하 는 결 과 는 abc 입 니 다.
3.모듈 과 함수
re 모듈
컴 파일 문법 규칙
match()  문자열 시작 위치 부터 일치 합 니 다.
search()문자열 의 임의의 위치 에서 첫 번 째 규칙 에 맞 는 문자열 로 일치 합 니 다.
findall  일치 하 는 모든 문자열 을 목록 으로 되 돌려 줍 니 다.
finditer               일치 하 는 모든 문자열 을 교체 기 형식 으로 되 돌려 줍 니 다.
split()  분할 문자열
group()   일치 하 는 문자열 의 그룹 정보 가 져 오기
4.특수 구조의 규칙
 
총결산
위 에서 말 한 것 은 소 편 이 소개 한 python 정규 표현 식 의 번호 대로 자리 에 앉 는 편 입 니 다.여러분 에 게 도움 이 되 기 를 바 랍 니 다.궁금 한 점 이 있 으 시 면 메 시 지 를 남 겨 주세요.소 편 은 제때에 답 해 드 리 겠 습 니 다.여기 서도 저희 사이트 에 대한 여러분 의 지지 에 감 사 드 립 니 다!

좋은 웹페이지 즐겨찾기