【자신용 메모】Python에서의 정규 표현

3273 단어 파이썬정규식

정규식이란?



문자열을 하나의 패턴화된 문자열로 표현하는 표기법.
"정규 표현식을 사용하여 문자열을 패턴화 된 문자열로 바꾸면 문자열을 찾거나 바꿀 수 있습니다.

예제


import re

source = "Hatsune Miku"

result = re.match("Hatsu", source)
if result:
    print(result.group())    
#matchはオブジェクトを返す。
#オブジェクトから、マッチした部分を取り出す(str)には
#.group()関数を使う



여기서 "Hatsu"가 패턴이고 "Hatsune Miku"가 소스 문자열이고 match ()는 소스의 시작이 패턴인지 여부를 확인합니다.

패턴과 소스를 비교하는 방법은 match만이 아니다. 그 밖에도 다음과 같은 메소드를 사용할 수 있다.

· search ()는 첫 번째 일치를 반환합니다. (있는 경우)
· findall ()은 겹치지 않는 모든 일치의 목록을 반환합니다. (있는 경우)
· split ()은 패턴과 일치하는 곳에서 소스를 분할하고 부분 문자열 목록을 반환합니다.
· sub ()는 대체 문자열 인수를 취하고 소스 중 패턴과 일치하는 모든 부분을 대체 문자열로 바꿉니다.

사람 이름에서 Miss.를 추출해 보았습니다.


source = "Graham, Miss. Margaret Edith"

title_search = re.search(' ([A-Za-z]+)\.', source)
#' ([A-Za-z]+)\.'は、英文字([A-Za-z])1文字以上でかつ .が語尾につくものを表す。

if title_search:
    print(title_search.group()) 



【참고・인용】
· 입문 Python 3(Bill Lubanovic (저자), 사이토 야스히로 (감수), 나가오 타카히로 (번역))
· htps : // 테카로 my. jp/마가지네/15635
· htps : // 코 m / 완완 d / ms / 272419 2f95c입니다 bc
· htps : // 이 m/세아_해 p/있어 ms/7c8811b5cf37d700아dc4

좋은 웹페이지 즐겨찾기