Python 에서 정규 표현 식 을 사용 하 는 ASCII 모드 를 자세히 설명 합 니 다.

ASCII
ASCII(American Standard Code for Information Interchange)는 단일 바이트 의 인 코딩 입 니 다.컴퓨터 세계 에 서 는 처음에는 영어 만 있 었 고,단일 바이트 에 서 는 256 개의 서로 다른 문 자 를 표시 할 수 있 으 며,모든 영어 문자 와 많은 제어 기 호 를 표시 할 수 있 었 다.그러나 ASCII 는 그 중 절반(\x80 이하)만 사용 한 것 도 MBCS 가 실현 할 수 있 는 기반 이다.
현재 기본적으로 python 3 을 사용 하여 개발 되 었 으 나,때로는 오래된 python 2 코드 를 호 환 하기 위해 정규 표현 식 에 서 는 문자열 의 표현 방식 이 다 릅 니 다.python 3 에 서 는 유 니 코드 를 사용 하여 문자열 과 정규 표현 식 을 표시 하고,python 2 에 서 는 ASCII 로 표시 하기 때문에 python 3 에 서 는 어떻게 설정 해 야 오래된 방식 을 호 환 할 수 있 습 니까?사실은 ASCII 의 표 지 를 통 해 해결 할 수 있 습 니 다.예 를 들 어 다음 과 같 습 니 다.

#python 3.6 
#     
#http://blog.csdn.net/caimouse/article/details/51749579 
# 
import re 
text = u'Français złoty Österreich' 
pattern = r'\w+' 
ascii_pattern = re.compile(pattern, re.ASCII) 
unicode_pattern = re.compile(pattern) 
print('Text  :', text) 
print('Pattern :', pattern) 
print('ASCII  :', list(ascii_pattern.findall(text))) 
print('Unicode :', list(unicode_pattern.findall(text))) 
결과 출력 은 다음 과 같 습 니 다:

Text  : Français złoty Österreich
Pattern : \w+
ASCII  : ['Fran', 'ais', 'z', 'oty', 'sterreich']
Unicode : ['Français', 'złoty', 'Österreich']
총결산
위 에서 말 한 것 은 소 편 이 소개 한 Python 에서 정규 표현 식 을 사용 하 는 ASCII 모드 입 니 다.여러분 에 게 도움 이 되 기 를 바 랍 니 다.궁금 한 점 이 있 으 면 메 시 지 를 남 겨 주세요.소 편 은 바로 답 해 드 리 겠 습 니 다.여기 서도 저희 사이트 에 대한 여러분 의 지지 에 감 사 드 립 니 다!

좋은 웹페이지 즐겨찾기