Python 간 번 체 전환 실현
현재 세계 에는 두 가지 중국어 가 존재 하 는데 하 나 는 중국어 간 체 이 고 하 나 는 중국어 번 체 이다.중국어 의 자 연 스 러 운 언어 처 리 를 완전히 익히 려 면 간단명료 함 도 불가피 하 다.그래서 간 체 와 번 체 의 전환 을 파악 하면 적은 노력 으로 큰 효 과 를 거 둘 수 있다.
한편,HanLP 는 간단 하고 복잡 한 변환 클래스 를 제공 합 니 다.CharTable 은 문자 의 정규 화 를 수행 합 니 다.예 를 들 어 간 체 는 번 체 를 바 꾸 고 전각 은 반 각 을 바 꾸 며 대문자 로 소문 자 를 바 꾸 면 모두 이런 유형 으로 실현 할 수 있다.
CharTable 을 사용 하여 간단 한 번 체 전환 을 진행 합 니 다.
다음은 CharTable 을 직접 사용 하여 시의 번 체 에서 간단 한 전환 을 하 겠 습 니 다.구체 적 인 코드 는 다음 과 같다.
if __name__ == "__main__":
CharTable=JClass('com.hankcs.hanlp.dictionary.other.CharTable')
print(CharTable.convert(' , C g , 。 w , O 。S , O 。'))
실행 후 효 과 는 다음 과 같 습 니 다.그러나 번 체 발전 은 한 가지 만 있 는 것 이 아니다.중국 어 는 역사가 유구 하여 지금까지 문자 등급 에'한 쌍 의 여러 개의 번 체'와'한 쌍 의 다 간'현상 이 존재 하고 있다.이 를 위해 한 LP 는'간 체','번 체','대만 번 체','홍콩 번 체'간 상호 전환 기능 을 구현 해 간 체 전환 을 극 대화 하려 고 애 썼 다.
HanLP 중국어 분 류 는 다음 과 같 습 니 다.
간 체 s번 체 t대만 번체자 tw홍콩 번체자 hk여러 가지 번잡 함 과 간략 함 사이 의 전환
이렇게 많은 번 체 가 있다 면,전환 해 보면 틀림없이 여러 가지 가 있 을 것 이다.다음은 이 글씨체 들 간 의 상호 전환 을 실현 한다.전체 코드 는 다음 과 같다.
if __name__ == "__main__":
text_tw=" , C g , 。 w , O 。S , O 。"
text_sc = " , 。 , 。 , 。 , 。"
text_hk=" , C g , 。 w , O 。S , O 。"
text_st=" , C g , 。 w , O 。S , O 。"
#
print(HanLP.s2tw(text_sc))
#
print(HanLP.tw2s(text_tw))
#
print(HanLP.s2hk(text_sc))
#
print(HanLP.hk2s(text_hk))
#
print(HanLP.hk2tw(text_hk))
#
print(HanLP.tw2hk(text_tw))
#
print(HanLP.tw2t(text_tw))
print(HanLP.hk2t(text_hk))
#
print(HanLP.t2tw(text_st))
print(HanLP.t2hk(text_st))
실행 후 효 과 는 다음 과 같 습 니 다.파 이 썬 의 간단 한 번 체 전환 실현 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 파 이 썬 의 간단 한 번 체 전환 내용 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 조회 하 시기 바 랍 니 다.앞으로 많은 응원 바 랍 니 다!
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Python의 None과 NULL의 차이점 상세 정보그래서 대상 = 속성 + 방법 (사실 방법도 하나의 속성, 데이터 속성과 구별되는 호출 가능한 속성 같은 속성과 방법을 가진 대상을 클래스, 즉 Classl로 분류할 수 있다.클래스는 하나의 청사진과 같아서 하나의 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.