Python 간 번 체 전환 실현

간 체 번 체 전환
현재 세계 에는 두 가지 중국어 가 존재 하 는데 하 나 는 중국어 간 체 이 고 하 나 는 중국어 번 체 이다.중국어 의 자 연 스 러 운 언어 처 리 를 완전히 익히 려 면 간단명료 함 도 불가피 하 다.그래서 간 체 와 번 체 의 전환 을 파악 하면 적은 노력 으로 큰 효 과 를 거 둘 수 있다.
한편,HanLP 는 간단 하고 복잡 한 변환 클래스 를 제공 합 니 다.CharTable 은 문자 의 정규 화 를 수행 합 니 다.예 를 들 어 간 체 는 번 체 를 바 꾸 고 전각 은 반 각 을 바 꾸 며 대문자 로 소문 자 를 바 꾸 면 모두 이런 유형 으로 실현 할 수 있다.
CharTable 을 사용 하여 간단 한 번 체 전환 을 진행 합 니 다.
다음은 CharTable 을 직접 사용 하여 시의 번 체 에서 간단 한 전환 을 하 겠 습 니 다.구체 적 인 코드 는 다음 과 같다.

if __name__ == "__main__":
    CharTable=JClass('com.hankcs.hanlp.dictionary.other.CharTable')
    print(CharTable.convert('     ,    C   g ,     。   w  , O 。S    , O   。'))
실행 후 효 과 는 다음 과 같 습 니 다.
繁体转换为简体
그러나 번 체 발전 은 한 가지 만 있 는 것 이 아니다.중국 어 는 역사가 유구 하여 지금까지 문자 등급 에'한 쌍 의 여러 개의 번 체'와'한 쌍 의 다 간'현상 이 존재 하고 있다.이 를 위해 한 LP 는'간 체','번 체','대만 번 체','홍콩 번 체'간 상호 전환 기능 을 구현 해 간 체 전환 을 극 대화 하려 고 애 썼 다.
HanLP 중국어 분 류 는 다음 과 같 습 니 다.
간 체 s번 체 t대만 번체자 tw홍콩 번체자 hk여러 가지 번잡 함 과 간략 함 사이 의 전환
이렇게 많은 번 체 가 있다 면,전환 해 보면 틀림없이 여러 가지 가 있 을 것 이다.다음은 이 글씨체 들 간 의 상호 전환 을 실현 한다.전체 코드 는 다음 과 같다.

if __name__ == "__main__":
    text_tw="     ,    C  g ,     。   w  , O 。S    , O   。"
    text_sc = "     ,     。     ,     。      ,     。     ,     。"
    text_hk="     ,    C  g ,     。   w  , O 。S    , O   。"
    text_st="     ,    C  g ,     。   w  , O 。S    , O   。"
    #       
    print(HanLP.s2tw(text_sc))
    #       
    print(HanLP.tw2s(text_tw))
    #       
    print(HanLP.s2hk(text_sc))
    #       
    print(HanLP.hk2s(text_hk))
    #         
    print(HanLP.hk2tw(text_hk))
    #          
    print(HanLP.tw2hk(text_tw))
    #             
    print(HanLP.tw2t(text_tw))
    print(HanLP.hk2t(text_hk))
    #              
    print(HanLP.t2tw(text_st))
    print(HanLP.t2hk(text_st))
실행 후 효 과 는 다음 과 같 습 니 다.
繁体简体转换
파 이 썬 의 간단 한 번 체 전환 실현 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 파 이 썬 의 간단 한 번 체 전환 내용 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 조회 하 시기 바 랍 니 다.앞으로 많은 응원 바 랍 니 다!

좋은 웹페이지 즐겨찾기