Python jieba 라이브러리 분사 모드 실례 사용법

중국어 분사 중에서 jiebe 라이브러리가 가장 흔히 볼 수 있는 이유는 바로 그 독특한 지원 분사 모델, 예를 들어 정확한 모델, 전체 모델, 검색 엔진 모델이다.지바를 포함한 세 가지 방식도 대응한다.cut () 방법, jieba.lcut () 방법, jieba.cut_for_검색 () 방법.다음은 여러분을 위해 이러한 분사 모델과 방법의 사용을 실례적으로 조작하여 함께 알아보겠습니다.

전체 모드:


import jieba
seg_list = jieba.cut(" 。", cut_all=True)
print(type(seg_list),seg_list)

정확한 모드:


seg_list1 = jieba.lcut(" 。", cut_all=False)
print(type(seg_list1),seg_list1)

검색 모드:


seg_list2 = jieba.cut_for_search(" 。")
print(type(seg_list2),seg_list2)
print(" :" + "/ ".join(seg_list))
print(" :" + "/ ".join(seg_list1))
print(" :" + "/ ".join(seg_list2))
출력 결과:
전 모델: 남경/남경시/경시/시장/장강/장강대교/대교/환영/당신/.
정확한 모델: 남경시/장강대교/환영/당신/.
검색 엔진 모델: 남경/경시/남경시/장강/대교/장강대교/환영/당신/.
컨텐츠 확장:
어성을 얻다
우리는 또한 jiaba라는 라이브러리를 통해 단어의 성질을 구분할 수 있다. 예를 들어 동사, 명사 등이다.

import jieba.posseg as psg

seg_list = psg.cut(" ")
print([(s.word, s.flag) for s in seg_list])
# [(' ', 'r'), (' ', 'v'), (' ', 'v'), (' ', 'n'), (' ', 'v')]
우리는 동사나 명사도 추출할 수 있다. 우리는 안에 있는 동사를 추출할 수 있다

import jieba.posseg as psg

seg_list = psg.cut(" ")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])
Python jieba 라이브러리 분사 모드의 실례적인 용법에 관한 이 글은 여기까지 소개되었습니다. 더 많은 Python jieba 라이브러리 분사 모드가 어떻게 사용되는지 내용을 검색하거나 아래의 관련 글을 계속 훑어보십시오. 앞으로 많은 응원 부탁드립니다!

좋은 웹페이지 즐겨찾기