N-gram 언어 모델을 기반으로 한 보완 (company-ngram)
company-ngram이라는
company-mode
백엔드를 사용하면 이러한 희망을 높은 가능성으로 실현할 수 있습니다.company-ngram
는 N-gram 언어 모델을 기반으로 커서 앞에 쓰여진 단어의 순서에서 다음에 쓸 가능성이 높은 단어를 예상하고 보완 후보를 제공합니다.company-ngram
에 의한 보완 후보의 예입니다.보완 후보 디스플레이의 오른쪽 열에있는
.
의 왼쪽 숫자는 N-gram 데이터에서 보완 후보의 빈도를 나타냅니다..
의 오른쪽 숫자는 커서 앞의 어느 단어가 보완 후보를 생성하는 데 사용되었는지를 나타냅니다.1
의 위치에 해당하는 단어가 N-gram 데이터와 일치했음을 (그림에는 존재하지 않지만) 0
의 위치에 해당하는 단어는 N-gram 데이터와 일치하지 않았습니다. 것을 나타냅니다.예를 들어,
a b c
에 대해 d 42.110
라는 보완 후보가 표시되는 경우, N-gram 데이터의 기초가 된 텍스트 데이터 중에 a b * d
(*
는 임의의 단어를 나타낸다) 42 개 존재했다는 것을 읽을 수 있습니다.이용방법
company-ngram
는 Melpa에서 설치할 수 있습니다.설치 후
~/.emacs.d/init.el
에 다음 설정을 추가하십시오.; ~/.emacs.d/init.el
(with-eval-after-load 'company-ngram
; ~/data/ngram/*.txt are used as data
(setq company-ngram-data-dir "~/data/ngram")
; company-ngram supports python 3 or newer
(setq company-ngram-python "/path/to/python3")
(company-ngram-init)
(cons 'company-ngram-backend company-backends)
; or use `M-x turn-on-company-ngram' and
; `M-x turn-off-company-ngram' on individual buffers
;
; save the cache of candidates
(run-with-idle-timer 3600 t
(lambda ()
(company-ngram-command "save_cache")
))
)
(require 'company-ngram nil t)
company-ngram
를 사용하려는 버퍼에서 M-x turn-on-company-ngram
하면 company-ngram
가 활성화됩니다.company-ngram
를 사용하려면 N-gram 데이터를 생성하기 위해 텍스트 데이터가 필요합니다.기본적으로
~/data/ngram/*.txt
는 텍스트 데이터로로드됩니다.기존 코퍼스를 사용하거나
w3m -dump <URI>
로 스크래핑하여 자신의 코퍼스를 만들 수 있습니다.우선 시도하려면 RFC 텍스트이 저렴합니다.
자세한 내용은 README을 참조하십시오.
Reference
이 문제에 관하여(N-gram 언어 모델을 기반으로 한 보완 (company-ngram)), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/kshramt/items/9f6ee7d546b711439052텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)