MeCab을 MacOS에 넣어 사용해보기

2388 단어 mecab

소개



자연언어 처리에서 최근 자주 사용되고 있는 툴로서 「MeCab( ht tp // 타쿠 910. 기주 b. 이오 / 메카 b / )」를 들 수 있습니다.
그 MeCab을 MacOS에 넣어 동작시키는 곳까지의 흐름을 설명합니다.

이번은 Macports나 HOME BREW등은 이용하지 않고 해 가고 싶습니다.

MeCab 다운로드



우선, 공식 사이트의 「다운로드」로부터,
MeCab 본체와 MeCab 용 사전을 다운로드하십시오.


설치



다운로드 한 MeCab 본체 (아마 mecab-0.996)와 MeCab 사전 (아마 mecab-ipadic-2.7.0-20070801)을 설치합니다.

MeCab 본체 설치



우선, mecab-0.996(MeCab의 본체)를 해동해,
터미널의 cd 명령으로 압축을 푼 폴더에 들어가십시오.
그리고 다음 명령을 순서대로 두드려갑니다.

Terminal
$ ./configure
$ make
$ make check
$ sudo make install

기본적으로 make 중에 나온 warning은 무시합니다.
설치가 끝나면 이제 MeCab용 사전을 설치합니다.

MeCab 사전 설치



우선, mecab-ipadic-2.7.0-20070801(MeCab의 사전)을 해동해,
터미널의 cd 명령으로 압축을 푼 폴더에 들어가십시오.
그리고 다음 명령을 순서대로 두드려갑니다.

그러나 사전은 기본적으로 문자 코드가 EUC로 설치되므로,
다루기 쉽도록 UTF-8로 변경하여 설치합시다.

Terminal
$ ./configure --with-charset=utf8
$ make
$ sudo make install

이것으로 설치가 종료됩니다.

우선 사용해 본다



Terminal
$ mecab
すもももももももものうちだけど、そんなことはどうでもいいよね?
すもも   名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも  名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも  名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち  名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
だ 助動詞,*,*,*,特殊・ダ,基本形,だ,ダ,ダ
けど  助詞,接続助詞,*,*,*,*,けど,ケド,ケド
、 記号,読点,*,*,*,*,、,、,、
そんな   連体詞,*,*,*,*,*,そんな,ソンナ,ソンナ
こと  名詞,非自立,一般,*,*,*,こと,コト,コト
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
どう  副詞,助詞類接続,*,*,*,*,どう,ドウ,ドー
でも  助詞,副助詞,*,*,*,*,でも,デモ,デモ
いい  形容詞,自立,*,*,形容詞・イイ,基本形,いい,イイ,イイ
よ 助詞,終助詞,*,*,*,*,よ,ヨ,ヨ
ね 助詞,終助詞,*,*,*,*,ね,ネ,ネ
? 記号,一般,*,*,*,*,?,?,?



아무쪼록 부디



· MeCab에서 원본 사전 만들기

좋은 웹페이지 즐겨찾기