PHP로 메카브로 간단하게 일본어 형태소 해석 결과!

4245 단어 PHP
■ MeCabMeCab은 오픈소스의 형태소 분석 엔진이다.MeCab 이외에 자유롭게 얻을 수 있는 것은 ChaSen, 주먼, KAKASI 등이다.유상으로는 Basis Technology의 Rosette형태소 분석 시스템 등도 있다.MeCab - Wikipedia에 따르면
  • MeCab은 소스 파일의 엔진으로 형태소 분석 출신이며 현재나라선단과학기술대학 소프트웨어 엔지니어Google는 개발자 중 한 명인 공등탁이 개발하고 있다.개발자가 좋아하는 물건'Google 일본어 입력기'에서 따온 이름이다.
  • 개발 시작은 당초무청를 기반으로 채션TNG라는 명칭으로 개발됐으나, 지금은 채슨과 독립적으로 스크럽부터 개발됐다.ChaSen과 비교하면 분석 정밀도가 같고 분석 속도가 평균 3-4배 빠르다.
  • 어성 정보를 이용하여 분석하고 평가할 수 있다.MeCab에서 사용할 수 있는 사전은 많지만 채신과 마찬가지로 일반적으로 사용ChaSen에 구축된 IPADIC를 사용한다.
  • MeCab은 구글이 공개한 대규모 일본어 n-gram 데이터 제작에도 사용된다.

  • IPA 품사 체계Mac OS X v10.5v10.6Spotlight2.1 이후의 일본어 입력에도 사용된다.
  • 그렇습니다.■ 사전 준비된 Ubuntu에 구축에 필요한 패키지를 설치합니다.
    $ sudo aptitude install build-essential libc6-dev g++
    MeCab 다운로드
    MeCab 바디
    $ wget https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE
    MeCab용 사전(IPA 사전)
    $ wget https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE
    설치하다.
    호스트 설치
    $ tar zxfv mecab-0.996.tar.gz
    $ cd mecab-0.996
    $ ./configure 
    $ make
    $ make check
    $ sudo make install
    
    사전 설치
    $ tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz
    $ mecab-ipadic-2.7.0-20070801
    $ ./configure --with-charset=utf8
    $ make
    $ sudo make install
    
    libmecab.so.2: cannot open shared object file
    의 오류가 발생하면sudo ldconfig를 통해 다시 시도하십시오.
    테스트
    명령행
    $ mecab すもももももももものうち
    すもも  名詞,一般,*,*,*,*,すもも,スモモ,スモモ
    も      助詞,係助詞,*,*,*,*,も,モ,モ
    もも    名詞,一般,*,*,*,*,もも,モモ,モモ
    も      助詞,係助詞,*,*,*,*,も,モ,モ
    もも    名詞,一般,*,*,*,*,もも,モモ,モモ
    の      助詞,連体化,*,*,*,*,の,ノ,ノ
    うち    名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
    EOS
    
    에 따르면 일본어 형태소 해석은 기본적으로 완성되었다.
    ■ PHP 사용
    pecl.opendogs.채널에 org를 추가합니다.
    pear channel-discover pecl.opendogs.org
    pear remote-list -c opendogs
    sudo pear install opendogs/mecab-beta
    
    설치 과정에서 mecab-config를 진행하는 장면이 있을 수 있습니다.이런 경우 이런 느낌으로 지정한다.
    specify pathname to mecab-config [no] : /usr/local/bin/mecab-config
    
    은(는) Ubuntu의 경우입니다./etc/php5/conf.d/mecab.제작 ini, 다음과 같은 설정.
    extension=mecab.so
    그리고 Apache를 다시 시작하고 phpinfo ();이렇게 하면 이렇게 읽는 것을 확인할 수 있다.
    iPhone OS
    실제로 PHP를 사용하여 이동할 때 mecabsplit !

    좋은 웹페이지 즐겨찾기