solr로 일본어 형태소 해석 결과를 조사한다(Mac판)

Mac에서 solr 도입부터 일본어 형태소 해석 결과의 테스트를 할 때까지의 순서 메모입니다.

전제



OS Mac OS 10.13.3
Java 1.8.0_151-b12

절차


  • Solr 사이트 에서 다운로드
  • zip 파일 압축 풀기
  • 아래 명령으로 서버 시작 및 코어 생성
  • $ cd solr-7.2.1
    $ bin/solr start
    $ bin/solr create -c mycore
    
  • 브라우저에서 관리 화면 시작
  • Core selector 에서 mycore 선택


  • 왼쪽 메뉴에서 "analysis"선택


  • "Fieldname/Field type"에서 "text_ko"를 선택


  • Filed Value(Query)에 질문문을 입력하고 「Analysis Values」버튼을 클릭
    (맨 위의 "JT"(JapaneseTokenizer) 결과)


  • (맨 아래의 "LCF"(LowerCaseFilter) 결과)


    보충



    기본적으로 자동 생성되는 구성 파일(solr-7.2.1/server/solr/mycore/conf/managed-schema)의 "text_ja"부분
      <fieldType name="text_ja" class="solr.TextField" autoGeneratePhraseQueries="false" positionIncrementGap="100">
        <analyzer>
          <tokenizer class="solr.JapaneseTokenizerFactory" mode="search"/>
          <filter class="solr.JapaneseBaseFormFilterFactory"/>
          <filter class="solr.JapanesePartOfSpeechStopFilterFactory" tags="lang/stoptags_ja.txt"/>
          <filter class="solr.CJKWidthFilterFactory"/>
          <filter class="solr.StopFilterFactory" words="lang/stopwords_ja.txt" ignoreCase="true"/>
          <filter class="solr.JapaneseKatakanaStemFilterFactory" minimumLength="4"/>
          <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>
      </fieldType>
    

    관련 링크 Mac에서 Elasticsearch 6

    좋은 웹페이지 즐겨찾기