Elasticsearch 문자 필터

https://grokonez.com/elasticsearch/elasticsearch-character-filters
Elasticsearch 문자 필터
Elasticsearch 문자 필터는 태그에 문자 흐름을 전달하기 전에 미리 처리합니다. (추가, 삭제, 변경)이 강좌에서 우리는 세 가지 종류의 문자 필터를 소개할 것이다. 그것이 바로 HTML 테이프, 맵, 패턴 교체이다. 이것은 고객 분석기를 구축하는 데 매우 중요하다.
1. HTML 막대 문자 필터html_strip 문자 필터는 다음을 수행할 수 있습니다.
  • HTML 요소 제거(예: <b>
  • HTML 엔티티를 디코딩 값으로 바꿉니다(&amp;.
  • 예를 들면 다음과 같습니다.
    
    POST _analyze
    {
      "tokenizer":      "keyword", 
      "char_filter":  [ "html_strip" ],
      "text": "

    JavaSampleApproach's tutorials are so helpful!

    " }
    약관:
    
    [ \nJavaSampleApproach's tutorials are so helpful!\n ]
    
    프로비저닝&: 분리할 수 없는 HTML 태그 배열.
    예를 들어

    태그를 보존하기를 원합니다.

    
    PUT jsa_index_char_filter_html
    {
      "settings": {
        "analysis": {
          "analyzer": {
            "jsa_analyzer": {
              "tokenizer": "keyword",
              "char_filter": ["jsa_char_filter"]
            }
          },
          "char_filter": {
            "jsa_char_filter": {
              "type": "html_strip",
              "escaped_tags": ["b", "p"]
            }
          }
        }
      }
    }
    
    POST jsa_index_char_filter_html/_analyze
    {
      "analyzer": "jsa_analyzer",
      "text": "

    JavaSampleApproach's tutorials are so helpful!

    " }
    자세한 내용은 다음을 참조하십시오.
    https://grokonez.com/elasticsearch/elasticsearch-character-filters
    Elasticsearch 문자 필터

    좋은 웹페이지 즐겨찾기