【초보자용】전문 검색에 대해 정리해 본다

Elastic Search에 대해 공부하려고 했는데 처음에는 검색 처리에 대한 지식이 전혀 없다는 것을 알았습니다.
그래서 이번에는 전문 검색에 대해 정리해 보았습니다.

전체 텍스트 검색이란?



전체 텍스트 검색(전부 켄사쿠, 영국: Full text search)이란, 컴퓨터에 있어서, 복수의 문서(파일)로부터 특정의 캐릭터 라인을 검색하는 것. 「파일명 검색」이나 「단일 파일 내의 문자열 검색」과 달리, 「복수 문서에 걸쳐서, 문서에 포함되는 전체 텍스트를 대상으로 한 검색」이라는 의미로 사용된다.

전문 검색 - Wikipedia

간단하게 말하면, 많은 파일 중에서 「문장내에 특정의 캐릭터 라인을 포함한다」라고 하는 조건을 가지는 파일을 찾아내는 것과 같은 곳입니까.
파일명이 조건에서의 검색도 아니고, 하나의 파일에 대한 검색도 아니다고 하는 것입니다.
문장만으로는 이미지가 붙기 어려우므로, 실제로 Visual Studio Code의 검색 기능을 사용하면서 보고 갑니다.


세 개의 HTML 파일을 준비했습니다.
각각의 내용은 아래와 같습니다.

sample-1.html
<h1>今日の夕食はカレーライスです。</h1>

sample-2.html
<h1>今日の夕食はラーメンです。</h1>

sample-3.html
<h1>今日の昼食はカレーライスです。</h1>

우선은 「카레라이스」라고 하는 캐릭터 라인을 포함한 파일을 전문 검색해 보겠습니다.
덧붙여서 전문 검색은 액티비티 바의 돋보기 아이콘 또는 ⌘ + shift + F로 열 수 있습니다.

「카레라이스」를 문장내에 포함한, sample-1.htmlsample-3.html 가 히트했습니다.
계속해서 「저녁 식사」라고 하는 캐릭터 라인을 포함한 파일을 전문 검색해 봅니다.

「카레라이스」를 문장내에 포함한, sample-1.htmlsample-2.html 가 히트했습니다.
그럼 마지막으로 「점심」이라고 하는 캐릭터 라인을 포함한 파일을 전문 검색해 보겠습니다.

「점심」을 문장내에 포함한, sample-3.html 만이 히트했습니다.

요약



  • 여러 파일 검색 대상
  • 파일 이름이 아닌 파일 내용이 검색됩니다.

    조사하고 있는 도중에 깨달았습니다만, 전문 검색 기술은 지금까지 당연히 사용하고 있던 기술이었습니다.
    분명 그 밖에도 이름도 모르고 사용하고 있는 기술은 많이 있을 것.
    기회가 있으면 전문 검색 방식인 순차 검색 방식, 색인형 검색 방식에 대해 정리해 보고 싶습니다.

    참고



    검색 로그 및 검색 엔진 | Think IT(싱크 잇)
    전문 검색 - Wikipedia
  • 좋은 웹페이지 즐겨찾기