InterSystems IRIS NLP를 VB.NET에서 사용하는 방법 요약 (1)

InterSystems IRIS의 주요 기능인 Natural Language Processing(NLP)은
・「그 문장이 어떤 의미의 연결을 가지고 있는가」를 수치화한다
・「컨텍스트」(그 문장이 표현하려고 하고 있는 지식 영역의 맵)과 「엔티티」(컨텍스트를 구성하는 요소로서의 정해진 단어)를 출력한다
라는 기능이 특징입니다. 이 능력을 알기 위해서는, 웹 브라우저상에서 GUI로 동작할 수 있는 「Analyze」기능이 있습니다만, 프로그램과 연동해 동작시키기 위해서는 ObjectScript로 기술할 필요가 있습니다. 접속 방법을 InterSystems 거지 님에게 가르쳐 주셨습니다 (감사합니다) 때문에, 정리합니다. 우선, GUI 조작으로의 NLP 이용까지의 흐름을 소개합니다. 이 토대를 이용해, 프로그래밍을 실시합니다.

· InterSystems IRIS 시작
오른쪽 하단 아이콘에서 [IR]->[Management Portal]을 시작합니다.


· Analytics에서 분석 할 네임 스페이스를 선택합니다 (여기서 TESTSAMPLES에 데이터를 저장합니다)


・NLP로 읽을 수 있는 기본적인 데이터 세트를 작성하기 위해, [Text Analytics]→[도메인·아키텍트]를 클릭


· 새로 만들기를 클릭합니다. 도메인명을 임의로 붙인다(여기에서는 Analyze로 한)와, 클래스로서, User.Analyze라는 클래스명이 자동적으로 기술된다.


・스키마(여기에서는, NLP의 원 데이터를 입력한 장소. "User"라는 이름의 바로 아래에 클래스를 작성해 데이터를 넣은 경우만, "SQLUser"라는 이름이 되는 것에 주의)와 테이블명"MercForNLP를 입력합니다. 가장 간단하게 실시하는 경우는, ID 필드에 ID, 그룹 필드에도 ID, 데이터 필드에 NLP에 걸고 싶은 데이터 필드(여기에서는 ContentFull)를 넣으면 시작하기 쉽다.


· [저장] [컴파일] [빌드]를 준비 실행하면 NLP 용 데이터 도메인 작성이 시작됩니다. (상당히 시간이 걸립니다) 그 후 [Domain Explorer]를 눌러 분석 결과를 보는 환경으로 들어갑니다.


· 이미 도메인 구축이 이루어져 있는 경우에는 [Text Analytics]->[Domain Explorer]를 선택할 수 있다.

[Domain Explorer]에서는, 왼쪽에 해석된 엔티티와 그 빈도, 중간에 유사한 엔티티, 우측에 관련(컨셉)이 표시된다.

좋은 웹페이지 즐겨찾기