자연어 처리(NLP)의 종속성 파서

종속성 파서는 문장의 문법 구조를 분석하는 데 도움이 되는 도구 유형입니다.

문장을 구성 요소로 분해하고 관련된 단어나 구를 찾을 수 있습니다.

종속성 파서는 "헤드"단어를 찾습니다. 그들은 이러한 표제어가 다른 단어, 특히 한 단어가 다른 단어를 수정하거나 변경할 때 어떻게 의존하는지 분석합니다.

오픈 소스 라이브러리 spacy는 종속성 구문 분석과 같은 다양한 종류의 자연어 처리 작업을 위한 훌륭한 도구입니다. 여기에는 뛰어난 종속성 파서가 포함되어 있으며 Stanford CoreNLP도 확인하고 싶을 수 있습니다.

"그들은 빠르게 운전하고 있습니다"라는 문장에 종속성 구문 분석을 적용하면 다음과 같은 멋진 다이어그램을 얻을 수 있습니다.



화살표는 "빠른"이라는 단어가 "운전"이라는 단어를 특수 태그로 설명된 관계의 특성으로 수정함을 나타냅니다. 이 특정한 경우에는 advmod입니다.

다른 가능한 수정자는 다음과 같습니다.

acl: clausal modifier of noun (adjectival clause)
advcl: adverbial clause modifier
amod: adjectival modifier
appos: appositional modifier

위의 다이어그램은 다음 코드로 생성되었습니다.

`공간 가져오기
스페이시 수입 변위에서

nlp = spacy.load("en_core_web_sm")
doc = nlp("그들은 빠르게 운전하고 있습니다.")
displacy.serve(doc, style="dep")
`

자신의 jupyter 노트북이나 다른 코드를 실행하지 않고도 종속성 구문 분석을 수행하고 싶다면 다음 온라인 도구를 사용할 수 있습니다.

https://explosion.ai/demos/displacy?text=They%20are%20driving%20fast&model=en_core_web_sm&cpu=1&cph=1

다음은 이 온라인 도구로 만든 다이어그램의 예입니다.


종속성 구문 분석은 어디에서 사용합니까?

종속성 구문 분석은 NLP의 많은 분야에서 사용되며 그 중 일부는 다음과 같습니다.

grammar checking
information extraction
website categorization
aspect based sentiment analysis
named entity recognition
product categorization
question answering
trending products analysis
document summarization

좋은 웹페이지 즐겨찾기