spacy_streamlit 폭발 속도로 "일본의 올림픽은 어떻게 되었습니까?"책임자

4111 단어 StreamlitspaCyPython

spacy_스트림라이트가 뭐예요?


streamlit는python의 몇 줄 코드로 인터넷 응용 프로그램을 제작하는 최근 관심이 급격히 높아지고 있는 라이브러리다.
그리고spacy는python에서 다양한 자연 언어 처리 라이브러리를 시도할 수 있습니다.
그 streamlit이 스페이스와 손을 잡았어요.
이것이 바로 spacy_streamlit이다.

기본적으로spacy_streamlit의github상의 Quickstart에 적힌 것과 변화가 없지만 Quickstart는 영어판 모형을 이용했기 때문에 일본어판 모형도 작동할 수 있는지 확인했다.
※ 아래 시도된 소스 코드는 여기 에 배치됩니다.

설치 등


※ 이번 실행 환경은 윈도우즈 10(64bit)으로 실시됩니다.

spacy-streamlit 설치

pip install spacy-streamlit --pre

스페이스의 일본어 모델 다운로드


spacy에는 3가지 일본어 모델이 있습니다(ja_core_news_sm, ja_core_news_md, ja_core_news_lg)
공개는 했지만 가볍게 해보고 싶어서 이번에는 자_core_news_sm,ja_core_news_나는 md 두 개를 다운로드했다.
python -m spacy download ja_core_news_sm
python -m spacy download ja_core_news_md

코드 (실제 4줄)


다음 코드는 japanese_spacy_streamlit_sample.py로 저장합니다.
import spacy_streamlit

models = ["ja_core_news_md", "ja_core_news_sm"]
default_text = "もうすぐ梅雨。日本のオリンピックはどうなる?"
spacy_streamlit.visualize(models, default_text)
이상
지금 다음 명령을 실행하십시오.
streamlit run japanese_spacy_streamlit_sample.py
다음 웹 화면이 표시되면 성공합니다.

상기 화면에서 보듯이 Splitsentences는 기본적으로 검사가 있기 때문에 모든 문장의 시각화 관련 해석을 합니다.
  • 겸사겸사 "일본의 올림픽은 어떻습니까?"관련 결과는 여기 있습니다.

  • 물론 웹 응용 프로그램이기 때문에 Text to analyze에 다른 글을 입력하면 입력한 글의 관련 결과가 표시됩니다.

    다른 것도 있어요.


    몇 가지 결과를 가시화하다.
    ※ Text Classification은 spacy를 이해하지 못하면 표시할 수 없기 때문에 앞으로 확인하고 싶습니다.

    고유 표현법


    올림픽은 매우 좋은 활동으로 여겨진다.
    ※GPE: Geopolitical entity, i.e. countries, cities, states.

    단어 유사도


    ※ 1 기본값은 "apple"과 "orange"입니다.
    ※ 2 이하는 spacy의 ja_core_news_md 모델의 결과를 표시합니다.
    '일본'과'올림픽'단어의 싱크로율이'그리스'와'올림픽'의 싱크로율보다 높다는 것을 발견했다.


    태그 속성



    느끼다


    어떤 결과가 나올지 시험해 보고 싶을 때 홈페이지에 글과 단어를 넣으면 가시화돼 편리하고 재미있다.

    참고 자료

  • spacy_streamlit: https://github.com/explosion/spacy-streamlit
  • spacy: https://spacy.io/models/ja
  • streamlit: https://streamlit.io/
  • 좋은 웹페이지 즐겨찾기