spacy_streamlit 폭발 속도로 "일본의 올림픽은 어떻게 되었습니까?"책임자
spacy_스트림라이트가 뭐예요?
streamlit는python의 몇 줄 코드로 인터넷 응용 프로그램을 제작하는 최근 관심이 급격히 높아지고 있는 라이브러리다.
그리고spacy는python에서 다양한 자연 언어 처리 라이브러리를 시도할 수 있습니다.
그 streamlit이 스페이스와 손을 잡았어요.
이것이 바로 spacy_streamlit이다.
기본적으로spacy_streamlit의github상의 Quickstart에 적힌 것과 변화가 없지만 Quickstart는 영어판 모형을 이용했기 때문에 일본어판 모형도 작동할 수 있는지 확인했다.
※ 아래 시도된 소스 코드는 여기 에 배치됩니다.
설치 등
※ 이번 실행 환경은 윈도우즈 10(64bit)으로 실시됩니다.
spacy-streamlit 설치
pip install spacy-streamlit --pre
스페이스의 일본어 모델 다운로드
spacy에는 3가지 일본어 모델이 있습니다(ja_core_news_sm, ja_core_news_md, ja_core_news_lg)
공개는 했지만 가볍게 해보고 싶어서 이번에는 자_core_news_sm,ja_core_news_나는 md 두 개를 다운로드했다.
python -m spacy download ja_core_news_sm
python -m spacy download ja_core_news_md
코드 (실제 4줄)
다음 코드는 japanese_spacy_streamlit_sample.py로 저장합니다.
import spacy_streamlit
models = ["ja_core_news_md", "ja_core_news_sm"]
default_text = "もうすぐ梅雨。日本のオリンピックはどうなる?"
spacy_streamlit.visualize(models, default_text)
이상지금 다음 명령을 실행하십시오.
streamlit run japanese_spacy_streamlit_sample.py
다음 웹 화면이 표시되면 성공합니다.상기 화면에서 보듯이 Splitsentences는 기본적으로 검사가 있기 때문에 모든 문장의 시각화 관련 해석을 합니다.
물론 웹 응용 프로그램이기 때문에 Text to analyze에 다른 글을 입력하면 입력한 글의 관련 결과가 표시됩니다.
다른 것도 있어요.
몇 가지 결과를 가시화하다.
※ Text Classification은 spacy를 이해하지 못하면 표시할 수 없기 때문에 앞으로 확인하고 싶습니다.
고유 표현법
올림픽은 매우 좋은 활동으로 여겨진다.
※GPE: Geopolitical entity, i.e. countries, cities, states.
단어 유사도
※ 1 기본값은 "apple"과 "orange"입니다.
※ 2 이하는 spacy의 ja_core_news_md 모델의 결과를 표시합니다.
'일본'과'올림픽'단어의 싱크로율이'그리스'와'올림픽'의 싱크로율보다 높다는 것을 발견했다.
태그 속성
느끼다
어떤 결과가 나올지 시험해 보고 싶을 때 홈페이지에 글과 단어를 넣으면 가시화돼 편리하고 재미있다.
참고 자료
Reference
이 문제에 관하여(spacy_streamlit 폭발 속도로 "일본의 올림픽은 어떻게 되었습니까?"책임자), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/study_program/items/9bfdde11befcd354fbc9텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)