일본어 극성 판정을 만들어 공개했다

소개



일본어 극성 판정 API를 공개했습니다. 여기 에서 공개하고 있습니다. 극성 판정은 입력 텍스트에 대해 Positive 또는 Negative를 판정하는 기술입니다. 조속한 동작을 살펴 보겠습니다.

※11월 6일 업데이트
최신 성능 정보는 여기에서 업데이트합니다.

amarec (20161023-142925)

데모 사이트


  • 모두 개선하는 Social Sentiment
  • API는 여기에서 사용할 수 있습니다.

  • 관련 정보


  • deeplearning4j에서 일본어 Wikipedia의 Word2Vec 만들기
  • deeplearning4j의 word2vec 한계와 능숙한 사용법
  • deeplearning4j의 doc2vec에서 극성을 결정했습니다.
  • deeplearning4j의 doc2vec에 wikipedia의 word2vec 모델을 주입
  • deeplearning4j에서 word2vec의 벡터 데이터에서 NN에서 극성을 결정해보십시오.
  • deeplearning4j에서 word2vec의 벡터 데이터에서 RNN으로 극성을 결정해보십시오.
  • 【API】일본어 극성 판정 API를 공개했습니다
  • 일본어 극성 판정 기술의 데모 사이트 만들었습니다
  • deeplearning4j의 RNN에서 극성 판정을 만든 ~Early Stop편~
  • 【업데이트 정보】극성 판정 API의 정밀도 개선

  • 활용 사례


  • 피요 마루 님 감정 추정 [극성 판정] AppleScript

  • 사용해보기



    극성 판정의 성능은 F값으로 80% 정도 있습니다.

    【극성 판정의 성능】
    Precision: 0.778
    Recall: 0.8633
    F1 Score: 0.8185

    그렇다면 트위터로 적당히 트윗을 가져와 그것을 흠뻑 젖어 동작을 보자. 적당히 트윗을 취해 왔으므로, 누군가의 트윗을 그대로 싣고 있습니다. 문제가 있으면 알려주세요.

    우선은 포지티브 같은 트윗을・・・. 오. 제대로 긍정적인 녀석이 긍정으로 분류되어 있군요.
    "text": "FEif買ったけど普通に面白いな。 昔やってたテンミリオンっていうゲームに似てるからテンミリオン好きで任天堂信者なら買ってみ?"
    "sentiment": "positive"
    "score": 0.5070942044258118
    

    계속해서 부정적입니다. 이쪽의 부정적인 녀석도 제대로 잡히고 있을 것 같습니다.
    "text": "地震だったね( ; ; ) 最近家がドシンと揺れることがあるんだけどなんでだ🤔 工事とかしてないのになあ(´・ω・`)"
    "sentiment": "negative"
    "score": 0.5986717343330383
    

    대체로 있는 인상입니다. 평판 분석이라든지 상품 과제 추출이라든지, 여러가지 업무 개선 태스크가 드문 것 같습니다. ...하지만 당연히 실패도합니다.
    "text": "任天堂NXの 動画みた!🤗 凄いなー! 欲しい!☺️"
    "sentiment": "negative"
    "score": 0.5325021147727966
    
    "text": "ひどいな。何に性的刺激を感じるかは人それぞれ、フェティシズムの対象を公共の場所に貼るのは性的マイノリティに対する暴力である!"
    "sentiment": "positive"
    "score": 0.7025600075721741
    

    데모 설명



    여기 에서 데모를 경험할 수 있습니다.

    공개 트윗을 극성 판정한 결과와 직접 입력한 텍스트를 극성 판정한 결과를 볼 수 있습니다. 극성 판정 결과가 잘못되면 피드백을 보낼 수 있도록 했으므로, 좋으면 성능 개선에 협력해 주세요. 학습 모델을 정기적으로 업데이트합니다. "모두 만드는 무료 극성 판정 기술"이 컨셉입니다. 데모에 대한 자세한 사용법은 여기을 참조하십시오.

    결론



    일본어 극성 판정은 있을 것 같지 않았다고 생각합니다. 영어의 극성 판정 기술은 IBM Watson이 내고 있네요. 원래는 AlchemyAPI사의 기술로, 3년전 정도로 일로 평가했습니다만 적당히 성능이 좋았습니다. 이번 공개한 API는 일본어로 그 때의 AlchemyAPI에 필적할 정도의 성능은 나와 있습니다(현재는 모릅니다). 여기에서 무료 API라는 메리트를 살려, 모두라도의 굉장히 사용할 수 있는 극성 판정 기술을 만들 수 있으면 좋다고 생각합니다. 협조해 주시면 기쁩니다.

    기타 관련 기술 정보


  • Twitter Stream API 데이터에 대한 초보적 감정 분석 시도
  • 딥 러닝을 사용하여 전직 회의의 기업 리뷰 데이터를 감정 분석해보기
  • 심층 학습에서 트윗의 감정 분석
  • 좋은 웹페이지 즐겨찾기