콘텐츠 감정 분석: Google API로 콘텐츠의 감정 점수 탐색

내 워크플로우



GoogleanalyzeSentiment API을 GitHub Action으로 래핑하는 데 며칠 밤을 보냈습니다. 액션은 HTML 파일의 내용에 대해 감정 분석을 실행하고 프로젝트의 모든(선택한) 페이지의 전반적인 감정에 대한 개요를 제공합니다.

API는 -1에서 1까지의 값을 반환하여 특정 감정(긍정적 또는 부정적)이 얼마나 강한지를 나타냅니다. Action을 실행한 후 각 페이지당 점수가 포함된 테이블이 해당 로그에 인쇄됩니다. Interpreting sentiment analysis values에 대해 자세히 알아보십시오.

다른 콘텐츠 분석 도구와 함께 매일 프로젝트에 푸시되는 텍스트를 이해하려는 유지 관리자에게 유용할 수 있습니다. 직접 확인해보세요 🚀



⚠️ 이제 저는 이것에 대해 정말 흥분했고 제가 가지고 있는 다른 자동화 아이디어와 함께 계속 발전할 것입니다. 이것은 Action의 초기 릴리스이므로 roadmap을 살펴보고 향후 릴리스에서 어떤 기능을 보고 싶은지 문제를 제출하십시오.

제출 카테고리:



메인테이너 머스트해브

Yaml 파일 또는 코드 링크



다음은 공용.html 파일에서 작업을 사용하는 방법의 예입니다.

name: Sentiment analysis on public

on: push

jobs:
  analysis:
    runs-on: ubuntu-latest
    steps:
    - uses: actions/checkout@v2 #Be sure you checkout the files beforehand
    - name: Run sentiment analysis on HTML files
      uses: bogdaaamn/[email protected]
      with: 
        gcp_key: ${{ secrets.GCP_KEY }} #Google Cloud Platform API key. Read the README for instructions 

코드와 함께 – more examples , requirements 및 a known issues roadmapbogdaaamn/copy-sentiment-analysis 저장소에서 사용할 수 있습니다(Marketplace 에서 확인).


보그DAAAMN / 카피 감성 분석


Google API를 사용하여 웹사이트 텍스트에 대한 감정 분석을 실행합니다.





감정 분석 복사





이 GitHub 작업은 GitHub 프로젝트의 빌드된 텍스트에 대해 감정 분석을 실행합니다. GoogleanalyzeSentiment API을 사용하여 페이지의 전반적인 감정 점수(긍정에서 부정적으로)를 평가합니다. 작업은 프로젝트의 모든 페이지 점수에 대한 개요를 제공합니다(자세한 내용은 interpreting the scores 참조).

🚀 사용법



이것은 .html 폴더(기본값)에서 일반public 파일에 대한 작업을 사용하는 작업 흐름의 예입니다.
name: Sentiment analysis on public
on: push
jobs
  analysis:
    runs-on: ubuntu-latest
    steps:
    - uses: actions/checkout@v2 #Be sure you checkout the files beforehand
    - name: Run sentiment analysis on HTML files
      uses: bogdaaamn/[email protected]
      with: 
        gcp_key: ${{ secrets.GCP_KEY }} #Google Cloud Platform API key. Read the README for instructions 

그러나 프로젝트를 미리 빌드해야 하는 경우 다음 위치에 배치해야 합니다.

View on GitHub


추가 리소스/정보



오픈 소스 사용 사례



현재 코드가 실행된 후 작업 탭에 개요 표가 인쇄됩니다. 그러나 그것은 직관적이지 않고 그 사이에 너무 많은 마찰이 있는 것처럼 보입니다.

커뮤니티가 어떻게 생각하는지 궁금합니다. 이 작업이 결과를 인쇄하는 것을 어떻게 보겠습니까? PR에 대한 의견? 액션 로그의 테이블? 부정적인 결과가 너무 많으면 실패합니까?

⚠️ GCP의 감정 분석 편향



몇 년 전 Google API는 인종, 성별, 종교에 편향된 결과를 낳는다는 이유로 언론에서 비판을 받았습니다. 그래서 저는 이 Action에서 사전 훈련된 모델을 사용하는 것에 대해 복잡한 감정을 느꼈습니다.

이제 Google의 독점 알고리즘이 어떻게 진행되고 있으며 원치 않는 편견과 어떻게 싸우는지 이해하기 어렵지만 최근 연구(charlescearl, 2019 참조)는 GCP가 다른 경쟁업체보다 참가자의 인종이나 성별에 덜 민감한 것 같다고 결론지었습니다. 플랫폼. 같은 문서에서는 사용자가 주의해서 진행하고 스스로 평가를 수행해야 한다고 권장합니다. 내가 수행한 테스트는 중립적인 결과를 얻었지만 필요한 경우 연구를 확장하고 플러그를 뽑을 준비가 되어 있습니다.

또한 데이터의 편향을 식별, 분석 및 줄이기 위한 특별한 연구가 수행되었습니다(Google Research의 Dixon et al., 2018 또는 Caliskan et al., 2016May et al., 2019 참조). 점점 더 잘하고 있습니다. 저는 편견과 공정성 연구를 가능하게 하고 지원하는 것이 정말 중요하다고 생각합니다. 특히 사회가 기술에 점점 더 많이 노출되는 GPT-3(Burus, 2020 참조)의 최근 육성 이후에는 특히 그렇습니다.

출처


  • Vice: Google’s Sentiment Analyzer Thinks Being Gay Is Bad
  • Engadget: Google's sentiment analysis API is just as biased as humans
  • Techleer: Google Sentiment Analysis API gives a biased output
  • Gender and Racial Bias in Cloud NLP Sentiment APIs
  • Measuring and Mitigating Unintended Bias in Text Classification
  • Semantics derived automatically from language corpora contain human-like biases
  • On Measuring Social Biases in Sentence Encoders
  • The (Un)ethical Story of GPT-3: OpenAI’s Million Dollar Model
  • 좋은 웹페이지 즐겨찾기