파이톤에서 트위터 정서 분석 빠른 안내
14865 단어 machinelearningdatasciencepythonnlp
안녕하세요.
이 강좌에서는 tweepy 와 textblob 트위터에서 직접 얻은 특정 사항에 대한 텍스트 데이터에 대한 정서 분석을 어떻게 하는지 가르쳐 드리겠습니다.
정서 분석은 무엇입니까?
감정 분석은 자연 언어 처리와 기계 학습 기술을 이용하여 텍스트 데이터와 관련된 감정을 분석하는 과정이다.
만약 당신이 새로 온 사람이라면...
만약python의 정서 분석에 익숙하지 않다면, 이 강좌를 계속하기 전에 먼저 emotion detection from the text를 보시기를 권장합니다.
우리 뭐 지을 거야?
지정한 테마에 따라 트위터에서 정서 분석을 할 수 있는python 명령행 도구/스크립트를 구축합니다.
그것은 어떻게 일할 것입니까?
관심 있는 주제를 입력하고 트위터에 연구를 한 다음에 스크립트는 트위터에 깊이 들어가 관련 추문을 삭제하고 정서 분석을 한 다음에 분석 요약을 출력한다.
프로젝트 요구 사항
본 강좌를 완성하려면 다음과 같은 내용이 필요합니다
Twitter 개발자(API 키)
이 링크를 통해 API 키를 얻으려면 트위터 개발자 계정을 등록할 수 있습니다.
개발자 계정을 만들고 트위터 API를 신청하면 몇 시간에서 며칠 만에 승인을 받을 수 있다.
api 페이지에 있는api와 키가 승인되면 아래api 키 페이지로 복사합니다.
Tweepy 기기
PyPI 에서 최신 버전을 설치하는 가장 간단한 방법은 pip:
$ pip install tweepy
GitHub 클론 저장소에서 Git를 사용하여 최신 개발 버전을 설치할 수도 있습니다.$ git clone https://github.com/tweepy/tweepy.git
$ cd tweepy
$ pip install .
TextBlob 설치
$ pip install -U textblob
$ python -m textblob.download_corpora
Twitter 분석 도구 구축
이제 모든 물건을 설치한 후에, 우리 처음부터 도구를 작성합시다.
API 키를 별도의 파일에 배치
먼저 프로젝트를 API 키와 스크립트 코드로 구성된 두 개의 파일로 나눕니다.
.
├── API_KEYS.py
└── app.py
0 directories, 2 files
API 키 내부를 살펴보면py는 다음과 같이 api key와api secret key의 값을 트위터에서 받은 증빙서류로 대체합니다api_key = 'your api key'
api_secret_key = 'your api secret key'
이제 스크립트를 작성해 보도록 하겠습니다.
라이브러리 및 종속성 가져오기
from tweepy import API, OAuthHandler
from textblob import TextBlob
from API_KEYS import api_key, api_secret_key
스크립트 확인
트위터에서 트윗을 가져오려면 먼저 API 키와 키를 사용하여 응용 프로그램을 검증해야 합니다.
API를 검증하기 위해 다음과 같이 OAuthHandler를 사용합니다.
authentication = OAuthHandler(api_key, api_secret_key)
api = API(authentication)
특정 주제의 트윗 가져오기
인증된 API를 사용하여 트위터에서 트윗을 가져오려면 다음과 같이 검색 방법을 사용하여 특정 matte에 대한 트윗을 가져오십시오.
public_tweets = api.search(Topic)
public 추문은 추문 대상의 일부이지만 정서 분석을 위해 추문 텍스트만 필요합니다.따라서 모든 추문의 텍스트에 접근하기 위해서 우리는 추문 대상의text 속성을 사용해야 한다. 다음과 같다.
from tweepy import API, OAuthHandler
from textblob import TextBlob
from API_KEYS import api_key, api_secre
authentication = OAuthHandler(api_key, api_secret_key)
api = API(authentication)
corona_tweets = api.search('corona virus')
for tweet in corona_tweets:
text = tweet.text
print(text)
위 스크립트를 실행하면 다음과 같은 결과가 발생합니다.$ python example.py
......
RT @amyklobuchar: So on Frontier Airlines you now have to pay an extra fee to keep yourself safe from corona virus. As I said today at the...
There are so many disturbing news these days ON TOP OF CORONA VIRUS. It just sinks my heart![😟](https://s.w.org/images/core/emoji/12.0.0-1/svg/1f61f.svg) We all need therapy.
RT @ug_chelsea: Corona virus symptoms basically are the same feelings you get when your wife is checking your phone
정서 분석을 하다
이제 TextBlob을 이용해 이 트윗들에 대해 정서 분석을 해 긍정적인 것인지 부정적인 것인지를 살펴봅시다.
Textblob 구문은 적극성 또는 부정성을 검사하는 데 사용됩니다.
polarity = TextBlob(Text).sentiment.polarity
극성이 0보다 작으면 마이너스극성이 0보다 크면 플러스
최종 신청
그리고 저는 방금 배운 상술한 지식을 편집하여 clean tweets 함수를 추가하여 Twitters의hashtag를 삭제하여 다음 스크립트를 구축했습니다.
from tweepy import API, OAuthHandler
from textblob import TextBlob
from API_KEYS import api_key, api_secret_key
def clean_tweets(tweet):
tweet_words = str(tweet).split(' ')
clean_words = [word for word in tweet_words if not word.startswith('#')]
return ' '.join(clean_words)
def analyze(Topic):
positive_tweets, negative_tweets = [], []
authentication = OAuthHandler(api_key, api_secret_key)
api = API(authentication)
public_tweets = api.search(Topic, count=10)
cleaned_tweets = [clean_tweets(tweet.text) for tweet in public_tweets]
for tweet in cleaned_tweets:
tweet_polarity = TextBlob(tweet).sentiment.polarity
if tweet_polarity<0:
negative_tweets.append(tweet)
continue
positive_tweets.append(tweet)
return positive_tweets, negative_tweets
positive, negative = analyze('Magufuli')
print(positive , '\n\n', negative)
print(len(positive), ' VS ', len(negative))
분석할 테마를 변경하거나analyze 함수의 topic 파라미터를 관심 있는 테마로 변경하십시오.트위터에서 가져온 트윗 수량을 지정하려면count 파라미터를 변경할 수 있습니다.
상기 프로그램을 실행할 때 다음과 같은 결과가 발생합니다
python app.py
.....................
['@o_abuga Obvious, the test kits the results are doubtful!! Magufuli said it']
9 VS 1
🎉🎉🎉 python을 사용하여 트위터 정서 분석을 하는 강좌를 마친 것을 축하합니다. 자부심을 가지고 다른 개발자와 좋은 소식을 공유해야 합니다.나도 네가 이 문장을 읽어 보라고 건의한다.
카레브 / 트위터 정서 분석
이 가이드는 트위터 데이터에 대한 정서 분석을 위해 Tweepy Library와 Textblob을 사용하는 방법을 간략하게 소개한다.
트위터 정서 분석
이 가이드는 트위터 데이터에 대한 정서 분석을 위해 Tweepy Library와 Textblob을 사용하는 방법을 간략하게 소개한다.
View on GitHub
Reference
이 문제에 관하여(파이톤에서 트위터 정서 분석 빠른 안내), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://dev.to/kalebu/a-quick-guide-to-twitter-sentiment-analysis-in-python-55dh
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
Reference
이 문제에 관하여(파이톤에서 트위터 정서 분석 빠른 안내), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/kalebu/a-quick-guide-to-twitter-sentiment-analysis-in-python-55dh텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)