TwitterAPI와 MeCab을 사용하여 "피곤 지수"측정기를 만들어보십시오.
9248 단어 Python3TwitterAPImecab
1. 무엇을 하는가?
자신의 트윗을 분석하고 '피로 지수'를 계산하는 간단한 프로그램을 만들면서 TwitterAPI와 MeCab을 빨리 시도해 봅시다.
・TwitterAPI로 자신의 트윗을 취득
・MeCab로 트윗을 나눕니다(형태소마다 리스트화)
・「피로」「심한」「잠」이라고 하는 문자열이 어느 정도 있는지를 출력한다(「피로 지수」)
덧붙여서, MeCab을 사용하지 않고도 Twitter API만으로 비슷한 것을 만들 수 있습니다. 그렇다면 왜 MeCab을 사용합니까?
"피곤한 피곤한 피곤한"
같은 트윗(조금 걱정이 되네요)을 단순히 str로 받고 "피로"가 포함되어 있는지 여부를 판단하면 값으로 1을 반환하지만 MeCab을 사용하면
「피곤하다」 「피곤하다」 「피곤했다」라고 하는 바람에 나눠 써 주므로, 카운트가 3이 되어, 보다 정확한 「피로 지수」를 계산할 수 있게 되는 것입니다.
또, MeCab를 사용하면 「자연 언어 처리」를 했다는 어딘지 모르게 멋진 체험을 한 신경이 쓰여져 추천입니다.
2. Twitter API와 MeCab 준비
먼저 Twitter API와 MeCab을 사용할 수 있도록 합시다.
・Twitter API는 이쪽
h tps:// 퀵했다. 작은 m/바키라/있어 MS/00743D10 그림 C42993f85 그림 b
・MeCab는 이쪽
htps : // m / g 등 ch / ms / 4fbc9bf8174c5, b7bd
기본적으로 이쪽의 멋진 기사대로 진행해 주시면 도입할 수 있다고 생각합니다. 내 환경은
MacOS High Sierra 10.13.5
파이썬 3.6.4
이었다.
3. 소스 코드
tsukare_analysis.py
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import json, config #標準のjsonモジュールとconfig.pyの読み込み
from requests_oauthlib import OAuth1Session
import pandas as pd
import sys
import MeCab
#config.pyにAPIキーを書いておく。
CK = config.CONSUMER_KEY
CS = config.CONSUMER_SECRET
AT = config.ACCESS_TOKEN
ATS = config.ACCESS_TOKEN_SECRET
twitter = OAuth1Session(CK, CS, AT, ATS) #認証処理
url = "https://api.twitter.com/1.1/statuses/user_timeline.json"
#調べる対象
keywords = ["疲", "しんどい", "眠"]
params = {}
# OAuth で GET
twitter = OAuth1Session(CK, CS, AT, ATS)
res = twitter.get(url, params = params)
text_list = []
if res.status_code == 200: #正常通信出来た場合
timelines = json.loads(res.text) #レスポンスからタイムラインリストを取得
for line in timelines: #タイムラインリストをループ処理
text_list.append(line['text'])
else: #正常通信出来なかった場合
print("Failed: %d" % res.status_code)
print("最近のツイートを表示します。")
for text in text_list:
print(text)
m = MeCab.Tagger("-Owakati") #分かち書きします
keitaiso_list = []
for text in text_list:
keitaiso_list.extend(m.parse(text).split(" "))
number = 0
for keitaiso in keitaiso_list:
for key in keywords:
if key in keitaiso:
number += 1
print("あなたの疲れ指数は:")
tsukare = number / len(text_list)
print(tsukare)
· Twitter API 부분은 거의 copipe입니다 ()
· 자신의 최근 트윗을 얻고 형태소로 나누기
・「피로」 「신드이」 「잠」이라는 키워드가 총 트윗 수에 대해 얼마나 있는지를 계산합니다.
・즉 「피로 지수」는 1 트윗에 평균 얼마나 피곤해 그런 말이 들어가 있는지를 나타냅니다. 1을 넘거나하면 그렇습니다.
내 공개 계정 ( @k_o2o_k )에서 몇 개 트윗하여 분석한 결과 이렇게 되었습니다.
3. 발전·확장
이번에는 「피곤 지수」를 조사했습니다만, 키워드를 「맥주」 「소주」 「음료」 「연회」등으로 하면 「과음 지수」도 계산할 수 있을 것 같습니다. 나름대로 커스터마이징 해 봅시다.
keywords = ["ビール","焼酎","飲み","宴会","二日酔い"]
또한 여러 지수를 유연하게 조사할 수 있도록 프로그램을 확장할 수 있습니다. if 구문을 사용하여 키워드를 변경할 수 있습니다. 예를 들어 처음에 이런 코드를 덧붙이면 좋다고 생각합니다.
print("何について調べますか?→「疲れ」「飲み過ぎ」")
target = input(">>")
if target == "疲れ":
keywords= ["疲", "しんどい", "眠"]
elif target == "飲み過ぎ":
keywords = ["ビール","焼酎","飲み","宴会","二日酔い"]
else:
print("「疲れ」「飲み過ぎ」の中から選んでください")
이 경우에는 마지막 「당신의 ○○지수는」 부분도 변경할 수 있도록 해 두는 것을 잊지 않고.
그리고는, 피로 지수의 값에 의해, 다른 코멘트를 돌려주는 등, 여러가지 확장할 수 있을 것 같습니다.
다음은 이것을 웹상에서 사용할 수 있도록 해 보고 싶습니다!
Reference
이 문제에 관하여(TwitterAPI와 MeCab을 사용하여 "피곤 지수"측정기를 만들어보십시오.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/Kiro02/items/0971ebbf12a6ac64d78f
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
먼저 Twitter API와 MeCab을 사용할 수 있도록 합시다.
・Twitter API는 이쪽
h tps:// 퀵했다. 작은 m/바키라/있어 MS/00743D10 그림 C42993f85 그림 b
・MeCab는 이쪽
htps : // m / g 등 ch / ms / 4fbc9bf8174c5, b7bd
기본적으로 이쪽의 멋진 기사대로 진행해 주시면 도입할 수 있다고 생각합니다. 내 환경은
MacOS High Sierra 10.13.5
파이썬 3.6.4
이었다.
3. 소스 코드
tsukare_analysis.py
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import json, config #標準のjsonモジュールとconfig.pyの読み込み
from requests_oauthlib import OAuth1Session
import pandas as pd
import sys
import MeCab
#config.pyにAPIキーを書いておく。
CK = config.CONSUMER_KEY
CS = config.CONSUMER_SECRET
AT = config.ACCESS_TOKEN
ATS = config.ACCESS_TOKEN_SECRET
twitter = OAuth1Session(CK, CS, AT, ATS) #認証処理
url = "https://api.twitter.com/1.1/statuses/user_timeline.json"
#調べる対象
keywords = ["疲", "しんどい", "眠"]
params = {}
# OAuth で GET
twitter = OAuth1Session(CK, CS, AT, ATS)
res = twitter.get(url, params = params)
text_list = []
if res.status_code == 200: #正常通信出来た場合
timelines = json.loads(res.text) #レスポンスからタイムラインリストを取得
for line in timelines: #タイムラインリストをループ処理
text_list.append(line['text'])
else: #正常通信出来なかった場合
print("Failed: %d" % res.status_code)
print("最近のツイートを表示します。")
for text in text_list:
print(text)
m = MeCab.Tagger("-Owakati") #分かち書きします
keitaiso_list = []
for text in text_list:
keitaiso_list.extend(m.parse(text).split(" "))
number = 0
for keitaiso in keitaiso_list:
for key in keywords:
if key in keitaiso:
number += 1
print("あなたの疲れ指数は:")
tsukare = number / len(text_list)
print(tsukare)
· Twitter API 부분은 거의 copipe입니다 ()
· 자신의 최근 트윗을 얻고 형태소로 나누기
・「피로」 「신드이」 「잠」이라는 키워드가 총 트윗 수에 대해 얼마나 있는지를 계산합니다.
・즉 「피로 지수」는 1 트윗에 평균 얼마나 피곤해 그런 말이 들어가 있는지를 나타냅니다. 1을 넘거나하면 그렇습니다.
내 공개 계정 ( @k_o2o_k )에서 몇 개 트윗하여 분석한 결과 이렇게 되었습니다.
3. 발전·확장
이번에는 「피곤 지수」를 조사했습니다만, 키워드를 「맥주」 「소주」 「음료」 「연회」등으로 하면 「과음 지수」도 계산할 수 있을 것 같습니다. 나름대로 커스터마이징 해 봅시다.
keywords = ["ビール","焼酎","飲み","宴会","二日酔い"]
또한 여러 지수를 유연하게 조사할 수 있도록 프로그램을 확장할 수 있습니다. if 구문을 사용하여 키워드를 변경할 수 있습니다. 예를 들어 처음에 이런 코드를 덧붙이면 좋다고 생각합니다.
print("何について調べますか?→「疲れ」「飲み過ぎ」")
target = input(">>")
if target == "疲れ":
keywords= ["疲", "しんどい", "眠"]
elif target == "飲み過ぎ":
keywords = ["ビール","焼酎","飲み","宴会","二日酔い"]
else:
print("「疲れ」「飲み過ぎ」の中から選んでください")
이 경우에는 마지막 「당신의 ○○지수는」 부분도 변경할 수 있도록 해 두는 것을 잊지 않고.
그리고는, 피로 지수의 값에 의해, 다른 코멘트를 돌려주는 등, 여러가지 확장할 수 있을 것 같습니다.
다음은 이것을 웹상에서 사용할 수 있도록 해 보고 싶습니다!
Reference
이 문제에 관하여(TwitterAPI와 MeCab을 사용하여 "피곤 지수"측정기를 만들어보십시오.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/Kiro02/items/0971ebbf12a6ac64d78f
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import json, config #標準のjsonモジュールとconfig.pyの読み込み
from requests_oauthlib import OAuth1Session
import pandas as pd
import sys
import MeCab
#config.pyにAPIキーを書いておく。
CK = config.CONSUMER_KEY
CS = config.CONSUMER_SECRET
AT = config.ACCESS_TOKEN
ATS = config.ACCESS_TOKEN_SECRET
twitter = OAuth1Session(CK, CS, AT, ATS) #認証処理
url = "https://api.twitter.com/1.1/statuses/user_timeline.json"
#調べる対象
keywords = ["疲", "しんどい", "眠"]
params = {}
# OAuth で GET
twitter = OAuth1Session(CK, CS, AT, ATS)
res = twitter.get(url, params = params)
text_list = []
if res.status_code == 200: #正常通信出来た場合
timelines = json.loads(res.text) #レスポンスからタイムラインリストを取得
for line in timelines: #タイムラインリストをループ処理
text_list.append(line['text'])
else: #正常通信出来なかった場合
print("Failed: %d" % res.status_code)
print("最近のツイートを表示します。")
for text in text_list:
print(text)
m = MeCab.Tagger("-Owakati") #分かち書きします
keitaiso_list = []
for text in text_list:
keitaiso_list.extend(m.parse(text).split(" "))
number = 0
for keitaiso in keitaiso_list:
for key in keywords:
if key in keitaiso:
number += 1
print("あなたの疲れ指数は:")
tsukare = number / len(text_list)
print(tsukare)
이번에는 「피곤 지수」를 조사했습니다만, 키워드를 「맥주」 「소주」 「음료」 「연회」등으로 하면 「과음 지수」도 계산할 수 있을 것 같습니다. 나름대로 커스터마이징 해 봅시다.
keywords = ["ビール","焼酎","飲み","宴会","二日酔い"]
또한 여러 지수를 유연하게 조사할 수 있도록 프로그램을 확장할 수 있습니다. if 구문을 사용하여 키워드를 변경할 수 있습니다. 예를 들어 처음에 이런 코드를 덧붙이면 좋다고 생각합니다.
print("何について調べますか?→「疲れ」「飲み過ぎ」")
target = input(">>")
if target == "疲れ":
keywords= ["疲", "しんどい", "眠"]
elif target == "飲み過ぎ":
keywords = ["ビール","焼酎","飲み","宴会","二日酔い"]
else:
print("「疲れ」「飲み過ぎ」の中から選んでください")
이 경우에는 마지막 「당신의 ○○지수는」 부분도 변경할 수 있도록 해 두는 것을 잊지 않고.
그리고는, 피로 지수의 값에 의해, 다른 코멘트를 돌려주는 등, 여러가지 확장할 수 있을 것 같습니다.
다음은 이것을 웹상에서 사용할 수 있도록 해 보고 싶습니다!
Reference
이 문제에 관하여(TwitterAPI와 MeCab을 사용하여 "피곤 지수"측정기를 만들어보십시오.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/Kiro02/items/0971ebbf12a6ac64d78f텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)