코토하 API를 사용했습니다.
0. 관련 보도
1. 배경
알았으니까선물 기획.
개인적으로 일찌감치 텍스트 해석을 하고 싶었기 때문에 이를 계기로 결심했다.
그럼에도 불구하고 찾아보니 정부측은 각종 언어에 대응하는 API를 제공하지 않았다.이 보도 저자가 속한 NTT 스타일, 어쩌면 공식설일지도 모른다)
거기서 공부하는 김에 해 봐요.
COTOHA API Portal에 대한 링크
2. 생성된 API에 대한 설명
2.1 동작 확인 환경
필요requests.
windows
Linux
Mac
오류: 없음
2.2 Quick start
git clone https://github.com/tsuji-tomonori/cotohapy.git
cd cotohapy
pip install -r requirements.txt
# config.json の作成
python demo.py
# もし, python3 環境の場合
python3 demo.py
# action!
config.json
는 다음과 같다.{
"access_token_publish_url": "",
"developer_api_base_url": "",
"clientid": "",
"clientsecret": ""
}
계좌 계좌로 가면 다음 페이지가 나타날 수 있으니 이를 바탕으로 설정하세요.시계를 아래에 붙이다.2.3 사용 방법
GitHub
git clone https://github.com/tsuji-tomonori/cotohapy.git
가져오기
from cotohapy3 import CotohaAPI
장서는 "cotohapy3"에 다 있어요.CotohaAPI
말고 다른 반이 있어요. 그 다음에...액세스 토큰 획득
너는 반드시 먼저 가야 한다.
api = CotohaAPI(
developer_api_base_url=developer_api_base_url,
access_token_publish_url=access_token_publish_url
)
api.login(clientid=clientid, clientsecret=clientsecret)
def __init__(self, developer_api_base_url, access_token_publish_url)
매개 변수데이터 형식
컨텐트
developer_api_base_url
str
API Base URL
access_token_publish_url
str
Access Token Publish URL
def login(self, clientid, clientsecret)
매개 변수데이터 형식
컨텐트
clientid
str
Client ID
clientsecret
str
Client secret
문법 분석 : parse
# 実行例
api.parse("昨日母と銀座で焼き肉を食べた")
def parse(self, sentence, **kwargs)
매개 변수데이터 형식
컨텐트
sentence
str
분석 대상문
**kwargs
기타 매개 변수(방정식 참조의 API 참조)
고유 표현식 추출: ne
# 実行例
api.ne("昨日は東京駅を利用した。")
def ne(self, sentence, **kwargs)
매개 변수데이터 형식
컨텐트
sentence
str
분석 대상문
**kwargs
기타 매개 변수(방정식 참조의 API 참조)
대응 해석:coreference
# 実行例
api.coreference("太郎は友人です。彼は焼き肉を食べた。")
def coreference(self, document, **kwargs)
매개 변수데이터 형식
컨텐트
document
str/list
다음 임의의 형식으로 지정
str
: 분석 대상의 문장list
: 분석 대상의 문장 집합**kwargs
기타 매개 변수(방정식 참조의 API 참조)
키워드 추출:keyword
# 実行例
api.keyword("レストランで昼食を食べた。")
def keyword(self, document, **kwargs)
매개 변수데이터 형식
컨텐트
document
str/list
다음 임의의 형식으로 지정
str
: 분석 대상의 문장list
: 분석 대상의 문장 집합**kwargs
기타 매개 변수(방정식 참조의 API 참조)
유사도 계산
# 実行例
api.similarity("近くのレストランはどこですか?", "このあたりの定食屋はどこにありますか?")
def similarity(self, s1, s2, **kwargs)
매개 변수데이터 형식
컨텐트
s1
str
유사도 계산 대상의 텍스트
s2
str
유사도 계산 대상의 텍스트
**kwargs
기타 매개 변수(방정식 참조의 API 참조)
문장 유형 판정:sentencetype
# 実行例
api.sentence_type("あなたの名前は何ですか?")
def sentence_type(self, sentence, **kwargs)
매개 변수데이터 형식
컨텐트
sentence
str
분석 대상문
**kwargs
기타 매개 변수(방정식 참조의 API 참조)
사용자 속성 추정(β): user_attribute
# 実行例
api.user_attribute("私は昨日田町駅で飲みに行ったら奥さんに怒られた。")
def user_attribute(self, document, **kwargs)
매개 변수데이터 형식
컨텐트
document
str/list
다음 임의의 형식으로 지정
str
: 분석 대상의 문장list
: 분석 대상의 문장 집합**kwargs
기타 매개 변수(방정식 참조의 API 참조)
막힘 제거(β): remove_filler
# 実行例
api.remove_filler(
"えーーっと、あの、今日の打ち合わせでしたっけ。すみません、ちょっと、急用が入ってしまって。"
)
def remove_filler(self, text, **kwargs)
매개 변수데이터 형식
컨텐트
text
str
분석할 텍스트
**kwargs
기타 매개 변수(방정식 참조의 API 참조)
음성 인식 오류 감지(β): detect_misrecognition
# 実行例
api.detect_misrecognition("温泉認識は誤りを起こす")
def detect_misrecognition(self, sentence, **kwargs)
매개 변수데이터 형식
컨텐트
sentence
str
분석 대상문
**kwargs
별거 없어요.β삼가다
감정 분석:sentiment
# 実行例
api.sentiment("人生の春を謳歌しています")
def sentiment(self, sentence)
매개 변수데이터 형식
컨텐트
sentence
str
분석 대상문
요약(β): summary
# 実行例
with open("summary.txt", "r", encoding="utf-8") as f:
document = f.read()
api.summary(document, 1)
summary.txt前線が太平洋上に停滞しています。一方、高気圧が千島近海にあって、北日本から東日本をゆるやかに覆っています。関東地方は、晴れ時々曇り、ところにより雨となっています。東京は、湿った空気や前線の影響により、晴れ後曇りで、夜は雨となるでしょう。
def summary(self, document, sent_len, **kwargs)
매개 변수데이터 형식
컨텐트
document
str
입력한 글
sent_len
int
적요수
**kwargs
별거 없어요.β삼가다
3. 향후 계획
만들고 싶은 걸 꺼내고 싶어요.
아니면 설명이 없는 기능을 설명하고 싶어요.
참고 자료
pixivpy
Reference
이 문제에 관하여(코토하 API를 사용했습니다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/wagasa2/items/74d5f78d36c2e3599534텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)