코토하 API를 사용했습니다.

13455 단어 COTOHAPython

0. 관련 보도

  • 소문의 COTOHA API를 사용하면 자연 언어를 쉽게 처리할 수 있습니다.
  • 코토하는'만타스와 바둑의 추억'의 결과를 정리했다.가장 빠른 자습서 부착
  • n차전

    1. 배경


    알았으니까선물 기획.
    개인적으로 일찌감치 텍스트 해석을 하고 싶었기 때문에 이를 계기로 결심했다.
    그럼에도 불구하고 찾아보니 정부측은 각종 언어에 대응하는 API를 제공하지 않았다.이 보도 저자가 속한 NTT 스타일, 어쩌면 공식설일지도 모른다)
    거기서 공부하는 김에 해 봐요.
    COTOHA API Portal에 대한 링크

    2. 생성된 API에 대한 설명


    2.1 동작 확인 환경


    필요requests.

    windows

  • Windows 10 Home
  • Python 3.7.3
  • Linux

  • Ubuntu 18.04.3 LTS
  • Python 3.6.9
  • Mac


    오류: 없음

    2.2 Quick start

  • 우선COTOHA API for Developers 무료 등록
  • 다음 명령 실행
  • git clone https://github.com/tsuji-tomonori/cotohapy.git
    cd cotohapy
    pip install -r requirements.txt
    # config.json の作成
    python demo.py
    # もし, python3 環境の場合
    python3 demo.py
    # action!
    
    config.json는 다음과 같다.
    {
        "access_token_publish_url": "",
        "developer_api_base_url": "",
        "clientid": "",
        "clientsecret": ""
    }
    
    계좌 계좌로 가면 다음 페이지가 나타날 수 있으니 이를 바탕으로 설정하세요.시계를 아래에 붙이다.

    2.3 사용 방법


    GitHub

    git clone https://github.com/tsuji-tomonori/cotohapy.git
    

    가져오기

    from cotohapy3 import CotohaAPI
    
    장서는 "cotohapy3"에 다 있어요.CotohaAPI말고 다른 반이 있어요. 그 다음에...

    액세스 토큰 획득


    너는 반드시 먼저 가야 한다.
    api = CotohaAPI(
        developer_api_base_url=developer_api_base_url, 
        access_token_publish_url=access_token_publish_url
    )
    api.login(clientid=clientid, clientsecret=clientsecret)
    
    def __init__(self, developer_api_base_url, access_token_publish_url)
    
    매개 변수
    데이터 형식
    컨텐트
    developer_api_base_url
    str
    API Base URL
    access_token_publish_url
    str
    Access Token Publish URL
    def login(self, clientid, clientsecret)
    
    매개 변수
    데이터 형식
    컨텐트
    clientid
    str
    Client ID
    clientsecret
    str
    Client secret

    문법 분석 : parse

    # 実行例
    api.parse("昨日母と銀座で焼き肉を食べた")
    
    def parse(self, sentence, **kwargs)
    
    매개 변수
    데이터 형식
    컨텐트
    sentence
    str
    분석 대상문
    **kwargs
    기타 매개 변수(방정식 참조의 API 참조)

    고유 표현식 추출: ne

    # 実行例
    api.ne("昨日は東京駅を利用した。")
    
    def ne(self, sentence, **kwargs)
    
    매개 변수
    데이터 형식
    컨텐트
    sentence
    str
    분석 대상문
    **kwargs
    기타 매개 변수(방정식 참조의 API 참조)

    대응 해석:coreference

    # 実行例
    api.coreference("太郎は友人です。彼は焼き肉を食べた。")
    
    def coreference(self, document, **kwargs)
    
    매개 변수
    데이터 형식
    컨텐트
    document
    str/list
    다음 임의의 형식으로 지정str: 분석 대상의 문장list: 분석 대상의 문장 집합
    **kwargs
    기타 매개 변수(방정식 참조의 API 참조)

    키워드 추출:keyword

    # 実行例
    api.keyword("レストランで昼食を食べた。")
    
    def keyword(self, document, **kwargs)
    
    매개 변수
    데이터 형식
    컨텐트
    document
    str/list
    다음 임의의 형식으로 지정str: 분석 대상의 문장list: 분석 대상의 문장 집합
    **kwargs
    기타 매개 변수(방정식 참조의 API 참조)

    유사도 계산

    # 実行例
    api.similarity("近くのレストランはどこですか?", "このあたりの定食屋はどこにありますか?")
    
    def similarity(self, s1, s2, **kwargs)
    
    매개 변수
    데이터 형식
    컨텐트
    s1
    str
    유사도 계산 대상의 텍스트
    s2
    str
    유사도 계산 대상의 텍스트
    **kwargs
    기타 매개 변수(방정식 참조의 API 참조)

    문장 유형 판정:sentencetype

    # 実行例
    api.sentence_type("あなたの名前は何ですか?")
    
    def sentence_type(self, sentence, **kwargs)
    
    매개 변수
    데이터 형식
    컨텐트
    sentence
    str
    분석 대상문
    **kwargs
    기타 매개 변수(방정식 참조의 API 참조)

    사용자 속성 추정(β): user_attribute

    # 実行例
    api.user_attribute("私は昨日田町駅で飲みに行ったら奥さんに怒られた。")
    
    def user_attribute(self, document, **kwargs)
    
    매개 변수
    데이터 형식
    컨텐트
    document
    str/list
    다음 임의의 형식으로 지정str: 분석 대상의 문장list: 분석 대상의 문장 집합
    **kwargs
    기타 매개 변수(방정식 참조의 API 참조)

    막힘 제거(β): remove_filler

    # 実行例
    api.remove_filler(
        "えーーっと、あの、今日の打ち合わせでしたっけ。すみません、ちょっと、急用が入ってしまって。"
    )
    
    def remove_filler(self, text, **kwargs)
    
    매개 변수
    데이터 형식
    컨텐트
    text
    str
    분석할 텍스트
    **kwargs
    기타 매개 변수(방정식 참조의 API 참조)

    음성 인식 오류 감지(β): detect_misrecognition

    # 実行例
    api.detect_misrecognition("温泉認識は誤りを起こす")
    
    def detect_misrecognition(self, sentence, **kwargs)
    
    매개 변수
    데이터 형식
    컨텐트
    sentence
    str
    분석 대상문
    **kwargs
    별거 없어요.β삼가다

    감정 분석:sentiment

    # 実行例
    api.sentiment("人生の春を謳歌しています")
    
    def sentiment(self, sentence)
    
    매개 변수
    데이터 형식
    컨텐트
    sentence
    str
    분석 대상문

    요약(β): summary

    # 実行例
    with open("summary.txt", "r", encoding="utf-8") as f:
        document = f.read()
    api.summary(document, 1)
    
    summary.txt
    前線が太平洋上に停滞しています。一方、高気圧が千島近海にあって、北日本から東日本をゆるやかに覆っています。関東地方は、晴れ時々曇り、ところにより雨となっています。東京は、湿った空気や前線の影響により、晴れ後曇りで、夜は雨となるでしょう。
    
    def summary(self, document, sent_len, **kwargs)
    
    매개 변수
    데이터 형식
    컨텐트
    document
    str
    입력한 글
    sent_len
    int
    적요수
    **kwargs
    별거 없어요.β삼가다

    3. 향후 계획


    만들고 싶은 걸 꺼내고 싶어요.
    아니면 설명이 없는 기능을 설명하고 싶어요.

    참고 자료


    pixivpy

    좋은 웹페이지 즐겨찾기