「야지가 날아오는 마인크래프트」DeepLearning에서 적당한 텍스트 생성 ~전체의 흐름~

DeepLearning의 힘을 빌려, 마이크라의 플레이중, 게임에 관계가 있는 문장을 읽어 주는 소프트를 만든 이야기.

↓이런 녀석


실제로 놀고 있는 동영상

하나의 기사로 묶는 것이 어렵기 때문에 여러 기사로 나눕니다.
구체적인 내용에 대해 쓴 기사는 기다려 주세요.

이 기사에서는 전체 흐름을 설명합니다.

동기



혼자서 마인크래프트를 하고 있던 어느 날......
「자연 언어 처리 × DeepLearning 로 재미있는 것은 없나」
"혼자서 게임하는 것도 질려왔다"
「그렇다, 게임중 AI가 말하면, 보치마이크라도 외롭지 않아!」

했던 일



마이크라라면 게임 내 정보를 얻을 수 있습니다.
게임 내에 있는 몬스터 등에 관련된 문장을 가져오면 좋을 것 같다.

데이터 수집


  • 우선, 스크래핑 ← ← 미묘한 결과에

  • 니코 니코 코멘트 데이터 세트 ← ← 양 충분, 목적에도 적합하다

  • DeepLearning하다


  • 뇌사로 BERT를 돌린다( 훌륭한 라이브러리 ).
  • 좋은 느낌으로 문장의 벡터 표현을 얻을 수 있다.
  • 게임 내 객체 이름의 벡터와 수집된 텍스트 데이터의 벡터에서 cos 유사도를 계산합니다.
  • 게임내 오브젝트와 관련하여 그러한 문장을 꺼낸다.
  • 게다가 텍스트 생성도 시도한다.

  • 마이크라 모드로 이동


  • 마이크라 모드에서 근처에있는 객체의 이름을 가져옵니다.
  • 취득한 이름을, 텍스트를 검색·생성하는 클래스에 건네준다.
  • 생성에는 deep learning을 사용하고 싶다. 소켓 통신으로 파이썬에 정보를 전달합니다. ( mcpi를 개조 )

  • 알다시피



    문맥은 없어도 비교적 재미있다.
    頓珍漢 문장도 츳코미하고 싶어지기 때문에 재미있다.
    흥미로운지 여부, 문장과 문맥의 정확성은 필수는 아닙니다.

    사이고에게



    야지가 날아오는 마인크래프트에서는, 최대한 인력으로 데이터를 괴롭히지 않게 했습니다.
    이것은, 대응하고 싶은 오브젝트를 나중에 늘리기 쉽게 하기 위해서입니다.
    더 말하면, 넷상의 텍스트가 풍부하고, mod를 작성할 수 있는 게임이면, 마이크라가 아니어도 할 수 있습니다.

    염소가 날아 오는 마인크래프트가, 자연언어 처리의 부담스러운 응용예의 하나가 되면 좋다고 생각합니다.

    모두, 자연 언어 처리로 재미있는 소프트 만들자! !

    좋은 웹페이지 즐겨찾기