【발렌타인 특별 기획】LINE 궁합 진단 만들어 보았다!

발렌타인입니다.



2월 14일이 가까워지고 소름 끼치는 남자도 많지 않을까요?
이번은 LINE의 토크 이력을 사용해 신경이 쓰이는 상대와의 궁합을 진단하는 시스템을 만들어 보았습니다!

자세한 내용은 다음 동영상에서 소개합니다.
htps: //같다. 베 / L 뭉 fC 비호 XY

어떻게 만드는거야?



만드는 방법은 간단합니다.
  • 개인 LINE 토크 내역 저장
  • 데이터 성형
  • 자신의 알고리즘으로 점수 계산

  • ※1은 스마트폰 앱에서와 PC의 앱에서 저장하는 것은 텍스트의 포맷이 바뀌므로 스마트폰 앱에서 저장해 주세요

    개인 LINE의 대화 기록 저장



    다음 단계에 따라 대화 기록을 저장합니다.



    데이터 성형



    텍스트 형식의 토크 이력을 데이터 정형해 나갑니다
    메시지와 턴과 대화라는 세 가지 데이터 형식을 정의합니다.



    데이터 구조는 한 줄 메시지가 메시지, 메시지 집합이 턴, 자신과 상대의 턴 집합이 대화라는 관계가 됩니다.



    고유 알고리즘으로 점수 계산



    LINE 궁합 진단 시스템에는 4개의 평가 축이 있습니다.



    대화 길이



    대화의 길이는 10일을 만점으로 1회화 마다 계산합니다



    회신 간격



    회신 간격에서는 6시간 이상 경과로 0점이 되도록 계산합니다.



    내용의 질



    내용의 질은 이번에는 쉽게 질문문이나 이모티콘을 포함할 경우 점수가 들어가게 했습니다
    향후는 word2vec나 doc2vec에 의해 「좋아」에 가까운 단어가 포함되어 있는 경우에 가점하는 등의 처리를 넣어 가고 싶습니다



    통화 시간



    통화시간 평가에서는 1시간 이상의 통화를 만점으로 전체 통화에서 평균을 취합니다.



    결과



    결과는 다음과 같습니다.



    거기서 엄격하게 만들었기 때문에 60 점 있으면 위로 할 수있는 곳입니다, 짚

    요약



    이번은 간단한 알고리즘으로 상대와의 궁합을 수치화하는 시스템을 만들었습니다!
    데이터가 데이터에만 걱정이지만 heroku 등에서 공개하여 사용하는 것도 좋을 것 같습니다.

    좋은 웹페이지 즐겨찾기