기계 학습을 사용하여 CS의 문의 판정을 해 보았습니다.
2073 단어 기계 학습 입문
소개
주식회사 삼자뿌에서 전국 불무를 담당하고 있습니다 nakamura입니다.
이전부터 기계 학습에 흥미가 있었으므로 배우면서 게시제와 같은 것을 시도해 보았습니다.
게임 운영은 기능 구현뿐만 아니라 문의 대응이나 조사도 엔지니어의 일 중 하나입니다.
1차 대응으로 실수해 버리면 히트 안건화해 버리는 케이스도 있기 때문에 문의를 받은 시점에서 적절하게 판별, 배분을 할 수 있으면, 보다 좋은 대응을 할 수 있는 것은 아닐까 생각했습니다.
처리 흐름
사용한 도구
-Phyton
-Jupyter Notebook(분석 환경)
-scikit-learn(기계 학습)
-MeCab(형태소 해석)
형태소 해석 코드 예
import MeCab
tagger = MeCab.Tagger()
#形態素解析
word_s = tagger.parse(text)
words = []
for line in word_s.split("\n"):
# 省略
기계 학습 코드 예
from sklearn.naive_bayes import GaussianNB
#省略
#学習用とテスト用に分割
x_train, x_test, y_train, y_test = train_test_split(data)
# 学習
model = GaussianNB()
model.fit(x_train, y_train)
# テスト
y_pred = model.predict(x_test)
acc = accuracy_score(y_test, y_pred)
결과
상기에서 기계 학습시킨 모델을 바탕으로 실제 CS데이터 2000건정의 판정을 실시해 보았습니다만 정밀도는 50% 정도라는 결과가 되었습니다.
실업무로 사용하기에는 일상적인 결과입니다만 문자열의 정규화나 보다 많은 단어의 신규 등록을 해 형태소 해석 정밀도를 올리는 것으로 판정의 정밀도도 오를 것 같기 때문에 계속해 임해 가고 싶습니다.
참고
바로 사용할 수 있습니다! 업무로 실천 할 수 있습니다! Python으로 AI, 기계 학습, 심층 학습 앱을 만드는 방법
내일은 @shoichi1023 님의 기사입니다.
Reference
이 문제에 관하여(기계 학습을 사용하여 CS의 문의 판정을 해 보았습니다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/kazun9_naka/items/42267dff352990c286b9텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)