【쇼기 AI】「쇼기 AI에서 배우는 딥 러닝」을 읽는다♪~쇼기 AI를 강하게 하기 위해서


제 5 밤은 장기 AI를 강하게하려면 어떻게해야할지 고찰합니다.

했던 일



(1)쇼기 AI의 성질로부터 생각한다
(2) Gikou2와 대전한다

(1)쇼기 AI의 성질로부터 생각한다



원래 장기 AI의 힘은 이하의 4점이 중요하다.
①평가 함수의 정밀도
②실행속도
③초기반면에서의 정적 이용
④ 채장기

이 문서에서는 다음을 다룹니다.
①【평가 함수】Network 모델을 튜닝하여 강하게 한다
②【평가 함수】Policy와 Value를 동시 학습에 의해 학습 효율을 올린다
③【평가함수】 학습하는 기보를 커스터마이즈하여 최적화한다
④【실행속도】처리를 병렬화한다
⑤【실행 속도】UCT 탐색의 궁리
⑥【실행속도】실행속도가 빠른 언어(C++)로 한다
⑦【막장기】 채우기 탐색의 도입
⑧【평가 함수와 정석】 강화 학습
우완의 실력으로 말해 ①에서 ③은 여기서 다루었지만 ④이후는 곧바로 실행하기에는 조금 어렵다.
그래서 ④의 병렬화는 본서 다운로드 사이트에서 앱을 받아 이용하는 것으로 하고, 한층 더 실행 속도를 올리는 것은 어렵기 때문에 가지고 시간을 대폭 증가시켜, 한층 더 탐색 깊이를 가능한 한 큰 값으로 한다고 하는 것으로 어디까지 강해지는지를 실시해 보았다.

(2) Gikou2와 대전한다



Gikou2의 소프트 등급은 읽기 깊이로 조정할 수 있으며 아래 참고 페이지에서 공개되어 있다. 그리고 일로 레이팅에서 본 것처럼 대체로 레이트 차이 200이라고 승부가 되기 때문에, Gikou2의 Depth1 다르면 레이트 차이가 거의 200 정도가 되어 있기 때문에 강도를 보는 데 편리하다.
【참고】
· 컴퓨터 장기 정리 사이트
실은, 여기에 줄지어 있는 장기 소프트는 거의 C언어로 쓰여져 있다.
C언어와 Python의 속도차는 이하의 참고에 의하면 대체로 15배 정도의 차이가 있다.
반대로, 15배의 시간을 주면 속도 차이가 흡수될 수 있다.
【참고】
· 다양한 언어로 계산 속도를 비교해 보았습니다.
그렇다고 해서, 소요시간을 길게 하고(최대 1시간 정도) 한편 탐색 깊이를 10000으로 해 대전해 보았다.

Gikou2 D1 1512 +17/-9





Gikou2 D2 1799 +12/-9





Gikou2 D3 2001 +12/-12






Gikou2 D5 2187 +14/-13





그건 그렇고, Gikou2D5의 힘에 대해서는 이런 힘 (기교 2와 나) 그렇습니다.
탐색 깊이는 상기는 10000의 결과이지만, 30000까지 증가해 보았지만, 그다지 향상되지 않았다.

요약



・쇼기 AI의 힘의 포인트를 정리했다
・속도 향상은 스킬적으로 어렵기 때문에, 소요시간을 길게 해 10000 탐색 국면(playout)으로 늘려 Gikou2와 Depth를 바꾸어 대전했다
· 대체로 등급 1800 정도라고 보인다

・탐색 국면이 거의 동일하다면, 평가 함수 레벨에서는 Gikou와 같은 레벨이 되었을지도 모르지만 확증은 없다

좋은 웹페이지 즐겨찾기