【쇼기 AI】「쇼기 AI에서 배우는 딥 러닝」을 읽는다♪～쇼기 AI를 강하게 하기 위해서

제 5 밤은 장기 AI를 강하게하려면 어떻게해야할지 고찰합니다.

했던 일

(1)쇼기 AI의 성질로부터 생각한다
(2) Gikou2와 대전한다

(1)쇼기 AI의 성질로부터 생각한다

원래 장기 AI의 힘은 이하의 4점이 중요하다.
①평가 함수의 정밀도
②실행속도
③초기반면에서의 정적 이용
④ 채장기

이 문서에서는 다음을 다룹니다.
①【평가 함수】Network 모델을 튜닝하여 강하게 한다
②【평가 함수】Policy와 Value를 동시 학습에 의해 학습 효율을 올린다
③【평가함수】 학습하는 기보를 커스터마이즈하여 최적화한다
④【실행속도】처리를 병렬화한다
⑤【실행 속도】UCT 탐색의 궁리
⑥【실행속도】실행속도가 빠른 언어(C++)로 한다
⑦【막장기】 채우기 탐색의 도입
⑧【평가 함수와 정석】 강화 학습
우완의 실력으로 말해 ①에서 ③은 여기서 다루었지만 ④이후는 곧바로 실행하기에는 조금 어렵다.
그래서 ④의 병렬화는 본서 다운로드 사이트에서 앱을 받아 이용하는 것으로 하고, 한층 더 실행 속도를 올리는 것은 어렵기 때문에 가지고 시간을 대폭 증가시켜, 한층 더 탐색 깊이를 가능한 한 큰 값으로 한다고 하는 것으로 어디까지 강해지는지를 실시해 보았다.

(2) Gikou2와 대전한다

Gikou2의 소프트 등급은 읽기 깊이로 조정할 수 있으며 아래 참고 페이지에서 공개되어 있다. 그리고 일로 레이팅에서 본 것처럼 대체로 레이트 차이 200이라고 승부가 되기 때문에, Gikou2의 Depth1 다르면 레이트 차이가 거의 200 정도가 되어 있기 때문에 강도를 보는 데 편리하다.
【참고】
· 컴퓨터 장기 정리 사이트
실은, 여기에 줄지어 있는 장기 소프트는 거의 C언어로 쓰여져 있다.
C언어와 Python의 속도차는 이하의 참고에 의하면 대체로 15배 정도의 차이가 있다.
반대로, 15배의 시간을 주면 속도 차이가 흡수될 수 있다.
【참고】
· 다양한 언어로 계산 속도를 비교해 보았습니다.
그렇다고 해서, 소요시간을 길게 하고(최대 1시간 정도) 한편 탐색 깊이를 10000으로 해 대전해 보았다.

Gikou2 D1 1512 +17/-9

Gikou2 D2 1799 +12/-9

Gikou2 D3 2001 +12/-12

Gikou2 D5 2187 +14/-13

그건 그렇고, Gikou2D5의 힘에 대해서는 이런 힘 (기교 2와 나) 그렇습니다.
탐색 깊이는 상기는 10000의 결과이지만, 30000까지 증가해 보았지만, 그다지 향상되지 않았다.

요약

・쇼기 AI의 힘의 포인트를 정리했다
・속도 향상은 스킬적으로 어렵기 때문에, 소요시간을 길게 해 10000 탐색 국면(playout)으로 늘려 Gikou2와 Depth를 바꾸어 대전했다
· 대체로 등급 1800 정도라고 보인다

・탐색 국면이 거의 동일하다면, 평가 함수 레벨에서는 Gikou와 같은 레벨이 되었을지도 모르지만 확증은 없다

Reference

이 문제에 관하여(【쇼기 AI】「쇼기 AI에서 배우는 딥 러닝」을 읽는다♪～쇼기 AI를 강하게 하기 위해서), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/MuAuan/items/14881c9ca64e9a95ba72

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다