【쇼기 AI】「쇼기 AI에서 배우는 딥 러닝」을 읽는다♪~레이팅을 요구한다


제 6 밤은 요 전날 계속해서 평가의 이야기입니다.
이번은, 참고의 페이지에 대전 성적을 입력하면 상대적인 레이팅 차이로부터 레이팅을 요구한다고 하는 것입니다.
【참고】
· 레이트 계산하기 @ 컴퓨터 장기 데이터베이스

했던 일



(1) 상기 참고 페이지로부터 등급을 요구한다
(2) 이론(소스 코드)을 본다

(1) 상기 참고 페이지로부터 등급을 요구한다



어젯밤의 결과에서 대체로 등급이 밝혀졌습니다. 하지만, 역시 제삼자적인 의미로 등급을 내는 것은 의미가 있다고 생각하기 때문에 해 보았다.
결과는 다음과 같다.
data generated : 30/9/2018 total games: 76

software
rating
error
게임

Gikou2D5 2181 +544/-117
10

Gikou2D3 2036 +150/-96
10

Gikou2D2 1800+0/-0
56

Try 1776 +23/-29
70

Q22 1695 +104/-136
6


입력 데이터;sample2.csv

sample2.csv
engine1,option1,engine2,option2,win1,win2,draw(-1=undef),drawadd,date(-1=undef),writer
Gikou2D2,+,Try,+,27.5,22.5,1,1,-1,undefined
Gikou2D3,+,Try,+,8,2,0,0,-1,undefined
Gikou2D2,+,Q22,+,4,2,0,0,-1,undefined
Gikou2D5,+,Try,+,9,1,0,0,-1,undefined

각 데이터의 의미는 속도 계산 스크립트 사용 @ 컴퓨터 장기 데이터베이스에 있다.
※입력 방법은 상기 CSV 파일과 같다
등급을 올바르게 계산하는 데 중요한 것은 첫 번째 소프트웨어 속도를 기준으로 계산하기 때문에 해당 속도가 정확해야합니다. 그 Software를 기준으로 한 레이트 산출이다.
※기본은 일로 등급 로 나타낸 대로이다.

(2) 이론(소스 코드)을 본다



기본 방정식은 다음과 같습니다.
$ΔR=R-R_B$, $R_B$는 기준이 되는 소프트의 레이팅, $R$는 요구하고 싶은 소프트의 레이트로 하면,
E_{ΔR}=\frac{1}{1+10^{−ΔR/400}}

식변형하면 다음과 같이
R=R_B-400\log (\frac{1-E_{ΔR}}{E_{ΔR}})

※ 원래 $1-E_{ΔR}$는 상대의 승률이므로, 이로 레이팅은 승률비의 $\log$의 400배가 레이트 차이라고 하는 정의인 것을 알 수 있다
여기까지 식 변형하여 소스 코드를 바라 보면,
이하의 함수로 bias값(기준값)에 레이트차를 플러스하여 레이트를 계산하고 있다.
    def get_beta_with_bias(self,i,bias):
        beta = 400*np.log10(self.p)
        beta += (bias-beta[i])
        return beta

또한, bias값(기준값)은 이하에서 계산 전에 설정할 필요가 있다.
    for k in np.arange(n_trial):
        bt = bt_model(samples[k,:,:],p_init)
        bt.estimate()
        betas[k,:] = bt.get_beta_with_bias(0,1800)   #rate of 1st
        p_init = bt.p
bt.get_beta_with_bias(0,1800) 의 1800을 변경합니다.
그리고 결과 출력은 다음과 같이 수행됩니다.
result = np.c_[range(K),q_50,q_75-q_50,q_50-q_25,n_games]

그렇다고 해서 위의 산출된 레이트에는 +-가 붙어 있지만, 이것은 코드에 의하면 다시 샘플링(사고 실험해), 그 중앙값과 25퍼센타일, 75퍼센타일을 취하고 있는 것 같다 .
모든 코트는 여기에서 다운로드하여 볼 수 있습니다.

요약



・제3자적인 등급을 요구했다
· 분명히 일로 등급에서 요구하는 것 같습니다.

・이번에는, 대전 조건이 통상이 되지만, 무엇을 보는지를 정해 레이팅·랭킹을 게재한다고 하는 것도 있을 수 있다

좋은 웹페이지 즐겨찾기