ニューラルネットで遊びましょ - 序盤編 (3)

...とまあ暫く沈黙でしたが(利きを計算する関数に些細なバグが入り、3日程呆けていました)、結論から言えば

「それなりに使えそう」...です。

あちこちパラメター調整して(そんなに無いけど)ざっと約29,000局面を一通り学習させました。

所要時間 2,800秒 = 46.67分 なので毎秒約10局面の速度で学習していました。(最初のころは一局面に3分掛かっていたな~)

①初期局面で「次の手」を聞くと...

 9  8  7  6  5  4  3  2  1 
ky ke gi ki oh ki gi ke ky a
.. hi .. .. .. .. .. ka .. b
fu fu fu fu fu fu fu fu fu c
.. .. .. .. .. .. .. .. .. d
.. .. .. .. .. .. .. .. .. e
.. .. .. .. .. .. .. .. .. f
FU FU FU FU FU FU FU FU FU g
.. KA .. .. .. .. .. HI .. h
KY KE GI KI OH KI GI KE KY i

ボナンザ定跡データより
[P1:FU (7,7)-(7,6) ..]  52306 (1)
[P1:FU (2,7)-(2,6) ..]  12443 (2)
[P1:FU (5,7)-(5,6) ..]  715 (3)
[P1:FU (3,7)-(3,6) ..]  23 (4)
[P1:HI (2,8)-(6,8) ..]  21 (5)
[P1:KI (6,9)-(7,8) ..]  18 (6)
[P1:HI (2,8)-(7,8) ..]  7 (7)
[P1:OH (5,9)-(6,8) ..]  2 (8)

我のニューラルネット曰く...
[P1:FU (7,7)-(7,6) ..] -> 0.4 <- (1)
[P1:HI (2,8)-(7,8) ..] -> 0.373 <- (5) これはオジサマに感化されたか???
[P1:FU (9,7)-(9,6) ..] -> 0.357
[P1:FU (5,7)-(5,6) ..] -> 0.327 <- (3)
[P1:GI (7,9)-(7,8) ..] -> 0.307
[P1:FU (2,7)-(2,6) ..] -> 0.306 <- (2)
[P1:HI (2,8)-(6,8) ..] -> 0.298 <- (7)
[P1:GI (3,9)-(4,8) ..] -> 0.288
[P1:FU (1,7)-(1,6) ..] -> 0.27
[P1:KI (6,9)-(7,8) ..] -> 0.262 <- (6)
[P1:FU (4,7)-(4,6) ..] -> 0.261
[P1:FU (3,7)-(3,6) ..] -> 0.251 <- (4)
[P1:HI (2,8)-(5,8) ..] -> 0.251
[P1:GI (7,9)-(6,8) ..] -> 0.249
[P1:FU (6,7)-(6,6) ..] -> 0.248
[P1:GI (3,9)-(3,8) ..] -> 0.23
[P1:OH (5,9)-(6,8) ..] -> 0.229 <- (8)
[P1:HI (2,8)-(4,8) ..] -> 0.219
[P1:FU (8,7)-(8,6) ..] -> 0.202
[P1:KY (1,9)-(1,8) ..] -> 0.196
[P1:KY (9,9)-(9,8) ..] -> 0.195
[P1:HI (2,8)-(3,8) ..] -> 0.191
[P1:KI (4,9)-(5,8) ..] -> 0.189
[P1:HI (2,8)-(1,8) ..] -> 0.182
[P1:OH (5,9)-(4,8) ..] -> 0.166
[P1:OH (5,9)-(5,8) ..] -> 0.165
[P1:KI (6,9)-(6,8) ..] -> 0.165
[P1:KI (4,9)-(3,8) ..] -> 0.162
[P1:KI (4,9)-(4,8) ..] -> 0.162
[P1:KI (6,9)-(5,8) ..] -> 0.16

...と、指すべき手が上位に集中しているので「とりあえずよろし」とします。

②チョットあり得ない局面を仕込んで「次の手」を聞きました。香の位置をずらしてあります。

 9  8  7  6  5  4  3  2  1 
.. ke gi ki oh ki gi ke .. a
ky hi .. .. .. .. .. ka ky b
fu fu fu fu fu fu fu fu fu c
.. .. .. .. .. .. .. .. .. d
.. .. .. .. .. .. .. .. .. e
.. .. .. .. .. .. .. .. .. f
FU FU FU FU FU FU FU FU FU g
.. KA .. .. .. .. .. HI .. h
KY KE GI KI OH KI GI KE KY i

[P1:FU (7,7)-(7,6) ..] -> 0.419 <- (1)
[P1:HI (2,8)-(7,8) ..] -> 0.391 <- (5)
[P1:FU (9,7)-(9,6) ..] -> 0.374
[P1:FU (5,7)-(5,6) ..] -> 0.341 <- (3)
[P1:GI (7,9)-(7,8) ..] -> 0.325
[P1:FU (2,7)-(2,6) ..] -> 0.323 <- (2)
[P1:HI (2,8)-(6,8) ..] -> 0.313 <- (7)
[P1:GI (3,9)-(4,8) ..] -> 0.304
[P1:FU (1,7)-(1,6) ..] -> 0.286
[P1:KI (6,9)-(7,8) ..] -> 0.277 <- (6)
[P1:FU (4,7)-(4,6) ..] -> 0.27
[P1:FU (3,7)-(3,6) ..] -> 0.265 <- (4)
[P1:HI (2,8)-(5,8) ..] -> 0.263
[P1:FU (6,7)-(6,6) ..] -> 0.262
[P1:GI (7,9)-(6,8) ..] -> 0.262
[P1:OH (5,9)-(6,8) ..] -> 0.246 <- (8)
[P1:GI (3,9)-(3,8) ..] -> 0.244
[P1:HI (2,8)-(4,8) ..] -> 0.23
[P1:FU (8,7)-(8,6) ..] -> 0.213
[P1:KY (1,9)-(1,8) ..] -> 0.207
[P1:KY (9,9)-(9,8) ..] -> 0.205
[P1:HI (2,8)-(3,8) ..] -> 0.2
[P1:KI (4,9)-(5,8) ..] -> 0.199
[P1:HI (2,8)-(1,8) ..] -> 0.19
[P1:OH (5,9)-(4,8) ..] -> 0.175
[P1:OH (5,9)-(5,8) ..] -> 0.174
[P1:KI (6,9)-(6,8) ..] -> 0.172
[P1:KI (4,9)-(3,8) ..] -> 0.171
[P1:KI (4,9)-(4,8) ..] -> 0.169
[P1:KI (6,9)-(5,8) ..] -> 0.167

...と、この場合人間なら「あほな香の位置は無視して初期局面と見なして指す」と思われますので「初期局面次の一手」とほぼ同等の計算値を出せたことは評価しても良いのではないかと...と思ってみました。

後は学習時間を延長して精度の向上が見られるかを確認ですね。

投稿者: 紫外線 投稿日時: 土, 10/09/2010 - 15:42 categories [ ]

コメントの表示オプション

お好みの表示方法を選択し、「設定の保存」をクリックすると、表示方法を変更することができます。

次の課題

...ボナメソなり、TDなり学習方法を取り入れて構想中の「駒価値無し評価関数」の構築です。

でも「持ち駒」の扱いを如何するのか未だ煮詰まっていないのでこれも考えないといけませぬ。

これが最大最高の難関です。

オジサンは

先手なら▲76歩オンリーです、他の手は指しませんぞ。
によって、感化したのは他のコンちゃんが疑わしいです。
将棋ソフト改竄ソフト現る?(笑)

コメントの表示オプション

お好みの表示方法を選択し、「設定の保存」をクリックすると、表示方法を変更することができます。