開発目標

...選手権が終わってもいないのに(始まってもいないケド)来年度へ向けて目標・方針を覚え書きしておきます。

①探索 - やっぱり他のソフトのソースをよく読んで取り込むのが強化への道でしょう

②評価関数 - (A)2~3年前から考えていた 進化アルゴリズム を導入します、(B)となればマトリックス演算は避けて通れない道なのでライブラリーを探すか、CUDAに手を染めるか...です。

備忘録
http://nd4j.org/

投稿者: webMaster 投稿日時: 日, 05/03/2015 - 01:28 categories [ ]

コメントの表示オプション

お好みの表示方法を選択し、「設定の保存」をクリックすると、表示方法を変更することができます。

最初にすること

...やはり、我流でチクチク書くには限界がありありなのでお手本を読経するべきでしょう。

読むべき経典は 干物 が現在のオススメです。

プラン #4

...先ずは控えめに 駒割り だけで実験するのも有効かな?

パラメーター五千万個? P2

...この数字は通常在り得ない状況も多分に含み、実際の普通の対局に使用・貢献するのはその一部です。

そしてこの部分が ボナンザ系評価関数(と言うより、機械学習全般) の問題点でもあります。 ⇒ 学習していない事項は無知の極み

((補足))

通常在り得ない状況...の例として、KKP (玉、玉、任意の駒の関係)の場合、

先手玉 51
後手玉 59

...と、通常の玉の位置を入れ替えた場合のデータは江戸時代から探してもほぼ存在しないでしょう。

パラメーター五千万個?

今の技術は存じませぬが、それだともはや評価関数と常識的に呼べるものとは、概念として別にすべきではないだろうかと思いますね。

恐らく五千万個の項目の内多くても数百個を除く大部分は、データを学習して自動的に生成されたもので、0(合致、存在)、1(不一致、不存在)で評価され、適当に係数(重み)が掛かって関数値に寄与するのでしょうけれども。

それならば関数には違いないのですが、関数概念自体にも、歴史的に2度大きな変革が有りました。大げさに見れば、もしかしたらコンピューター将棋のせいで、3度目が近づいているということなのかもしれません。

プラン#3

ボナンザの評価関数パラメターは5千万程あるので...無理なのでは?
...とのご指摘がありましたので考え直します。

コメント P2

私見では...

①盤面が穏やかな時は常識的な手をさす
②いざ中盤・終盤に突入したときの出来・不出来の差が激しい

...ですね。

コメント

無明くんの すべての指し手を見たわけでもないですが 思うことはあります
そのうちに お伝えします

プラン#2

...は、選手権中に思いついた案。

①探索・評価関数はボナンザをまるパクリ
②評価関数のパラメターは空から始め、最適値に到達するよう頑張る

コメントの表示オプション

お好みの表示方法を選択し、「設定の保存」をクリックすると、表示方法を変更することができます。