倶楽部入口倶楽部活動検索累計訪問者数
一年目 約9万3千 |
評価関数 - どうしましょ?...と半年掛けてネチネチと将棋ソフトの部品を書き溜めて来たわけですが、「評価関数」の構築をこれ以上は先送りに出来ないので着手します。(本来はこれを最初にするべきなのでは???) 開発方針としては... ①関数の構築はソフトに任せる ⇒ イワユル自動学習の方向へ、ですね。将棋がヘタッピの我が自分で書くなど恐れ多い話です。 学習の手法としては強化学習のバリエーションの一つ、TD学習(Temporal Difference Learning)を使用。 強化学習 TD学習 ...普段は家族・仕事・家事、etcと忙しい一般人にとっては寝る間にも頑張ってくれる自動学習はアリガタ~イ存在です。 ②「ボナメソ」は使用しない...即ち「(普通、高段者の)棋譜より学習し、指し手を人間の解答と合致するように評価関数のパラメターを調整する」...はやらないという事です。棋譜を使用してのの学習は多分行うでしょうが、別の方向で...ですね。 いろいろ論文漁って(これにえらく時間がかかった)基本のコードは出来ているのでもう少し煮詰めれば「評価関数作成・学習」プログラムが完成...するはずです。
投稿者: 紫外線 投稿日時: 火, 12/29/2009 - 15:29 categories [ ]
|
ID取得(無料)してログインすると広告は不表示掲示板更新状況ID取得(無料)してログインすると広告は不表示 |
最近のコメント
2時間 43分前
2時間 44分前
2時間 47分前
2時間 51分前
2時間 53分前
2時間 56分前
4時間 38分前
5時間 15分前
5時間 59分前
6時間 15分前
6時間 19分前
6時間 10分前
14時間 14分前
14時間 45分前
15時間 52分前
16時間 55分前
20時間 9分前
20時間 10分前
20時間 18分前
20時間 29分前