倶楽部入口倶楽部活動検索累計訪問者数
一年目 約9万3千 |
評価関数 - 評価項目新年よろしくお願いいたします。 前出の評価関数の基本形は... 評価値 = (評価項目① x 比重①) + (評価項目② x 比重②) + (評価項目③ x 比重③)… 機械学習のゴールは適切な「比重」をトライアル&エラーにより見つけることにあります。 「では、評価項目はどこから来るの???」 ①局面そのものを評価項目とする これはカナリ乱暴粗雑に見えますが、「局面」は全ての情報を包括しているのでこれから学習できればしめたものです。 TDギャモン (TD-Gammon) ...因みにTDギャモンは150万回程練習試合を繰り返して学習し、人間の達人とほぼ同程度のレベルまで学習の成功しました。 ②作者が評価項目を選ぶ これは従来の評価関数作成と同じですね。チューニングの部分を自動学習で行う...という事です。 KnightCap ”The most original feature of KnightCap, introduced in the late 1990s, was an experiment in temporal difference learning as applied to chess. This technique allowed KnightCap to automatically tune the weights applied to the various features in its evaluation function based on the games it played.” ③ ①+②... 我はこれを模索中です。
投稿者: 紫外線 投稿日時: 金, 01/01/2010 - 09:25 categories [ ]
返信 |
ID取得(無料)してログインすると広告は不表示掲示板更新状況ID取得(無料)してログインすると広告は不表示 |
最近のコメント
21分 38秒前
1時間 15分前
2時間 50分前
3時間 1分前
3時間 49分前
5時間 19分前
5時間 47分前
7時間 24分前
7時間 32分前
7時間 11分前
8時間 18分前
9時間 1分前
9時間 52分前
18時間 38分前
19時間 25分前
20時間 23分前
22時間 24分前
22時間 56分前
23時間 43分前
1日 1時間前