評価関数 - 評価項目

新年よろしくお願いいたします。

前出の評価関数の基本形は...

評価値 = (評価項目① x 比重①) + (評価項目② x 比重②) + (評価項目③ x 比重③)…

機械学習のゴールは適切な「比重」をトライアル&エラーにより見つけることにあります。

「では、評価項目はどこから来るの???」

①局面そのものを評価項目とする

これはカナリ乱暴粗雑に見えますが、「局面」は全ての情報を包括しているのでこれから学習できればしめたものです。

TDギャモン (TD-Gammon)
http://www.ai-gakkai.or.jp/jsai/whatsai/AItopics4.html

...因みにTDギャモンは150万回程練習試合を繰り返して学習し、人間の達人とほぼ同程度のレベルまで学習の成功しました。

②作者が評価項目を選ぶ

これは従来の評価関数作成と同じですね。チューニングの部分を自動学習で行う...という事です。

KnightCap
http://en.wikipedia.org/wiki/KnightCap

”The most original feature of KnightCap, introduced in the late 1990s, was an experiment in temporal difference learning as applied to chess. This technique allowed KnightCap to automatically tune the weights applied to the various features in its evaluation function based on the games it played.”

③ ①+②... 我はこれを模索中です。

投稿者: 紫外線 投稿日時: 金, 01/01/2010 - 09:25 categories [ ]

返信

このフィールドの内容は非公開にされ、公表されることはありません。
  • ウェブページアドレスとメールアドレスは、自動的にハイパーリンクに変換されます。
  • 使用できるHTMLタグ: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <hr>
  • 行と段落は自動的に折り返されます。

書式オプションに関するさらに詳しい情報...