正統(?)なモンテカルロ法

...の場合、現在の局面からランダムに駒を動かして(これを何万・何千万回繰り返す)比較的ましな結果に到る手を選びます。

我の手法はMinMax法とモンテカルロ法のハイブリッドとなります...制限時間内(一手20秒程度)ではおのずと読める深さに限りがでます。それを補足するために検索木の端でランダム(おおざっぱ)に検索することにより「この先は良さそう・悪そう」といった観測を評価値に加味する...と言う事ですね。

返信

このフィールドの内容は非公開にされ、公表されることはありません。
  • ウェブページアドレスとメールアドレスは、自動的にハイパーリンクに変換されます。
  • 使用できるHTMLタグ: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <hr>
  • 行と段落は自動的に折り返されます。

書式オプションに関するさらに詳しい情報...