倶楽部入口倶楽部活動検索累計訪問者数
一年目 約9万3千 |
プランB - モンテカルロ法モンテカルロ法 『モンテカルロ法 (モンテカルロほう、Monte Carlo method, MC) とはシミュレーションや数値計算を乱数を用いて行なう手法の総称。元々は、中性子が物質中を動き回る様子を探るためにジョン・フォン・ノイマンにより考案された手法。カジノの賭博国家モナコ公国の4つの地区(カルティ)の一つであるモンテ・カルロから名づけられた。ランダム法とも呼ばれる。台湾中国など漢字圏では賭博手法と呼ばれる。』 極言すれば、将棋のAI検索はいかに「組合せ爆発」を抑えるかにかかっています。 組合せ爆発 『組合せ爆発(くみあわせばくはつ、英: Combinatorial explosion)は、数学において、組合せ的効果によって関数の値が急激に増大することを意味する。』 ...その為に様々なテクが使用されます。 ⇒ アルファ・ベータ (後ろ向き枝刈り) ...で、無明が今回採用するのが「モンテカルロ法を使用した評価値の補正」となります。 なぜこんなみょうちくりんな物を引っ張ってくるかと言うと、 ① (少なくとも今年は)誰も使用していないようですし...ネタ扱いですね ② 学習は要らない ③ プログラム部分は単純明快 ④ モンテカルロ法は我が大学生当時(専攻は離散数学)多用していた手法なので 検索の実際はこんな感じになります。 ① アルファ・ベータ使用で一定深度まで検索...その時点での評価値を計算。 ② そこから◎手ランダムに手を進め、その時点での評価値を計算...これを数万~数十万回繰り返し、その平均を求める。 ③ 最終評価値は ① + α x (②-①) とする。 基本の考え方は以下の通りです... ある程度の深度まで読み評価値を計算したとします。この評価値が安定した信頼できる数値ならば、この局面から数手双方がランダムに駒を動かしても大して評価値は変動しないハズです。もしこの手が評価値以上の悪手・好手なら評価値にブレが出ます。この手法の肝は一定深度まで検索した評価値にさらにその未来の予測を加味して精度を上げよう...といった企みです。
投稿者: 紫外線 投稿日時: 日, 03/14/2010 - 19:01 categories [ ]
返信 |
ID取得(無料)してログインすると広告は不表示掲示板更新状況ID取得(無料)してログインすると広告は不表示 |
最近のコメント
1時間 1分前
1時間 11分前
1時間 35分前
2時間 29分前
4時間 4分前
4時間 15分前
5時間 3分前
6時間 33分前
7時間 1分前
8時間 38分前
8時間 46分前
8時間 25分前
9時間 32分前
10時間 15分前
11時間 6分前
19時間 52分前
20時間 39分前
21時間 37分前
23時間 38分前
1日 10分前