倶楽部入口倶楽部活動検索累計訪問者数
一年目 約9万3千 |
無明の学習開始...です一ヶ月程遅れましたが、無明の学習が開始しました。ふ~~ 設定はこんな感じ... ①三層パーセプトロンを使用... 入力層369、中間層81、出力層2 369個のパラメターを81に凝縮してそれを更に煮詰めた結果が評価関数の「出力」...と言う事です。 なぜ「中間層81」か?中間層のノード数は入力ノードの1割から2割程度に設定するので当初80程度を考えていました...将棋盤のマス目が81なので、なんとなくです。 ②データベースに取り込んだ約29万局の棋譜からランダムに選び... 千日手局、引き分けは局は現在の所メリットが薄いと思ったのでスキップです。 ③対局に出現した全局面を生成し... 369個のパラメターを抽出... ④TD(λ)と呼ばれる強化学習のアルゴリズムを使用しパーセプトロンを調整... TD(λ) ②~④を気の遠くなるほど繰り返します。 「学習」に必要な時間は一局辺り1秒程度で済みます。一日辺り約86,000回位のペースです。 但し、一局辺りの学習量は微細です。 ...で、何を「学習」するのか? (続)
投稿者: 紫外線 投稿日時: 月, 01/25/2010 - 14:29 categories [ ]
返信 |
ID取得(無料)してログインすると広告は不表示掲示板更新状況ID取得(無料)してログインすると広告は不表示 |
最近のコメント
14分 2秒前
23分 56秒前
48分 8秒前
1時間 42分前
3時間 17分前
3時間 28分前
4時間 16分前
5時間 45分前
6時間 13分前
7時間 51分前
7時間 59分前
7時間 38分前
8時間 44分前
9時間 28分前
10時間 18分前
19時間 5分前
19時間 51分前
20時間 49分前
22時間 51分前
23時間 23分前