ダウンロード数: 454
このアイテムのファイル:
ファイル | 記述 | サイズ | フォーマット | |
---|---|---|---|---|
1559-04.pdf | 1.91 MB | Adobe PDF | 見る/開く |
タイトル: | マルコフ決定過程における TD 法による学習アルゴリズムについて(最適化問題における確率モデルの展開と応用) |
その他のタイトル: | A learning algorithm of TD method for Markov decision processes(Developments of probability models on optimization problems) |
著者: | 堀口, 正之 蔵野, 正美 安田, 正實 |
著者名の別形: | HORIGUCHI, Masayuki KURANO, Masami YASUDA, Masami |
発行日: | Jun-2007 |
出版者: | 京都大学数理解析研究所 |
誌名: | 数理解析研究所講究録 |
巻: | 1559 |
開始ページ: | 34 |
終了ページ: | 49 |
URI: | http://hdl.handle.net/2433/81055 |
出現コレクション: | 1559 最適化問題における確率モデルの展開と応用 |
このリポジトリに保管されているアイテムはすべて著作権により保護されています。