マルコフ決定過程における TD 法による学習アルゴリズムについて(最適化問題における確率モデルの展開と応用)

このアイテムのアクセス数: 470

http://hdl.handle.net/2433/81055

このアイテムのファイル:

ファイル	記述	サイズ	フォーマット
1559-04.pdf		1.91 MB	Adobe PDF	見る/開く

タイトル:	マルコフ決定過程における TD 法による学習アルゴリズムについて(最適化問題における確率モデルの展開と応用)
その他のタイトル:	A learning algorithm of TD method for Markov decision processes(Developments of probability models on optimization problems)
著者:	堀口, 正之蔵野, 正美安田, 正實
著者名の別形:	HORIGUCHI, Masayuki KURANO, Masami YASUDA, Masami
発行日:	Jun-2007
出版者:	京都大学数理解析研究所
誌名:	数理解析研究所講究録
巻:	1559
開始ページ:	34
終了ページ:	49
URI:	http://hdl.handle.net/2433/81055
出現コレクション:	1559 最適化問題における確率モデルの展開と応用

このリポジトリに保管されているアイテムはすべて著作権により保護されています。