強化学習の在庫問題への適用と方策オン型・方策オフ型学習の比較 (非線形解析学と凸解析学の研究)

このアイテムのアクセス数: 87

http://hdl.handle.net/2433/265720

このアイテムのファイル:

ファイル	記述	サイズ	フォーマット
2194-07.pdf		2.85 MB	Adobe PDF	見る/開く

タイトル:	強化学習の在庫問題への適用と方策オン型・方策オフ型学習の比較 (非線形解析学と凸解析学の研究)
その他のタイトル:	A comparison between on-policy learning and off-policy one in reinforcement learning for an inventory problem (Study on Nonlinear Analysis and Convex Analysis)
著者:	高橋, 勇人星野, 満博
著者名の別形:	Takahashi, Hayato Hoshino, Mitsuhiro
発行日:	Aug-2021
出版者:	京都大学数理解析研究所
誌名:	数理解析研究所講究録
巻:	2194
開始ページ:	42
終了ページ:	49
URI:	http://hdl.handle.net/2433/265720
出現コレクション:	2194 非線形解析学と凸解析学の研究

このリポジトリに保管されているアイテムはすべて著作権により保護されています。