このアイテムのアクセス数: 87

このアイテムのファイル:
ファイル 記述 サイズフォーマット 
2194-07.pdf2.85 MBAdobe PDF見る/開く
タイトル: 強化学習の在庫問題への適用と方策オン型・方策オフ型学習の比較 (非線形解析学と凸解析学の研究)
その他のタイトル: A comparison between on-policy learning and off-policy one in reinforcement learning for an inventory problem (Study on Nonlinear Analysis and Convex Analysis)
著者: 高橋, 勇人  KAKEN_name
星野, 満博  KAKEN_name
著者名の別形: Takahashi, Hayato
Hoshino, Mitsuhiro
発行日: Aug-2021
出版者: 京都大学数理解析研究所
誌名: 数理解析研究所講究録
巻: 2194
開始ページ: 42
終了ページ: 49
URI: http://hdl.handle.net/2433/265720
出現コレクション:2194 非線形解析学と凸解析学の研究

アイテムの詳細レコードを表示する

Export to RefWorks


出力フォーマット 


このリポジトリに保管されているアイテムはすべて著作権により保護されています。