このアイテムのアクセス数: 87
このアイテムのファイル:
ファイル | 記述 | サイズ | フォーマット | |
---|---|---|---|---|
2194-07.pdf | 2.85 MB | Adobe PDF | 見る/開く |
タイトル: | 強化学習の在庫問題への適用と方策オン型・方策オフ型学習の比較 (非線形解析学と凸解析学の研究) |
その他のタイトル: | A comparison between on-policy learning and off-policy one in reinforcement learning for an inventory problem (Study on Nonlinear Analysis and Convex Analysis) |
著者: | 高橋, 勇人 ![]() 星野, 満博 ![]() |
著者名の別形: | Takahashi, Hayato Hoshino, Mitsuhiro |
発行日: | Aug-2021 |
出版者: | 京都大学数理解析研究所 |
誌名: | 数理解析研究所講究録 |
巻: | 2194 |
開始ページ: | 42 |
終了ページ: | 49 |
URI: | http://hdl.handle.net/2433/265720 |
出現コレクション: | 2194 非線形解析学と凸解析学の研究 |

このリポジトリに保管されているアイテムはすべて著作権により保護されています。