このアイテムのアクセス数: 48
このアイテムのファイル:
ファイル | 記述 | サイズ | フォーマット | |
---|---|---|---|---|
2126-09.pdf | 3.78 MB | Adobe PDF | 見る/開く |
タイトル: | 区間型マルコフ決定過程の推移行列の推定について (不確実性の下での意思決定の数理とその周辺) |
その他のタイトル: | On a way of estimating the transition probabilities in controlled Markov set-chains (Mathematics of Decision Making under Uncertainty and Related Topics) |
著者: | 堀口, 正之 ![]() |
著者名の別形: | HORIGUCHI, Masayuki |
発行日: | Aug-2019 |
出版者: | 京都大学数理解析研究所 |
誌名: | 数理解析研究所講究録 |
巻: | 2126 |
開始ページ: | 67 |
終了ページ: | 76 |
抄録: | 推移法則未知のマルコフ決定過程において, 状態観測に基づき推移法則を推定しながら適応型最適政策を求める学習問題がある。その推移法則の推定と最適化問題を構成するとき事前区間測度を用いた区間型マルコフ決定過程による解決アプローチの方法がある。本報告では, ディリクレ分布による区間型推定と推定に用いられるベータ関数比における方程式の解と不動点について考察する。 |
URI: | http://hdl.handle.net/2433/252234 |
出現コレクション: | 2126 不確実性の下での意思決定の数理とその周辺 |

このリポジトリに保管されているアイテムはすべて著作権により保護されています。