このアイテムのアクセス数: 85
このアイテムのファイル:
ファイル | 記述 | サイズ | フォーマット | |
---|---|---|---|---|
2158-08.pdf | 3.36 MB | Adobe PDF | 見る/開く |
タイトル: | 推移法則未知の区間型マルコフ決定モデルにおける確信集合について (不確実・不確定性の下における数理的意思決定の理論と応用) |
その他のタイトル: | On the credible set in controlled Markov set-chains with unknown transition probabilities (Theory and Its Application of Mathematical Decision Making under Uncertainty and Ambiguity) |
著者: | 堀口, 正之 ![]() |
著者名の別形: | Horiguchi, Masayuki |
発行日: | Jun-2020 |
出版者: | 京都大学数理解析研究所 |
誌名: | 数理解析研究所講究録 |
巻: | 2158 |
開始ページ: | 58 |
終了ページ: | 65 |
抄録: | 推移法則が未知のマルコフ決定過程において, 各期での行動によって生じる推移状態の観測によって推移法則を推定しながら適応型最適政策を求める学習問題がある. その推移法則の推定と最適化問題を構成するとき, 事前区間測度を用いた推定による事後区間測度から区間確率行列が得られるそのことによって区間型マルコフ決定過程(controlled Markov set-chain)による解決アプローチを適用することができる. 本報告では, a-percentileに基づいて区間推移法則を推定するMDPの構成法と最適化問題を考察する. |
URI: | http://hdl.handle.net/2433/261325 |
出現コレクション: | 2158 不確実・不確定性の下における数理的意思決定の理論と応用 |

このリポジトリに保管されているアイテムはすべて著作権により保護されています。