ダウンロード数: 29

このアイテムのファイル:
ファイル 記述 サイズフォーマット 
2126-09.pdf3.78 MBAdobe PDF見る/開く
タイトル: 区間型マルコフ決定過程の推移行列の推定について (不確実性の下での意思決定の数理とその周辺)
その他のタイトル: On a way of estimating the transition probabilities in controlled Markov set-chains (Mathematics of Decision Making under Uncertainty and Related Topics)
著者: 堀口, 正之  KAKEN_name
著者名の別形: HORIGUCHI, Masayuki
発行日: Aug-2019
出版者: 京都大学数理解析研究所
誌名: 数理解析研究所講究録
巻: 2126
開始ページ: 67
終了ページ: 76
抄録: 推移法則未知のマルコフ決定過程において, 状態観測に基づき推移法則を推定しながら適応型最適政策を求める学習問題がある。その推移法則の推定と最適化問題を構成するとき事前区間測度を用いた区間型マルコフ決定過程による解決アプローチの方法がある。本報告では, ディリクレ分布による区間型推定と推定に用いられるベータ関数比における方程式の解と不動点について考察する。
URI: http://hdl.handle.net/2433/252234
出現コレクション:2126 不確実性の下での意思決定の数理とその周辺

アイテムの詳細レコードを表示する

Export to RefWorks


出力フォーマット 


このリポジトリに保管されているアイテムはすべて著作権により保護されています。