このアイテムのアクセス数: 85
このアイテムのファイル:
ファイル | 記述 | サイズ | フォーマット | |
---|---|---|---|---|
2158-08.pdf | 3.36 MB | Adobe PDF | 見る/開く |
完全メタデータレコード
DCフィールド | 値 | 言語 |
---|---|---|
dc.contributor.author | 堀口, 正之 | - |
dc.contributor.alternative | Horiguchi, Masayuki | - |
dc.contributor.transcription | ホリグチ, マサユキ | - |
dc.date.accessioned | 2021-02-09T04:46:12Z | - |
dc.date.available | 2021-02-09T04:46:12Z | - |
dc.date.issued | 2020-06 | - |
dc.identifier.issn | 1880-2818 | - |
dc.identifier.uri | http://hdl.handle.net/2433/261325 | - |
dc.description.abstract | 推移法則が未知のマルコフ決定過程において, 各期での行動によって生じる推移状態の観測によって推移法則を推定しながら適応型最適政策を求める学習問題がある. その推移法則の推定と最適化問題を構成するとき, 事前区間測度を用いた推定による事後区間測度から区間確率行列が得られるそのことによって区間型マルコフ決定過程(controlled Markov set-chain)による解決アプローチを適用することができる. 本報告では, a-percentileに基づいて区間推移法則を推定するMDPの構成法と最適化問題を考察する. | - |
dc.format.mimetype | application/pdf | - |
dc.language.iso | jpn | - |
dc.publisher | 京都大学数理解析研究所 | - |
dc.publisher.alternative | Research Institute for Mathematical Sciences, Kyoto University | - |
dc.subject.ndc | 410 | - |
dc.title | 推移法則未知の区間型マルコフ決定モデルにおける確信集合について (不確実・不確定性の下における数理的意思決定の理論と応用) | ja |
dc.title.alternative | On the credible set in controlled Markov set-chains with unknown transition probabilities (Theory and Its Application of Mathematical Decision Making under Uncertainty and Ambiguity) | - |
dc.type | departmental bulletin paper | - |
dc.type.niitype | Departmental Bulletin Paper | - |
dc.identifier.ncid | AN00061013 | - |
dc.identifier.jtitle | 数理解析研究所講究録 | ja |
dc.identifier.volume | 2158 | - |
dc.identifier.spage | 58 | - |
dc.identifier.epage | 65 | - |
dc.textversion | publisher | - |
dc.sortkey | 08 | - |
dc.address | 神奈川大学理学部 | - |
dc.address.alternative | Department of Mathematics, Faculty of Science, Kanagawa University | - |
dcterms.accessRights | open access | - |
dc.identifier.jtitle-alternative | RIMS Kokyuroku | en |
出現コレクション: | 2158 不確実・不確定性の下における数理的意思決定の理論と応用 |

このリポジトリに保管されているアイテムはすべて著作権により保護されています。