このアイテムのアクセス数: 85

このアイテムのファイル:
ファイル 記述 サイズフォーマット 
2158-08.pdf3.36 MBAdobe PDF見る/開く
完全メタデータレコード
DCフィールド言語
dc.contributor.author堀口, 正之-
dc.contributor.alternativeHoriguchi, Masayuki-
dc.contributor.transcriptionホリグチ, マサユキ-
dc.date.accessioned2021-02-09T04:46:12Z-
dc.date.available2021-02-09T04:46:12Z-
dc.date.issued2020-06-
dc.identifier.issn1880-2818-
dc.identifier.urihttp://hdl.handle.net/2433/261325-
dc.description.abstract推移法則が未知のマルコフ決定過程において, 各期での行動によって生じる推移状態の観測によって推移法則を推定しながら適応型最適政策を求める学習問題がある. その推移法則の推定と最適化問題を構成するとき, 事前区間測度を用いた推定による事後区間測度から区間確率行列が得られるそのことによって区間型マルコフ決定過程(controlled Markov set-chain)による解決アプローチを適用することができる. 本報告では, a-percentileに基づいて区間推移法則を推定するMDPの構成法と最適化問題を考察する.-
dc.format.mimetypeapplication/pdf-
dc.language.isojpn-
dc.publisher京都大学数理解析研究所-
dc.publisher.alternativeResearch Institute for Mathematical Sciences, Kyoto University-
dc.subject.ndc410-
dc.title推移法則未知の区間型マルコフ決定モデルにおける確信集合について (不確実・不確定性の下における数理的意思決定の理論と応用)ja
dc.title.alternativeOn the credible set in controlled Markov set-chains with unknown transition probabilities (Theory and Its Application of Mathematical Decision Making under Uncertainty and Ambiguity)-
dc.typedepartmental bulletin paper-
dc.type.niitypeDepartmental Bulletin Paper-
dc.identifier.ncidAN00061013-
dc.identifier.jtitle数理解析研究所講究録ja
dc.identifier.volume2158-
dc.identifier.spage58-
dc.identifier.epage65-
dc.textversionpublisher-
dc.sortkey08-
dc.address神奈川大学理学部-
dc.address.alternativeDepartment of Mathematics, Faculty of Science, Kanagawa University-
dcterms.accessRightsopen access-
dc.identifier.jtitle-alternativeRIMS Kokyurokuen
出現コレクション:2158 不確実・不確定性の下における数理的意思決定の理論と応用

アイテムの簡略レコードを表示する

Export to RefWorks


出力フォーマット 


このリポジトリに保管されているアイテムはすべて著作権により保護されています。