推移法則未知の区間型マルコフ決定モデルにおける確信集合について (不確実・不確定性の下における数理的意思決定の理論と応用)

堀口, 正之

このアイテムのアクセス数: 85

http://hdl.handle.net/2433/261325

このアイテムのファイル:

ファイル	記述	サイズ	フォーマット
2158-08.pdf		3.36 MB	Adobe PDF	見る/開く

完全メタデータレコード

DCフィールド	値	言語
dc.contributor.author	堀口, 正之	-
dc.contributor.alternative	Horiguchi, Masayuki	-
dc.contributor.transcription	ホリグチ, マサユキ	-
dc.date.accessioned	2021-02-09T04:46:12Z	-
dc.date.available	2021-02-09T04:46:12Z	-
dc.date.issued	2020-06	-
dc.identifier.issn	1880-2818	-
dc.identifier.uri	http://hdl.handle.net/2433/261325	-
dc.description.abstract	推移法則が未知のマルコフ決定過程において, 各期での行動によって生じる推移状態の観測によって推移法則を推定しながら適応型最適政策を求める学習問題がある. その推移法則の推定と最適化問題を構成するとき, 事前区間測度を用いた推定による事後区間測度から区間確率行列が得られるそのことによって区間型マルコフ決定過程(controlled Markov set-chain)による解決アプローチを適用することができる. 本報告では, a-percentileに基づいて区間推移法則を推定するMDPの構成法と最適化問題を考察する.	-
dc.format.mimetype	application/pdf	-
dc.language.iso	jpn	-
dc.publisher	京都大学数理解析研究所	-
dc.publisher.alternative	Research Institute for Mathematical Sciences, Kyoto University	-
dc.subject.ndc	410	-
dc.title	推移法則未知の区間型マルコフ決定モデルにおける確信集合について (不確実・不確定性の下における数理的意思決定の理論と応用)	ja
dc.title.alternative	On the credible set in controlled Markov set-chains with unknown transition probabilities (Theory and Its Application of Mathematical Decision Making under Uncertainty and Ambiguity)	-
dc.type	departmental bulletin paper	-
dc.type.niitype	Departmental Bulletin Paper	-
dc.identifier.ncid	AN00061013	-
dc.identifier.jtitle	数理解析研究所講究録	ja
dc.identifier.volume	2158	-
dc.identifier.spage	58	-
dc.identifier.epage	65	-
dc.textversion	publisher	-
dc.sortkey	08	-
dc.address	神奈川大学理学部	-
dc.address.alternative	Department of Mathematics, Faculty of Science, Kanagawa University	-
dcterms.accessRights	open access	-
dc.identifier.jtitle-alternative	RIMS Kokyuroku	en
出現コレクション:	2158 不確実・不確定性の下における数理的意思決定の理論と応用

アイテムの簡略レコードを表示する

Export to RefWorks

このリポジトリに保管されているアイテムはすべて著作権により保護されています。