ダウンロード数: 81
このアイテムのファイル:
ファイル | 記述 | サイズ | フォーマット | |
---|---|---|---|---|
iscie.29.122.pdf | 2.88 MB | Adobe PDF | 見る/開く |
完全メタデータレコード
DCフィールド | 値 | 言語 |
---|---|---|
dc.contributor.author | 泉田, 啓 | ja |
dc.contributor.author | 菱沼, 徹 | ja |
dc.contributor.author | 谷, 百合夏 | ja |
dc.contributor.alternative | Senda, Kei | en |
dc.contributor.alternative | Hishinuma, Toru | en |
dc.contributor.alternative | Tani, Yurika | en |
dc.date.accessioned | 2017-09-13T02:11:35Z | - |
dc.date.available | 2017-09-13T02:11:35Z | - |
dc.date.issued | 2016-03 | - |
dc.identifier.issn | 1342-5668 | - |
dc.identifier.uri | http://hdl.handle.net/2433/227087 | - |
dc.description.abstract | In a general reinforcement learning problem, a plant, i.e. state transition probabilities, is estimated, and a learning policy for the estimated plant is applied to a real plant. If there is a difference between the estimated plant and the real plant, the obtained policy may not work well for the real plant. In this study, the real plant variation is parameterized by an interpolation of several estimated plants. This study proposes a reinforcement learning method based on estimation of parameter variation, and applies this method to 2-dimensional Peg-in-Hole Task. The effectiveness of the proposed method is demonstrated by numerical and experimental results. | en |
dc.format.mimetype | application/pdf | - |
dc.language.iso | jpn | - |
dc.publisher | システム制御情報学会 | ja |
dc.publisher.alternative | Institute of Systems, Control and Information Engineers | en |
dc.rights | © 2016 システム制御情報学会 | ja |
dc.rights | 発行元の許可を得て登録しています. | ja |
dc.subject | reinforcement learning | en |
dc.subject | plant variation | en |
dc.title | プラント変動の推定に基づく近似ベイジアン強化学習とペグ・イン・ホール・タスクへの適用 | ja |
dc.title.alternative | Approximation Bayesian Reinforcement Learning based on Estimation of Plant Variation and its Application to Peg-in-Hole Task | en |
dc.type | journal article | - |
dc.type.niitype | Journal Article | - |
dc.identifier.ncid | AN1013280X | - |
dc.identifier.jtitle | システム制御情報学会論文誌 | - |
dc.identifier.volume | 29 | - |
dc.identifier.issue | 3 | - |
dc.identifier.spage | 122 | - |
dc.identifier.epage | 129 | - |
dc.relation.doi | 10.5687/iscie.29.122 | - |
dc.textversion | publisher | - |
dc.address | 京都大学大学院工学研究科 | ja |
dc.address | 京都大学大学院工学研究科 | ja |
dc.address | 京都大学大学院工学研究科 | ja |
dc.address.alternative | Graduate School of Engineering, Kyoto University | en |
dc.address.alternative | Graduate School of Engineering, Kyoto University | en |
dc.address.alternative | Graduate School of Engineering, Kyoto University | en |
dc.relation.NAID | 130005157767 | - |
dcterms.accessRights | open access | - |
出現コレクション: | 学術雑誌掲載論文等 |
このリポジトリに保管されているアイテムはすべて著作権により保護されています。