このアイテムのアクセス数: 129
このアイテムのファイル:
ファイル | 記述 | サイズ | フォーマット | |
---|---|---|---|---|
djohk00901.pdf | Dissertation_全文 | 2.94 MB | Adobe PDF | 見る/開く |
yjohk00901.pdf | Abstract_要旨 | 171.35 kB | Adobe PDF | 見る/開く |
タイトル: | Toward Scalable Reinforcement Learning via Massive Batching |
その他のタイトル: | 大規模バッチングによるスケーラブルな強化学習の実現に向けて |
著者: | Koyamada, Sotetsu |
著者名の別形: | 小山田, 創哲 |
キーワード: | Reinforcement Learning Multi-armed bandit Multi-agent Game AI AlphaZero |
発行日: | 25-Nov-2024 |
出版者: | Kyoto University |
学位授与大学: | 京都大学 |
学位の種類: | 新制・課程博士 |
取得分野: | 博士(情報学) |
報告番号: | 甲第25680号 |
学位記番号: | 情博第901号 |
metadata.dc.date.granted: | 2024-11-25 |
請求記号: | 新制||情||151(附属図書館) |
研究科・専攻: | 京都大学大学院情報学研究科システム科学専攻 |
論文調査委員: | (主査)教授 石井 信, 教授 下平 英寿, 教授 森本 淳 |
学位授与の要件: | 学位規則第4条第1項該当 |
著作権等: | In reference to IEEE copyrighted material which is used with permission in this thesis, the IEEE does not endorse any of Kyoto University’s products or services. Internal or personal use of this material is permitted. If interested in reprinting/republishing IEEE copyrighted material for advertising or promotional purposes or for creating new collective works for resale or redistribution, please go to http://www.ieee.org/publications_standards/publications/rights/rights_link.html to learn how to obtain a License from RightsLink. If applicable, University Microfilms and/or ProQuest Library, or the Archives of Canada may supply single copies of the dissertation. |
DOI: | 10.14989/doctor.k25680 |
URI: | http://hdl.handle.net/2433/293243 |
出現コレクション: | 140 博士(情報学) |

このリポジトリに保管されているアイテムはすべて著作権により保護されています。