ダウンロード数: 246

このアイテムのファイル:
ファイル 記述 サイズフォーマット 
djohk00838.pdfDissertation_全文12.87 MBAdobe PDF見る/開く
yjohk00838.pdfAbstract_要旨191.76 kBAdobe PDF見る/開く
完全メタデータレコード
DCフィールド言語
dc.contributor.authorZhang, Guoxien
dc.contributor.alternative张, 国熙ja
dc.contributor.transcriptionチョウ, コクキja-Kana
dc.date.accessioned2023-08-23T06:10:52Z-
dc.date.available2023-08-23T06:10:52Z-
dc.date.issued2023-07-24-
dc.identifier.urihttp://hdl.handle.net/2433/284789-
dc.language.isoeng-
dc.publisherKyoto Universityen
dc.publisher.alternative京都大学ja
dc.rights3章は1及び2に基づく。4章は3に基づく。5章は4及び5に基づく。1. G. Zhang and H. Kashima. Batch reinforcement learning from crowds. In Machine Learning and Knowledge Discovery in Databases, pages 38–51. Springer Cham, 2023. https://doi.org/10.1007/978-3-031-26412-2_3 2. G. Zhang, J. Li, and H. Kashima. Improving pairwise rank aggregation via querying for rank difference. In Proceedings of the Ninth IEEE International Conference on Data Science and Advanced Analytics, IEEE, 2022. https://doi.org/10.1109/DSAA54385.2022.10032454 3. G. Zhang and H. Kashima. Learning state importance for preference-based reinforcement learning. Machine Learning, 2023. https://doi.org/10.1007/s10994-022-06295-5 4. G. Zhang and H. Kashima. Behavior estimation from multi-source data for offline reinforcement learning. In Proceedings of the Thirty-Seventh AAAI Conference on Artificial Intelligence. AAAI Press, 2023. 5. G. Zhang, X. Yao, and X. Xiao. On modeling long-term user engagement from stochastic feedback. In Companion Proceedings of the ACM Web Conference 2023. Association for Computing Machinery, 2023. https://doi.org/10.1145/3543873.3587626ja
dc.subjectOffline Reinforcement Learningen
dc.subjectPreference-based Reinforcement Learningen
dc.subjectHuman-in-the-loop Reinforcement Learningen
dc.subject.ndc007-
dc.titleOffline Reinforcement Learning from Imperfect Human Guidanceen
dc.title.alternative不完全な人間の誘導からのオフライン強化学習ja
dc.typedoctoral thesis-
dc.type.niitypeThesis or Dissertation-
dc.textversionETD-
dc.description.degreegrantor京都大学ja
dc.description.degreelevel新制・課程博士-
dc.description.degreediscipline博士(情報学)ja
dc.description.degreereportnumber甲第24856号-
dc.description.degreenumber情博第838号-
dc.description.degreekucallnumber新制||情||140(附属図書館)-
dc.date.granted2023-07-24-
dc.description.degreeaffiliation京都大学大学院情報学研究科知能情報学専攻-
dc.description.degreeexamcommittee(主査)教授 鹿島, 久嗣, 教授 河原, 達也, 教授 森本, 淳-
dc.description.degreeprovision学位規則第4条第1項該当-
dc.identifier.selfDOI10.14989/doctor.k24856-
dcterms.accessRightsopen access-
dc.description.degreediscipline-enDoctor of Informaticsen
dc.identifier.degreegrantorID14301-
dc.description.degreegrantor-enKyoto Universityen
dc.description.degreeObjectTypeDFAM-
jpcoar.contributor.TypeSupervisor-
jpcoar.contributor.TypeSupervisor-
jpcoar.contributor.TypeSupervisor-
jpcoar.contributor.Name鹿島, 久嗣ja
jpcoar.contributor.Name河原, 達也ja
jpcoar.contributor.Name森本, 淳ja
出現コレクション:140 博士(情報学)

アイテムの簡略レコードを表示する

Export to RefWorks


出力フォーマット 


このリポジトリに保管されているアイテムはすべて著作権により保護されています。