このアイテムのアクセス数: 306
このアイテムのファイル:
ファイル | 記述 | サイズ | フォーマット | |
---|---|---|---|---|
IPSJ-CH23131007.pdf | 931.77 kB | Adobe PDF | 見る/開く |
タイトル: | ローマ字・カタカナ・キリル文字併用アイヌ語RoBERTa・DeBERTaモデルの開発 |
著者: | 安岡, 孝一 ![]() ![]() |
発行日: | 11-Feb-2023 |
出版者: | 情報処理学会 |
誌名: | 情報処理学会研究報告 : 人文科学とコンピュータ(CH) |
巻: | 2023-CH-131 |
号: | 7 |
開始ページ: | 1 |
終了ページ: | 7 |
抄録: | 書写言語としてのアイヌ語は, ローマ字(ラテンアルファベット)・カタカナ・キリル文字など, 多彩な文字と記法によって記述されてきた. その一方, 抱合語としてのアイヌ語は, 日本語や欧米諸語とは全く異なる言語構造を持つことから, これらの言語向けのRoBERTa・DeBERTaモデルは, そのままではアイヌ語に適用できない. 本発表では, ローマ字・カタカナ・キリル文字で書かれたアイヌ語に対し, RoBERTa・DeBERTaモデルを開発する手法を示し, さらに形態素解析・係り受け解析への応用について考察する. |
著作権等: | ここに掲載した著作物の利用に関する注意: 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。 The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, ⓒ 2023 Information Processing Society of Japan. |
URI: | http://hdl.handle.net/2433/279486 |
関連リンク: | http://id.nii.ac.jp/1001/00224072/ |
出現コレクション: | 学術雑誌掲載論文等 |

このリポジトリに保管されているアイテムはすべて著作権により保護されています。