日本語話し言葉書き言葉変換による大学講義の日英翻訳の精度向上

中尾, 亮太; Chu, Chenhui; 黒橋, 禎夫

このアイテムのアクセス数: 207

http://hdl.handle.net/2433/276891

このアイテムのファイル:

ファイル	記述	サイズ	フォーマット
jnlp.28.1034.pdf		454.48 kB	Adobe PDF	見る/開く

完全メタデータレコード

DCフィールド	値	言語
dc.contributor.author	中尾, 亮太	ja
dc.contributor.author	Chu, Chenhui	en
dc.contributor.author	黒橋, 禎夫	ja
dc.contributor.alternative	Nakao, Ryota	en
dc.contributor.alternative	Kurohashi, Sadao	en
dc.date.accessioned	2022-10-25T09:46:47Z	-
dc.date.available	2022-10-25T09:46:47Z	-
dc.date.issued	2021-12	-
dc.identifier.uri	http://hdl.handle.net/2433/276891	-
dc.description.abstract	話し言葉の機械翻訳では，話し言葉に特有の現象が翻訳精度に悪影響を及ぼすことが知られている．本研究では大学講義翻訳システムにおける日英翻訳の前処理として，日本語の話し言葉から書き言葉への自動変換を行うことにより翻訳精度を向上させる．まず大学講義の書き起こしとそれを書き言葉に変換したもの，対応する英文の 3 つ組からなるコーパスを構築した．次にそれを用いて話し言葉書き言葉変換モデルと日英翻訳モデルを学習させた．その結果，話し言葉書き言葉変換が日英翻訳の精度を向上させることを示した．また，話し言葉に特有の現象の分類に基づき，どのような現象が翻訳精度にどの程度影響するのかを定量化した．	ja
dc.description.abstract	In machine translation of spoken language, it is known that phenomena specific to spoken language have a negative impact on translation accuracy. Therefore, in this study, as a preprocessing step for Japanese-English translation in our university lecture translation system, we improve the translation accuracy by automatically converting spoken-style Japanese texts to written-style. First, we create a corpus consisting of Japanese transcriptions of university lectures, their conversions into written language, and the corresponding English texts. Next, we train spoken-written conversion models and Japanese-English translation models using the corpus. As a result, we show that spoken-written Japanese conversion improves the accuracy of Japanese-English translation. In addition, we quantify which phenomena affect translation accuracy and to what extent.	en
dc.language.iso	jpn	-
dc.publisher	言語処理学会	ja
dc.publisher.alternative	Association for Natural Language Processing	en
dc.rights	© 2021 一般社団法人　言語処理学会	ja
dc.rights	Licensed under CC BY 4.0	en
dc.rights.uri	https://creativecommons.org/licenses/by/4.0/	-
dc.subject	機械翻訳	ja
dc.subject	話し言葉	ja
dc.subject	書き言葉	ja
dc.subject	講義翻訳	ja
dc.subject	Machine Translation	en
dc.subject	Spoken Language	en
dc.subject	Written Language	en
dc.subject	Lecture Translation	en
dc.title	日本語話し言葉書き言葉変換による大学講義の日英翻訳の精度向上	ja
dc.title.alternative	Spoken-Written Japanese Conversion for Japanese-English University-Lecture Translation	en
dc.type	journal article	-
dc.type.niitype	Journal Article	-
dc.identifier.jtitle	自然言語処理	ja
dc.identifier.volume	28	-
dc.identifier.issue	4	-
dc.identifier.spage	1034	-
dc.identifier.epage	1052	-
dc.relation.doi	10.5715/jnlp.28.1034	-
dc.textversion	publisher	-
dcterms.accessRights	open access	-
datacite.awardNumber	19K20343	-
datacite.awardNumber.uri	https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-19K20343/	-
dc.identifier.pissn	1340-7619	-
dc.identifier.eissn	2185-8314	-
dc.identifier.jtitle-alternative	Journal of Natural Language Processing	en
jpcoar.funderName	日本学術振興会	ja
jpcoar.awardTitle	マルチモーダルデータからの対訳資源の抽出によるニューラル機械翻訳	ja
出現コレクション:	学術雑誌掲載論文等

アイテムの簡略レコードを表示する

Export to RefWorks

このアイテムは次のライセンスが設定されています: クリエイティブ・コモンズ・ライセンス