このアイテムのアクセス数: 204
このアイテムのファイル:
ファイル | 記述 | サイズ | フォーマット | |
---|---|---|---|---|
jnlp.28.1034.pdf | 454.48 kB | Adobe PDF | 見る/開く |
タイトル: | 日本語話し言葉書き言葉変換による大学講義の日英翻訳の精度向上 |
その他のタイトル: | Spoken-Written Japanese Conversion for Japanese-English University-Lecture Translation |
著者: | 中尾, 亮太 ![]() Chu, Chenhui ![]() ![]() ![]() 黒橋, 禎夫 ![]() ![]() |
著者名の別形: | Nakao, Ryota Kurohashi, Sadao |
キーワード: | 機械翻訳 話し言葉 書き言葉 講義翻訳 Machine Translation Spoken Language Written Language Lecture Translation |
発行日: | Dec-2021 |
出版者: | 言語処理学会 |
誌名: | 自然言語処理 |
巻: | 28 |
号: | 4 |
開始ページ: | 1034 |
終了ページ: | 1052 |
抄録: | 話し言葉の機械翻訳では,話し言葉に特有の現象が翻訳精度に悪影響を及ぼすことが知られている.本研究では大学講義翻訳システムにおける日英翻訳の前処理として,日本語の話し言葉から書き言葉への自動変換を行うことにより翻訳精度を向上させる.まず大学講義の書き起こしとそれを書き言葉に変換したもの,対応する英文の 3 つ組からなるコーパスを構築した.次にそれを用いて話し言葉書き言葉変換モデルと日英翻訳モデルを学習させた.その結果,話し言葉書き言葉変換が日英翻訳の精度を向上させることを示した.また,話し言葉に特有の現象の分類に基づき,どのような現象が翻訳精度にどの程度影響するのかを定量化した. In machine translation of spoken language, it is known that phenomena specific to spoken language have a negative impact on translation accuracy. Therefore, in this study, as a preprocessing step for Japanese-English translation in our university lecture translation system, we improve the translation accuracy by automatically converting spoken-style Japanese texts to written-style. First, we create a corpus consisting of Japanese transcriptions of university lectures, their conversions into written language, and the corresponding English texts. Next, we train spoken-written conversion models and Japanese-English translation models using the corpus. As a result, we show that spoken-written Japanese conversion improves the accuracy of Japanese-English translation. In addition, we quantify which phenomena affect translation accuracy and to what extent. |
著作権等: | © 2021 一般社団法人 言語処理学会 Licensed under CC BY 4.0 |
URI: | http://hdl.handle.net/2433/276891 |
DOI(出版社版): | 10.5715/jnlp.28.1034 |
出現コレクション: | 学術雑誌掲載論文等 |

このアイテムは次のライセンスが設定されています: クリエイティブ・コモンズ・ライセンス