このアイテムのアクセス数: 204

このアイテムのファイル:
ファイル 記述 サイズフォーマット 
jnlp.28.1034.pdf454.48 kBAdobe PDF見る/開く
タイトル: 日本語話し言葉書き言葉変換による大学講義の日英翻訳の精度向上
その他のタイトル: Spoken-Written Japanese Conversion for Japanese-English University-Lecture Translation
著者: 中尾, 亮太  KAKEN_name
Chu, Chenhui  kyouindb  KAKEN_id  orcid https://orcid.org/0000-0001-9848-6384 (unconfirmed)
黒橋, 禎夫  kyouindb  KAKEN_id
著者名の別形: Nakao, Ryota
Kurohashi, Sadao
キーワード: 機械翻訳
話し言葉
書き言葉
講義翻訳
Machine Translation
Spoken Language
Written Language
Lecture Translation
発行日: Dec-2021
出版者: 言語処理学会
誌名: 自然言語処理
巻: 28
号: 4
開始ページ: 1034
終了ページ: 1052
抄録: 話し言葉の機械翻訳では,話し言葉に特有の現象が翻訳精度に悪影響を及ぼすことが知られている.本研究では大学講義翻訳システムにおける日英翻訳の前処理として,日本語の話し言葉から書き言葉への自動変換を行うことにより翻訳精度を向上させる.まず大学講義の書き起こしとそれを書き言葉に変換したもの,対応する英文の 3 つ組からなるコーパスを構築した.次にそれを用いて話し言葉書き言葉変換モデルと日英翻訳モデルを学習させた.その結果,話し言葉書き言葉変換が日英翻訳の精度を向上させることを示した.また,話し言葉に特有の現象の分類に基づき,どのような現象が翻訳精度にどの程度影響するのかを定量化した.
In machine translation of spoken language, it is known that phenomena specific to spoken language have a negative impact on translation accuracy. Therefore, in this study, as a preprocessing step for Japanese-English translation in our university lecture translation system, we improve the translation accuracy by automatically converting spoken-style Japanese texts to written-style. First, we create a corpus consisting of Japanese transcriptions of university lectures, their conversions into written language, and the corresponding English texts. Next, we train spoken-written conversion models and Japanese-English translation models using the corpus. As a result, we show that spoken-written Japanese conversion improves the accuracy of Japanese-English translation. In addition, we quantify which phenomena affect translation accuracy and to what extent.
著作権等: © 2021 一般社団法人 言語処理学会
Licensed under CC BY 4.0
URI: http://hdl.handle.net/2433/276891
DOI(出版社版): 10.5715/jnlp.28.1034
出現コレクション:学術雑誌掲載論文等

アイテムの詳細レコードを表示する

Export to RefWorks


出力フォーマット 


このアイテムは次のライセンスが設定されています: クリエイティブ・コモンズ・ライセンス Creative Commons