このアイテムのアクセス数: 197
このアイテムのファイル:
ファイル | 記述 | サイズ | フォーマット | |
---|---|---|---|---|
jnlp.28.1034.pdf | 454.48 kB | Adobe PDF | 見る/開く |
完全メタデータレコード
DCフィールド | 値 | 言語 |
---|---|---|
dc.contributor.author | 中尾, 亮太 | ja |
dc.contributor.author | Chu, Chenhui | en |
dc.contributor.author | 黒橋, 禎夫 | ja |
dc.contributor.alternative | Nakao, Ryota | en |
dc.contributor.alternative | Kurohashi, Sadao | en |
dc.date.accessioned | 2022-10-25T09:46:47Z | - |
dc.date.available | 2022-10-25T09:46:47Z | - |
dc.date.issued | 2021-12 | - |
dc.identifier.uri | http://hdl.handle.net/2433/276891 | - |
dc.description.abstract | 話し言葉の機械翻訳では,話し言葉に特有の現象が翻訳精度に悪影響を及ぼすことが知られている.本研究では大学講義翻訳システムにおける日英翻訳の前処理として,日本語の話し言葉から書き言葉への自動変換を行うことにより翻訳精度を向上させる.まず大学講義の書き起こしとそれを書き言葉に変換したもの,対応する英文の 3 つ組からなるコーパスを構築した.次にそれを用いて話し言葉書き言葉変換モデルと日英翻訳モデルを学習させた.その結果,話し言葉書き言葉変換が日英翻訳の精度を向上させることを示した.また,話し言葉に特有の現象の分類に基づき,どのような現象が翻訳精度にどの程度影響するのかを定量化した. | ja |
dc.description.abstract | In machine translation of spoken language, it is known that phenomena specific to spoken language have a negative impact on translation accuracy. Therefore, in this study, as a preprocessing step for Japanese-English translation in our university lecture translation system, we improve the translation accuracy by automatically converting spoken-style Japanese texts to written-style. First, we create a corpus consisting of Japanese transcriptions of university lectures, their conversions into written language, and the corresponding English texts. Next, we train spoken-written conversion models and Japanese-English translation models using the corpus. As a result, we show that spoken-written Japanese conversion improves the accuracy of Japanese-English translation. In addition, we quantify which phenomena affect translation accuracy and to what extent. | en |
dc.language.iso | jpn | - |
dc.publisher | 言語処理学会 | ja |
dc.publisher.alternative | Association for Natural Language Processing | en |
dc.rights | © 2021 一般社団法人 言語処理学会 | ja |
dc.rights | Licensed under CC BY 4.0 | en |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | - |
dc.subject | 機械翻訳 | ja |
dc.subject | 話し言葉 | ja |
dc.subject | 書き言葉 | ja |
dc.subject | 講義翻訳 | ja |
dc.subject | Machine Translation | en |
dc.subject | Spoken Language | en |
dc.subject | Written Language | en |
dc.subject | Lecture Translation | en |
dc.title | 日本語話し言葉書き言葉変換による大学講義の日英翻訳の精度向上 | ja |
dc.title.alternative | Spoken-Written Japanese Conversion for Japanese-English University-Lecture Translation | en |
dc.type | journal article | - |
dc.type.niitype | Journal Article | - |
dc.identifier.jtitle | 自然言語処理 | ja |
dc.identifier.volume | 28 | - |
dc.identifier.issue | 4 | - |
dc.identifier.spage | 1034 | - |
dc.identifier.epage | 1052 | - |
dc.relation.doi | 10.5715/jnlp.28.1034 | - |
dc.textversion | publisher | - |
dcterms.accessRights | open access | - |
datacite.awardNumber | 19K20343 | - |
datacite.awardNumber.uri | https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-19K20343/ | - |
dc.identifier.pissn | 1340-7619 | - |
dc.identifier.eissn | 2185-8314 | - |
dc.identifier.jtitle-alternative | Journal of Natural Language Processing | en |
jpcoar.funderName | 日本学術振興会 | ja |
jpcoar.awardTitle | マルチモーダルデータからの対訳資源の抽出によるニューラル機械翻訳 | ja |
出現コレクション: | 学術雑誌掲載論文等 |

このアイテムは次のライセンスが設定されています: クリエイティブ・コモンズ・ライセンス