ダウンロード数: 20

このアイテムのファイル:
ファイル 記述 サイズフォーマット 
jnlp.26.231.pdf669.46 kBAdobe PDF見る/開く
タイトル: ニューラルネットワークを利用した中国語の統合的な構文解析
その他のタイトル: Neural Network-based Chinese Joint Syntactic Analysis
著者: 栗田, 修平  KAKEN_name
河原, 大輔  KAKEN_id
黒橋, 禎夫  kyouindb  KAKEN_id
著者名の別形: Kurita, Shuhei
Kawahara, Daisuke
Kurohashi, Sadao
キーワード: 構文解析
係り受け解析
遷移に基づく解析
深層学習
単語の分散表現
Syntactic Analysis
Dependency Parsing
Transition-based Parsing
Deep Learning
Word Embeddings
発行日: 15-Mar-2019
出版者: 言語処理学会
誌名: 自然言語処理
巻: 26
号: 1
開始ページ: 231
終了ページ: 258
抄録: ニューラルネットワークに基づく係り受け解析モデルは,近年の深層学習を利用した言語処理研究の中でも大きな潮流となっている.しかしながら,こうした係り受け解析モデルを中国語などの言語に適用した際には,パイプラインモデルとして同時に用いられる単語分割や品詞タグ付けモデルの無視できない誤りによって性能が伸び悩む問題が存在する.これに対しては,単語分割・品詞タグ付けと係り受け解析の統合モデルを利用し,単語分割と構文木作成とを同時に行うことでその双方の改善が期待される.加えて,中国語においては個々の文字が固有の意味を持ち,構文解析では,文字やその組み合わせである文字列もしくは部分単語の情報が単語単位の情報と並んで本質的な役割を果たすことが期待される.本研究では,ニューラルネットワークに基づいて,単語分割と品詞タグ付け,もしくは単語分割と品詞タグ付け,係り受け解析の統合構文解析を行うモデルを提案する.また,同時に,文字列や部分単語の情報を捉えるために,文字や単語の分散表現に加えて,文字列の分散表現を利用する.
Recently, dependency parsers with neural networks have outperformed existing parsers. When these parsing models are applied to Chinese sentences, they are used in a pipeline model with word segmentation and POS tagging models. In such cases, parsing models do not work well because of word segmentation and POS tagging errors. This can be solved by joint models of word segmentation, POS tagging and dependency parsing. In addition to this, Chinese characters have their own meanings, so the meanings of characters, character strings and sub-words are as important as the meanings of words in dependency parsing. In this study, we propose a neural network-based joint word-segmentation, POS tagging and dependency parsing model in addition to a joint word-segmentation and POS tagging model. We exploit not only word and character embeddings but also character string embeddings in all our models.
著作権等: © 2019 一般社団法人 言語処理学会
Licensed under CC BY 4.0
URI: http://hdl.handle.net/2433/276889
DOI(出版社版): 10.5715/jnlp.26.231
出現コレクション:学術雑誌掲載論文等

アイテムの詳細レコードを表示する

Export to RefWorks


出力フォーマット 


このアイテムは次のライセンスが設定されています: クリエイティブ・コモンズ・ライセンス Creative Commons