ダウンロード数: 26

ファイル 記述 サイズフォーマット 
jnlp.29.807.pdf545.09 kBAdobe PDF見る/開く
タイトル: 弱教師あり学習によるイベントの意志性・主語有生性の分類の同時学習
その他のタイトル: Minimally-Supervised Joint Learning of Event Volitionality and Subject Animacy Classification
著者: 清丸, 寛一  KAKEN_name
黒橋, 禎夫  kyouindb  KAKEN_id
著者名の別形: Kiyomaru, Hirokazu
Kurohashi, Sadao
キーワード: イベント
Weakly-supervised Learning
発行日: 2022
出版者: 言語処理学会
誌名: 自然言語処理
巻: 29
号: 3
開始ページ: 807
終了ページ: 834
抄録: 意志性と主語有生性はイベントの基本的な属性であり,密接な関係にある.これらの認識は文脈を考慮したテキスト理解を必要とし,その学習には大量のラベル付きデータを要する.本論文では,人手でラベル付きデータを構築することなく,意志性と主語有生性を同時学習する手法を提案する.提案手法では生コーパス中のイベントにヒューリスティクスを用いてラベルを付与する.意志性のラベルは「わざと」や「うっかり」といった意志性を示す副詞を頼りに付与する.主語有生性のラベルは知識ベースに登録されている有生名詞・無生名詞を頼りに付与する.こうして集めたイベントから手がかり語を含まないイベントに汎化する分類器を構築する.本研究ではこの問題をバイアス削減ないしは教師なしドメイン適応の問題とみなして解く.日本語と英語の実験で,提案手法により,人手でラベル付きデータを構築することなく,意志性・主語有生性の高精度な分類器を構築できることを示した.
Volitionality and subject animacy are fundamental and closely related properties of an event. Their classification is challenging because it requires contextual text understanding and a huge amount of labeled data. This paper proposes a novel method that jointly learns volitionality and subject animacy at a low cost, heuristically labeling events in a raw corpus. Volitionality labels are assigned using a small lexicon of volitional and non-volitional adverbs such as “deliberately” and “accidentally”; subject animacy labels are assigned using a list of animate and inanimate nouns obtained from ontological knowledge. We then consider the problem of learning a classifier from the labeled data so that it can perform well on unlabeled events without the words used for labeling. We regard the problem as a bias reduction or unsupervised domain adaptation problem and apply the techniques. We conduct experiments with crowdsourced gold data in Japanese and English and show that our method effectively learns volitionality and subject animacy without manually labeled data.
著作権等: © 2022 一般社団法人 言語処理学会
Licensed under CC BY 4.0
URI: http://hdl.handle.net/2433/284723
DOI(出版社版): 10.5715/jnlp.29.807


Export to RefWorks


このアイテムは次のライセンスが設定されています: クリエイティブ・コモンズ・ライセンス Creative Commons