ダウンロード数: 957

このアイテムのファイル:
ファイル 記述 サイズフォーマット 
IPSJ-JNL5902009.pdf1.41 MBAdobe PDF見る/開く
タイトル: 古典中国語(漢文)の形態素解析とその応用
その他のタイトル: Morphological Analysis of Classical Chinese Texts and Its Application
著者: 安岡, 孝一  kyouindb  KAKEN_id
ウィッテルン, クリスティアン  KAKEN_name
守岡, 知彦  KAKEN_id  orcid https://orcid.org/0000-0001-5315-3383 (unconfirmed)
池田, 巧  KAKEN_name
山崎, 直樹  KAKEN_name
二階堂, 善弘  KAKEN_name
鈴木, 慎吾  KAKEN_name
師, 茂樹  KAKEN_name
著者名の別形: Yasuoka, Koichi
Wittern, Christian
Morioka, Tomohiko
Ikeda, Takumi
Yamazaki, Naoki
Nikaido, Yoshihiro
Suzuki, Shingo
Moro, Shigeki
キーワード: 漢文コーパス
リンクトデータ
固有表現抽出
classical Chinese corpus
linked data
named entity extraction
発行日: 15-Feb-2018
出版者: 情報処理学会
誌名: 情報処理学会論文誌
巻: 59
号: 2
開始ページ: 323
終了ページ: 331
抄録: 古典中国語(漢文)の解析手法として, MeCabを用いた形態素解析手法を提案する. 本手法では, 漢文の動賓構造を表現すべく, 4階層の「品詞」からなる新たな品詞体系を構築し, それに基づくMeCab漢文コーパスを設計した. 合わせて, MeCab漢文コーパスを入力するための専用ツールとして, XEmacs CHISEをベースとしたコーパス入力ツールを開発した. また, MeCab漢文コーパスを効果的に管理し, さらには品詞体系のリファクタリングを行うべく, MeCab漢文コーパスのLinked Data化を行い, WWW上で公開した. さらに, MeCabを用いた漢文形態素解析の応用として, 漢文における固有表現の自動抽出に挑戦した. 結果として, 地名の自動抽出は高精度に行うことができたが, 官職・人名の自動抽出はそれぞれに課題が残った.
A method to analyze classical Chinese texts is proposed. In the method, we use our original morphological analyzer based on MeCab. We propose a new four-level word-class system to represent the predicate-object structure of classical Chinese. In order to make a corpus for classical Chinese on MeCab, we have constructed a MeCab-corpus editor based on XEmacs CHISE. In order to control the corpus effectively, and to refactor our four-level word-class system, we have converted it into Linked Data on WWW. As an applied study for our morpholgical analysis of classical Chinese texts, we have tried to extract named entities: names of places, job titles, and names of people. As a result we are able to extract names of places from classical Chinese texts almost perfectly. But we have found some difficulties to extract job titles or names of people.
著作権等: The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。
URI: http://hdl.handle.net/2433/229121
関連リンク: http://id.nii.ac.jp/1001/00185742/
出現コレクション:学術雑誌掲載論文等

アイテムの詳細レコードを表示する

Export to RefWorks


出力フォーマット 


このリポジトリに保管されているアイテムはすべて著作権により保護されています。