このアイテムのアクセス数: 1366
このアイテムのファイル:
ファイル | 記述 | サイズ | フォーマット | |
---|---|---|---|---|
ELCAS_J_5_23.pdf | 845.44 kB | Adobe PDF | 見る/開く |
タイトル: | <論文・報告>感情分析における機械学習手法の比較検討 |
著者: | 中井, 諒馬 ![]() |
発行日: | Apr-2020 |
出版者: | 京都大学高大接続・入試センター |
誌名: | ELCAS Journal |
巻: | 5 |
開始ページ: | 23 |
終了ページ: | 25 |
抄録: | 本研究ではKaggleの自然言語処理に関わるコンペティションの一つである『Toxic Comment Classification Challenge』において種々の機械学習アルゴリズムを比較することを目的とする. 本データセットは感情分析に関連するものであり, 感情分析とはテキストデータからテキストに含まれる感情を分析するタスクである. 本稿では機械学習を用いた感情分析の検討を行う. 具体的には, 感情分析をする際に1. 文章をベクトル化する, 2. ベクトル化したものを用いて分析を行うという二段階の方法を検討する. 1ではterm frequency-inverse documentfrequency(tf-idf)と呼ばれるBag of Words(BoW)に基づいた方法を用い, 2ではNaive Bayes Support Vector Machine(NBSVM)およびロジスティック回帰を用いた[1]. そして, これらの方法の組み合わせを比較検討した. またデータを別の言語に翻訳し元に戻すことで作られたデータの使用の有無でも比較した[2]. |
URI: | http://hdl.handle.net/2433/251397 |
出現コレクション: | Vol. 5 |

このリポジトリに保管されているアイテムはすべて著作権により保護されています。