Title: 検索語の説明文による音声内容検索を利用した音声検索語検出
Other Titles: Spoken Term Detection using Spoken Content Retrieval by Term Explanation Text
Authors: 南條, 浩輝  KAKEN_id  orcid (unconfirmed)
川口, 達也  KAKEN_name
Author's alias: Nanjo, Hiroaki
Kawaguchi, Tatsuya
Keywords: 話者検出
Issue Date: 2017
Publisher: 情報処理学会
Journal title: 情報処理学会研究報告: 音声言語情報処理(SLP)
Volume: 2017-SLP-115
Issue: 5
Start page: 1
End page: 6
Abstract: 音声中で検索語がそのまま現れる部分を特定する音声検索語検出 (Spoken Term Detection : STD) の研究を行う. 一般的に STD では, 検索語と検索対象の音声ドキュメントをそれぞれをシンボル列に変換し, 音声認識誤りを考慮しつつそれらの一致度に基づいて検出を行う. このため, 同音異義語や近い文字列などを誤検出する問題がある. 本論文では, 検索語候補が含まれる音声ドキュメントの話題を調べ, 検索語が出現しにくい話題である時は, その候補は当該検索語である可能性が低いと仮定して誤検出に対応する. 具体的には, 検索語が与えられたとき, その説明文と音声ドキュメントとの意味的な類似性を音声内容検索 (Spoken Content Retrieval : SCR) に基づいて求めて, 検出候補をリスコアリングする誤検出抑制手法を提案する. 種々の STD 検索タスクで評価したところ, 全てのタスクで検索精度の向上が得られ, 提案手法の有効性および汎用性を示した. また, 本手法は, 意味的な類似度情報を利用する誤検出抑制手法であり, 我々がこれまでに提案している文字列の一致度に基づく検出候補のリスコアリング手法と併用する効果もあることがわかった.
This paper addresses Spoken Term Detection (STD), which finds speeches including a specified query term. Typically, terms are detected based on string matching, which causes false detections for phonetically similar terms. In this paper, we propose a novel STD method which combines string matching and semantic matching. Specifically, we perform Spoken Content Retrieval (SCR) with a term descriptive text and combine string matching-based STD score and SCR score. As for STD from lecture corpus, we showed the effectiveness of the proposed method. We achieved a STD performance improvement for several STD tasks, which showed a validity and robustness of the proposed method.
Rights: ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。
The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) 2017 Information Processing Society of Japan.
