電気通信大学 情報・ネットワーク工学専攻/II類 電子情報学プログラム
高橋弘太研究室

話速バリエーション型音声データベースの概要と収録について

レコーディング風景 No.1
本研究室オリジナルの原稿提示システム(ReCoK5)
レコーディング風景 No.2
データベース構築のための専用マイク(中央)

音声データベース: SRV-DB

データベース公開中です! 以下のリンクより,2008年度および2009年度収録版へアクセスできます.

2010/06/23 声優パートを追加しました [New!]

各年度の収録について

2009年度

こちらのページで2009年度の収録をご案内しております. 2010年2月〜3月の収録を予定しております.

2008年度

こちらのページで2008年度の収録をご案内しております. 2008年7月と8月の2回に分けて,収録を行いました.

概要

データベースの特徴

話速を管理して、多数の異なる話速での発声音声を収録する。

データベースを作成する目的

高齢者に確実に音声を聞き取らせるにはどうしたらよいか、 また健常者においては、短い時間でより多くの音声を聞き取らせるには、 どうしたらよいか、などを研究する研究者のために作成する。 本データベースを用いることで、 多数のデータに基づいた客観的解析が可能となることを狙っている。 これによって、 話速変動が人間の音声聞き取りに及ぼす影響に対する研究をより行いやすいものにする。 この結果、多くの研究者がこの分野に参入し、 音声研究の中の重要な分野として成長することを目的とする。

背景

平成20年度〜平成22年度 文部科学省・科学研究費・基盤研究C 課題番号205011「フレキシブルな時間軸を持つ高効率音声再生法の研究と 研究者用音声データベースの研究」の研究の一部として本データベースを作成する。 本研究課題において、音声データベースを構築して、 外部の研究グループに利用してもらうという計画があり、 その一環として行っているものである。

原稿提示システム: ReCoK5

本プロジェクト用に開発された,原稿提示システム(Windowsパソコン上で動作する ソフトウエア)を,一般に公開することになりました. ソフトウエア名は,ReCoK5(REcording system for COntrolled speaking rate with Kind interface : ver.5,レコクファイブと呼んで下さい)となります. このシステムを使うことで, 話速の管理された原稿読み上げと録音を行うことができます. 読み上げの時間管理がうまくいっているかのリアルタイムでのチェック機能 がありますので,時間精度のよい音声録音を,効率よく進めることができます. その他,日本語テキストから,モーラ数を換算するソフトウエアなども 付録としてつける予定です.

研究用の音声データベースの構築に役立つだけでなく, アナウンサーやナレータ用の道具としても役立つものにしたいと思っています. 以下のページから,ReCoK5をダウンロードできます.

[音声データベース公開ページに戻る]

Copyright© 2008-2010 Takahashi Kota Laboratory. All Rights Reserved.