電気通信大学 情報通信工学科 / 情報通信工学専攻
高橋弘太研究室

話速バリエーション型音声データベース 2009年度収録

概要

2009年度は、ドラマもしくはアニメ的な雰囲気を持った原稿を、 声優の方々に、多数の異なる話速で読んで頂く。 収録は2010年2月〜3月(2月27日〜3月5日あたりが有力だが声優の方にあわせる) に行う予定である。

重要リンク: 1.原稿   2.原稿提示システム  3.前年度収録分の公開ページ  4.音声データベースのトップ

収録の目的

背景

平成20年度〜平成22年度 文部科学省・科学研究費・基盤研究C 課題番号205011 「フレキシブルな時間軸を持つ高効率音声再生法の研究と研究者用音声データベースの研究」 の研究の一部として本データベースを作成する。 本研究課題において、音声データベースを構築して、 外部の研究グループに利用してもらうという計画があり、 その一環として行っているものである。

3年間の収録の目的

高齢者に確実に音声を聞き取らせるにはどうしたらよいか、 また健常者においては、短い時間でより多くの音声を聞き取らせるには、 どうしたらよいか、などを研究する研究者のために作成する。 本データベースを用いることで、 多数のデータに基づいた客観的解析が可能となることを狙っている。 これによって、 話速変動が人間の音声聞き取りに及ぼす影響に対する研究をより行いやすいものにする。 この結果、多くの研究者がこの分野に参入し、 音声研究の中の重要な分野として成長することを目的とする。

2009年度の収録の目的

音声データベースは本来研究用であるため、聞いて面白いかというと、 必ずしもそうではないものがほとんどだった。

大学にはいってくる学生の志望を聞くと、 音楽を対象とした研究を行いたい学生はかなりの割合いるのだが、 音声を対象とした研究をしたいという学生は、それほど多くない。 この原因として、音声研究は「地味」と見られていることがあげられるのではないだろうか。 そう見られてしまう要因のひとつとして、 研究対象とする音声自体にそれほど魅力を感じられないということがあるのではないかと考えられる。

一方で、放送やDVDなどコンテンツには、 研究者や一般の人が魅力を感じる音声が多数存在する。 しかし、それらのほとんどは、著作権の問題があり、 音声自体を配布したり、処理結果等を自由に公開することはできない。

そこで、本データベース作成の予算を使って、独自の魅力的な音声を収録し、 誰にでも使ってもらえるようにする。

このような音声は、音声データベースとして希有なものであるので、 独自性があり、価値が高いと考えられる。

それだけでなく、 最近よく言われている若者の理系ばなれの進む中、 テレビやゲームなどで馴れ親しみ、 憧れている声優さんの声が研究対象になることの楽しさを中学生や高校生などに知ってもらい、 ややもすれば、地味と見られる音声研究に注目してもらうことをも狙いたい。

以上の考えのもと、2009年度は、ドラマもしくはアニメ的な雰囲気を持った原稿を、 声優の方々に読んで頂くことを計画している。

準備

お願いする声優の方について

男性1名、女性1名を、お呼びすることを考えている。 どなたをおお呼びするかを検討するため、 3日間(合計8時間程度)にわたり、協力学生に用意してきてもらったサンプル音声の試聴会を行ない、 本データベース収録に最も適した方がどなたであるかを議論した。

原稿について

まず、劇のフリー台本を探したが、男1女1の台本はほとんど無い上、あっても長すぎた。 次に、インターネット上での投稿サイトをいろいろ調べたが、逆に短いものが多く、 長いものは、内容があまり一般的なものではなかった。

そこで、研究室オリジナルの原稿を作成することにした。 まず、内容的に無難な候補2つを作った。 この2つの中から1つを選び、そのひとつについて5日間のメイル中心のやりとりで 磨きをかけていった結果、 この 原稿 が完成した。

なお、オリジナル原稿であるので、改変は自由であるというメリットがある。 当日、声優の方々からの意見をうかがって、 声優の方が読みやすいように、 声優の方が自然と感じるように自由に変更して頂けたらと考えている。

機材について

マイクロホンは、 男性声優用に SONY C-38B を用い、 女性声優用に NEUMANN U87Ai を用いる予定。 プリアンプは、GRACE m101 で、AD変換器は、Lynx AURORA-16 とする。 その他、信号分離の研究用に、FOSTEX MC10ST を8本、マイクアレイにして遠方から収録する予定。 原稿は、 原稿提示システム で表示する。

騒音対策について

防音のスタジオでなく、研究室内で収録するため、外の騒音が問題となる。 現在、本学西地区でいくつかの工事が進んでいるため、大きな音の出る行程の日は はずさなければならない。施設課に安全な日がないか相談にいったところ、 むしろ、こちらの収録日にあわせて可能な配慮をしてくださるということであった。 収録日が決まったら、施設課に連絡する。

音声の収録と公開について
(声優の事務所の方への説明)

収録時間と場所

4時間程度の時間で、1日で録り終える予定です。 たとえば、14:00〜18:00 といった時間帯で行うことを想定しています。 あるいは、夜の時間帯も可能です。

収録は、電気通信大学の研究室内で行います。 電気通信大学は、都内にある理系の国立大学法人です。 調布駅(新宿から京王線で15分)から歩いて15分の場所にあります。 また、甲州街道沿いにあり、調布ICすぐそばでもありますので、 お車でいらっしゃる場合には、事前におっしゃって頂ければ構内に駐車場を用意できます。

収録手順

まず、原稿をごく標準的な話速で読んで頂き、それを収録します。 この部分は、普通のアニメとかラジオドラマの収録と同じと思います。 その収録をもとに、少し速く、割と速く、少し遅く、かなり遅く、といった風に しゃべる速さを変えて、収録させて頂きます。 (今回は,声優の方にお願いする収録であることを考え,昨年度ほど速い発話は 行わない予定です.そこそこの速さまでです). しゃべる速さの目安をつけるために、 カラオケの歌詞の上をマーカがなぞるように、原稿の上をマーカが動く仕組みの 当研究室独自の 原稿提示システム を使用します。話速が指定どおりにならなかった部分等が生じた場合は、 必要に応じて、リテイクを行います。

収録のペースや休憩等については、声優の方のおっしゃるようにさせて頂きます。 なお、時間に十分な余裕ができましたら、ATRの文章もしくは読売新聞の編集手帳などから、 一部の文章を読んで頂く予定でが、4時間を目安に、ドラマ原稿収録の一部が未了でも 今回収録ぶんは、終了といたします。

公開方法

音声ファイル(wav形式)と、原稿ファイル(テキストファイル)の両方を、 電気通信大学内に設置するWebサーバにより提供し、 音声関係の研究者が自由にダウンロードして、研究に役立てられるようにします。

参考のために、前年度収録分の公開ページをご覧下さい。 このように、話者の顔写真をサムネイルにして表示する形になっております。 これは、データベースを無機質的なものにしないという狙いのためです。 当日、マイクに向かっている風景を写真に撮らさせて頂きますが、 掲載前にご覧頂き、許可を頂きます。うまく撮れなかった場合は、ご指定のものと交換します。

現在の進捗状況

声優の方々の事務所にコンタクトをとり、協力して頂ける可能性があるかを問い合わせ中です。

Copyright© 2008-2011 Takahashi Kota Laboratory. All Rights Reserved.