Skip to content Skip to footer

VOICEVOX冥鳴ひまりが喋るドキュメンタリー

「語り 冥鳴ひまり」のきっかけ

先日投稿した「TAMRON 11-20mm F2.8 レビュー」の動画では、普段のゆっくりボイスに加えて、VOICEVOXの冥鳴ひまりさんの音声を採用しました。今日はこの試みについてお話ししたいと思います。

写真旅の舞台は東京都の御岳山。梅雨どきのしっとりした森の中、ぐねぐねとした参道を歩いて写真を撮りました。かつて映像学区で訪れた紅葉の高尾山とはちがい、この日は登山客も少なく幻想的な景色が楽しめました。にぎやかな山もしっとりした山も味があっていいものです。

芳醇な御岳山の雰囲気をお伝えするために、この動画ではクラシックなBGMを選んでいます。制作中、ピアノと弦楽器で構成された静かな音源に、ゆっくりボイスでナレーションを加えたのですが、いまいち空気感にまとまりがなく悩んでいました。

そんなある時、NHKのドキュメンタリーを観ていて「語り」の存在に気づきました。しばしばドキュメンタリー作品では、通常のナレーションとは別で、著名な演者を採用した「語り」が挿しこまれます。たとえば『新日本風土記』という番組では、大部分のナレーションをアナウンサーが担当しますが、番組中盤の数十秒だけ*1、松たか子さんがカッコいい決めゼリフを入れる箇所があります。「語り」によってチャプターの切れ目を視聴者が認識でき、一気に雰囲気が締まります。

私はこの「語り」をぜひ映像学区の写真旅でやってみたいと思いました。これが、より生声に近いVOICEVOXの冥鳴ひまりボイスに興味を持ったきっかけです。

VOICEVOX WEBサイト – https://voicevox.hiroshiba.jp/

VOICEVOXを用いた調声の感想

個人的に、VOICEVOXの調声はゆっくりボイスよりもはるかに難しいと感じています。ゆっくりボイスより声質がリアルであり、その分アラが出たときに目立ってしまうからです。とくにひまりちゃんボイスは、調声に本気を出せば心がぞわっとするほど良い声になるんだけど、単に言葉を打ち込んだだけでその品質を出すのはなかなか難しいです。

今回の動画ではYMM4ですべてのセリフを打ち込み、1フレーズごとに、イントネーションの細かな調整も行いました。不慣れでリアリティを追い込み切れない部分もあったのですが、個人的にはかなり満足しています。ただし、これらの作業はそこそこ大変なので、2~3分くらいの文章量が自分的には限度だと思っています。2~3分というとたしかに短い時間なのですが、これを「語り」部分として使えば、ぞわっとくる演技を一瞬挟むことができて魅力的です。

編集していて気づいたのは、ゆっくりボイスとひまりちゃんボイスを組み合わせるのはかなり難しいということです。両者を交互に喋らせるのも検討したのですが、音圧のせいかナレーションに統一感がなくなってしまうように感じます。

ライブラリがバラエティ豊富なのはVOICEVOXの魅力の1つです。今回使用したひまりちゃんボイスは、閑静なシーンやシリアスシーンに向いています*2。彼女のような、すこぶる落ちつきのある自動音声(キャピキャピしてない自動音声)はあまり見たことがなく、時代も変わったなぁと感動しています。


※1:年によって構成が変わるため現在では観られない可能性もある。※2:彼女の声は常体(ダ・デアル調)の原稿と相性がよいためこのようなシーンに馴染む。