ニコニコチャンネルメニュー

ブロマガ - ニコニコチャンネル

スズモフLog

歌うボイスロイド研究会 第1回『再生時間の変化』

2016/04/04 07:35 投稿

  • タグ:
  • VOICEROID
  • 歌ボイロ研究会
そんなわけで唐突に始まりました歌うボイスロイド研究会

当シリーズではボイスロイドに歌ってもらう事を目的として調べた内容を気が向いた時に書き記していきます。もし間違っている部分があればご指摘頂けると助かります。

第1回のテーマは『再生時間の変化』です。

VOICEROIDには入力した文章の再生時間を計測する機能が搭載されています。
今回は一文字だけ入力した状態で再生時間がどのように変化するかを見ていきましょう。



※グラフ中の子音や母音の再生時間の計測については次回以降で解説する予定です。

話速を変更してみよう!

再生時間に一番大きな影響を及ぼすパラメータは話速です。

話速はフレーズ編集タブから0.50~2.00の間で調整可能なので早速数値を変えながら再生時間をひたすら計測します。ちなみに音声効果側の設定も調整すれば最大4.00まで話速を上げる事も可能です。

次の図は話速を変更しながら "あ" の再生時間を計測したときのグラフです。



予測値は話速1.00のときの再生時間に話速を割って算出しています。

このグラフから再生時間は話速にほぼ反比例している事が確認できます。でも線があまり滑らかじゃないですね。これでは分かりづらいのでもう少し細部を拡大してみましょう。



話速0.90~1.10のデータを見ると再生時間の変化が階段状になっています。どうやら話速が変わっても必ずしも再生時間も変わる訳では無いようです。

続いて "ゆ" "か" "り" の再生時間も調べてみましょう。



"ゆ" の再生時間は "あ" と同じく多少ガタガタするものの普通のグラフになっています。





"か" の再生時間では話速を0.94から0.95に上げたときに本来は再生時間が短くなるはずが、0.186秒から0.188秒になるという現象が起きています。





"り" の再生時間では話速0.65以下のときに再生時間に急激な変化が起こっています。


高さを変更してみよう!

音の長さには関係無さそうですが、高さを変えたときの再生時間も調べてみましょう。







予想に反して高さも再生時間に影響を与えているようです。特に "か" の音については再生時間が20ミリ秒ほど跳ね上がる部分があります。リズム調整において20ミリ秒は無視する事の出来ない差なので、話速程じゃ無いにしても注意しておく必要がありそうです。


抑揚を変更してみよう!

続いては抑揚を変化させた場合の再生時間を調べてみます。







ほとんど誤差レベルですが抑揚も再生時間に影響を及ぼすみたいです。


アクセントや発声方法を変えてみよう!

高低アクセントの調整や無声化を行った場合の再生時間も調べてみます。
標準語のボイスロイドでは一音のみのフレーズでアクセント位置を変える事ができないので、ここでは関西弁の茜ちゃんで確認します。







ここでもやはり再生時間が変化しています。

音量を変更してみよう!

ここまでの調査で一見関係無さそうなパラメータでも再生時間に影響を及ぼす事が分かりました。それでは最後に音量を変化させた場合の再生時間を調べてみます。



全く変わっていません。
どうやら音量は再生時間に一切影響を与えない調整パラメータのようです。

今回のまとめ

今回の調査で分かったことは以下の通りになります。

・再生時間は話速におおよそ反比例する。でも滑らかな曲線にはならない。
・高さや抑揚、高低アクセントや無声化によって再生時間は複雑に変化する
・音量は再生時間とは無関係

再生時間の変化はかなり不規則です。

音ごとの特徴と話速設定からある程度の数値は計算で求められそうですが、実際のリズム調整では地道に時間の計測と調整を繰り返していくしか無さそうです。

もし次回があればより詳細な再生時間の計測方法について書いていきます。
ではではー。


コメント

コメントはまだありません
コメントを書き込むにはログインしてください。

いまブロマガで人気の記事