Te-tsu君の錆びてるブロマガ

結月ゆかり...恐ろしい子...!

2021/02/04 08:30 投稿

コメント:2

  • タグ:
  • VOCALOID
  • CeVIO
  • CeVIO_AI
  • 結月ゆかり
  • 中島みゆき
合成音声界に光明をもたらすかもしれないCeVIO AI(大げさ)
最初に発売になった「結月ゆかり 麗」
(以下ゆかりさん)をお迎えしたので
何か1曲、というところで手持ちのMIDIファイルから
合いそうな曲をセレクトして歌ってもらいました


これ、僕は2016年にONEちゃんで出してるんだけど、
この子も低音部は優しい声になるので合うんだよなぁ。
あの時は確かGMのサウンドフォント使ってたけど、
今回は当時と違いDAWの音源が使えるのでオケも作り直した。

CeVIO AIを触れてみて「声」の印象を述べる。
今現在CeVIOユーザーの間で話題になっている
初期バージョン特有?の不具合についてはここでは触れない。
ゆかりさんの「声そのもの」は
VOCALOIDで聴き慣れたあの感じだけれども、
「息が流れる」雰囲気はより出てるかな。
一部で、なんでこんな変なところにビブラートが?とか
ちょっとこのピッチは不安定だよねとか、
AIの精度の問題は時々感じたな。
プロ用ならともかく一般消費者向けだしやむを得ない気もする。
ピッチだけならペンツールあたりで
簡単に修正がきくので良しとして、
例えばロングトーンの終わらせ方。
ゆかりさん、しかも「麗」なので
とにかく美しく息を残してフレーズを終わってくれる。
そういう場所にはめっちゃ合う。
が、例えば終わり方に切れ味を求めようとすると、
CeVIOの過去バージョンではTMGの末尾を
うまく弄ってそういう表現ができていたが
AIではそういうのはあんまり簡単ではなさそうで、
何か別の工夫が要りそうだ。
これについてはちょっと思いついたことがあるので
今度試してみる価値はあるかな。
バージョンアップによって
変わってくる可能性はあるが、こちらの要求よりは
AIの演算結果を優先されてる感がある。
(それが良くない、という意見ではない)
それをさらに強く感じたのが強弱記号の指定。
初期状態は”N”つまり大きくも小さくもないが
VOL曲線を見る限り、これを”f”にしようが”p”にしようが
過去バージョンより明らかに上下の幅が狭い。
これはもっと時間をかけてみて「音にどう変化を与えているか」
調べてみる必要はありそうだ。
あと、TMGをどういじっても
ブレスの位置が変わってくれないのは困った。
曲の雰囲気に合わせ、休符が短い時はスッとでいいけれど、
ゆったりと歌い始める時は余裕を持った息遣いで、
みたいな感じになってくれるとそれだけで
表現の幅が広がりそうなのにな。
そんなことをいちいち実現していたら
動作速度と値段がとんでもないことになるのかもだが、
擬似的にとは言え過去バージョンでは
それが今よりずっと簡単にできるので
いつか実現してほしい部分ではある。
ただやはりAIなので、
「なんでも言うこと聞いてくれると思うなよ」
「ゆかりさんの個性も大事にしてやれよ」
くらいに考えるのが正しいと思う。

しかしなんだかんだ言って
こちらがとんでもない歌い方を望まない限り
AIがちゃんと歌おうとしてくれるのはいいと思うな。
声を聴いて、あ、じゃあこういう曲をとか、
こういう歌い方やってみる?おおそうきたか、とか、
声と対話しながら歌ができていきそうな感じはある。

曲および背景について少し触れておきたい。
この曲はNHK「プロジェクトX」のEDテーマとして有名。
(知名度としてはOP「地上の星」のほうがもちろん高いんだけど)
これ、僕も時々観てて概ね良い番組ではあったけれど
途中にどんな紆余曲折があっても
行き着く先はサクセスストーリーだったし
視聴率が高かった頃は人事の人間が
「プロジェクトXみたいな活躍ができそうな人材がほしい」
という話をしてたとか何かで聞いたことがあるし、
(いやお前人材は育てるものだろう?)
今となってはのちに増殖する「ニッポンすごい」的な番組
ハシリになってしまったのかなあと。
番組も末期には「事実と違う」疑惑が出たし、
番組そのものの評価よりもその後の日本に与えた影響を考えると、
有名曲だが不遇の曲でもあると思う。

「ファイト!」の時にも書いたが、
「地上の星」ともどもサビでの繰り返しが多く、そのことで
「誰もが覚えて歌える要素のある」曲になっている。
この曲、中島みゆきのオリジナルはどちらかと言えば、
たゆとう時間の流れの中に身を置きつつ
自分自身を俯瞰的に見ているような視点で
一言一言丁寧に諭すような歌い方。
今回もいつものように制作にあたって、
原曲を聴き倒すようなことはせずわりあい自由に歌ってもらった。
(聴き倒さないだけでポイントは押さえているつもりである)
僕のいつものアプローチではあるが、曲が進むに従い
アドリブ要素が増えていくような形にしたのは
言葉をどう伝えたら良いか、みたいな実験的な気分もある。
原曲においても実は「旅はまだ終らない」の
「まだ」の後に休符があったりなかったりしている
(それはONE版の時にもやってもらってる)ので
この辺りをヒントにして色々な歌い方を試している。
それら全てがうまくいっているとは思わないが
同じことを伝えるにもその方法はみんな違ってていい、
いやもう毎回違っててもいい、というのをやりたかった。

何も考えずに原曲の通りにしておけば
ひょっとして今以上の再生数を稼げるのかもしれんが
僕がそれを「楽しい」と思えるかどうかは別問題。
どう言えばいいのかなぁ、例えば、
音楽に呼び止められるような感覚」とか、
聞き流されるのを全力で拒む意思」とか、かな。

コメント

只野夢芽(ただの無名な人)
No.1 (2021/02/04 13:35)
記事お疲れさまです。
機械が、人間の思った通りに動くのは、AIでは通用しないと感じています。
例えば、人間だって知らないことに対しては、どうすれば良いのかわからないのと同じで、AIも学習していないことはどうしたら良いのかわからないです。
現在のAIは、人間に例えると3歳くらいです。
教えたことは出来るけど、教えていないことに対しての応用は出来ません。
可愛い子どもと思って接するのが良いと思います。
Te-tsu (著者)
No.2 (2021/02/04 17:28)
>>1
コメどうもです
Neutrinoの時にもそういったことは感じているのだけれども、だからといって意見を述べてはいけないということはないので書いてます。
声と選曲のミスマッチはできれば避けたいのでユーザーとしても考えますし、多少無茶かなと思っても創意工夫で作品を作ることをやめるつもりはありません。
今後もキャラクターが増えていくと思いますが得手不得手はキャラ毎にあるでしょう。
キャラ毎ならまだいいのですが合成エンジンのせいで不可能になってしまっているものがあるとすればそれは改善されるべきポイントと考えています。
コメントを書き込むにはログインしてください。

いまブロマガで人気の記事