B級科学者もどきの憂鬱

とある理系になりきれない奴のつれづれなる活動記

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

利点を伸ばすか、欠点を潰すか……

忙しいですが、ブログだけは更新します。
自分で決めたことなので。
というか、もはや意地になってるかも。

UTAU用歌声合成エンジンTIPSの、
合成アルゴリズム部分の改良について色々考えています。
今までずっとやってきたのはパラメータ推定に関してで、
合成部分はあまり触ってこなかったんですよ。

多分、これ以上の音質の改善には、
どうやっても計算量の増加が避けられません。
合成が速いというのが、このエンジンの
唯一の利点と言っても過言ではないというのに……。

本当は、次のバージョンでは、
さらに高速化しようと思っていたんですがね。
今の段階でもかなり速いとは思ってますが、
個人的にはまだ満足のいく速度ではないんです。

ちなみに、速度の目標としては、VST化した時、
ほとんどリアルタイムで合成できるぐらいです。

現在の処理では、プログラム自体の読み込みを除いた
処理時間の合計が、一秒の音声につき数十msecかかってるので、
(私のPCでかかる時間なので、環境によってばらつきがあります)
これを何とか10msecぐらいにまでしたいなと思っていました。

まぁ、高音質verと普通音質verをオプションで
切り替えられるようにするというのが、
一番無難な解決策ですかね。

高音質verで許される計算時間ってどのくらいだろう。
生成音声と同じくらいの長さはかけていいだろうか。
それぐらいなら何とかなるかもしれません。

コメント

コメントの投稿


管理者にだけ表示を許可する

トラックバック

トラックバック URL
http://scientistb.blog42.fc2.com/tb.php/86-6a9ff4fc
この記事にトラックバックする(FC2ブログユーザー)

FC2Ad

まとめ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。