B級科学者もどきの憂鬱

とある理系になりきれない奴のつれづれなる活動記

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

とりあえず目指すこと

UTAU用歌声合成エンジン、TIPSのカテゴリタグを作りました。
単に「TIPS」だけだと単なる英単語の方の意味と誤解しそうなので、
一応「エンジン」も付けておきました。
まだこの名前が定まっていない頃の記事のカテゴリはそのままですw

TIPSの高音質モードはいずれ作る予定ですが、
実験と実装の手間がかなりかかるので、
多分次のリリースでは無理です。
その前に、まずはそれ以外の部分を改良しようかと思います。

今考えている事を書いてみます。

まず、パラメータ推定を別exeにしようと思います。
今、これのせいでかなりコードが面倒くさいことになっているので、
いっそのこと別にしてしまえばいいんじゃないかという。
それぞれに特化した設計に出来るので、若干の高速化も期待できます。

パラメータを格納したファイルが存在しない場合、TIPS.exeが
このプログラムを呼び出して作らせるという形式になります。

ただ、合成とは直接関係ないexeが
増えることを嫌う人もいるでしょうから、
それは今後の意見次第かなぁと思います。

もし作ることになった場合、
resampler用周波数表の作成も出来たほうがいいでしょうね。
もちろん今のピッチの推定精度ではダメダメなんですけど、
高音質モードの実装の時に改良はすると思いますし。

それから高速化のために、内部の演算を
出来る限り固定小数点演算に置き換えます。
実際にはC言語に固定小数点型は存在しないので、int型を代用します。
これだけでかなり高速になるはずです。

桁落ち・桁あふれが起こってしまわないかどうか、
かなり念入りに検討しないといけませんが。

それと、メモリ使用量の削減です。
必要最小限の音声データしか読み込まないようにします。
今の処理では、まず最初に全部読み込んで、
合成の際に切り捨てています。

それと、まだほとんど実装していないフラグ類も、
需要の高そうなものからいくつかやっていきます。
また、パラメータ格納ファイルの形式も若干変わると思います。
動作報告なども少しずつ上がってきたので、readmeもかなり書き換えます。

とまぁ何やかやと書きましたが、
一回のバージョンアップでこれだけ全部やるのは
ちょっときついので、数回に分けたいと思います。
その間に、また別の実装も増えるんじゃないかな。

次のリリースは、1月末ぐらいになりそうです。

コメント

コメントの投稿


管理者にだけ表示を許可する

トラックバック

トラックバック URL
http://scientistb.blog42.fc2.com/tb.php/87-673e3c52
この記事にトラックバックする(FC2ブログユーザー)

FC2Ad

まとめ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。