B級科学者もどきの憂鬱

とある理系になりきれない奴のつれづれなる活動記

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

それが出来てりゃ苦労してない

久しぶりにTIPSエンジンのソースを触りました。
今は主に、パラメータファイルの再作成部をいじってます。
一応今の仕組みでも、99%ぐらいは上手く検出できると思います。
けどそれでもやっぱり苦手な音源とかあるらしいので。

この辺は下手にいじると、今までちゃんと生成出来てた音まで
生成できなくなることがあるので、かなり慎重にやってます。

ちなみに、元々参考にしていた論文のやり方そのままだと、
ノイズの載り方が音源によってかなり違うせいか、
97%ぐらいの信頼性しか無かったので、
推定は独自方式(と言うと聞こえだけはいい)です。

一番のネックはピッチ推定です。
ここをもっと頑健なものにしたいと思っています。
が、音声処理ではかなり古くからあるテーマにもかかわらず、
未だに新しいアルゴリズムが開発されているような所なので、
かなり四苦八苦してます。

今現在のアルゴリズムで使っているいくつかの内部定数は、
色々な音源で試して一番上手く行った値なので、
理論的な裏付けは一切されてません。
この辺も何とかしたいなと思います。

一応、アイデアはいくつかあるのですが、
実装するための時間が中々取れないので、
未だもやもやしてます。

早く作りたーい。
スポンサーサイト

FC2Ad

まとめ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。