B級科学者もどきの憂鬱

とある理系になりきれない奴のつれづれなる活動記

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

こだわり

音声処理。

前々から、パラメータ検出に
色々悩んでることを書いてきました。

そういえば、UTAU作者様のブログの
だいぶ前の記事で、ピッチ検出方法に関して
書いてたのがあったなー、
と先ほど思いだして、検索かけてみました。

この記事です

かなり参考になります。
ただ、そのまま使ったりはしません。

高調波に着目する方法など、
前に実装を考えていたものはいくつかありましたが、
それらは、とりあえず音高検出を簡単に実装してみて、
どうしても上手く抽出出来なければ
やってみようと思っていました。

でも今の実装でも、九割九分くらいは
ちゃんと検出できてるんですよ。
ただ、精度はUTAU公式エンジンと段違いなので、
比較すると僅かに音痴に聞こえますが……。

まだ色んな方法を試しきったとも言えないですし、
あの記事の方法をそのまま実装したら、
高速性というこのプログラムの売りが
かなり弱くなってしまいそうなので、
最後の手段にとっておきます。

もしくは、音声合成部分とパラメータ抽出部分とに
プログラムを分けて、通常の合成時に出来る限り
オーバーヘッドを無くすというやり方を取ります。

今現在のプログラムでは、
パラメータの抽出を同時にやっても、
UTAU公式エンジン最速のresampler.dllの
普通の合成よりも速いです(デフォ子の場合)。

この水準を出来る限り維持したいものです。
もちろん、散々やって出来なければ諦めますが、
少なくともあと一週間ほどは研究しときます。

コメント

コメントの投稿


管理者にだけ表示を許可する

トラックバック

トラックバック URL
http://scientistb.blog42.fc2.com/tb.php/54-5948a21e
この記事にトラックバックする(FC2ブログユーザー)

FC2Ad

まとめ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。