B級科学者もどきの憂鬱

とある理系になりきれない奴のつれづれなる活動記

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

超えないで

音声処理。TD-PSOLAの実装で、
あらかじめピッチとピッチマークを計算して、
別ファイルに保存するようにしました。

で、実行してみたところ、爆☆速
1秒の音声を加工するのに大体0.02秒ぐらいです。
結構アバウトな計り方なので、正確な時間はわかりません。

TD-PSOLAは元々、フォルマント修正の必要が無いので、
一番時間がかかるのは、波形切り出し処理に使うハミング窓の計算です。

それでも線形時間しかかかりませんから、
これぐらいの速度が出て当然です。
でもまだまだ改良の余地はあります。

まだ音質の改善対策をほとんど実装していません。
それをやって、どこまで実行時間を短くできるか、
というのが腕の見せ所ですね。
まぁ、見せる腕なんてありませんが……。

対策の一つとして今思っている方法は、線形予測分析を用います。
結局まだ実装してないんだよなぁ……。
ピッチ検出の精度向上のためにも、早く実装しないとっ


かなり大きな配列を扱っているので、
ミスって確保したメモリ領域を超えて書き込みしようとすると、
すぐにエラーが出て止まります。

まぁ止まってくれるだけありがたいのですが、
そのたびにタスクマネージャさんのお世話になっています。

実装はほぼ完全なC言語で行っているため、
そういうエラー対策のコードが全体の半分を占めています。

何とかならないでしょうかね?

コメント

コメントの投稿


管理者にだけ表示を許可する

トラックバック

トラックバック URL
http://scientistb.blog42.fc2.com/tb.php/36-b55779c2
この記事にトラックバックする(FC2ブログユーザー)

FC2Ad

まとめ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。