B級科学者もどきの憂鬱

とある理系になりきれない奴のつれづれなる活動記

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

苦戦中

様々な音声でちゃんと合成できるようにするのは、
結構大変です。

現在、色々と実験を繰り返していますが、
まだ解決の見込みのない問題がいくつもあります。

音源との相性もあるらしく、
ほぼ全ての音声ファイルで
ある程度きちんと合成できるものもあれば、
一割ほどのファイルで
かなり顕著に劣化してしまうものもあります。

デモに使おうと思っていた音源がまさに後者でした。
歌唱に使おうとするなら、
一割もちゃんと生成できないなんて話にならないので、
色々と調整を繰り返しています。

全然改善の目処が立たなくて、
だんだん集中力が途切れてきて、
別の事をやって気を紛らして、
なんてことを連日やってます。
というか、最近は気晴らしの方が長いです。

TD-PSOLAでは、ピッチとピッチマークという、
二つのパラメータを検出しなければなりません。
ピッチの方はほぼ解決しました。
ピッチマークの方がかなりの曲者です。

ちょっとずれただけで、大きく雑音が出たりします。
ただ、データによってはほとんど出ないものもあるので、
逆に厄介です。

それに最近、計算結果の視覚化の手間が、
バカにならないほど大きくなってきました。

今はExcelにデータをコピーしてグラフを作ったり、
波形に得られたパラメータを直接埋め込んだりしてますが、
細かい部分を見るには限界があります。
いい加減、専用の視覚化ツールを作らないとな……。
でもGUIプログラミング嫌いなんだよな……。

コメント

コメントの投稿


管理者にだけ表示を許可する

トラックバック

トラックバック URL
http://scientistb.blog42.fc2.com/tb.php/63-f975e47e
この記事にトラックバックする(FC2ブログユーザー)

FC2Ad

まとめ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。