B級科学者もどきの憂鬱

とある理系になりきれない奴のつれづれなる活動記

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

STRAIGHT

ニコ生で昨日、
【中継】情報処理学会『歌声情報処理最前線!』
というのを観ました。
やってるのに気付いたのは完全に偶然だったので、
途中からしか観れませんでしたが。

色々面白そうなことを聞けました。
個人的には、もっと理論面に踏み込んだ発表が
欲しかったなー、なんて思います。
まぁ、ニコ生なので噛み砕いた説明に
なるのは仕方ないのですが。

特に音声合成分析システムSTRAIGHTの発表では、
色々参考になりそうな情報も聞けました。
ただ、あくまで「なりそう」であって、
「なる」とは断言できません。

というのも、STRAIGHTの仕組みが、
自作プログラムの仕組みと全く違うからです。

STRAIGHTは分析合成系、つまり、
音声を成分ごとに分離し、
再合成するという仕組みです。

が、自作プログラムの中核を成す
TD-PSOLAというアルゴリズムは、
ノンパラメトリックな手法、つまり、
音声成分は抽出するだけで、
元の音声はそのまま使うのです。

だから、参考にできるとすれば
音声の成分分析の部分のみ。
分離技術も合成技術も必要ありません。

とりあえず検討してみます。
スポンサーサイト
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。