B級科学者もどきの憂鬱

とある理系になりきれない奴のつれづれなる活動記

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

音声合成の統一的規格

前回の記事から四週間弱が経過してしまいました。
本当に、どうしてここまで予定が詰まってるのか。
やっぱり年末年始に書き溜めておくべきでしたかね。

前回、力学の多分オリジナル問題を、
次の記事ででも書くと言いましたが、
説明用の図を用意する時間が無かったので、
次回以降(出来れば次回)にします。

ところで最近思ったのですが、
音声合成(歌声合成も含む)ソフトって色々ありますよね。
でも、例えばVOCALOIDのデータをUTAUで扱いたいなんて時には、
そのままでは使えず、適切に変換しなければなりません。

Cadenciiというソフトでは、UTAUもVOCALOIDも同じように扱えますが、
それはプログラムに応じた形に適宜データを変換しているからで、
単にユーザーはそれを意識しないで済むというだけです。

もし音声合成に、例えばMIDIのような統一的な規格があれば、
ユーザーの利便性も向上すると思うのです。
じゃあ、声のパラメータを扱う統一的な規格って、
現在までに何か考案されているのでしょうか。

歌声合成だけであれば、XML-VSQ形式(.xvsq)やMusicXMLなどが、
汎用性もあり今後の拡張にも十分耐えうると思うのですが、
TextToSpeachなどにも使えるようにするのはちょっと難しそうです。

そのような規格が考案され、取り扱うAPIが広く普及すれば、
今後別の音声合成ソフトが開発されても、
比較的簡単にデータのやり取りが行えるようになるはずです。

というわけで、誰か作ってくれませんかね?(笑)
スポンサーサイト

FC2Ad

まとめ

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。