build 2018の初日である2018/5/7にSpeech ServiceがCognitive Serviceに追加されました。
https://azure.microsoft.com/ja-jp/services/cognitive-services/speech-services/
あれ?音声認識ってもともとあったよね?とお気づきの方もいるとは思いますが、従来のものは、Bing Speech APIやCustom Speech Serviceですね。
https://azure.microsoft.com/ja-jp/services/cognitive-services/speech/
Custom Speech Service:音響モデルや言語モデル、ノイズ除去などに対応した音声認識
https://azure.microsoft.com/ja-jp/services/cognitive-servic
新しいSpeech Serviceは、Bing Speech、Custom Speech Service、Translator Speech APIを統合したものです。
- 一つのキーで
- 一つのSDKで
- シンプルな価格で
- 単一のポータルからカスタマイズ可能で
というのが特徴です。
従来、「音声認識」についてはCustom Speech Serviceがありましたが、Speech Serviceでは「音声合成」もカスタマイズ可能になりました。
カスタマイズポータルは、http://customspeech.ai になっています。
※翻訳部分のカスタマイズは公式サイトからは判断つかなかったですが…
いま、比較表をつくっているのですが、buildの資料だと音声認識が28言語ってかいてあるんですが、その一覧がのっている資料がなくてちょっと困っているので、ここにあるよ!って情報をお待ちしております。
そうそうGAはいつなの?ってきいたら数か月だと思って!っていたのでGAにも期待sですね。4週間くらいでイテレーション回しているそうなので、なんか気になることがあったらタイムリーにフィードバックしてみるといいかもです。