はつねの日記

Kinect, Windows 10 UWP, Windows Azure, IoT, 電子工作

Cognitive Service - Speech Service Previewが登場しました

build 2018の初日である2018/5/7にSpeech ServiceがCognitive Serviceに追加されました。

https://azure.microsoft.com/ja-jp/services/cognitive-services/speech-services/

 

あれ?音声認識ってもともとあったよね?とお気づきの方もいるとは思いますが、従来のものは、Bing Speech APIやCustom Speech Serviceですね。

Bing Speech API:20言語に対応した音声認識

https://azure.microsoft.com/ja-jp/services/cognitive-services/speech/

Custom Speech Service:音響モデルや言語モデル、ノイズ除去などに対応した音声認識

https://azure.microsoft.com/ja-jp/services/cognitive-servic

 

新しいSpeech Serviceは、Bing Speech、Custom Speech Service、Translator Speech APIを統合したものです。

  1. 一つのキーで
  2. 一つのSDK
  3. シンプルな価格で
  4. 単一のポータルからカスタマイズ可能で

というのが特徴です。

従来、「音声認識」についてはCustom Speech Serviceがありましたが、Speech Serviceでは「音声合成」もカスタマイズ可能になりました。

カスタマイズポータルは、http://customspeech.ai になっています。

※翻訳部分のカスタマイズは公式サイトからは判断つかなかったですが…

 

いま、比較表をつくっているのですが、buildの資料だと音声認識が28言語ってかいてあるんですが、その一覧がのっている資料がなくてちょっと困っているので、ここにあるよ!って情報をお待ちしております。

 

そうそうGAはいつなの?ってきいたら数か月だと思って!っていたのでGAにも期待sですね。4週間くらいでイテレーション回しているそうなので、なんか気になることがあったらタイムリーにフィードバックしてみるといいかもです。