はつねの日記

Kinect, Windows 10 UWP, Windows Azure, IoT, 電子工作

New Cognitive Services capabilities are now generally available

Microsoft Build 2020のオンラインイベントが本日0時からスタートしました。

それに伴って、Cognitive ServicesもいろいろGA (generally available) がありますね。

音声認識関連をピックアップしてみましょう。

azure.microsoft.com

Quickly transcribe audio to text. Speech to Text is expanding to 27 new locales (coming soon), with 30 percent improvement in speech transcription accuracy.

音声テキスト変換の速度向上、27の新しい地域(これからのも含め)の追加、音声認識精度が30%向上などだそうです。

音声認識の対応地域って、この前まで30地域(言語的には21言語)だったと思うので、一気に倍近くになったのかな?

早速、ドキュメントをみてみましょう。

docs.microsoft.com

ドキュメントの更新日付見ると3月なんで、まだ、今回の発表分は反映されてないのかな?

ロケール一覧を抜き出してみると下記の様になります。

Locale Language  
ar-AE アラビア語 (UAE) [2019/10/22追加]
ar-BH アラビア語 (バーレーン) [2019/10/22追加]
ar-EG アラビア語 (エジプト)  
ar-KW アラビア語 (クウェート) [2019/10/22追加]
ar-QA アラビア語 (カタール) [2019/10/22追加]
ar-SA アラビア語 (サウジアラビア) [2019/10/22追加]
ar-SY アラビア語 (シリア) [2020/03/26追加]
ca-ES カタロニア語  
da-DK デンマーク語 (デンマーク)  
de-DE ドイツ語 (ドイツ)  
en-AU 英語 (オーストラリア)  
en-CA 英語 (カナダ)  
en-GB 英語 (イギリス)  
en-IN 英語 (インド)  
en-NZ 英語 (ニュージーランド)  
en-US 英語 (米国)  
es-ES スペイン語 (スペイン)  
es-MX スペイン語 (メキシコ)  
fi-FI フィンランド語 (フィンランド)  
fr-CA フランス語 (カナダ)  
fr-FR フランス語 (フランス)  
gu-IN グジャラート語 (インド) [2019/10/22追加]
hi-IN ヒンディー語 (インド)  
it-IT イタリア語 (イタリア)  
ja-JP 日本語 (日本)  
ko-KR 韓国語 (韓国)  
mr-IN マラーティー語 (インド) [2019/10/22追加]
nb-NO ノルウェー語 (ノルウェー)  
nl-NL オランダ語 (オランダ)  
pl-PL ポーランド語 (ポーランド)  
pt-BR ポルトガル語 (ブラジル)  
pt-PT ポルトガル語 (ポルトガル)  
ru-RU ロシア語 (ロシア)  
sv-SE スウェーデン語 (スウェーデン)  
ta-IN タミール語 (インド) [2019/10/22追加]
te-IN テルグ語 (インド) [2019/10/22追加]
th-TH タイ語 (タイ)  
tr-TR トルコ語 (トルコ) [2019/10/22追加]
zh-CN 中国語 (簡体字)  
zh-HK 中国語 (繁体字)  
zh-TW 中国語 (台湾)  

docsの変更履歴を見ても、2019/10/22にアラビア語ロケール増加、インドの言語の増加、トルコ語の追加があり、2020/3/26にアラビア語(シリア)が追加されていますが、まだ、今回のGAのが追加されてはいないのかな?

30地域(言語的には21言語)と思っていたけれど、現時点で、41地域(言語的には26言語)でした。そういえば、アラビア語は、ar-EGがMSA=Modan Standard Arabicだったのですが、2019/10/22の追加で、ar-BHの方に移ったみたいですね。

本日(2020/05/20)にアナウンスのあった27地域がどこなのか、どこが増えるのか楽しみですね。