MS Azure Cognitive Service

マイクロソフトブランディングがコロコロ変わったり、ユーザコミュニティを作るのがすごく下手だったりするのであまり知られていないような気がするが、機械学習クラウド系ではGoogle Cloud Platformよりもかなり先行している。たぶん。Cognitive Service は機械学習系サービスの総称。

分類

以下の5つに大別される

  • Vision
  • Knowledge
  • Language
  • Speech
  • Search

この内のSearch は既存のBingのサービス群なので、その他4つを調べてみる。

Vision

視覚系のサービス。

  • Computer Vision API : 一般物体認識
  • Face API : 顔の検出、認識
  • Content Moderator: 画像、テキスト、動画のモデレーション
  • Emotion API: 画像中の顔の感情分析
  • Video API: 動画中の物体トレース、動画の手ぶれ補正、動き検出、シーン検出によるサムネイル作成
  • Custom Vision Service:画像認識をユーザのデータを使ってファインチューン
  • Video Indexer: 動画へのインデックスの付与

Speech

発話、音声認識系のサービス

  • Translator Speech API : 音声認識翻訳サービス どのくらいつかいものになるんだろうか。
  • Speaker Recgnition API : 発話者識別サービス 認証につかえということか。これもどのくらい精度がでるんだろう。
  • Bing Speech API : 音声認識、発話サービス 日本語もサポートされている。
  • Custom Speech Service: ユーザ固有の言語モデル、音響モデルを構築しデプロイする事ができる

Language

自然言語処理系サービス

  • Language Understanding Intelligent Service: 音声認識の際に可能な文章を予め指定して効率よく認識しようとしている?
  • Text Analytics API:文章に対して、言語や感情を推定。キーフレーズの抽出も行う。
  • Bing Spell Check API:Spell をチェックして修正してくれる。スラングの指摘もするようだ。グラマーチェックはないようだ。
  • Translator Text API:テキストベースの翻訳API
  • Web Language Model API :スペースがない文の分割、共起確率、条件付き確率、次の単語の予測など。
  • Linguistic Analysis API:文章を解析して構文木を返したりtaggingしてくれたり。

Knowledge

知識処理?

  • Recommendation API:いわゆるリコメンデーションサービス。よく一緒に買われるものや、個々のユーザに特化したリコメンデーションをするらしい。B2C向けに出してるのか。
  • Academic Knowledge APIMicrosoft Academic GraphというWebから抽出したナレッジベースがあり、それに対するクエリをかけるというものらしい。よくわからない。
  • Knowledge Exploration Service:自然言語SQLに変換してクエリをかける?よくわからない。自然言語ではなく、特定のテンプレートを解析しているようでもある。
  • QnA Maker API:ドキュメントから自動的にFAQを構築する?
  • Entity Linking Intelligence Service API:単語の意味を文脈依存で解析
  • Custom Decision Service:ユーザ提供のデータを用いて強化学習を使う、判断を補助する?なんだかよくわからない。。

所感

色々ありすぎてよくわからない。。。機能の粒度もまちまちだし、もう少し整理して欲しいところ。しかし機械学習応用の本命はやっぱりこの手のサービスだよな、という感あり。