AWS AI

Google や MSに比べてちょっと弱い印象があったのだが、色々見落としていたようだ。
https://aws.amazon.com/jp/amazon-ai/: AWSでの人工知能というページができている。
3つのレイヤでサポートしていると主張。

  • 従来のEC2上にAI向けのAMIを整備する、という話
  • API主導サービス
  • Managed Service - 従来の Amazon MLや Elastic Map Reduceのこと。

要するに新しいのは2番めのAPI主導サービスだけだ。

API 主導サービス

Lex、Polly, Rekognitionの3つのサービスができている。Rekognitionが'k'なのはタイプミスではない。

Lex

Amazon Alexaに使っているのと同じ技術で音声認識自然言語理解を伴う会話形インターフェイスを構築するサービス。コンテクストフリーの音声認識だと大変すぎるので、API.AIのようなインテントに基づくボット作成機能も統合されているようだ。
現在サポートされているのは、米国英語のみらしい。

Polly

音声合成サービス。LexとPollyを使うと対話サービスが簡単に作れる、ということ。現在の対応言語は、デンマーク語、オランダ語、英語(英、豪、印、米、ウェールズ)、フランス語、ドイツ語、アイスランド語、イタリア語、日本語、ノルウェイ語、ポルトガル語ルーマニア語、ロシア語、スペイン語スウェーデン語、トルコ語ウエールズ語。
多くの言語では男性、女性、方言をサポートできる。

Rekognition

画像内の物体、シーン、顔認識。

所感

当然出てくるだろうと思われたものが揃った感じか。GoogleAmazon、MS三つ巴。。

さくら高火力

機械学習に不可欠なGPUサーバを借りられるさくらの高火力。以前は月単位で、GPUもTitanX一択で選べなかったと思うのだけど、最近色々できるようになったようだ。

課金体系

月額課金と時間単位が選択できるようになっている。GPUも4種類。

  • Maxwell Titan X x4, 267/h,
  • Pascal Titan X x4 - 294/h, 93,000/month (初期費用 815,000)
  • Tesla P40 x 1 - 349/h, 97,000/month (初期費用 875,000)
  • Tesla P100 x 1 - 357/h, 99,000/month (初期費用 895,000)

月額の場合には、初期料金も必要なのか。。なかなか苦しい。

Azureとどちらが安い?

しらべてみたらまだAzureでのPascalは使えないのかな??
アナウンスはされているけど、まだ実際には使えないのか。。

Cloud TPU

https://cloud.google.com/tpu/

GoogleのTPUをクラウド上で使うサービス。現在αで、サインアップすることができる状態。1ユニットは180 teraflops だそうだ。

この記事 によれば1チップ?あたりは45teraflopsらしいので、これを4つ組み込んだボード?が一つの単位になるということか。

しかし、1ユニット180 teraflopsとはすごいな。。京が10ペタフロップス。わずか60ユニットでならぶ事になってしまう。写真をみると1ラックに32ユニットはいっているように見えるので、2ラック分か。もちろん精度とか、可能な計算の制約があるわけなので、代替できるわけではないのだけど。

手元で開発したTensorFlowのモデルをそのまま使える、ということは書いてあるが、他に情報がない。。おそらく、Cloud Machine Learning Engine と透過的になっていて、ただ速くなるだけなんだろうな。そうじゃないとこまるし。

Amazon EC2 F1 インスタンス

なんなのか

最高生可能なハードウェアデバイスFPGA が使えるインスタンスFPGA は Xlinx UltraScale Plus かなりリッチなやつ。64GiBのDDR4 メモリも搭載。PC側との接続はPCIe x16。2016年12月に導入。

  • f1.2xlarge - 1 FPGA, 8vCPU, 122GiB
  • f1.16xlarge - 8 FPGA, 64vCPU, 976GiB

8FPGAと言うのはすごいな。

HDK

Hardware Development Kit なるものがある。AMIとして提供されている?VIVADOとかインストールされている。おそらくWindows。これを普通のインスタンスで実行して、開発。つくったものをAFIとして、F1インスタンスにデプロイする、というワークフローらしい。AFIをマーケットプレースで共有することもできる、と。

PCIe を経由したCPUとの通信は標準化されていてそこはつくらなくてもよいらしい。メモリインタフェースも入っているらしい。

想定されるアプリケーション

遺伝子解析、金融、実時間動画解析、ビッグデータ解析、セキュリティが挙げられている。FPGAの用途としては、I/Oのアクセラレーションをよく見るが、F1ではおそらくできない。

価格

以下はバージニアの価格。

  • f1.2xlarge $1.65/ hour
  • f1.16xlarge $13.2/hour

さすがにいいお値段である。 あたらしいGPGPUのp2.16xlarge の$14.4/hour 、1952 GiB メモリ搭載のx1.32xlarge の $13.338/hour にならんで、最も高価なインスタンスの一つとなっている。

所感

使いこなすのはかなり大変そうだが顧客ついてるんだろうか。また、HDKを使って開発したら、他の環境には動きにくくなるだろうからロックインされてしまいそう。

Effective Amazon Machine Learning

by Alexis Perrier

どんな本か

AmazonのMLサービスについて書かれた本。まとまって書かれているものはあまり無いので貴重。

Amazon MLについて

意外なほど機能が限定されている。できるのはクラス分類と回帰だけ。モデルも線形のみ。クラスタリングや次元削減などのありがちな機能もない。

入力はCSVだけ。例えば多項式特徴量を入れるには、SQLで事前にデータを変換してCSVに書き出しておいて、そこから学習するらしい。SQLで変換するということは、要するに一回本当にデータを特徴量を増やして作り直しているということで、I/O的には相当非効率な気がする。

基本的に、GUIで操作できることしかできないので、隔靴掻痒感が強い。ワンショットの問題解決を行うのなら、手元でscikit-learnとかでやったほうがなんぼかよさそう。どうせ計算量の大きいモデルは扱えないし。
強みは他のサービスと連携したストリーム処理や、大規模なワークフローの一部としての機械学習アルゴリズムの実装にあるのだろう。


Effective Amazon Machine Learning
Alexis Perrier
Packt Publishing (2017-04-25)
売り上げランキング: 131,661

AWS Athena

Amazon Athena とは

  • 2016年12月に導入
  • S3上においたデータに対してサーバレスでSQL問い合わせを可能にするサービス
  • 対応フォーマットはCSV,JSON,ORC,Avro,Qarquet
  • Amazon Machine Learning はCSVしか食わないのでフォーマット変換としても有効
  • 内部ではPrestodbを使っている
  • 課金は「スキャンされたデータ1Tバイトあたり5ドル」

full SQLが動くようなので、内部的には一度普通のDBに変換して処理しているのだろうか。実装方法によってスキャンされる回数が大きく異なりそう。そうなると課金も変わってくるだろう。いくら掛かるかわからないのはちょっと恐ろしいな。。

API.AIに関するメモ

昨夜のGDGでちょっとだけ紹介されていたので軽く調べてみた。

  • 現在もWebページは独立しているようで、https://api.ai/ にある。どおりでGCPのページには出ていないわけだ。
  • ユーザとのインタラクションを自動化することが目的。ボットなど。入力からユーザの意図をとりだし、足りない情報は自動的に問い合わせる。
  • 自然言語でのピザ注文などが、簡単に作れる。住所が入っていなかったら住所を聞き返すなど。
  • Azureにも非常に似た機能が有ったような。