Azure Machine Learning Studio

これはなにか ウェブブラウザ上でブラフィカルに機械学習パイプラインを構築し、モデルをデプロイすることのできるフレームワーク。 Azure Machine Learning と呼ばれていたものに、いつのまにかStudioがついた。たしかにMachine Learning だけだとあまりに…

MS Azure Cognitive Service

マイクロソフトはブランディングがコロコロ変わったり、ユーザコミュニティを作るのがすごく下手だったりするのであまり知られていないような気がするが、機械学習クラウド系ではGoogle Cloud Platformよりもかなり先行している。たぶん。Cognitive Service …

Watson API

これはなにか https://www.ibm.com/watson/jp-ja/developercloud/services-catalog.htmlIBMのWatsonといえばJeopardy! のチャンピオンを破ったことで有名になったIBMのシステムだが、今現在のWatsonは、いろんな機械学習系アルゴリズム、製品全体をさすブラ…

Amazon Rekognition

どういうものか https://aws.amazon.com/rekognition/AWSの画像系機械学習サービス。Prime Photosで培った技術で作られているとかで、サービス内容を見てもわりに写真サービスに特化した物が多い。 Object and Scene Detection 画像のなかの物体やシーンを認…

Amazon EC2 Elastic GPU

昨年のイベントで発表されていたものがGAになっちょうだ。ネットワーク経由でGPUをEC2インスタンスからシェアリングするというもの。なかなかすごい技術のような気がするがどうやって実現してるんだろうか。https://aws.amazon.com/jp/about-aws/whats-new/2…

Google Cloud Functions

https://cloud.google.com/functions/docs/知らない間にできてた。名前から言ってもAmazon Lambdaの対抗なのだろう。HTTPリクエストで関数をトリガーするもの。GoogleならApp Engineでも良いような気がするが、App Engineよりもコンテナが軽量なのだろうか。…

サンプルを動かしてみたのでメモ

"クイックスタート"に従うだけで、非常に簡単だった。面倒なのはプロジェクトをセットアップして課金を設定する部分で、そこができてしまえば簡単。特にこのページからJSONで実験するだけなら直ぐにできる。対象となる絵はStorageにアップロードして実行する…

AWS AI

Google や MSに比べてちょっと弱い印象があったのだが、色々見落としていたようだ。 https://aws.amazon.com/jp/amazon-ai/: AWSでの人工知能というページができている。 3つのレイヤでサポートしていると主張。 従来のEC2上にAI向けのAMIを整備する、とい…

さくら高火力

機械学習に不可欠なGPUサーバを借りられるさくらの高火力。以前は月単位で、GPUもTitanX一択で選べなかったと思うのだけど、最近色々できるようになったようだ。 課金体系 月額課金と時間単位が選択できるようになっている。GPUも4種類。 Maxwell Titan X x4…

Cloud TPU

https://cloud.google.com/tpu/GoogleのTPUをクラウド上で使うサービス。現在αで、サインアップすることができる状態。1ユニットは180 teraflops だそうだ。この記事 によれば1チップ?あたりは45teraflopsらしいので、これを4つ組み込んだボード?が一つの…

Amazon EC2 F1 インスタンス

なんなのか 最高生可能なハードウェアデバイスFPGA が使えるインスタンス。FPGA は Xlinx UltraScale Plus かなりリッチなやつ。64GiBのDDR4 メモリも搭載。PC側との接続はPCIe x16。2016年12月に導入。 f1.2xlarge - 1 FPGA, 8vCPU, 122GiB f1.16xlarge - 8…

Effective Amazon Machine Learning

by Alexis Perrier どんな本か AmazonのMLサービスについて書かれた本。まとまって書かれているものはあまり無いので貴重。 Amazon MLについて 意外なほど機能が限定されている。できるのはクラス分類と回帰だけ。モデルも線形のみ。クラスタリングや次元削…

AWS Athena

Amazon Athena とは 2016年12月に導入 S3上においたデータに対してサーバレスでSQL問い合わせを可能にするサービス 対応フォーマットはCSV,JSON,ORC,Avro,Qarquet Amazon Machine Learning はCSVしか食わないのでフォーマット変換としても有効 内部ではPrest…

API.AIに関するメモ

昨夜のGDGでちょっとだけ紹介されていたので軽く調べてみた。 2014年にlaunchした独立した会社。2016年9月19日にGoogleに買収された 現在もWebページは独立しているようで、https://api.ai/ にある。どおりでGCPのページには出ていないわけだ。 ユーザとのイ…

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Andreas C. Muller, Sarah Guido Pythonの機械学習ライブラリ scikit-learn を使って、さまざまな機械学習アルゴリズムの使い方を学ぶ。特徴的なのは、アルゴリズムの詳細には立ち入らず、使い方に重点を置いていること。とはいっても、ライブラリの使い方だ…

Google Cloud Platformの機械学習系サービス

このページによると、GCPの機械学習系サービスは7つ。というか、大物のEngineが1つとAPIが6つ。APIにはAlpha状態のものもある。 Cloud Machine Learning Engine TensorFlowのマネージド・サービスらしい。つまり、TFで書いたコードを用意すると、学習から運…

golang のyaml library の使い方

go

Go 言語にはyaml を入出力するためのライブラリhttp://godoc.org/gopkg.in/yaml.v2:package yaml があり、これを使うとGoの構造体とyamlとの変換が、わりに簡単にできる。ところが、構造を持たないようなデータを読もうと思うとなんだかうまくいかない。例え…

Cython ―Cとの融合によるPythonの高速化

Kurt W. Smith 著 PythonとRubyって、一時はキャラがかぶって競合関係にあったような気がするのだけど、今ではWebならRuby、科学技術計算ならPython と別れてしまったような気がする。numpyやscipyなどの数値演算ライブラリを使うと、Pythonで科学技術計算が…

ZooKeeperによる分散システム管理

Flavio Junqueira, Benjamin Reed ApacheのHadoopプロジェクトから派生したZooKeeperを紹介した本。頑健な分散協調を容易にしてくれるZooKeeperだが、実際にはかなり落とし穴がボコボコある。落とし穴の避け方を教えてくれるのがこの本。Zab プロトコルも詳…

json-simpleを使いやすく

ちょっとCassandraをいじっている。内部でJSONを使いたくなったので、Cassandraがもともと使っているjson-simpleを使ってみた。 Object o = (new JSONParser()).parse(jsonString);のように使う。jsonのMapはJSONObjectに、Listは JSONArrayにマップされる。…

Head First C ―頭とからだで覚えるCの基本

「チャート式技術書」とでもいうべき、半分おちゃらけた感じの技術書シリーズの一冊。 「Head First」は「頭から飛びけむ」ぐらいの意味で、「あまリ考えずにとにかく手を動かせ」というような ニュアンスなのかと思われる。 アメリカには「XXX for Dummies…

入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック

非常に実践的なソーシャルデータ解析入門書。ソーシャルデータの処理は、理屈はともかく実際にデータを取ってくるところでいろいろと知識が必要でなかなか先に進まなかったりするわけだが、この本はその辺りを埋めてくれる。対象は電子メイル、Twetter, Link…

RDBMS解剖学 よくわかるリレーショナルデータベースの仕組み

鈴木 幸市, 藤塚 勤也 翔泳社のDBマガジンに連載された記事をまとめたもの。2005年の発刊なので相当に古いのだけど、 基礎的な内容なのでそれほど古くなった感じはしない。SQLもDBの使い方も知っているけど内部構造を知らない人に向けて、内部構造の概要を解…

リーダブルコード ―より良いコードを書くためのシンプルで実践的なテクニック (Theory in practice)

Dustin Boswell Trevor Foucher プログラムをきれいに書こう、という話はよくあるが、「きれい」というのは基準になってるようで なってない。なので、ついついリファクタリングやりすぎて無駄に抽象クラス作ってみたり、 無駄にファクトリクラス作ってみた…

デバッグの理論と実践 ―なぜプログラムはうまく動かないのか

Andreas Zeller 未だに個人的な技芸の域を脱しきれていないプログラミングと言う過程の中でも特に 属人的な要素の強いデバッグという過程に対して、「科学的」な手法を適用すれば システマティックにデバッグできることを示している、かなり画期的な本。 個…

2週間でできる! スクリプト言語の作り方

千葉 滋 Javaでスクリプト言語を作る本。著者は、畏友 千葉さん。お忙しいのに本まで書いて頭がさがる。体裁は割りに軽めだが、中身はすごい。まずは普通にインタプリタで作り、その後仮想コードコンパイラに仮想コードインタプリタを組み合わせ、さらに型解…

さくらクラウド復活

パブリックベータ状態にもどって課金なしとなっていたさくらクラウドだが、あたらしいストレージの性能にめどが立って、10/1より課金を再開するとのアナウンスがあった。なにはともあれめでたい。publickeyによると、当初の予定とは異なり、完全な自社開発サ…

Amazon の6月の障害

2012年6月にあったAmazon AWS の障害について。publickeyさんから、備忘録としてさらにまとめてみる。6月14日にもあったようだが、こちらは比較的単純な電源断。ケーブル障害に発電機のクーリングファン障害が重なったというもので、障害時間も2時間弱。一方…

さくらのクラウドの件

2011年11月に導入されたさくらのクラウド、最低価格が月額2500円と安く大きな話題になったにも関わらず、春先に大規模なストレージ障害に見まわれ、新規募集を停止した。ここまでは記憶にあったのだけど、その後ニュースを聞かないな、と思って調べてみた。…

すごいHaskellたのしく学ぼう!

Miran Lipovača Haskell入門書。一見軽い入り口だけの本のようにも見えるが、内容的には結構ハードでガンガン進むので、読み流しているとガンガン置いて行かれる。コンパクトにまとまった良書ではあるが、この本を読んだだけではHaskellの深奥にはたどり着け…