AWS Athena
Amazon Athena とは
- 2016年12月に導入
- S3上においたデータに対してサーバレスでSQL問い合わせを可能にするサービス
- 対応フォーマットはCSV,JSON,ORC,Avro,Qarquet
- Amazon Machine Learning はCSVしか食わないのでフォーマット変換としても有効
- 内部ではPrestodbを使っている
- 課金は「スキャンされたデータ1Tバイトあたり5ドル」
full SQLが動くようなので、内部的には一度普通のDBに変換して処理しているのだろうか。実装方法によってスキャンされる回数が大きく異なりそう。そうなると課金も変わってくるだろう。いくら掛かるかわからないのはちょっと恐ろしいな。。