AWS Athena

Amazon Athena とは

  • 2016年12月に導入
  • S3上においたデータに対してサーバレスでSQL問い合わせを可能にするサービス
  • 対応フォーマットはCSV,JSON,ORC,Avro,Qarquet
  • Amazon Machine Learning はCSVしか食わないのでフォーマット変換としても有効
  • 内部ではPrestodbを使っている
  • 課金は「スキャンされたデータ1Tバイトあたり5ドル」

full SQLが動くようなので、内部的には一度普通のDBに変換して処理しているのだろうか。実装方法によってスキャンされる回数が大きく異なりそう。そうなると課金も変わってくるだろう。いくら掛かるかわからないのはちょっと恐ろしいな。。