Google BigQueryについて

大量のデータをなるべく楽して取り扱いたい

データを蓄えて高速に検索をするという目的に対して、すぐに思い浮かぶソリューションといえばHadoopやカラム指向データベースとなります。

自分が愛用しているMicrosoft AzureでもHadoop(サービス名称はHD Insight)を使用することが可能ですが、目的を達成するためには、やや学習コストが高くなってしまいます。

目的はデータ管理で余計なことはしたくない…となるとカラム指向データベースとなるのですが、今の所Microsoft Azureにはカラム指向データベースが提供されていません。

仮想マシンを立ち上げて、SQL Server 2014 Enterpriseを使用すればHekatonが使用可能になる為、全く選択肢がないわけではないのですが、フルマネージドなサービスでなくなってしまいます。(ランニングコストもかなり掛かります。)

Microsoft Azure以外となると

となりますが、インデックスのないカラム指向データベースというのが売りのBigQueryを調べてみることにしました。

Google BigQuery

https://cloud.google.com/bigquery/

料金体験としては、まず保存領域に課金されて、クエリを実行する度に課金が発生する仕組みとなっています。

単純な比較は出来ませんが、1TBytesあたりの値段でいくと

  • Microsoft Azure Standard Storage が 約2,500円
  • Amazon S3 が約3,300円
  • Amazon Redshift dw2.large(160GBytes SSD) が約22,600円
  • Google BigQery が約2,000円

容量だけから判断すると結構安いかも?

実際に利用を開始するとデータの入出力を行うたびに料金が発生します。

  • クエリを実行する度に課金 1TBytes あたり 500円
  • ストリーミングインサート 100,000行あたり 1円

思っていたよりも安いかも…ひとまず契約してみるかな。