【14-D-1】600億件を数十秒で検索するクラウド規模クエリサービスBigQuery

Google BigQueryは、クラウド上の数千台というサーバーを利用した大規模並列クエリサービスです。Google社内では2006年から利用されている「Dremel」と呼ばれるインフラを社外向けサービスとして公開したもので、600億件のデータに対する検索を、インデックスをまったく利用しないフルスキャンで数十秒という圧倒的なパフォーマンスで実行可能です。このDremelで利用されているカラム型ストレージのテクノロジーの解説をはじめ、BigQueryとMapReduce/Hadoopの違いと使い分け方について掘り下げます。

佐藤一憲

グーグル株式会社 クラウドソリューションズチーム ソリューションズアーキテクト
appengine ja night 管理人

日本オラクル、スティルハウスを経て現職に至る。Google App Engineをはじめ、BigQuery、Compute Engine、Cloud StorageなどのGoogle Cloud Platform製品を担当するソリューションズアーキテクトとして、技術コンサルティングやソリューション構築などの業務に従事。

http://d.hatena.ne.jp/kazunori_279/ @kazunori_279