GoogleのBigQueryの使い方。初期登録から説明します

Googleが提供するクラウド型のデータウェアハウスサービス[BigQuery]

BigQueryは、パソコンにインストールすることなくWebブラウザを通じて使うことができます。そして、Googleの他のサービス同様、Googleアカウントがあれば、初期登録も難しいことはありません。

GoogleのBigQuery

この記事では、GoogleのBigQueryの基本的な使い方を初期登録の手順を含めて説明します。

目次

BigQueryの初期登録(始め方)

BigQueryを無料で使う(試す)ための方法には、[Google Cloud Platformの無料トライアル][BigQueryサンドボックス]の2通りがあります。

料金プランについて

それぞれのプランの詳細と料金体系については、別記事で説明します

この章では、無期限で使えるBigQueryサンドボックスの始め方について説明します。

BigQueryサンドボックスの利用開始

普段、お使いのまたはBigQueryを使う予定のGoogleアカウントでログインした状態で始めてください。ブラウザの種類は問いませんが、BigQueryはGoogleのサービスのため、Chromeがベストでしょう。

BigQueryサンドボックスのWebページにアクセス
(https://cloud.google.com/bigquery/docs/sandbox/?hl=ja)
②中段のBigQueryに移動ボタンをクリック
③以上でBigQueryが使える状態
有効化のボタンについて

上記③のイメージ図の右上にある[有効化]のボタンは、Google Cloud Platformの無料トライアルを有効化するためのボタンです。このままBigQueryのサンドボックスを使い続けるのであれば、クリックする必要はありません。

Google Cloud Platformの無料トライアルをするなら・・

以上、BigQueryのサンドボックスの初期登録(始め方)の手順です

BigQueryサンドボックスでは、テーブルの有効期間が60日間に制限されています。60日を経過した場合、予告もなく削除されますので、お気をつけください。

BigQueryの基本的な使い方

この章では、BigQueryの基本的な使い方を説明します。なお、BigQueryではSQL言語をメインに使いますので、SQLの知識があることが前提です。

BigQueryの階層構造

BigQueryでは、まずプロジェクトを作成することから始まります。プロジェクトには、複数のデータセットを作成することが可能で、さらにデータセットには複数のテーブルを作成することが可能です。

下記のうち、データセットがRDBMSでいう「データベース」に該当します。

BigQueryの階層構造イメージ

プロジェクトの作成

まずは、BigQueryでプロジェクトを作成します。

プロジェクトの作成をクリック
②プロジェクト名(赤枠)、プロジェクトID・場所(青枠)を指定する
※プロジェクトIDや場所は特に理由がなければデフォルトでよい
③この記事ではプロジェクト名を[Analytics17]に設定する
作成ボタンをクリック
④プロジェクトが作成された

以上、BigQueryのプロジェクトの作成手順です。引き続き、データセットを作成します(次節)。

データセットの作成

前節で作成したプロジェクト内にデータセットを作成します。当章の[BigQueryの階層構造]で説明した通り、データセットはRDBMSのデータベースに該当し、複数のテーブルやビューの格納先になります。

①プロジェクトが選択(上段の赤枠)されていることを確認し、中段のプロジェクトIDの右にある縦に並んだ・・・をクリック
その後、データセットを作成をクリック
データセットIDを指定する
※その他の項目は必須ではなく特に設定不要
③この記事ではデータセットIDを[Sample_01]に設定する
データセットを作成ボタンをクリック
④データセットが作成された。データセットに移動をクリック
データセットの開き方

イメージ図④のメッセージウィンドウを閉じてしまっても、下記のようにデータセットを開くことができます。

プロジェクト配下にデータセットがある

以上、BigQueryのデータセットの作成手順です。引き続き、テーブルを作成します(次節)。

テーブルの作成

前節でデータセットを作成したあとは、いよいよテーブルの作成です。RDBMSでも同様ですが、データセット(データベース)の作成は特に難しいことではありません。

一方、テーブルの作成は実際のデータの格納先になりますので、スキーマの定義など、データベースの知識が問われる工程です。

なお、テーブルの作成は[空のテーブルを作成]、[他のクラウドサービスからの連携]、[アップロード]から選択できますが、当記事ではcsvのアップロードで作成します。

①データセットを選択した状態で、テーブルを作成をクリック
②この画面に遷移する
③テーブルの作成元(作成方法)を選択できる
④当記事ではアップロードを選択
⑤アップロードするファイルを選択するとファイル形式が自動的に判別される
テーブル名を設定する。当記事では、SampleTable_01に設定する。
重要│スキーマの定義。プラス記号をクリックすることで、カラム名・データ型などのスキーマを定義できる
自動検出について

本来、テーブルのスキーマはデータ管理の最重要ともいえる定義のため、手動で正確に定義することが望ましいのですが、当記事では[自動検出]機能を使って進めます。テーブル作成の詳細については、情報量が多いため、別記事で説明します。

⑧(今記事に限り)スキーマの自動検出にチェックをして、テーブルを作成ボタンをクリック
⑨テーブルが作成された
⑩テーブルを開くと、自動検出されたスキーマを確認することができる

以上、BigQueryのテーブルの作成手順です。この時点で、SQL文を実行できる状態です。

BigQueryでクエリを実行

ここまでに、BigQueryの初期登録からプロジェクト・データセット・テーブルの作成について説明しました。

細かい用途ごとの使い方は、それぞれの記事で説明していきますが、当記事ではBigQueryで簡単なクエリを実行する手順のみ紹介したいと思います。

クエリの実行

①テーブル内のクエリをクリック
新しいタブをクリック
③クエリのエディタが開く
④SQL文を記述し実行ボタンをクリック
⑤下段にSQLの実行結果がプレビュー表示される
結果を保存をクリックすると、プレビュー表示されている結果を保存することが可能
⑦保存形式は上記の通り

以上、BigQueryのクエリ実行の実画面です。

あとがき

今回は、Googleが提供するデータウェアハウスBigQueryの初期登録から、プロジェクト・データセット・テーブルの作成と、簡単なクエリの実行方法まで記事にしました。

これ以降、SQL言語が使えれば、特に困ることはないと思うのですが、勉強中の方やSQLにお詳しくない方についても、当サイトでは引き続きBigQueryやSQLの情報を発信していきますので、またご覧いただければ幸いです。

SQL言語は、BigQueryの他、MySQLやPostgreSQLでも使える汎用性の高い言語のため、勉強する価値は非常に高いです。

目次