Content
こんにちは。

本記事では、「Gemini for Google Cloud」のひとつである「Gemini in BigQuery」について深掘りしたいと思います。
そもそも「Gemini for Google Cloud」とは、Google Cloud で提供されるプロダクトに生成AI(Gemini)を組み込むことで、各プロダクトのアシスタントとしての機能を提供するサービスです。
Gemini が組み込まれたプロダクトは複数ありますが、今回はそのうちの「Gemini in BigQuery」について、見ていきたいと思います。

具体的には、
  • ざっくり「Gemini in BigQuery」でできること
  • 上記、できることについて、簡単に一通り試してみる という流れで深掘りしていければと思います。
 

色々できそうだけど、結局、「Gemini in BigQuery」で何ができるのか、ご参考になれば幸いです。

ざっくり「Gemini in BigQuery」でできること

公式サイトでは、主な機能として以下4つが挙げられています。

  • データインサイト機能
  • データ準備機能
  • データキャンバス機能
  • SQL/Python コードアシスト機能

 

各機能の概要は後述しますが、「Gemini in BigQuery」は、主にデータエンジニア/データアナリスト/データサイエンティスト向けに、データの検索~分析までのデータライフサイクル全体に対応するアシスタント機能を提供しています。
データエンジニア/データアナリスト/データサイエンティストらエンジニアが行う基本的なタスクを支援することで、エンジニアはより付加価値の高いタスクに注力することができます。

 

なお、料金についてですが、データ準備機能、データキャンバス機能、SQL/Python コードアシスト機能については、すべてのエディションで追加料金なしで利用可能です(25年5月14時点)。
詳細は、Gemini in BigQuery の料金概要をご参照ください。

検証に使用するデータ

今回は、BigQueryの一般公開データセットのコピーを使用して、各機能を検証していこうと思います。
使用するデータセット/テーブルは以下です。

  • データセット:thelook_ecommerce
  • テーブル:order_items

 

このデータセットは、架空のeコマース衣料品サイト(TheLook)に関する顧客、商品、注文、物流、ウェブイベント、デジタルマーケティングキャンペーンに関するテーブルが含まれています。
今回はこのうち、注文商品テーブルを使用します。テーブルの中身は以下の通りです。

 

※今回の検証では、必要な権限付与やAPI有効化については、手順から割愛しております。

※検証のキャプチャは、検証時点(25年4月)のものです。

データインサイト機能

【概要】

  • データインサイト機能は、データを探索し、理解するための機能です。
  • Gemini は、テーブルのメタデータに基づいて、有益なインサイトをもたらす SQL を生成します。
  • これにより、データアナリストは、馴染みのないテーブルを探索する際であっても、一から SQL を作成する必要はなく、有益なインサイトをもたらす SQL を使用して、すぐにデータの探索を行うことができます。

 

【検証】
実際に、order_items テーブルを使用して検証してみたいと思います。

1.Google Cloud コンソールで、BigQuery Studio を開く。

2.インサイトを生成するテーブルを選択し、[分析情報] タブをクリック。[分析情報を生成] をクリック。インサイトが生成される。
– 30近くのインサイトが生成されました。
– テーブルのデータプロファイリング(※)結果が公開されている場合は、その結果を使用して、そうでない場合は、列名とテーブル/列の説明に基づいてインサイトが生成されます。
(※)
データプロファイリングとは、Dataplex の機能のひとつで、テーブルをスキャンすることでテーブルの統計情報を取得することができます。
このデータプロファイリング結果が BigQuery に公開されている場合、インサイトの生成に使用されます。

3.気になるインサイトを選択し、[クエリにコピー] をクリック。
– 今回は、「Identify the product with the highest single-day revenue generated.(1日あたりの収益が最も高い製品を特定する)」を選択してみました。

4.[実行] をクリック。結果が表示される。

 

自分では考えつかないような様々な観点のインサイトが生成され、驚きました!

データ準備機能

【概要】

  • データ準備機能は、Gemini の提案に基づいて、データのクレンジングを行うことができる機能です。
  • これにより、データエンジニア/データアナリスト/データサイエンティストらは、分析用のデータを効率的に準備することができます。

 

【検証】
実際に、order_items テーブルを使用して検証してみたいと思います。

1.Google Cloud コンソールで、BigQuery Studio を開く。

2.[▾] をクリックし、[データ準備] をクリック。

3.クレンジングしたいテーブルに関連するキーワードを入力。テーブルのリストが表示される。

4.[ソースとして追加] をクリック。Gemini からクレンジングの提案が生成される。
– 10の提案(ステップ)が生成されました。

以降の対応としては、大きく2つが挙げられます。今回は、4-1 を試してみたいと思います。
4-1.Gemini からの提案を適用する。
4-2.ニーズを満たす提案がない場合、[ステップの追加] から自然言語を使用して独自のステップを追加する。

4-1.[適用] をクリック。選択したステップが適用される。
– 適用後の値を確認したい場合は、[プレビュー] をクリックし、確認することができます。

– Gemini からの提案を編集したい場合は、[編集] をクリックし、自然言語を使用して、もしくは手動で提案を編集できます。

– 表内の1~3つのセルの値を変更し、Gemini に例を提示することで、新しい提案を生成させることもできます。

 

出力先を設定し、手動で実行するか、スケジューリングすることで定期実行が可能です。

自動でクレンジングの提案をしてくれるのはもちろん、最後に紹介した例を提示するだけで新しい提案を生成してくれるのも魅力的だなと感じました!

データキャンバス機能

【概要】

  • データキャンパス機能は、自然言語を使用してデータの検索、結合、クエリ、可視化を行うことができる機能です。
  • データからインサイトを導き出すプロセスの支援を受けることによって、データアナリストやデータサイエンティストは、分析タスクを加速させることができます。

 

【検証】
実際に、order_items テーブルを使用して検証してみたいと思います。
今回は、検索~クエリ~可視化を試してみたいと思います。

1.データを検索する。
1-1.Google Cloud コンソールで、BigQuery Studio を開く。

1-2.[▾] をクリックし、[データ キャンパス] をクリック。

1-3.[データを検索する] をクリック。

1-4.探索したいテーブルに関連するプロンプトを入力。テーブルのリストが生成される。

1-5.[キャンバスに追加] をクリック。データキャンバス上に選択したテーブルが追加される。
– タブを切り替えることで、詳細やプレビューなどが確認できます。

2.選択したテーブルに対して、SQL クエリを生成する。
2-1.[クエリ] をクリック。

2-2.実行したいクエリに関連するプロンプトを入力。SQL クエリが生成される。
– クエリを編集したい場合は、手動、もしくはプロンプトを変更して再生成することで編集できます。

2-3.[実行] をクリック。結果が表示される。

3.結果を可視化する。
3-1.[可視化] をクリック。[棒グラフ] をクリック。グラフが生成される。

– [編集] をクリックで、グラフのデータ/ラベル/Style の編集が可能です。

– プロンプトを使用して、グラフを編集することも可能です。

 

1画面内でデータの検索~可視化まで行えるのは便利だなと感じました!

SQL/Python コードアシスト機能

【概要】

  • SQL/Python コードアシスト機能は、SQL/Python コードを生成、補完、説明することができる機能です(一部プレビュー)。
  • これにより、データエンジニア/データアナリスト/データサイエンティストらは、効率的にコーディングを行うことができます。

 

【検証】
実際に、order_items テーブルを使用して検証してみたいと思います。
今回は、SQL クエリの生成を試してみたいと思います。

1.Google Cloud コンソールで、BigQuery Studio を開く。

2.[+] をクリック。

3.アイコンをクリック。

4.実行したいクエリに関連するプロンプトを入力。SQL クエリが生成される。
– クエリを編集したい場合は、[編集] をクリックし、自然言語を使用して、もしくは手動で提案を編集できます。

5.[挿入] をクリック。エディタに反映される。

 

自社のデータソースに基づいたクエリが生成されるのは便利ですね!

 

ざっと、「Gemini in BigQuery」の機能を試してみました。
先述したように、「Gemini in BigQuery」は、主にデータエンジニア/データアナリスト/データサイエンティスト向けに、データの検索~分析までのデータライフサイクル全体に対応するアシスタント機能を提供しています。
BigQuery は、単なる DWH としての機能をはるかに超え、最終的な目的であるデータ活用に向け、エンジニアがより付加価値の高いタスクに注力できるよう、設計、開発が進められている点が非常に印象的でした。
今回は簡単な検証のみだったため、現状の精度で実際の業務にどこまで耐えうるのかという点は気になりますが、それ以上に今後のアップデートに期待したいです。

最後まで読んでいただき、ありがとうございました。

2025年5月20日 【Gemini in BigQuery】一通り試してみた

Category Google Cloud

ご意見・ご相談・料金のお見積もりなど、
お気軽にお問い合わせください。

お問い合わせはこちら