シャツとソックスの日記

@shatsutosokks の日記帳です。

俺たちの BigQuery 単体でデータ変換を含んだストリーミング処理ができるようになるってマジ?(マジ)

ちょっと衝撃を受けたので今日はいつもとは違う時間に更新。

 

zenn.dev

 

みんなこれ読んだ?

 

この記事で紹介されているのは、今回の Google Cloud NEXT'24 で紹介された、BigQuery の continuous queries っていう機能についてなんだけど、さらっとすごいことが書いてある。

 

要するに BIgQuery で、あるクエリをずっと動かしっぱなしにできるってこと。これの何がすごいって、BigQuery だけでストリーミング処理までできるようになるってことなんだよね。

 

例えば(上の記事でも触れられてるけど) Pub/Sub の BigQuery サブスクリプションによって連携された、BigQuery のあるテーブルに格納されたデータを、continuous queries 機能で動かしっぱなしにしたクエリで加工して、別のテーブルに格納する……なんてことができる。

 

cloud.google.com

 

さらにいえば、BigQuery には既にデータパイプラインツールとして Dataform が統合されている。ということは、こうしたストリーミング処理のパイプラインのコード管理もある程度 BigQuery 単体で目処が立つものと考えて良さそう(まあ、dbt とかと比べると少しかゆいところに手が届かない……みたいな点も、Dataform にはあるんだけど)。

 

cloud.google.com

 

もともとバッチ処理に関してはスケジュールドクエリ機能によって実現できていた BigQuery だけど、今回の発表でさらにストリーミング処理までできるようになってきた。

 

これはつまり、本当に BigQuery が Google Cloud を使ったデータ分析の中心になるってことを示しているんだと思う。

 

正直、生成 AI とかのリリースよりこっちのほうがインパクトあるんじゃね?って感じのリリースだった。マジで注目したい。