ITmedia NEWS > 速報 >

BigQueryが非構造化データをサポート 構造化データ(RDB)、半構造化データ(JSON)、非構造化データ全てに対応

» 2022年10月12日 11時07分 公開
[新野淳一ITmedia]

この記事は新野淳一氏のブログ「Publickey」に掲載された「[速報]BigQueryが非構造化データのサポートを発表。これで構造化データ(RDB)、半構造化データ(JSON)、非構造化データをサポート。Google Cloud Next '22」(2022年10月12日掲載)を、ITmedia NEWS編集部で一部編集し、転載したものです。

 米Google Cloudは、開催中のイベント「Google Cloud Next '22」において、大規模データ分析サービスの「BigQuery」で非構造化データのサポートを発表しました

photo BigQueryの非構造化データサポートを発表するGoogle Cloud CEO トーマス・クリアン氏

 BigQueryは1月にJSON型データへのネイティブ対応をパブリックプレビューとして公開しています。

 参考:BigQueryがJSONにネイティブ対応。SQLでJSONに対するクエリが可能に

 これでBigQueryは今回の非構造化データのサポートにより、RDBのテーブルに格納された構造化データと、JSONなどによる半構造化データ、そして非構造化データの3つをすべてサポートする柔軟な大規模データ分析基盤になるわけです。

Google Cloud Storageバケットのテーブル形表現

 BigQueryの非構造化データサポートは「Objectテーブル」によって実現され、画像や動画、音声、テキストなどのデータが扱えます。このObjectテーブルは、Google Cloud Storageのバケットのテーブル形表現であると説明されています。

 Objectテーブル内のオブジェクトのメタデータに対してSQLによるクエリが可能で、非構造化データに対しては機械学習モデルによる音声認識や画像認識、翻訳、文章処理などの処理が可能。

 非構造化データサポートは現在BigQueryのプレビュー機能となっています。

Copyright © ITmedia, Inc. All Rights Reserved.