BigQueryが非構造化データをサポート 構造化データ(RDB)、半構造化データ(JSON)、非構造化データ全てに対応
米Google Cloudが、大規模データ分析サービスの「BigQuery」で非構造化データをサポートすると発表。これにより、BigQueryは構造化データ(RDB)、半構造化データ(JSON)、非構造化データ全てに対応する。
この記事は新野淳一氏のブログ「Publickey」に掲載された「[速報]BigQueryが非構造化データのサポートを発表。これで構造化データ(RDB)、半構造化データ(JSON)、非構造化データをサポート。Google Cloud Next '22」(2022年10月12日掲載)を、ITmedia NEWS編集部で一部編集し、転載したものです。
米Google Cloudは、開催中のイベント「Google Cloud Next '22」において、大規模データ分析サービスの「BigQuery」で非構造化データのサポートを発表しました。
BigQueryは1月にJSON型データへのネイティブ対応をパブリックプレビューとして公開しています。
参考:BigQueryがJSONにネイティブ対応。SQLでJSONに対するクエリが可能に
これでBigQueryは今回の非構造化データのサポートにより、RDBのテーブルに格納された構造化データと、JSONなどによる半構造化データ、そして非構造化データの3つをすべてサポートする柔軟な大規模データ分析基盤になるわけです。
Google Cloud Storageバケットのテーブル形表現
BigQueryの非構造化データサポートは「Objectテーブル」によって実現され、画像や動画、音声、テキストなどのデータが扱えます。このObjectテーブルは、Google Cloud Storageのバケットのテーブル形表現であると説明されています。
Objectテーブル内のオブジェクトのメタデータに対してSQLによるクエリが可能で、非構造化データに対しては機械学習モデルによる音声認識や画像認識、翻訳、文章処理などの処理が可能。
非構造化データサポートは現在BigQueryのプレビュー機能となっています。
関連記事
- Google Cloudが「Cloud Workstations」発表 セキュアな開発環境一式をマネージドサービスで提供
米Google Cloudが、あらかじめ設定済みのセキュアな開発環境一式をマネージドサービスで提供する「Cloud Workstations」を発表。ローカルマシンに開発環境を置いた場合に発生するであろう多くのセキュリティ上の課題を解決するとしている。 - Googleが日本に約1000億円投資、ネットワークインフラ増強へ 2024年に千葉でデータセンター開設
Googleが日本のネットワークインフラに約1000億円を投資すると発表した。今後、日本とカナダを結ぶ海底ケーブルを開設する他、千葉県印西市に同社初の国内データセンターを開設する。 - GoogleとCoinbaseが提携 Google Cloud料金の暗号通貨支払い対応、CoinbaseはAWSからに移行
GoogleとCoinbaseが提携を発表した。Google Cloudの料金を暗号通貨で支払えるようになる。Coinbaseはアプリの一部をAWSからGoogle Cloudに移行する。 - Google、100兆桁の円周率計算で世界記録更新 GCP活用で 100兆桁目の数字は?
米Googleが、クラウドサービス「Google Cloud」の技術を活用し、100兆桁の円周率を計算することに成功した。同社が円周率計算の世界記録を達成するのは2019年以来2度目。 - Google Cloud、分散クラウドを実現する「Google Distributed Cloud Edge」正式リリース いわば“GCP版AWS Outposts”
Googleが、エッジでワークロードを実行可能にするハードウェアとソフトウェアのフルマネージドサービスを正式リリース。低レイテンシが要求されるワークロードや、クラウドへの転送が望ましくないセンシティブなデータのローカルな処理などを実現するという。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.