最新記事一覧
Snowflakeが企業向けエージェント型AIアプリ開発を支援する開発者ツール群を発表した。データ品質・セキュリティ向上機能も強化する。
()
センサーやアプリケーションから届く大量のデータをすぐに処理して活用したい――。それに応えるのが「ストリーム処理」だ。ストリーム処理の歴史を踏まえ、現状はどのような実装方法があるのかを解説する。
()
生成AIアプリケーションの構築における柔軟性や拡張性の点で「LangChain」が注目を集めている。LangChainを開発現場で活用するための応用方法と、導入時のベストプラクティスを紹介する。
()
大手IT企業が、自社サービスで「Apache Iceberg」形式のデータテーブルを扱えるようにする動きが進んでいる。データレイクとDWH双方の特徴を持つ「データレイクハウス」の土台になる、Apache Icebergの仕組みとは。
()
Qlikが新たに発表した「Open Lakehouse」は、リアルタイム性と柔軟性を両立しつつ、最大50%のコスト削減と2.5〜5倍の処理速度を実現する。「Iceberg」に対応し、AI時代のデータ基盤構築を支える。
()
あらゆるベンダーがAIへの対応、AI機能の取り込みを急ぐ中、Snowflake共同創業者の一人であるクルアネス氏は「AIは私たちが直面する最後の(技術)革命ではない」と状況を分析する。Snowflakeの狙いはどこにあるのだろうか。
()
生成AIの非決定論的な性質と固有の課題に対処するには、特別な専門知識やノウハウが必要となる。AIエンジニアリングは米国で最も急増している役割の一つだ。本稿では、AIエンジニアの役割と、AIエンジニアに不可欠な主要な技術的スキルについて紹介する。
()
データ分析の要となるDWHは、クラウドサービスの普及期を迎えて大きな転換点にある。従来型のオンプレミスDWHの“3層構造”とは何か。クラウドDWHの主要サービスは。
()
Dell Technologiesは「Dell AI Factory」の拡張を発表した。AIワークロード向けの最新サーバやデータ管理ソリューション、専門サービスを提供する。
()
AIアプリケーション開発において、適切なプログラミング言語を選択することは重要な要素の一つだ。AIプロジェクトではどのようなプログラミング言語が選択肢となるのか。
()
Python Software Foundationは、Python開発者を対象とした調査レポート「Python Developers Survey 2023」を発表した。本記事では主な調査結果を取り上げる。
()
Databricksは年次イベントでAIプラットフォームとしての機能強化を発表した。併せて、AI開発の効率化と低コスト化に向けた新機能も発表した。企業が本番環境で自社固有のAIを活用するための環境を着々と整えつつある。
()
Snowflakeは、「Apache Iceberg」形式でベンダー中立のオープンカタログ実装「Polaris Catalog」を発表した。Apache Icebergは、データレイクハウスやデータレイクなどのモダンアーキテクチャの実装に広く使われているオープンソースデータテーブル形式だ。
()
AI企業のDatabricksは“オープンな”汎用LLM「DBRX」をリリースした。サイズは1320億パラメータとMetaのLlama 2のほぼ2倍だが、速度もLlama 2の2倍という。
()
「クラウドネイティブ」という言葉がなじんだ今、市場に登場した新たなデータベースやデータベースを支えるプラットフォームにまつわる情報を紹介していきます。今回は「KubeCon+CloudNativeCon North America 2023」で気になった内容をお届けします。
()
Linux Foundationはデータレイク上にレイクハウスアーキテクチャを構築できるオープンソースのストレージフレームワークの最新版「Delta Lake 3.0」の一般提供を開始した。
()
SSDにデータ処理機能を組み込んだコンピュテーショナルストレージには幾つかの種類があり、さまざまな製品が登場してきている状況だ。注目製品と、コンピュテーショナルストレージの種類を紹介しよう。
()
Databricks日本法人トップに、ビジネスアプリケーションデータを深く理解する人物が就任した。日本企業におけるデータ活用やAI活用のこれからについて話を聞いた。
()
クラウドDWH「Snowflake」は、データドリブン経営などデータ活用のためのプラットフォームとして注目を集めている。新たにアプリ開発ができるようになったSnowflakeは、どのような進化を遂げたのか。
()
「Microsoft Intelligent DataPlatform」は何を実現するのか。課題を解決するというが果たして。
()
グローバルに活躍するエンジニアを紹介する本連載。前回に引き続き、GAテクノロジーズのAaron Bramson(アーロン・ブラムソン)さんにお話を伺う。同氏が語る「サイエンス」と「エンジニアリング」との違いとは。
()
AWS re:Inventの2日目には同社のCEO(最高経営責任者)であるアダム・セリプスキー氏が登場し、13の新たなサービスを発表した。本稿は全てを解説する。
()
RustでWebアプリケーションを開発する際に基礎となる要素技術からRustの応用まで、Rustに関するあれこれを解説する本連載。第3回は、Rust製の高速データ分析ライブラリであるPolarsの速度を簡易的に検証し、考察する。
()
Google CloudはGoogle Cloud Next '22で、「BigLake」のデータ形式サポートを強化し、「BigQuery」では非構造化データに対応、「Vertex AI」では動画を使った機械学習アプリケーション開発を効率化する「Vertex AI Vision」を発表した。
()
Gartnerには、「ビッグデータ」に関する問い合わせが継続して寄せられているが、「Apache Hadoop」についての問い合わせは多くない。本稿では、Hadoopの現状と今後の動向について考察する。
()
「ハイパースケーラー」として世界的にも高いシェアを誇るAWSが、モダンデータ分析環境の提供に本気を出す。主要なサービスをサーバレスで提供し、スケーラブルなデータ分析環境をオンデマンドで利用できるようになる見込みだ。
()
Stack Overflowは2022年の年次ソフトウェア開発者調査の結果を発表した。よく使われている技術や愛されている技術、年収の高い技術、雇用や勤務形態などの最新動向が明らかになった。
()
データ経営の重要性の高まりを受け、AI活用を含めてデータの潜在能力を最大限に引き出す必要性が生まれている。だが従来のデータウェアハウスではパフォーマンスが足りないだけでなく、複雑かつ非常に高価で投資に見合った価値を発揮し切れていない。
()
AutoML OSSを紹介する本連載最終回は連載内で紹介したOSSの比較と、これまでに紹介できなかった幾つかのOSSやAutoMLクラウドサービスを概説します。
()
マーケティング分析で用いられているデータ基盤サービスを活用した、リクルートの「次世代セキュリティDWH」の構築事例を中心に、最新のセキュリティログ基盤の動向を紹介する連載。今回は、どのような思想とこだわりを持ってシステムを設計したのか解説する。
()
データウェアハウスもデータレイクも限界が見えた今、各社は「次世代型データウェアハウス」で市場をリードしようとしている。最後に生き残るアーキテクチャとは?
()
AWSがアナリティクスサービススイートに向けた3つの新しいサーバレスオプションの提供を開始した。サーバレスサービスのメリットとは何か。
()
Google CloudはGoogle Cloud Next '21で、「BigQuery Omni」「Dataplex」「Spark on Google Cloud」「Vertex AI Workbench」「Cloud Spanner」など、データ関連の発表を多数行った。最大のテーマはマルチクラウドや社内に分散するデータの統合利用。
()
システム連携の課題は、相手のシステムにどう対応させるかにある。個別対応では開発リソースとコストがかかり過ぎる。OSSの分散イベントストリーミング基盤である「Apache Kafka」がそうした課題を解決する。
()
GPUによるデータ処理を高速化するNVIDIAの「GPUDirect Storage」は、大量のデータを扱う用途で活用が進む可能性がある。その可能性を考える上では、ストレージベンダーの取り組みが鍵になる。
()
日立造船は、新たなデータ分析基盤として、データブリックスの「レイクハウスプラットフォーム」を導入。課題だった大規模データの分析、分析ナレッジの共有、機械学習モデルの効率的な運用管理などを実現した。
()
データレイクの構築を決断したとして、オンプレミスで運用するのが適切なのか。クラウドを利用すべきなのか。各社の製品とサービスを紹介する。
()
2021年はビジネスそのもののスピードを加速させる技術に注目が集まるだろう。リアルタイムのデータ処理を可能にする技術分野や、機械学習モデル開発の効率化、といったトレンドを探る。
()
オープンソースソフトウェアとクラウドを軸に統合データ分析プラットフォームを提供するDatabricksが日本法人を設立。マーケターが注目すべきポイントをまとめた。
()
「Docker」の普及で利用が広がったコンテナ。その大規模運用の際に威力を発揮するのが「コンテナオーケストレーター」です。「Kubernetes」などの主要なコンテナオーケストレーターを紹介します。
()
JetBrainsは、開発者エコシステムの現状に関する4回目の年次調査の結果をまとめたレポート「The State of Developer Ecosystem 2020」を発表した。開発者がどのようにビッグデータを分析しているかについても調べた。
()
The Linux Foundationは「MLflow」を新たにLinux Foundationプロジェクトに加えた。MLflowは、Databricksが開発した、特定の機械学習フレームワークや言語に依存しない機械学習向けプラットフォーム。機械学習の開発ライフサイクルを管理する。
()
日本ヒューレット・パッカードは2020年5月14日、Kubernetesによるコンテナ基盤ソフトウェア、「HPE Container Platform」を同日に国内で提供開始したと発表した。企業における統合データ分析基盤として推進するという。
()
日本オラクルは、データ分析や機械学習に向けたクラウドサービス「Oracle Cloud Data Science Platform」を発表した。複数のアルゴリズムとハイパーパラメータ構成に対するテストプロセスを自動化するなど、機械学習に向けた自動化機能を備える。
()
NoSQLデータベース、インメモリデータベースが成熟し、リレーショナルデータベースの代替たり得る存在となった。さらにマイクロサービス化がこの流れを後押ししている。
()
Amazon Web Services(AWS)は12月第1週に開催した「AWS re:Invent 2019」で、同社が定義する意味での「値下げ」は発表しなかった。代わりに、インフラ関連では自社開発ハードウェアの活用をはじめ、「あの手この手」でパフォーマンスあるいはコストパフォーマンスを向上させる自社の取り組みをアピールした。
()
セキュリティ業務における「ログ」と、その分析基盤の活用について解説する連載。今回は、ログ分析基盤の設計ポイントを、アーキテクチャの観点から紹介します。
()
マクニカ アルティマ カンパニーは、「インテル FPGA PAC」を使用したソリューションの導入支援のため、検証用プラットフォーム「FPGA アクセラレーション・ラボ」の無償提供を開始した。
()