最新記事一覧
AI企業のDatabricksは“オープンな”汎用LLM「DBRX」をリリースした。サイズは1320億パラメータとMetaのLlama 2のほぼ2倍だが、速度もLlama 2の2倍という。
()
「クラウドネイティブ」という言葉がなじんだ今、市場に登場した新たなデータベースやデータベースを支えるプラットフォームにまつわる情報を紹介していきます。今回は「KubeCon+CloudNativeCon North America 2023」で気になった内容をお届けします。
()
Linux Foundationはデータレイク上にレイクハウスアーキテクチャを構築できるオープンソースのストレージフレームワークの最新版「Delta Lake 3.0」の一般提供を開始した。
()
SSDにデータ処理機能を組み込んだコンピュテーショナルストレージには幾つかの種類があり、さまざまな製品が登場してきている状況だ。注目製品と、コンピュテーショナルストレージの種類を紹介しよう。
()
Databricks日本法人トップに、ビジネスアプリケーションデータを深く理解する人物が就任した。日本企業におけるデータ活用やAI活用のこれからについて話を聞いた。
()
クラウドDWH「Snowflake」は、データドリブン経営などデータ活用のためのプラットフォームとして注目を集めている。新たにアプリ開発ができるようになったSnowflakeは、どのような進化を遂げたのか。
()
「Microsoft Intelligent DataPlatform」は何を実現するのか。課題を解決するというが果たして。
()
グローバルに活躍するエンジニアを紹介する本連載。前回に引き続き、GAテクノロジーズのAaron Bramson(アーロン・ブラムソン)さんにお話を伺う。同氏が語る「サイエンス」と「エンジニアリング」との違いとは。
()
AWS re:Inventの2日目には同社のCEO(最高経営責任者)であるアダム・セリプスキー氏が登場し、13の新たなサービスを発表した。本稿は全てを解説する。
()
RustでWebアプリケーションを開発する際に基礎となる要素技術からRustの応用まで、Rustに関するあれこれを解説する本連載。第3回は、Rust製の高速データ分析ライブラリであるPolarsの速度を簡易的に検証し、考察する。
()
Google CloudはGoogle Cloud Next '22で、「BigLake」のデータ形式サポートを強化し、「BigQuery」では非構造化データに対応、「Vertex AI」では動画を使った機械学習アプリケーション開発を効率化する「Vertex AI Vision」を発表した。
()
Gartnerには、「ビッグデータ」に関する問い合わせが継続して寄せられているが、「Apache Hadoop」についての問い合わせは多くない。本稿では、Hadoopの現状と今後の動向について考察する。
()
「ハイパースケーラー」として世界的にも高いシェアを誇るAWSが、モダンデータ分析環境の提供に本気を出す。主要なサービスをサーバレスで提供し、スケーラブルなデータ分析環境をオンデマンドで利用できるようになる見込みだ。
()
Stack Overflowは2022年の年次ソフトウェア開発者調査の結果を発表した。よく使われている技術や愛されている技術、年収の高い技術、雇用や勤務形態などの最新動向が明らかになった。
()
データ経営の重要性の高まりを受け、AI活用を含めてデータの潜在能力を最大限に引き出す必要性が生まれている。だが従来のデータウェアハウスではパフォーマンスが足りないだけでなく、複雑かつ非常に高価で投資に見合った価値を発揮し切れていない。
()
AutoML OSSを紹介する本連載最終回は連載内で紹介したOSSの比較と、これまでに紹介できなかった幾つかのOSSやAutoMLクラウドサービスを概説します。
()
マーケティング分析で用いられているデータ基盤サービスを活用した、リクルートの「次世代セキュリティDWH」の構築事例を中心に、最新のセキュリティログ基盤の動向を紹介する連載。今回は、どのような思想とこだわりを持ってシステムを設計したのか解説する。
()
データウェアハウスもデータレイクも限界が見えた今、各社は「次世代型データウェアハウス」で市場をリードしようとしている。最後に生き残るアーキテクチャとは?
()
AWSがアナリティクスサービススイートに向けた3つの新しいサーバレスオプションの提供を開始した。サーバレスサービスのメリットとは何か。
()
Google CloudはGoogle Cloud Next '21で、「BigQuery Omni」「Dataplex」「Spark on Google Cloud」「Vertex AI Workbench」「Cloud Spanner」など、データ関連の発表を多数行った。最大のテーマはマルチクラウドや社内に分散するデータの統合利用。
()
システム連携の課題は、相手のシステムにどう対応させるかにある。個別対応では開発リソースとコストがかかり過ぎる。OSSの分散イベントストリーミング基盤である「Apache Kafka」がそうした課題を解決する。
()
GPUによるデータ処理を高速化するNVIDIAの「GPUDirect Storage」は、大量のデータを扱う用途で活用が進む可能性がある。その可能性を考える上では、ストレージベンダーの取り組みが鍵になる。
()
日立造船は、新たなデータ分析基盤として、データブリックスの「レイクハウスプラットフォーム」を導入。課題だった大規模データの分析、分析ナレッジの共有、機械学習モデルの効率的な運用管理などを実現した。
()
データレイクの構築を決断したとして、オンプレミスで運用するのが適切なのか。クラウドを利用すべきなのか。各社の製品とサービスを紹介する。
()
2021年はビジネスそのもののスピードを加速させる技術に注目が集まるだろう。リアルタイムのデータ処理を可能にする技術分野や、機械学習モデル開発の効率化、といったトレンドを探る。
()
オープンソースソフトウェアとクラウドを軸に統合データ分析プラットフォームを提供するDatabricksが日本法人を設立。マーケターが注目すべきポイントをまとめた。
()
「Docker」の普及で利用が広がったコンテナ。その大規模運用の際に威力を発揮するのが「コンテナオーケストレーター」です。「Kubernetes」などの主要なコンテナオーケストレーターを紹介します。
()
JetBrainsは、開発者エコシステムの現状に関する4回目の年次調査の結果をまとめたレポート「The State of Developer Ecosystem 2020」を発表した。開発者がどのようにビッグデータを分析しているかについても調べた。
()
The Linux Foundationは「MLflow」を新たにLinux Foundationプロジェクトに加えた。MLflowは、Databricksが開発した、特定の機械学習フレームワークや言語に依存しない機械学習向けプラットフォーム。機械学習の開発ライフサイクルを管理する。
()
日本ヒューレット・パッカードは2020年5月14日、Kubernetesによるコンテナ基盤ソフトウェア、「HPE Container Platform」を同日に国内で提供開始したと発表した。企業における統合データ分析基盤として推進するという。
()
日本オラクルは、データ分析や機械学習に向けたクラウドサービス「Oracle Cloud Data Science Platform」を発表した。複数のアルゴリズムとハイパーパラメータ構成に対するテストプロセスを自動化するなど、機械学習に向けた自動化機能を備える。
()
NoSQLデータベース、インメモリデータベースが成熟し、リレーショナルデータベースの代替たり得る存在となった。さらにマイクロサービス化がこの流れを後押ししている。
()
Amazon Web Services(AWS)は12月第1週に開催した「AWS re:Invent 2019」で、同社が定義する意味での「値下げ」は発表しなかった。代わりに、インフラ関連では自社開発ハードウェアの活用をはじめ、「あの手この手」でパフォーマンスあるいはコストパフォーマンスを向上させる自社の取り組みをアピールした。
()
セキュリティ業務における「ログ」と、その分析基盤の活用について解説する連載。今回は、ログ分析基盤の設計ポイントを、アーキテクチャの観点から紹介します。
()
マクニカ アルティマ カンパニーは、「インテル FPGA PAC」を使用したソリューションの導入支援のため、検証用プラットフォーム「FPGA アクセラレーション・ラボ」の無償提供を開始した。
()
同社が東京都内で開催したユーザーイベント「C&Cユーザーフォーラム&iEXPO2019」(2019年11月7〜8日)では、最新の「SX-Aurora TSUBASA」アーキテクチャを搭載したベクトルプロセッサなどを展示。また、2019年11月1日からはメモリ帯域を強化した新製品の受注も開始している。
()
ビッグデータ分析が注目されて久しいが、現代のビジネス界ではITの進歩に伴い、取得できるデータの量や種類が増大している。そのため企業側も、データ分析基盤のアーキテクチャを見直し、膨大なデータの処理に対応しなければならない。日本マイクロソフトはこのほど開催したセミナーで、これからの時代に適したデータ分析基盤の仕組みとして「ラムダアーキテクチャ」を挙げ、自社のクラウドサービス「Microsoft Azure」を使って構築する方法をレクチャーした。
()
AMDの新サーバCPU、「第2世代EPYC(エピック)」が、ユーザーからの熱い注目を集めている。CPU性能、コア密度、I/O性能、価格性能比など、分かりやすいメリットをもたらすからだ。だが、新CPUの恩恵をどこまで享受できるかどうかは、「何に載せるか」に大きく依存するという。具体的にはどういうことなのだろうか。日本AMDの中村正澄氏とDell Technologiesの岡野家和氏に話を聞いた。
()
農業機器大手のAGCOは「Amazon Redshift」「Amazon SageMaker」などのAWSサービスを利用して、AIベースの新しいマーケティングツールと顧客向けポータルの開発を進めている。競合がひしめく市場で勝ち残るためだ。
()
Microsoftがデータガバナンスツールを手掛ける新興企業BlueTalonを買収した。Azure Data Governanceチームに統合し、データプライバシーとガバナンスを強化していく狙い。
()
Googleは「Google Cloud Platform」(GCP)のサービスとして、ビッグデータ分析サービスを提供している。主要な10種類のうち、「BigQuery」を含む5種類を紹介する。
()
2010年の提供開始以来、「SAP HANA」はさまざまな変化を遂げてきた。その主要な機能と用途を紹介する。
()
「データ活用」という言葉が定着した裏側で、それを支えるデータウェアハウスの技術や機能は変化し続けている。クラウドからAI、企業による購入モデルの変化まで、データウェアハウスの20年間を知る人物に聞いた。
()
オープンソースソフトウェアも活用し、AIプラットフォームの強化を続けるMicrosoft。バイスプレジデントのガスリー氏は、競合他社とは異なる戦略があると語る。
()
小売業が「Amazonプライム」に対抗するためのサービスを提供するShopRunnerは機械学習をどう活用しているのか。同社データサイエンス部門トップが語った。
()
竹中工務店はメルセデス・ベンツとコラボした体験施設「EQ House」で、ビルオートメーションシステムとAIを融合させ、次世代のビル設備管理に向けた実証実験を行う。将来的には、ビル設備や居住者データのビッグデータを解析し、AIによる居住者ごとに最適な照明や空調などを提供することも見込む。
()
厳しいコスト削減要請やデジタルトランスフォーメーション(DX: Digital transformation)を背景に、オープンソースソフトウェア(OSS: Open Source Software)の活用が拡大している。コストを抑えながら、必要なソフトウェアを自由に利用したり組み合わせたりできる点はOSSの大きな利点だが、脆弱性情報の収集・管理をはじめ、セキュリティリスクにもしっかりと対応しなければ甚大なダメージを被るリスクも隠れている。だが、ただでさえ多忙な業務の中、一体どうすれば多種多様なOSSの脆弱性情報を確実に収集・管理できるのだろうか? 日立製作所(以下、日立) に話を聞いた。
()
インサイトテクノロジーが新たに販売開始したデータベース移行支援ツールが「Insight Database Testing」だ。ユーザーは移行先データベースでSQL文を実行した結果を確認し、その場でSQL文の修正とテスト実行ができる。
()