最新記事一覧
日本企業は中国製AIの利用に慎重だとされる。しかしその間にも、企業によるAI活用の現場では大きな変化が進行している。性能面では依然として米国のクローズドモデルが上位を占めるものの、実際の利用量では中国発のオープンモデルが急速に存在感を高めている。
()
生成AIのコスト増大とデジタル主権への懸念が情シス部門を直撃している。パブリッククラウドの「トークン課金」による予算圧迫を回避するため、Red Hatは自社環境でAIを運用する「トークンプロバイダー」への転換を提唱した。
()
AIの料金体系が使用量を意識する形へ移りつつある今、「日本語」はAI利用のコストにどれほど影響するのか。GPT-5.5やClaude Opus 4.7など主要モデルを実測し、トークン効率からモデル選びを考える。
()
Gartnerは、2030年までに1兆パラメーターの大規模言語モデルによる推論コストが生成AIプロバイダーにとって2025年比で90%超低下すると予測した。一方、エージェント型AIの普及でトークン需要が増大するため、企業が支出する推論の総コストは増加する見通しだという。
()
GPT-5.5は、ベンチマークだけを見れば絶対王者ではない。それでも開発者が熱狂する理由を、Codexとの組み合わせ、トークン効率、そして“最後まで自走する力”から整理する。
()
AIエージェント運用時のトークン消費増大が企業の課題となりつつある。専門家は「トークンマキシング」による最適化やFinOpsを活用した管理体制の構築を提言する一方、より大きな視点で考えるべきだと指摘する。
()
LLMの利用拡大に伴い、入力・出力トークンの消費増加が課題となっているという声がある。トークンの請求額を膨らませる4つの要因と、増大を誘発させる従業員のアクションを紹介する。
()
GitHubはCopilotの課金体系を6月から従量制へ移行する。月額料金は据え置いたまま、トークン消費量に応じた「AIクレジット」制を導入予定だ。機能高度化に伴うコスト増に対応しつつ、移行後は利用制限の緩和も予定している。
()
シリコンバレーで広がる「トークンマクシング」とは何か。AIをどれだけ使えるかが生産性や評価を左右し始めた現実を追い、日本のソフトウェアエンジニアがどう向き合うべきかを考える。
()
AI導入が加速する一方で、CEOの56%が「投資効果を実感できていない」という厳しい現実がある。予測困難なトークン課金やGPU利用料による「コストの暴走」を防ぐには、クラウド管理の知見を応用した「FinOps for AI」の確立が急務だ。
()
トークンの上限を決めれば費用の目途が立つ。だが、上限に達しない範囲でしかエンジニアが働かなくなる――。この課題に取り組み、コスト最適化とエンジニアの創造性を両立させたAgodaの取り組みを紹介する。
()
npmを標的とした攻撃「CanisterWorm」の新たな改ざんパッケージが見つかった。正規アカウントを侵害してワーム化し、トークン窃取やバックドアを設置する。JFrogは認証情報の更新や特定サービスの削除などの対処手順を示した。
()
Cloudflareは、AI向けにHTMLコンテンツをMarkdown形式に自動変換して配信する「Markdown for Agents」を発表した。AIクローラーやエージェントの増加で構造化データの需要が高まっているという。
()
OpenAIの新モデル「GPT-5.4」が登場した。100万トークンの巨大コンテキストやCodexアプリとの連携により、AIが実務タスクを自律的に完遂する能力が大きく強化されている。本稿では、その特徴と実際の使いどころを整理する。
()
Anthropicは公式ドキュメントを更新し、サブスク版のOAuthトークン利用を自社ツールに限定すると明記した。第三者製ツールやAgent SDKでの利用は規約違反となり、外部連携にはAPIキーの使用が必須となる見通しだ。
()
AWSは、2025年に発生した一連のnpmサプライチェーン攻撃キャンペーンへの対応経験と、そこから得た知見を公開した。
()
Google Cloudは、「Gemini CLI」において、事前構成済みの監視ダッシュボードを提供開始した。ツールの導入状況やトークン消費量、パフォーマンスなどを可視化できるという。
()
Anysphereは、コーディングエージェントの性能向上と効率化を実現する「動的コンテキスト探索」の取り組み事例を解説した。トークン消費の抑制やコーディングエージェントの応答品質向上に寄与しているという。
()
NVIDIAは、次世代AIコンピューティングプラットフォーム「Rubin」を発表した。前世代のBlackwellと比較して推論トークンの生成コストを最大10分の1に削減し、大規模モデルのトレーニングに必要なGPU数を4分の1に抑えるという。
()
気軽に試せるラップトップ環境で、チャットbotを提供するオールインワンの生成AI環境構築から始め、Kubernetesを活用した本格的なGPUクラスタの構築やモデルのファインチューニングまで解説する本連載。今回は、LLMアプリケーション開発や運用で避けて通れない課題を、AI Gatewayで解決するアプローチを解説します。
()
欧州のAIチップの新興企業であるEuclydは、トークン当たりのコストを低く抑えられるハードウェアアーキテクチャを披露した。同社のチップ「Craftwerk」は、16384個のSIMDプロセッサを搭載し、最大8PFLOPS(FP16)または32PFLOPS(FP4)を実現する。NVIDIAやCerebras Systemsをはるかに上回る、2万トークン/秒を実行できるとする。
()
DatadogはMicrosoft Copilot Studioを悪用した新たなOAuthフィッシング手法「CoPhish」を発見した。攻撃者はOAuthトークンを奪取し、ユーザーデータに不正アクセスを実行する。
()
Entra IDの認証欠陥により、Actorトークンを悪用した攻撃で任意テナントのGlobal Admin権限を取得できることが分かった。監査不備や署名欠如の問題が指摘されており、Microsoftはこの脆弱性に対しCVEを割り当てて修正している。
()
NVIDIAは大規模コンテキストを処理するAI用の新GPU「Rubin CPX」を発表した。数百万トークン規模の処理を可能にし、コード生成や映像処理の分野で画期的な性能を実現するという。
()
継続的デリバリーツール「Argo CD」において、プロジェクト権限を持つAPIトークン経由でリポジトリ認証情報が漏えいする脆弱性(CVE-2025-55190)が報告された。CVSSスコアは9.9(Critical)で、修正版へのアップデートが推奨されている。
()
ゆうちょ銀行は9月1日、ブロックチェーン技術を活用した「トークン化預金」の導入を検討していると発表した。ディーカレットDCP(東京都千代田区)のプラットフォームを活用し、2026年度中の取り扱い開始を見込んでいるという。
()
DeepSeekがLLMの新バージョン「V3.1」を発表。思考と即答の2モードを搭載したハイブリッドモデルに進化し、精度とエージェント機能が強化された。さらにAPIの更新と価格改定も実施された。
()
Anthropicは2025年8月13日、大規模言語モデル「Claude Sonnet 4」が最大100万トークンのコンテキストを扱えるようになったと発表した。書籍を丸ごと取り込んだり、大規模なコードベースを一度に処理したりできるようになるため、同社は「研究、開発現場に新たな可能性を提供する」としている。
()
DatadogはMicrosoft Entra IDにおける高権限アプリケーションの不適切な構成が特権昇格に悪用される攻撃手法を明らかにした。サービスプリンシパルとドメイン設定権限を通じてSAMLトークンを偽造し、認証をバイパスできるという。対策はあるか。
()
Anthropicは10月に発表した高速・低コストが特徴の言語モデル「Claude 3.5 Haiku」の提供を開始した。トークン当たりの価格が先代の「Claude 3 Haiku」の4倍になった。
()
仏AI企業Mistral AIは、デバイス上でのコンピューティングとエッジユースケース向けに設計された最先端モデル「les Ministraux」を発表した。3BモデルのAPIは出力/入力トークン100万個当たり4セントで利用可能だ。
()
Tenstorrentは、同社の「LoudBox」ワークステーションのデモを披露した。Llama3.1-70B(BF8精度)を、32の同時ユーザー数で15トークン/秒/ユーザー(token/s/user)の速度で実行した。
()
NIIは、約1720億パラメーターの大規模言語モデル「LLM-jp-3 172B beta1」のプレビュー版を公開したと発表した。フルスクラッチ学習で作成され、学習データを含めて全てオープンになっている。
()
Claudeを開発したAnthropicは、企業用の生成AIアシスタント「Claude Enterprise」のサービス提供を開始した。
()
TechTargetは「Google Gemini AI アップデート」に関する記事を公開した。LLMの性能競争が激しくなる中、生成AIアプリの開発者や利用者にとって本当に必要な性能や機能とは何か? 「Google I/O 2024」の基調講演を通じて探る。
()
Microsoftの内部ストレージにアクセスできるトークンが「GitHub」に公開された。技術者のミスによって起きたこの情報漏えいは、「極めて深刻な事態を招く可能性があった」と専門家は見る。起こり得た深刻な事態とは。
()
Mistral AIは、同社初のコーディングモデル「Codestral」を発表した。コード生成タスク用に設計され、重みが公開されている生成AIモデルだ。
()
米Googleが5月14日(現地時間)、マルチモーダル生成AIモデル「Gemini」のアップデートについて発表した。「Gemini 1.5 Pro」のコンテキストウィンドウを100万トークンから200万トークンに拡張。高速な応答が可能な軽量モデル「Gemini 1.5 Flash」もリリースする。
()
GoogleがリリースしたGemini 1.5の強みの一つに、ロングコンテキストウィンドウがある。Googleが実装したロングコンテキストウィンドウとは何か、そしてこの機能が開発者にどのように役立つのか。
()
Googleは、生成AIの次世代モデル「Gemini 1.5」を発表した。動画なら1時間、音声なら11時間、コードなら3万行、ワードなら70万語を1度に処理できるとしている。まずはVertex AIとAI Studioユーザーに限定プレビューを提供する。
()
急速に浸透するタッチ決済。そのかじを取る、Visa日本法人社長は何を語るのか。2024年への意気込みを聞く。インタビュー後編。
()
Microsoft技術者のミスで、同社の内部ストレージにアクセスできるトークンが「GitHub」に公開された。このインシデントは、最悪の事態を引き起こす可能性があったという。背景にある「セキュリティ問題」とは。
()
OpenAI競合のAhthropicは、ChatGPTと競合する「Claude」をバージョン2.1にアップデートした。コンテキストウィンドウを従来の倍の20万トークンに増やした。「GPT-4 Turbo」は12万8000トークンだ。
()
OpenAIは開発者会議DevDayで生成AIモデル「GPT-4 Turbo」を発表した。パフォーマンス最適化でGPT-4と比較してトークンの価格を大幅に値下げした。また、トレーニングデータを2023年4月までにした。
()
サイバーエージェントは、商用利用可能な日本語大規模言語モデルを無料公開した。
()
Jina AIは、8192トークンのコンテキスト長をサポートするテキスト埋め込みモデル「jina-embeddings-v2」を発表した。
()
Googleは、WebパブリッシャーがGoogleの「Bard」や「Vertex AI」の生成API(これらのサービスを支える将来の世代のAIモデルを含む)を改良するために自サイトのコンテンツを使わせるかどうかを設定できるスタンドアロン製品トークン「Google-Extended」を発表した。
()
WizはMicrosoftのAI研究者がGitHubに38TBのデータを誤って公開したと報じた。SASトークンの設定ミスが原因だと指摘されていて、AI技術採用とセキュリティリスクへの対策が説明されている。
()
本連載第75回で、医療DXの変革ツールとしてブロックチェーン/分散台帳技術を取り上げたが、今回は、医療分野におけるNFT(非代替性トークン)利用について取り上げる。
()
楽天グループとHYDEが、NFT(非代替性トークン)によって音楽ライブからゲームまで幅広く連携を進めている。『HYDE RUN』を開発・運営するPhoenixx社長と、楽天グループエンタテインメントソリューション事業課の担当者に狙いを聞いた。
()