「トークン」関連の最新ニュース・レビュー・解説記事まとめ

応答品質を向上させる5つの取り組みとは：AIエージェントのトークン消費を約47％削減　Cursorの「コンテキストエンジニアリング」事例

Anysphereは、コーディングエージェントの性能向上と効率化を実現する「動的コンテキスト探索」の取り組み事例を解説した。トークン消費の抑制やコーディングエージェントの応答品質向上に寄与しているという。

(2026/1/30)

2026年後半にもパートナー企業が製品展開：推論コストを10分の1に？　NVIDIAが次世代AIプラットフォーム「Rubin」発表

NVIDIAは、次世代AIコンピューティングプラットフォーム「Rubin」を発表した。前世代のBlackwellと比較して推論トークンの生成コストを最大10分の1に削減し、大規模モデルのトレーニングに必要なGPU数を4分の1に抑えるという。

(2026/1/29)

クラウドサービスだけじゃない！　ローカルPCやサーバ、Kubernetesで生成AI（10）：トークン破産、情報漏えい、LLM実行遅延――全部「AI Gateway」に任せよう　無料枠で学ぶAIエージェント開発、運用の新常識

気軽に試せるラップトップ環境で、チャットbotを提供するオールインワンの生成AI環境構築から始め、Kubernetesを活用した本格的なGPUクラスタの構築やモデルのファインチューニングまで解説する本連載。今回は、LLMアプリケーション開発や運用で避けて通れない課題を、AI Gatewayで解決するアプローチを解説します。

(2026/1/22)

運用コストも最小限に抑える：NVIDIAやCerebrasをはるかに上回るトークン性能、欧州新興のAIチップ

欧州のAIチップの新興企業であるEuclydは、トークン当たりのコストを低く抑えられるハードウェアアーキテクチャを披露した。同社のチップ「Craftwerk」は、16384個のSIMDプロセッサを搭載し、最大8PFLOPS（FP16）または32PFLOPS（FP4）を実現する。NVIDIAやCerebras Systemsをはるかに上回る、2万トークン/秒を実行できるとする。

(2025/11/6)

セキュリティニュースアラート：Copilot Studioを悪用した新手のOAuth攻撃「CoPhish」　Datadogが警告

DatadogはMicrosoft Copilot Studioを悪用した新たなOAuthフィッシング手法「CoPhish」を発見した。攻撃者はOAuthトークンを奪取し、ユーザーデータに不正アクセスを実行する。

(2025/10/29)

セキュリティニュースアラート：Entra IDにActorトークンを悪用できる認証欠陥　多くのテナントに影響か

Entra IDの認証欠陥により、Actorトークンを悪用した攻撃で任意テナントのGlobal Admin権限を取得できることが分かった。監査不備や署名欠如の問題が指摘されており、Microsoftはこの脆弱性に対しCVEを割り当てて修正している。

(2025/9/23)

「RTXが起こした革命の再来」とCEOが強調：NVIDIA、新GPU「Rubin CPX」発表　数百万トークン規模のAI処理を可能に

NVIDIAは大規模コンテキストを処理するAI用の新GPU「Rubin CPX」を発表した。数百万トークン規模の処理を可能にし、コード生成や映像処理の分野で画期的な性能を実現するという。

(2025/9/18)

継続的デリバリーツール「Argo CD」に深刻な脆弱性、APIトークン経由で認証情報流出の恐れ

継続的デリバリーツール「Argo CD」において、プロジェクト権限を持つAPIトークン経由でリポジトリ認証情報が漏えいする脆弱性（CVE-2025-55190）が報告された。CVSSスコアは9.9（Critical）で、修正版へのアップデートが推奨されている。

(2025/9/5)

ゆうちょ銀行、「トークン化預金」の導入を検討　2026年度中めどに取り扱い開始か

ゆうちょ銀行は9月1日、ブロックチェーン技術を活用した「トークン化預金」の導入を検討していると発表した。ディーカレットDCP（東京都千代田区）のプラットフォームを活用し、2026年度中の取り扱い開始を見込んでいるという。

(2025/9/2)

Deep Insider Brief ― 技術の“今”にひと言コメント：新AIモデル「DeepSeek-V3.1」登場　8400億トークンで強化、思考と即答を両搭載、より長い文章に対応

DeepSeekがLLMの新バージョン「V3.1」を発表。思考と即答の2モードを搭載したハイブリッドモデルに進化し、精度とエージェント機能が強化された。さらにAPIの更新と価格改定も実施された。

(2025/8/28)

まずは「Anthropic API」と「Amazon Bedrock」で利用可能：「Claude Sonnet 4」が100万トークンのコンテキスト処理に対応　Anthropic

Anthropicは2025年8月13日、大規模言語モデル「Claude Sonnet 4」が最大100万トークンのコンテキストを扱えるようになったと発表した。書籍を丸ごと取り込んだり、大規模なコードベースを一度に処理したりできるようになるため、同社は「研究、開発現場に新たな可能性を提供する」としている。

(2025/8/20)

セキュリティニュースアラート：Microsoft Entra IDに潜む特権昇格リスクに要注意　推奨対策は？

DatadogはMicrosoft Entra IDにおける高権限アプリケーションの不適切な構成が特権昇格に悪用される攻撃手法を明らかにした。サービスプリンシパルとドメイン設定権限を通じてSAMLトークンを偽造し、認証をバイパスできるという。対策はあるか。

(2025/7/23)

Anthropic、「Claude 3.5 Haiku」提供開始　前版から4倍の値上げ

Anthropicは10月に発表した高速・低コストが特徴の言語モデル「Claude 3.5 Haiku」の提供を開始した。トークン当たりの価格が先代の「Claude 3 Haiku」の4倍になった。

(2024/11/5)

Mistral AI、スマホでも使える新AIモデル「les Ministraux」リリース

仏AI企業Mistral AIは、デバイス上でのコンピューティングとエッジユースケース向けに設計された最先端モデル「les Ministraux」を発表した。3BモデルのAPIは出力/入力トークン100万個当たり4セントで利用可能だ。

(2024/10/17)

「Llama3.1-70B」で実行：32の同時ユーザーで15トークン/秒　TenstorrentがLLMのデモを披露

Tenstorrentは、同社の「LoudBox」ワークステーションのデモを披露した。Llama3.1-70B（BF8精度）を、32の同時ユーザー数で15トークン／秒／ユーザー（token/s/user）の速度で実行した。

(2024/10/9)

「オープンかつ日本語に強いLLM」を目指し、全部で約2.1兆トークン学習させる：NIIが「学習データ含め全てオープンにした」LLMを公開　学習用日本語データを約5920億トークン用意、コードは何億トークン？

NIIは、約1720億パラメーターの大規模言語モデル「LLM-jp-3 172B beta1」のプレビュー版を公開したと発表した。フルスクラッチ学習で作成され、学習データを含めて全てオープンになっている。

(2024/9/20)

シングルサインオンなどセキュリティ機能やGitHubと統合も：Anthropic、企業用の生成AIアシスタント「Claude Enterprise」を発表　50万トークンのコンテキストウィンドウで何ができるのか

Claudeを開発したAnthropicは、企業用の生成AIアシスタント「Claude Enterprise」のサービス提供を開始した。

(2024/9/9)

AI最大の懸念は依然として信頼性、安全性、品質：「Google I/O 2024」の基調講演から探る、“100万トークン”が意味すること

TechTargetは「Google Gemini AI アップデート」に関する記事を公開した。LLMの性能競争が激しくなる中、生成AIアプリの開発者や利用者にとって本当に必要な性能や機能とは何か？　「Google I/O 2024」の基調講演を通じて探る。

(2024/6/20)

Computer Weekly日本語版＋セレクションMicrosoftの「SASトークン問題」で浮上した“最悪のシナリオ”とは

Microsoftの内部ストレージにアクセスできるトークンが「GitHub」に公開された。技術者のミスによって起きたこの情報漏えいは、「極めて深刻な事態を招く可能性があった」と専門家は見る。起こり得た深刻な事態とは。

(2024/6/19)

80以上のプログラミング言語のデータセットで学習：Mistral AI、コーディング用生成AIモデル「Codestral」を提供開始　3万2000トークンのコンテキストウィンドウを持つ220億パラメーターモデル

Mistral AIは、同社初のコーディングモデル「Codestral」を発表した。コード生成タスク用に設計され、重みが公開されている生成AIモデルだ。

(2024/6/3)

Googleが「Gemini 1.5 Pro」をアップデート、軽量版「Gemini 1.5 Flash」もリリース

米Googleが5月14日（現地時間）、マルチモーダル生成AIモデル「Gemini」のアップデートについて発表した。「Gemini 1.5 Pro」のコンテキストウィンドウを100万トークンから200万トークンに拡張。高速な応答が可能な軽量モデル「Gemini 1.5 Flash」もリリースする。

(2024/5/15)

ロングコンテキストウィンドウの持つ強み：GoogleのLLM「Gemini 1.5 Pro」は最大100万トークンのロングコンテキストウィンドウに対応　どう役立つのか？

GoogleがリリースしたGemini 1.5の強みの一つに、ロングコンテキストウィンドウがある。Googleが実装したロングコンテキストウィンドウとは何か、そしてこの機能が開発者にどのように役立つのか。

(2024/3/14)

Google、「Gemini 1.5 Pro」限定リリース　コンテキストウィンドウは100万トークン

Googleは、生成AIの次世代モデル「Gemini 1.5」を発表した。動画なら1時間、音声なら11時間、コードなら3万行、ワードなら70万語を1度に処理できるとしている。まずはVertex AIとAI Studioユーザーに限定プレビューを提供する。

(2024/2/16)

新春トップインタビュー：「トークン化は決済環境にゲームチェンジをもたらす」　Visa日本法人社長、次の一手

急速に浸透するタッチ決済。そのかじを取る、Visa日本法人社長は何を語るのか。2024年への意気込みを聞く。インタビュー後編。

(2024/1/11)

SASトークンが「GitHub」に流出【後編】Microsoftの「SASトークン問題」で浮上した“最悪のシナリオ”とは？

Microsoft技術者のミスで、同社の内部ストレージにアクセスできるトークンが「GitHub」に公開された。このインシデントは、最悪の事態を引き起こす可能性があったという。背景にある「セキュリティ問題」とは。

(2023/12/11)

OpenAIの競合Anthropic、「Claude 2.1」でコンテキストウィンドウを20万トークンに

OpenAI競合のAhthropicは、ChatGPTと競合する「Claude」をバージョン2.1にアップデートした。コンテキストウィンドウを従来の倍の20万トークンに増やした。「GPT-4 Turbo」は12万8000トークンだ。

(2023/11/22)

OpenAI、改良版生成AIモデル「GPT-4 Turbo」を「GPT-4」より安価に提供へ

OpenAIは開発者会議DevDayで生成AIモデル「GPT-4 Turbo」を発表した。パフォーマンス最適化でGPT-4と比較してトークンの価格を大幅に値下げした。また、トレーニングデータを2023年4月までにした。

(2023/11/7)

サイバーエージェント、再び大規模言語モデルを無料公開　3万2000トークンに対応　商用利用もOK

サイバーエージェントは、商用利用可能な日本語大規模言語モデルを無料公開した。

(2023/11/2)

オープンソースの8Kテキスト埋め込みモデル：OpenAIモデルに匹敵するオープンソースのテキスト埋め込みモデル、Jina AIが公開

Jina AIは、8192トークンのコンテキスト長をサポートするテキスト埋め込みモデル「jina-embeddings-v2」を発表した。

(2023/10/31)

robots.txtに設定を記述して使う「Google-Extended」：Google、Google AIの改良へのサイトコンテンツの使用可否を設定できるWeb管理者向けツールを発表

Googleは、WebパブリッシャーがGoogleの「Bard」や「Vertex AI」の生成API（これらのサービスを支える将来の世代のAIモデルを含む）を改良するために自サイトのコンテンツを使わせるかどうかを設定できるスタンドアロン製品トークン「Google-Extended」を発表した。

(2023/10/4)

MicrosoftのAI研究者が誤って38TBのデータを公開　AI時代に企業が気を付けるべきこととは

WizはMicrosoftのAI研究者がGitHubに38TBのデータを誤って公開したと報じた。SASトークンの設定ミスが原因だと指摘されていて、AI技術採用とセキュリティリスクへの対策が説明されている。

(2023/9/21)

海外医療技術トレンド（99）：世界各地で拡大する医療分野のNFT利用、国内医療機器メーカーも対応を迫られる

本連載第75回で、医療DXの変革ツールとしてブロックチェーン／分散台帳技術を取り上げたが、今回は、医療分野におけるNFT（非代替性トークン）利用について取り上げる。

(2023/9/15)

開発費は1億円超：Rakuten NFTが『HYDE RUN』とコラボした理由　ゲームの高い訴求力を生かす

楽天グループとHYDEが、NFT（非代替性トークン）によって音楽ライブからゲームまで幅広く連携を進めている。『HYDE RUN』を開発・運営するPhoenixx社長と、楽天グループエンタテインメントソリューション事業課の担当者に狙いを聞いた。

(2023/9/2)

医療情報管理にNFTを利用するメリット【後編】医療でこそ「NFT」（非代替性トークン）が大きな期待になる理由

NFT（非代替性トークン）化した医療情報は、医学研究と臨床医療に大きな変化をもたらす可能性がある。研究者が特に重視するのは「患者が自身のデータをNFTで管理すること」が患者に行動変容を促す点だ。その理由は。

(2023/8/8)

医療情報管理にNFTを利用するメリット【中編】医療データの「NFT化」が臨床研究で期待されるのはなぜ？

NFT（非代替性トークン）にした医療情報は、研究をはじめ、医療分野のさまざまな用途に応用できる可能性がある。ブロックチェーンの特性が、医療の領域でどのように役立つのか。専門家の見解は。

(2023/8/1)

SOCRadarの調査、企業が取るべき対策は？：企業のパブリックGitHubリポジトリは機密情報だらけ？　APIキーやトークン、認証情報が複数見つかる

セキュリティ企業SOCRadarは、企業がGitHubのリポジトリに機密情報を誤ってアップロードしていないかどうか調査した結果を発表した。

(2023/7/28)

医療情報管理にNFTを利用するメリット【前編】NFT（非代替性トークン）化が医療分野にも　そもそも患者の利点は？

厳格な管理が必要な医療情報を、代替できないデジタルデータである「NFT」（非代替性トークン）にすることの価値を探る研究が進んでいる。患者にはどのようなメリットがあるのか。

(2023/7/24)

Google、公式アプリストアでのNFT販売を認めるポリシー更新

Googleは、Google Playストアのポリシーを更新し、NFT（非代替性トークン）などのデジタル資産をアプリやゲームに統合できるようにすると発表した。年内にはすべての開発者がNFTをアプリ内で販売できるようになる見込みだ。

(2023/7/13)

セキュリティトークンのデジタル通貨決済、検証結果まとまる　どんなメリットが？

野村ホールディングス、大和証券グループ本社、BOOSTRY、ディーカレットDCPの4社は5月31日、セキュリティトークン（ST）取引におけるデジタル通貨決済の検討結果を公表した。デジタル通貨決済が実現すると、これまでの株式や債券などで必要とされた清算機関が不要となり、自動化された即時決済が可能になる。

(2023/5/31)

三井物産、LayerXと個人向け資産運用サービス「ALTERNA」　不動産をデジタル証券化

LayerXと三井物産が出資する三井物産デジタル・アセットマネジメントは、新たに個人向け資産運用サービス「ALTERNA（オルタナ）」を開始した。不動産をデジタル証券（セキュリティトークン）化し、スマートフォンサイトを通じて販売する。1口10万円と小口化することで、若年層への訴求を図る。

(2023/5/22)

Google支援のAnthropic、ChatGPT競合ツールで超長文プロンプト入力可能に

生成AIを手掛けるAnthropicは、汎用チャットbot「Claude」のコンテキストウィンドウを従来の9000トークから10万トークンに拡張した。これにより、7万語以上の長文プロンプトを投げられるようになった。競合するOpenAIの「ChatGPT」のLLM「GPT-4」の最大モデルでも3万2000トークンだ。

(2023/5/12)

OpenAI、「ChatGPT API」と企業向け専用容量プランの提供開始　「gpt-3.5-turbo」も発表

OpenAIは「ChatGPT API」と「Whisper API」の提供を開始した。ChatGPT APIの価格は1000トークン当たり0.002ドル。Azureの専用インスタンスプランも提供する。

(2023/3/2)

NFT攻撃「8つの手口」と「8つの対策」【第6回】「そのNFTの価格、低過ぎ？」は要注意　「NFT」詐欺の賢い防ぎ方

「NFT」（非代替性トークン）を狙った攻撃に対抗するためには、「基本的なセキュリティ対策」が有効だと考えられる。簡単に実施できる対策とは何か。

(2023/2/22)

コインチェック、IEO第2弾　フィナンシェトークン申込開始　3月7日まで

コインチェックは2月21日、IEOの第2弾としてフィナンシェが発行するフィナンシェトークン（FNCT）の申込受付を開始した。申し込みは3月7日まで。

(2023/2/21)

マネーフォワードME、MetaMaskなどのウォレット内の仮想通貨と連携可能に

マネーフォワードMEが、MetaMaskなどウォレットと連携。イーサリアム、ポリゴン、ERC-20トークンなどの価格を取得できる。

(2023/2/20)

NFT攻撃「8つの手口」と「8つの対策」【第5回】意外と簡単？　「NFT」を狙った攻撃はこうして防ぐ

企業は「NFT」（非代替性トークン）を狙った攻撃に立ち向かうためにはどうすればいいのか。実はその方法は難しいものではない。今すぐに始められるNFT攻撃対抗策とは。

(2023/2/16)

NFT攻撃「8つの手口」と「8つの対策」【第4回】3億円が盗まれたNFT詐欺「投資詐欺」の巧妙な手口

攻撃者はあの手この手を使い、「NFT」（非代替性トークン）を狙っている。企業はさまざまな手口を知り、NFTに対する攻撃に備えなければならない。具体的な手口を説明する。

(2023/2/9)

NFT攻撃「8つの手口」と「8つの対策」【第3回】“無料”を餌にするNFT詐欺「エアドロップ」のあくどい手口

「NFT」（非代替性トークン）を標的にしている攻撃者はソーシャルメディアを使い、ユーザーをだまそうとしている。要注意の手口とは、具体的に何か。

(2023/2/2)

アミューズがリリース：NFTを簡単に楽しめるウォレットサービス「A Wallet」　作品の権利を保護

アミューズは子会社のKulture（仙台市）と開発した、NFT（非代替性トークン）を保有できるウォレットサービス「A Wallet（エーウォレット）」を開始した。

(2023/1/31)

「Web3に乗り遅れてはいけない」　OASトークンがbitbankに上場　ゲーム特化のブロックチェーンOasysとは何か？

ゲーム特化型ブロックチェーン「Oasys（オアシス）」のネイティブトークンであるOASが、3月に仮想通貨取引所のbitbankへ上場する。このOAS、実は国内のメンバーがシンガポールで起業したものだ。いったいどんなブロックチェーンなのか。