最新記事一覧
経済産業省の「製造業ベンチマークワーキンググループ」の第4回会合で、排出量取引制度における電解ソーダ工業、板ガラス、ガラスびん、自動車製造業のベンチマーク及び排出枠割当量算定式の案が示された。
()
米Appleが10月15日に発表した、「M5」チップを搭載した「MacBook Pro (14-inch, M5)」を細かくチェックしてみました。インタフェースから付属品、各種ベンチマーク結果を紹介します。
()
インフレや景気後退など不確実な経済環境の中、企業はコスト見直しを迫られている。サイバーセキュリティ投資も例外ではない。本稿ではベンチマークを活用し、サイバーセキュリティのビジネス価値を可視化して資金確保につなげる方法を解説する。
()
2026年度から始まる排出量取引制度。その制度設計を検討している経済産業省の「排出量取引制度小委員会」の第4回会合では、業種横断的論点や排出枠割当て水準の考え方が示された。
()
ThinkPad P14s Gen 6 AMDのどこに魅力を感じたのか、外観や各種ベンチマークテストなど、さまざまな角度から紹介しよう。
()
2026年度から始まる排出量制度。経済産業省の「製造業ベンチマークワーキンググループ」の第3回会合では、アルミニウム、石灰、カーボンブラック、ゴム製品製造業について、排出枠の割り当ての基準となるベンチマーク案が示された。
()
最上位モデル「Grok 4」と同等の性能を保ちながらコストを47分の1に削減し、数学ベンチマークでは90%超の精度を達成。Webでは無料かつ回数制限なしで利用でき、開発者向けにも格安APIが用意されている。
()
資源エネルギー庁の「発電ベンチマーク検討ワーキンググループ」の第2回会合が開催。排出量取引制度における発電部門向け発電ベンチマークの「対象者」や、「対象範囲(バウンダリー)」に関する検討が行われた。
()
米Appleが9月10日に発表した、新型iPhone「iPhone 17」「iPhone 17 Pro」「iPhone 17 Pro Max」「iPhone Air」について、ベンチマーク「Geekbench 6」で計測した結果が投稿されている。
()
OpenAIは大規模言語モデルにおける「幻覚」(ハルシネーション)問題について、学習構造と評価方法に起因することを明らかにした。推測を優先する評価体系が誤答を助長し、正答率のみを重視する現行のベンチマークでは信頼性が損なわれると指摘している。
()
2026年度から始まる排出量制度。経済産業省の「製造業ベンチマークワーキンググループ」の第2回会合では鉄鋼業及びセメント製造業について、排出枠の割り当ての基準となるベンチマーク案が示された。
()
NEDOとSyntheticGestaltが開発した「SG4D10B」は、4D技術と100億件の化合物データを活用し創薬ベンチマークで世界首位を獲得。小型版公開や企業連携を進め、国際展開と次世代モデル開発で幅広い分野の研究効率化に寄与する。
()
パナソニック コネクトの「Let's note SC」シリーズは、最小最軽量モデルながら、アスペクト比が3:2のディスプレイによって視認性を確保することで、コンパクトボディーによる実用上の制約は感じにくい。ベンチマークテストで実力を検証してみた。
()
2026年度からの開始が予定されている排出量取引制度。その制度設計を検討する「排出量取引制度小委員会」の第2回会合では、ベンチマークやグランドファザリングにおける基準活動量・排出量の考え方、具体的な算定方法の詳細などが議論された。
()
Evidentによると、テクノロジーの拡張に向けてツールや人材に多額の投資を行っている保険業界において、AXAなど5社がその動向を示すベンチマークとなる存在だという。
()
2026年度から始まる排出量取引制度。対象事業者に対する「排出枠」の割当方法の検討に向けて、政府は「製造業ベンチマークワーキンググループ(WG)」を新設。製造業におけるベンチマークの適用対象の特定と、割当量の算定式の具体化に向けた検討を開始した。
()
ELYZAは、日本語版の医療LLM基盤「ELYZA-LLM-Med」シリーズを開発した。汎用モデルは国内最高性能、現場の医療タスクではグローバルトップ水準を超える精度を達成している。
()
Microsoftは、開発中のAI「MAI-DxO」が医療診断の精度で人間の医師を大幅に上回ったと発表した。新しいベンチマークによる評価では、AIの診断精度が80%に達し、経験豊富な医師の20%を大きく超えた。診断コストの削減効果も示された。
()
今回取り上げるのは「GeForce RTX 5070 Laptop GPU」を搭載したモデルで、直販価格は43万9800円となっている。以前レビューしたGeforce RTX 5070 Ti Laptop GPU搭載の「ROG Zephyrus G14(2025)」と各種ベンチマークテストのスコアを比較しながら、GeForce RTX 5070 Laptop GPUの性能をチェックしていきたい。
()
LLMの性能を評価したい場合、どのベンチマークを使えばいいのか。ベンチマークごとに得意分野はあるのか。LLM選定の鍵となる、主要なベンチマークとその特徴を紹介する。
()
自分が使っているLLMの性能はどの程度なのか。そもそもLLMの性能を評価するにはどうすればよいのか。そうした疑問を解消する、LLMの「ベンチマーク」や実施方法を紹介する。
()
リコーは図表を含む文書の読み取りに対応したLMMの基本モデルの開発を完了した。日本語の質問応答データセット「JDocQA」や独自開発のベンチマークツールによる検証の結果、他のモデルと比較しても優れた性能を示すことを確認したという。
()
Xiaomiが、独自開発のスマートフォン向け3nmプロセス採用SoCを正式に発表した。最先端の第2世代3nmプロセスを採用し、最大動作周波数3.9GHzのArm Cortex-X925コア2つを含む10コアのCPUおよび16コアのArm Immortalis-G925 GPUなどを搭載。スマートフォンの性能を数値化する「AnTuTuベンチマーク」で300万スコアを達成しているという。
()
Googleは、複雑な問題に取り組むためのリーズニングモデル「Gemini 2.5」を発表した。最初のリリースとなる「Gemini 2.5 Pro Experimental」は、一般的なさまざまなベンチマークで最先端の性能を示しており、特にリーズニング能力とコーディング能力に優れているという。
()
「JetBrains AI Assistant」がマルチモデルに対応:JetBrainsがOpenAI、Google、Anthropicの11モデルをベンチマーク比較 速度や知能別で優れたモデルを紹介
JetBrainsは、「JetBrains AI Assistant」がマルチモデルに対応し、開発者がタスクに応じて最適な大規模言語モデルを選択できるようになったことを受け、OpenAI、Google、Anthropicの主要モデルのベンチマーク比較結果を公式ブログで紹介した。
()
パナソニック ホールディングスと統計数理研究所は、材料の組成からその結晶構造を高速で高精度に予測するMLアルゴリズム「ShotgunCSP」を開発した。結晶構造予測のベンチマークにおいて世界最高性能を達成したという。
()
まもなく発売される「モンスターハンターワイルズ」のPC版ベンチマークテストにおいて、「性能が良い」とされるGPUでスコアが奮わないという現象が見受けられる。その理由を考察しつつ
()
ドライバがある程度成熟した今、Intel Arc A750はどの程度のパフォーマンスを発揮するのか筆者としても非常に気になるので、ベンチマークテストを通して実力をチェックしてみた。
()
製品紹介を踏まえつつ、ベンチマークテストやゲームプレイでその実力をチェックしていこう。
()
2月28日の発売に先駆けて、カプコンがWindows版「モンスターハンターワイルズ」のベンチマークテストアプリを公開した。ゲーム本編と同様にSteam Storeを通した配信となっており、ダウンロードするにはSteamアカウントとSteamアプリが必要となる。
()
カプコンは5日、「モンスターハンターワイルズ」発売を前に、PCの性能を測定できるベンチマークソフトをSteamで公開した。
()
SOLIZEは、スーパーエンプラ対応3Dプリンタ「ARGO 500 HYPERSPEED」の販売、装置導入サポートを開始した。同社の豊田工場にも導入し、検証や製作支援、装置検討用ベンチマークを受け付ける。
()
NTTコム オンライン・マーケティング・ソリューション(東京都品川区)がNPSベンチマーク調査2024ネット証券部門を実施した。
()
日本HPのAI PC3モデル(Intel/AMD/Qualcomm)を用意し、ベンチマークテストでそれぞれの得手不得手をチェックした。
()
日本HPのAI PC3モデル(Intel/AMD/Qualcomm)を用意し、ベンチマークテストでそれぞれの得手不得手をチェックした。
()
Google DeepMindが大規模言語モデル(LLM)の「事実性」と「根拠」を評価する新たなベンチマークを公開した。AAI開発コミュニティーにツールの活用と評価を呼び掛けている。
()
Core Ultra 200Sのベンチマークテスト結果にばらつきがある――そのことを受けて、Intelがその対応策を公表した。CES 2025でも追加の対策が発表されるという。
()
米Googleは、動画生成AI「Veo 2」を発表した。最大4Kの解像度で数分尺の動画を作成できる。米Metaのベンチマーク「MovieGenBench」で他の動画生成AIと性能を比べたところ、米OpenAIの動画生成AI「Sora Turbo」などよりも高い性能を記録したとしている。
()
NTTコム オンライン・マーケティング・ソリューションは友人や同僚に薦めたい自動車を調べた「NPSベンチマーク調査2024自動車部門」の調査結果を発表した。
()
Alibaba CloudのQwenチームは、推論能力の向上に焦点を当てた実験的AIモデル「QwQ-32B-Preview」を発表した。
()
中国Alibabaは、論理的推論と問題解決能力に重点を置いたAIモデル「QwQ-32B-Preview」をリリースした。一部のベンチマークテストではOpenAIのハイエンドモデルを上回るとしている。デモはHugging Faceにある。
()
クニエは、企業の調達、購買組織を多角的な視点で評価、数値化し、他社ベンチマークと比較した上で改善すべき課題を明確にする「ダイナミックSCM 調達診断サービス」を提供する。
()
今回は海外のクラウドファンディングで購入した製品版が届いたので、ベンチマークテストや実際のゲームプレイでの使い心地などを紹介していきたい。
()
Cohereの研究部門は高性能な多言語モデルファミリー「Aya Expanse」を発表した。23の言語にわたって優れた性能を発揮し、ベンチマークで他の主要なオープンウェイト(重み)モデルを上回っている。
()
SOLIZEは、日本HPの3Dプリンタ「HP Jet Fusion 5620」と、造形品質を向上させるオプション機能「Process Developmentパッケージ」の販売と装置導入サポートを開始した。装置検討用ベンチマークの受け付けも開始する。
()
Anthropicは、「Claude 3.5 Sonnet」の更新と「Claude Haiku 3.5」のリリースを発表した。いずれも各種能力が向上した。Haikuは先代と同等の速度を維持しつつ、「あらゆるスキルセットで」改善され、「Claude 3 Opus」を多くのベンチマークで超えた。
()
OpenAIは、機械学習エンジニアリングにおけるAIエージェントのパフォーマンスを測定するベンチマーク「MLE-bench」を論文で発表した。
()
「iPhone 16」シリーズと「Pixel 9」シリーズのスペックを比較する。ディスプレイはiPhone 16/16 Plusがピーク輝度2000ニトなのに対し、Pixel 9は2700ニト(ピーク輝度)。プロセッサの性能はベンチマークスコアを見る限り、iPhone 16シリーズの方が高い。
()
日本HPから発売された「AI PC」の「Envy X360 Laptop 14-fc(インテル)」。個人向けノートPCの最上位モデルにあたる本機を試して分かったことをまとめた本連載。最終回の今回は、性能面を中心に見ていこう。
()
UL Solutionsは、同社提供のAIベンチマークソフト「Procyon AI Image Generation」にNPU性能測定機能を実装した。
()