キーワードを探す
検索

「ベンチマーク」関連の最新 ニュース・レビュー・解説 記事 まとめ

関連キーワード
最新記事一覧

2026年度から始まる排出量制度。経済産業省の「製造業ベンチマークワーキンググループ」の第3回会合では、アルミニウム、石灰、カーボンブラック、ゴム製品製造業について、排出枠の割り当ての基準となるベンチマーク案が示された。

()

OpenAIは大規模言語モデルにおける「幻覚」(ハルシネーション)問題について、学習構造と評価方法に起因することを明らかにした。推測を優先する評価体系が誤答を助長し、正答率のみを重視する現行のベンチマークでは信頼性が損なわれると指摘している。

()

2026年度から始まる排出量取引制度。対象事業者に対する「排出枠」の割当方法の検討に向けて、政府は「製造業ベンチマークワーキンググループ(WG)」を新設。製造業におけるベンチマークの適用対象の特定と、割当量の算定式の具体化に向けた検討を開始した。

()

Microsoftは、開発中のAI「MAI-DxO」が医療診断の精度で人間の医師を大幅に上回ったと発表した。新しいベンチマークによる評価では、AIの診断精度が80%に達し、経験豊富な医師の20%を大きく超えた。診断コストの削減効果も示された。

()

今回取り上げるのは「GeForce RTX 5070 Laptop GPU」を搭載したモデルで、直販価格は43万9800円となっている。以前レビューしたGeforce RTX 5070 Ti Laptop GPU搭載の「ROG Zephyrus G14(2025)」と各種ベンチマークテストのスコアを比較しながら、GeForce RTX 5070 Laptop GPUの性能をチェックしていきたい。

()

Xiaomiが、独自開発のスマートフォン向け3nmプロセス採用SoCを正式に発表した。最先端の第2世代3nmプロセスを採用し、最大動作周波数3.9GHzのArm Cortex-X925コア2つを含む10コアのCPUおよび16コアのArm Immortalis-G925 GPUなどを搭載。スマートフォンの性能を数値化する「AnTuTuベンチマーク」で300万スコアを達成しているという。

()

Googleは、複雑な問題に取り組むためのリーズニングモデル「Gemini 2.5」を発表した。最初のリリースとなる「Gemini 2.5 Pro Experimental」は、一般的なさまざまなベンチマークで最先端の性能を示しており、特にリーズニング能力とコーディング能力に優れているという。

()

JetBrainsは、「JetBrains AI Assistant」がマルチモデルに対応し、開発者がタスクに応じて最適な大規模言語モデルを選択できるようになったことを受け、OpenAI、Google、Anthropicの主要モデルのベンチマーク比較結果を公式ブログで紹介した。

()

Cohereの研究部門は高性能な多言語モデルファミリー「Aya Expanse」を発表した。23の言語にわたって優れた性能を発揮し、ベンチマークで他の主要なオープンウェイト(重み)モデルを上回っている。

()
関連キーワード
キーワードを探す
ページトップに戻る