最新記事一覧
イーロン・マスク氏のAI企業xAIは、独自のLLM「Grok」の「1.5V」版を発表した。画像認識のマルチモーダルになった。画像認識のベンチマークで「GPT-4V」、「Claude 3 Opus」、「Gemini Pro 1.5」を上回ったとしている。
()
AMD Ryzen Threadripper PRO 7000 WXシリーズ プロセッサを搭載した日本HPの最新ワークステーション「HP Z6 G5 A」は、CAEツールのベンチマークにおいて最大で約70%のスループット向上を確認したという。その実力に迫った。
()
うっかり見逃していたけれど、ちょっと気になる――そんなニュースを週末に“一気読み”する連載。今回は、3月31日週を中心に公開された主なニュースを一気にチェックしましょう!
()
80年代に米国で販売されたファミコン「NES」。それをオマージュしたデザインのデスクトップPCが「AYANEO Retro Mini PC AM02」だ。カッコカワイイ見た目だが、果たして実用性はどうなのだろうか。仕事で使ってみた印象とベンチマークテストの結果を紹介する。
()
Apple、Google、Microsoft、Mozillaは、共同開発したWebベンチマークツール「Speedometer 3.0」のリリースを発表した。主要ブラウザエンジンBlink、Gecko、WebKitを搭載するWebブラウザのテストが可能だ。
()
パッケージからもこだわりが感じられるポータブルゲーミングPC「AYANEO SLIDE」をデスクトップPCとして使う場合のセットアップ方法を紹介するとともに、ベンチマークテストのスコアや実際に仕事で使えるのかどうかといった部分をレビューしていく。
()
コードと自然言語のプロンプトからコードとコード関連の自然言語を生成する「Code Llama」の高性能バージョン「Code Llama 70B」がリリースされた。高いパフォーマンスを示しており、ベンチマークテストでも他のLLMをしのぐという。
()
NECは、米国国立標準技術研究所(NIST)が実施した顔認証技術のベンチマークテスト「FRTE 1:N Identification」で世界第1位を獲得した。1200万人分の静止画を使用した「1:N認証」において、認証エラー率0.12%という第1位の性能評価を獲得した。
()
レノボ・ジャパンの「Legion Go」は、いわゆる「ポータブルゲーミングPC」としては後発ということもあって、ギミックとスペックの両面で高いレベルだ。しかし、それゆえに、あえて“弱く”した状態でテストしてみたくなるというのが人情である。そこで、あえて電源設定を省エネ重視とした上でベンチマークテストをしてみることにしよう。
()
ドン・キホーテの14.1型ノートPC「MUGA ストイック PC5」で、ベンチマークテストやさまざまなゲームタイトルを試してみた。税込み4万3780円の低価格PCは、どこまでいけるのだろうか。
()
USB PD給電にも対応しているという大きな特徴を持つCore i7-12650H搭載の超小型PC「Minisforum UN1265」の実力を各種ベンチマークテストで確かめてみた。
()
PC USERのレビュー記事でおなじみのマルオマサトさんが、実際にレビューしてきたPCを通して1年間を振り返った。
()
Google Cloudは、Google Cloud上のKubernetesクラスタの最適化に役立つ、サイジング、パフォーマンスベンチマーク、負荷テストといったタスクを支援するオープンソースツールを公開した。
()
Microsoftは、SLM(小規模言語モデル)の「Phi-2」をAzureでリリースした。27億パラメータだが、複数のベンチマークでMetaの「Llama 2」の700億パラメータモデルやGoogleの32億パラメータの「Gemini Nano 2」を上回った。
()
LLMのLlamaをオープンソースで公開しているMetaは、「責任ある安全な生成AI」の開発を促すプロジェクト「Purple Llama」を発表した。まずはLLM向けのサイバーセキュリティ評価ベンチマークセットをリリースした。
()
米Metaや米HuggingFaceなどに所属する研究者らは、難しいタスクではなく、人間にとって簡単なタスクを達成する大規模言語モデル(LLM)を評価するためのベンチマークを発表した。
()
Googleは、AIチャット「Bard」に新生成AIモデル「Gemini」のミドルサイズ版「Gemini Pro」を搭載したと発表した。日本でも英語版Bardで試すことができる。Gemini Proは多くのベンチマークでOpenAIの「GPT-3.5」を上回っている。
()
AMDが、デスクトップワークステーション向けGPUの新モデル「Radeon PRO W7700」をリリースする。、ECCメモリを備えながらも、米国での販売価格は999ドル(約15万4000円)と比較的手頃である。その特徴を、ベンチマークテストの結果を交えながら簡単に紹介しよう。
()
イーロン・マスク氏が7月に立ち上げたAI企業xAIは、同社初のAIモデル「Grok」を発表した。まだ初期β段階だが、ベンチマークでは「ChatGPT-3.5」や「Inflection-1」を上回るとしている。
()
6月に発売された「15インチMacBook Air」は、15.3型のディスプレイを備えながらも約11.5mmの薄さと約1.51kgの軽さを実現した。その秘密はファンレス設計なのだが、実用的に使えるのだろうか。検証してみたい。
()
Intelのデスクトップ向け「Coreプロセッサ(第14世代)」のアンロック対応品が発売された。その実力はいかほどのものか、ベンチマークテストを通してチェックしてみよう。【更新】
()
米OpenAIの生成AI「GPT-4」を上回る性能をうたうAI「Xwin-LM」が、AIモデル共有サイト「Hugging Face」に公開されている。言語モデルのベンチマークサイト「AlpacaEval」でGPT-4を追い抜き1位を獲得したとしている。
()
NVIDIAは、グラフィックスカード(GPU)の消費電力をリアルタイムに測れるデバイス「PCAT」を提供している。今回、PCI Express 4.0に対応した第2世代製品(PCAT2)を試す機会があったので、実際にベンチマークテストを実行しつつ、GPUの消費電力をチェックしていく。
()
Maxonが無料で配信しているベンチマークテストアプリ「Cinebench」に最新版が登場する。昨今のレンダリングのワークロードを踏まえてテストの内容を一新した他、Cinebench R15に搭載されていたGPUテストを復活させた。Windows版では、新たにArmプロセッサ向けのプログラムも用意される。
()
米Google Researchに所属する研究者らは、グラフ構造学習のベンチマーク戦略を提案するもので、既存のいくつかの方法を単一のモデルにまとめたフレームワークに関する研究報告を発表した。
()
MINISFORUM(ミニスフォーラム)から、手のひらに収まるRyzen 7搭載のデスクトップPCが登場した。外観とベンチマークテストの結果をお届けする。
()
メール配信システムを提供するベンチマークジャパン(東京都千代田区)は、「メール配信業務における失敗談の調査」を実施した。その結果、最も多い失敗は「表示エラーや文字化け」(55.3%)だった。
()
カプコンは、同社最新作「STREET FIGHTER 6」の動作を確認できる「STREET FIGHTER 6ベンチマークツール」を公開した。
()
AI開発向けのツールを提供しているベンチャー企業Hugging Faceは、2023年5月4日(米国時間)、コーディング用大規模言語モデル(LLM)の「StarCoder」を一般公開。ベンチマークによる評価やデータセットなども併せて公開した。
()
データセット「GLUE」について説明。英語で自然言語処理モデルの性能を評価するための標準ベンチマーク。英語文法の正しさ判定などの9つのタスク(CoLA/SST-2/MRPC/STS-B/QQP/MNLI/QNLI/RTE/WNLI)に対応するデータセットのコレクション。
()
自動車の内装やランプ類の設計において自動車業界で広く採用されている3次元光学解析ソフトウェア「Ansys Speos」。ワークステーションによって計算速度がどの程度向上するのか、デル・テクノロジーズのワークステーション製品「Dell Precisionシリーズ」を用いてベンチマークテストを実施した。その結果をレポートする。
()
パナソニック コネクトの顔認証技術が、NISTの顔認証ベンチマークテストで世界1位の評価を獲得した。経年変化や照明変動、顔向きの変化がある環境でも、高精度に顔認証できる点が評価された。
()
Apple、Google、MozillaがWebブラウザベンチーマーク「Speedometer 3」の開発で協力。完成すれば、Safari、Chrome、Firefoxを同じ条件で比較できることになる。
()
NTT コム オンライン・マーケティング・ソリューションは、モバイル通信サービスのMVNO・サブブランド業界を対象に顧客ロイヤルティを測る指標「NPSベンチマーク」についての調査を実施し、結果を発表した。
()
NTTコム オンライン・マーケティング・ソリューションは、MVNO/サブブランド業界を対象とした「NPSベンチマーク調査2022MVNO・サブブランド部門」の結果を発表。最もNPSが高いのは「IIJmio」となった。
()
設計者向けリアルタイムシミュレーション環境として構想設計や初期設計の現場で活用が進む「Ansys Discovery」。今回、デル・テクノロジーズのワークステーション製品「Dell Precisionシリーズ」を用いてベンチマークテストを実施した。その結果をレポートする。
()
米Appleが9月7日(現地時間)に発表した、「iPhone 14 Pro」「iPhone 14 Pro Max」について、ベンチマークアプリ「Geekbench 5」を使って計測したスコアの結果が投稿されている。
()
先日、レノボ・ジャパンの「ThinkPad X1 Carbon Gen 10」をレビューした際に、ベンチマークテストの一部スコアが思ったほど出なかった。「もしかして、電源設定のせいか?」と思った筆者は、電源設定を変えてテストを実施してみることにした。
()
レノボ・ジャパンの「ThinkPad X1 Carbon Gen 10」は、フラグシップノートPC「ThinkPad X1 Carbon」の記念すべき第10世代だ。Gen 9(第9世代)と見た目は変わっていないものの、最新の第12世代Coreプロセッサを搭載してパワーアップしている。Core i5-1240Pを搭載するモデルの実力をベンチマークテストでチェックしてみよう。
()
「Geekbench 5」を使用した「MacBook Air (M2, 2022)」のベンチマーク計測データが投稿されていたので、M1搭載Macと比較してみた。
()
Googleは、機械学習の業界標準ベンチマーク「MLPerf」の最終ラウンドにおいて、全8個のベンチマークのうち4個で最高スコアを達成した。
()
ビジネスPC「VersaPro UltraLite タイプVC」の新モデルは、CPUの刷新によってどれほどの性能を発揮できるようになったのか。ベンチマークテストの結果や、テクニカルライターが実際に外出先で作業して実感した印象は。
()
「Geekbench 5」を使用した「MacBook Pro (13-inch, M2, 2022)」のベンチマークデータが公開された。
()
Google Researchは、文章から画像を生成する拡散モデル「Imagen」を発表した。独自ベンチマークではOpneAIの「DALL-E 2」よりも人間に好まれる結果が出たとしている。
()
エンジニアリングコンソーシアムのMLCommonsが最近、機械学習の業界標準ベンチマーク「MLPerf」の推論(Inference)ラウンドのスコア結果を発表した。MLPerf Tinyでは、米国の新興企業Syntiantが、キーワードスポッティングのレイテンシとエネルギー消費量のベンチマークでトップの座を獲得している。一方NVIDIAとQualcommは、エッジ/データセンターのカテゴリーにおいて再び激しい争いを繰り広げた。
()
Salesforce傘下のMuleSoftが「2022年版 接続性ベンチマークレポート」を発表しました。
()
アユートは、ATXマザーボードに対応したオープンフレームベンチ台「ATX オープンフレーム・ホワイトエディション改」を発売する。
()
M1 MaxとM1 Ultraを搭載したMac Studioの、Geekbench 5ベンチマークの結果が公開されている。
()
Intelの新型「NUC」となる「Intel NUC 12 Extreme Kit」が発表された。前編に続き、後編ではメモリやストレージ、グラフィックスカードにOSを追加してベンチマークテストを行った。
()