中国発のAIエージェント「Manus」が注目を浴びている。中国のAIスタートタップ・ManusAIが3月5日(現地時間)に発表したサービスで、AIの問題解決能力を測るベンチマークでは米OpenAIのAIエージェント「deep research」よりも好記録を達成したという。日本時間の10日時点ではクローズドβ版として提供中だが、利用には招待コードが必要になる。
Manusは、deep researchのようなWebで情報検索をする調査エージェント機能に加えて、Web上のタスクを代行するエージェント機能なども備えている。
ManusAIは日本語の公式Webサイトも公開中で、Manusの利用イメージを複数掲載している。利用イメージを見ると、日本旅行の日程作成や米Tesla株の市場分析などの調査業務を遂行する様子や、名刺や脚本の作成、音源の文字起こしと要約などさまざまな利用例を確認できる。
AIエージェントの実世界での問題解決能力を評価するベンチマーク「GAIA」では、現時点での最高記録(SOTA)を達成。レベル1〜3の3段階の問題全てでOpenAIのdeep researchの記録を上回ったとしている。
SNS上でもManusの性能に驚きの声を上げるユーザーは多い。同じ中国発で、高性能と話題になったAIモデル「DeepSeek R1」登場時の衝撃になぞらえ、“中国産AIショックの再来”とする意見も見られる。一方、Manusを利用したユーザーからは処理速度や実用性面には課題があると指摘する声も上がっている。
一方GitHubでは、ネット上の有志がManusを再現したオープンソースのAIエージェント「OpenManus」も公開中。公開から1週間未満にもかかわらず、2万以上のスターを集めるなど人気を博している。
競馬全然知らないけどChatGPT任せでフェブラリーステークスに挑んでみた 1万円がいくらになった?【結果発表編】
AIがWeb操作してくれるOpenAI「Operator」、日本で解禁 飲食店やホテルの予約などもAIにおまかせ
「deep research」は“ニュースメディア離れ”を引き起こすか? 生成AIが変えるニュース読者の生活
Anthropic、「Claude 3.7 Sonnet」公開 「o1」を大きく上回るコーディング性能
「DeepSeekショック」とは何だったのか? 2025年、AI開発の最新事情を解説Copyright © ITmedia, Inc. All Rights Reserved.