2015年7月27日以前の記事
検索
連載

DeepSeek-R1とOpneAI「o3-mini」を徹底比較 性能面から見た賢い使い方は?その悩み、生成AIが解決(2/4 ページ)

DeepSeekをユーザー視点で性能面などに注目した場合、どの程度使えるサービスなのだろうか? 同社の推論モデルDeepSeek-R1と、OpneAIの最新の推論モデルo3-miniを比較し、使いどころを探ってみた。

Share
Tweet
LINE
Hatena
-

長いテキストの分析はどちらが得意?

 続いて、本連載で過去に扱った「カスタマーサポートと顧客のやり取りの評価」も試してみた。チャット履歴のテキストを渡し、それに対して「顧客の本音」を推測してもらうものだ。

※関連記事:推論に強い「OpenAI o1」で“顧客の不満”を探れ CX向上に生成AIを生かす方法

プロンプト

以下はカスタマーサポートと顧客とのチャットでのやり取りです。問題が解決したにもかかわらず、チャット終了後のアンケートでは「やや不満」との回答でした。顧客が不満を感じた要因はどこにあると思いますか? それぞれのやり取りに対する「顧客の本音」を推測してください。

(以下、会話の文字起こし)

 o3-miniが顧客の発言ごとの「本音」を回答しているのに対して、DeepSeek-R1は会話全体の総括のような内容を返してきた。「それぞれのやり取りに対する顧客の本音」という指示が正しく理解できていないことがうかがえる。

DeepSeek-R1の回答

  • 顧客が不満を感じた要因と本音の推測:

1.【機械的な対応への不満

本音

 「サポートの対応がマニュアル通りで冷たい。私の焦りや不安に共感してくれない…」

分析

 サポートが手順を淡々と指示する一方、顧客の心理状態(例:「確認の仕方がわからない」という不安)に寄り添う言葉(「お急ぎでしょうが、一緒に確認しましょう」など)が欠けていた。問題解決に必要な情報は提供されたが、人間味のあるコミュニケーションが不足していた。

2.【手順の煩雑さへの苛立ち

本音

 「何度も設定を開いたりクリックしたり…面倒すぎる!もっと簡単にできないの?」

分析

 複数の操作ステップ(通知領域→設定→デバイス→Bluetooth→ペアリング)を要し、非技術者にとって負担が大きかった。特に「ペアリングモード」の手順が抽象的で、スピーカー側の操作に戸惑った可能性がある。

(後略)

OpneAI o3-miniの回答

以下は、各やり取りごとに顧客が内心感じた可能性のある「本音」を推測したものです。

1.顧客

 「こんにちは。…無線でPCに接続できなくて困っています。」

顧客の本音

 「急いで使いたいのにトラブルが起きて、正直焦っている。早く解決したいのに不安だ。」

2.サポート

 「PCのBluetoothはオンになっていますか?」

顧客の本音

 「え、そんな基本的なことを聞かれるなんて…私の使い方が下手なのか?もっと具体的な解決策を知りたい。」

3.顧客

 「たぶんオンになっていると思いますが、確認の仕方がわかりません。」

顧客の本音

 「基本操作が分からなくてちょっと情けないけど、早く教えてほしい。」

4.サポート

 「まず、PCの画面の右下…Bluetoothアイコンが表示されているか確認してください。」

顧客の本音

 「なるほど、でもややマニュアル的で、もっと具体的に『どうやって探すのか』説明してほしいな。」

(後略)

 なお、DeepSeekについても、この後に追加指示で「会話ひとつひとつに対して、顧客の本音を出してください」と追加指示することで正しい回答が行えた。少し複雑な作業を行う場合などは、ていねいな指示を心がけるとよさそうだ。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る