2015年7月27日以前の記事
検索
ニュース

AIの基本を総復習 画像認識、テキストマイニング、音声データ……それぞれの強みとは?

AIの効果的な活用にはデータが不可欠だ。企業のデータに目を向けてみると、主に画像・テキスト・音声の3つに分類されるため、この3つの領域でそれぞれ活用が進む。

Share
Tweet
LINE
Hatena
-

この記事は、會田武史氏の著書『音声×AIがもたらすビジネス革命 VOICE ANALYSIS』(幻冬舎、2024年)に、編集を加えて転載したものです(無断転載禁止)。なお、文中の内容・肩書などはすべて出版当時のものです。

 AIの活用はこれからますます加速します。サービス提供者が増え、企業の活用も進み、活用を通じた成果の競争も激化していきます。

 その中心となる領域は大きく3つにつに分けられます。AIは学習に必要なデータがなければ効果を十分に発揮しませんが、逆にデータが豊富であればその性能を最大限に引き出すことができます。つまり、AIの効果的な活用にはデータが不可欠です。

 企業のデータに目を向けてみると、主に画像テキスト音声の3つに分類されるため、この3つの領域でそれぞれ活用が進みます。

 さっそく、それぞれの特徴を見ていきましょう。


企業のAI活用は、データが豊富な画像・テキスト・音声の3つの領域で進む。写真はイメージ(ゲッティイメージズ)

著者プロフィール:會田 武史(あいだ・たけし)

photo

株式会社RevComm代表取締役

三菱商事株式会社にて自動車のトレーディング、クロスボーダーの投資案件・新会社設立、M&A案件等に従事。

2017年7月株式会社RevComm設立。電話解析AI「MiiTel Phone」、Web会議解析AI「MiiTel Meetings」、対面会話解析AI「MiiTel RecPod」を提供している。


画像認識――製品不具合、インフラ老朽化対策など

 1点目の画像については、例えば画像認識エンジンにより、人やモノの状態や変化をカメラによってとらえられます。

 分かりやすい例が、日頃使っている人も多いスマホやPCの顔認識です。技術的には、これはパターン認識に含まれます。パターン認識は、対象とする人や物の特徴を記憶し、それに合致するかどうかを照らし合わせることによって個人や物を特定します。スマホやPCでこの技術を使って持ち主を特定し、セキュリティを高めています。

 製造業では、製品の不具合を見つけ出す仕組みに画像認識が使われています。あらかじめ完成形の状態をAIに覚えさせ、その状態と違う製品がライン上で流れてきたときにアラートを出す仕組みです。

 橋などのインフラの状態を定点観測し、ひび割れなどの異変を見つけ出すことで施設の老朽化対策としても使われています。また、SNSではユーザーが投稿する大量の写真から流行を探るなどトレンド観測にも使われます。

テキストーー定性的なデータの分析が可能に

 2点目のテキストについては、テキストマイニングなどの技術があり、こちらも読者の方ですでに活用している人も多いと思います。テキストマイニングは、例えば、アンケートやSNSなどの文字を対象とするもので、自然言語に含まれる特定のキーワードがどれくらい使われているか、どのような単語が多く出ているかという分析をします。

 ちなみに、自然言語というのは、人が日常的に使っている言語のことです。その分析結果を踏まえて、例えばX(旧Twitter)でどのような話題が盛り上がっているかを見つけ出します。

 テキストマイニングが特徴的なのは、定性的な分析ができることです。定性的なデータ分析は、数値で表現できない複雑な情報を理解するために重要です。AIは予実管理や労働時間という数字を扱う定量的なデータ分析が得意です。一方の定性的なデータは数値で表現できないことが多く、分析が難しい領域でした。

 定性的なデータは、キーワードなどを分析することで読み解きができます。例えば、ある商品の売れ行きを分析する際に、アンケートの回答などから単語を抽出し、商品を買った理由を探ります。 「安い」「おいしい」「家が近い」という単語が多ければ、そこから購入動機が見えてきます。また、「安い」と「おいしい」が多ければ、その情報を合わせることで安さと味に強みがあるという考察を導くことができます。

音声データーー顧客ニーズ分析、生産性向上などのヒント

 3つ目は、本書のテーマである音声で、技術としては音声認識や合成音声などがあります。これはiPhoneのSiriやAmazonのAlexaなどが分かりやすい例でしょう。音声認識もパターン認識と自然言語の解析を使うもので、マイクが拾った音声から言葉を認識します。

 人は一日(平日)にだいたい13回の会話をし、1回あたり30分、一日の会話の合計で6時間ほどの会話をします(国立国語研究所調べ)。これだけ会話の回数と時間があれば、業務に関する重要な会話も行っているものです。意思決定に関わる相談もあれば、新たな価値創造につながるヒントを含む会話もあるかもしれません。

 そのような観点から、音声認識は生活を便利にする情報入力の手段としてだけでなく、顧客のニーズを探ったり、仕事の生産性を高めたりするヒントを獲得する手段として注目されています。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る