防塵防滴PDA+音声認識で実現“現場で使えるシステム”ってどんなもの?

» 2006年02月10日 10時50分 公開
[吉岡綾乃,ITmedia]

 NECインフロンティアの業務用PDA「Pocket@i EX」(ポケットアイ・イーエックス、2005年7月26日の記事参照)は、高さ1.5メートルから落下しても壊れることはなく、防塵・防水レベルでも「IP54」という高いレベルを実現している。

 NECが現在提案しているのが、このPocket@i EXに、耐騒音音声認識システム「VoiceDo/HTシリーズ」を組み合わせたソリューションだ。業務用PDAに、音声認識システムを組み合わせることにより、「現場で使えるシステム」を提供するという。

 Pocket@i EXは、前モデル「Pocket@i」を導入した現場からの要求を受けて開発された。業務用PDAは、現場でどのように使われているのか。また、現場で必要とされるシステムとは? NECインフロンティア国内営業事業本部の大庭敏幸氏、NEC放送・制御販売本部認識システム販売部の友岡靖夫氏、NECマーケティング推進本部の堀俊雄氏に話を聞いた。

Windows CE 5.0ベースの防塵・防滴PDA

 まず始めに、Pocket@i EXとVoiceDo/HTシリーズの特徴から紹介しよう。

 Pocket@i EXのサイズは、79×157×25ミリ、295グラム。内部にはマグネシウム合金フレームを、外側の四隅にはゴムカバーを備え、1.5メートルの高さから落下しても壊れない強度を実現している。防塵・防水性能は、IEC(国際電気標準会議)やJISで定められた規格「IP54」を取得している。これは水没はNGではあるが、「粉塵が内部に侵入することを防止し、若干の粉塵の侵入があっても、正常な運転を阻害しない」「いかなる方向からの水の飛沫にも有害な影響を受けない」という高いレベルだ。エタノールによる消毒もできる。

 OSはWindows CE 5.0。同社の業務用PDAとしては初めてテンキーを備え、電卓のような数字入力や、携帯電話のような5タッチの文字入力も可能になっている。C++やVisual Basic.NET、Java(J2ME)といった開発環境が利用できる。

 搭載するスキャナ機能の違いによって、4モデルをラインアップ。1次元バーコードスキャナ+RFIDタグリーダーを備えたモデル、1次元バーコードスキャナを備えたモデル、2次元バーコードスキャナを備えたモデル、スキャナがない変わりにCFスロットを備えたモデルの4種類だ。無線LAN(IEEE 802.11b/g)はスキャナの付いている3モデルが、Bluetoothは全モデルが備えている。スキャナモデルでは、オプションとして、VoIPソフトも提供する予定だ。

機能 スキャナなし 1次元スキャナ 2次元スキャナ RFID
CFスロット × × ×
スキャナ × 1次元スキャナ 2次元スキャナ 1次元スキャナ
RFIDリーダー × × ×
無線LAN ×
Bluetooth
Pocket@i EXのラインアップと機能表
スキャナ付きモデルは、本体裏の上部にスキャナがある。読み取りやすいように適度な角度が付けてある(左)。四隅にはゴムカバーが付いている。スキャナのトリガーは、写真の本体左側のほか、テンキーの上にも付いている(右)

 Pocket@i EXと組み合わせて利用する音声認識システムがVoiceDo/HTシリーズだ。最大の特徴は「騒音に強い」点にある。

 VoiceDo/HTシリーズでは、マイクを2つ備えた専用のヘッドセットを利用する。1つは話者の口の前に付いている通常のマイク、もう1つは外側に向けて使うクリップ型のマイクだ。

 クリップ型のマイクでは騒音を、話者の声を入力するマイクでは、声と騒音を拾う。声+騒音の音声データから、騒音の音声データを引き算して、声のデータだけを拾い出す。こうすることで、周りがうるさい環境でも、実用的なレベルでの音声認識が可能になる。NECでは目安として「地下鉄車内相当のうるささ、つまり85デシベルの環境下でも音声認識が可能」としている。

専用のヘッドセット。マイクが2つ付いているのが特徴

業務用PDA+音声認識で何ができる?

 NECでは、業務用PDAを「Portable Data Assistant」と位置づけている。同社の業務用PDAの前身といえるのが、2000年に発表された「WEBHANDY」(WEB)。手のひらサイズのWebブラウザで、Webターミナルとして利用することを想定していた。ローカルにアプリケーションを持てるようになった業務用PDAが、2002年の「Pocket@i」だ(2002年11月12日の記事参照)

 汎用のPDAであるPocket@iは、カスタマイズを施し、オプション製品と組み合わせることにより、流通、製造、医療・医薬といったさまざまな業種で現在利用されている。Pocket@i EXは、Pocket@iを導入した現場の声から生まれたともいえる製品だ。流通業界でニーズが多かった10キーを搭載し、製造業の現場からの声を反映して防塵・防水性能をアップさせ、医療・医薬業界では患者の個人情報保護のためにセキュリティ性能の向上をはかった。

 NECではさらに、業務用PDAに音声認識を組み合わせることによって、データ入力の効率化が可能になる分野へ、Pocket@i EXを投入したいと考えている。音声認識ができるPDAは他社からも出ているが、NECでは「現場で使える音声認識は、おそらく当社だけ」とする。

 VoiceDo/HTシリーズの特徴は、騒音の中でも音声認識が可能なことに加え、「ハンズフリー・アイズフリー」という点にある。ユーザーの手も視線も端末に向けることなく、声によるデータ入力作業ができるように工夫されているのだ。「現場では、端末は腰に付けており、画面なんか見えないわけです。ストレスなく使うためには、認識結果がいいことはもちろん、認識結果をどうユーザーに戻してあげるかが大切」(NEC)

 音声入力は、端末の画面を一切見ずに行えるようになっている。端末から音声合成で、入力を促す指示があった後、ユーザーは入力したい単語を発声する。音声が認識されると、その結果を音声合成で機械が復唱する。合っていればそのまま次の入力へ進み、間違っていれば「戻る」で入力をやり直す。

画面は、部材管理用ソフトの例。「区分?」と音声合成で聞かれたら「入庫」と答えて入力。すると「入庫」と機械が復唱したのちに「部材?」と次の指示があるので「金型1」と答える。「金型1」と復唱すると「数量?」と次の指示が入る……という仕組み

 音声認識を行うのは、あらかじめデータ登録を行っておいた単語だけなので、トレーニングなしで誰でも音声認識を利用できる。認識率が悪い場合は、特定話者向けに、認識性能を高めるトレーニングも可能だ。

音声入力が生きる現場とは?

 同社の音声認識システムがすでに10カ所以上導入されている一例が、食肉工場だという。検査官は手に包丁を持ち、両手を使って血液まみれの現場で作業を行う。そのため、検査官はいちいち包丁を置いて手を洗って問題点を紙に記入し、あとから紙のデータをまとめてPCに入力していたため、時間も手間もかかっていた。しかしここに音声による入力システムを導入したことで、データ入力の効率が格段に上がり、衛生面でも高評価を得ているという。

 もう1つ面白い例が、魚や青果の市場だ。従来は「せり」をしている横に記帳者が付き、せりのやりとりを聞きながら結果を紙に書き留めていた。早朝から朝にかけてせりが終わると、その結果をまとめて別の係がPCにデータ入力していたため、データがすべて入力され、せりの結果が分かるのは午後3時くらいになるのが普通だった。

 ここに音声入力システムを持ち込むことで、リアルタイムにデータを入力、途中経過を見ながらその結果をせりに生かすことが可能になったという。1回のせりは数秒で終わってしまうため、PCにキーボードを打ち込む方法では間に合わなかったが、音声認識によるデータ入力なら間に合っているそうだ。

 NECでは、物流・製造といったすでに実績のある業界以外にも、業務用PDAを利用したソリューションを展開していきたいと考えている。「『画面はいらない』という人向けに、音声入力を提案していきたい。音声認識を組み合わせることで、市場はもっと広がっていくと思う」(NEC)

Copyright © ITmedia, Inc. All Rights Reserved.