ITmedia総合  >  キーワード一覧  > 

「音声認識」関連の最新 ニュース・レビュー・解説 記事 まとめ

「音声認識」に関する情報が集まったページです。

音声入力の新配筋検査システム、全数検査を効率化しチェック漏れも防ぐ
アドバンスト・メディアは2018年11月1日、音声認識技術を活用した建築工程管理プラットフォーム「AmiVoice スーパーインスペクションプラットフォーム」の新サービス「配筋検査II」を発売した。(2018/11/7)

音声を自動でテキスト化→解析 無料ツール、ユーザーローカルが公開
ユーザーローカルは、テキストを解析できる無料のWebツールに、音声を自動でテキスト化する機能を追加した「音声認識テキストマイニング」を公開した。(2018/11/5)

医師や看護師は何に満足したか
ボストン小児病院で「Alexa」が活躍、ハンズフリー操作や、治療手順の検索に貢献
ボストン小児病院では、音声認識技術を臨床現場で利用した3つのパイロットスタディーを実施し、一定の成果が得られたという。現場で使われたのは「Echo Dot」をはじめとするさまざまなAmazonデバイスだった。(2018/10/25)

車載情報機器:
クルマの操作に関する音声認識は自前で、だからこそ「ハーイ、メルセデス」
メルセデス・ベンツ日本は2018年10月18日、東京都内で会見を開き、コンパクトカー「Aクラス」の新モデルを発表した。音声認識機能を充実させた新開発のインフォテインメントシステム「MBUX(メルセデスベンツユーザーエクスペリエンス)」を初めて採用したモデルとなる。(2018/10/19)

ほぼ無音の「吸った声」で音声認識 マイクロソフト研究
(2018/10/18)

「ドラえもんのように」……“AIの民主化”に挑むベンチャー 中小企業や個人も気軽に使える環境整備
「人工知能(AI)の“民主化”」に挑むベンチャー企業が登場してきた。東大発ベンチャー、エッジインテリジェンス・システムズ(EIS、東京都渋谷区)はパソコンやスマートフォンなどに標準搭載されているウェブブラウザー上で画像・音声認識を世界最速で実行できるシステムを開発。大企業だけでなく、ベンチャーや個人など誰もがAI技術を活用できる環境整備に乗り出した。一方、金融とITの融合「フィンテック」をビジネスチャンスととらえるフィンテックベンチャーの財産ネット(同)はAIを使ってプロの資産運用術を一般投資家に届ける。(2018/9/6)

「インストール!」で変身ロック解除 音声認識搭載「電磁戦隊メガレンジャー」デジタイザー&バトルライザー、大人向けに発売
「電磁戦隊メガレンジャー」の「デジタイザー」「バトルライザー」をセットにした大人向け玩具が登場。音声認識機能を搭載し、音声操作が可能だ。(2018/7/13)

IoT・生産性向上ソリューション講習会開催、ヒューマンタッチ総研
ヒューマンタッチ総研は、「建設技術者のためのIoT・生産性向上ソリューション講習会」を開催し、音声認識技術やウェアラブルIoT製品、ドローン点検などが紹介された。(2018/6/20)

Watsonがリアルタイムで議事録を作成――オカムラと日本IBM、議事録作成支援ソリューション「TalkView」を提供
オカムラと日本IBMは、IBM Watsonの音声認識サービスを活用して、会議の音声をリアルタイムにテキスト変換する議事録作成支援ソリューション「TalkView」を発表。会議の効率化を支援する。(2018/6/7)

計測結果の転記、PC入力作業を「音声」で:
トヨタ系完成車メーカーが車両監査業務で音声認識キーボード入力システムを活用
トヨタ車体グループの完成車メーカーである岐阜車体工業は車両監査業務において、アドバンスト・メディアの音声認識キーボード入力システム「AmiVoice Keyboard」を採用した。(2018/6/7)

3年間で3億円の売り上げを目指す:
AI活用し複雑な対話が可能、CTCがチャットbot開発プラットフォームを提供開始
伊藤忠テクノソリューションズは、ユーザーとの対話型システムを構築するための開発プラットフォーム「Benefitter」の提供を開始した。パターン化されていない質問には、AIを活用して対応可能。音声認識機能を拡充し、スマートスピーカーにも対応予定だ。(2018/6/6)

「きました500円!」 しゃべるスマート貯金箱、タカラトミーアーツから
タカラトミーア―ツが、しゃべる「スマート貯金箱」を発売。人感センサーや音声認識機能を搭載し、コミュニケーションを取ることができる。(2018/6/5)

ユニファイドコミュニケーション(UC)の可能性を広げる
人工知能(AI)の進化が生む「音声認識」の新たな用途とは
人工知能(AI)技術の成熟は、音声認識技術の用途をさらに広げる可能性がある。実際にどのような用途が考えられるのか。(2018/5/31)

Google Cloud Speech APIを活用:
大和総研がAI音声認識システムを開発 CRMへの営業記録を音声入力で効率化
大和総研は、「Google Cloud Speech API」を活用して「AI音声認識機能」を開発し、大和証券のCRMシステムに導入。同社の営業員による音声入力を可能にし、日々の営業活動記録作業を効率化する。(2018/5/22)

ドライバーの声で感情を認識 雑音環境でも使えるAI ドコモらが開発
NTTドコモと感情認識AI開発のEmpathが、ドライバーの声で感情を認識するAIを開発。雑音環境でも音声認識できるのが特徴だ。(2018/5/8)

機械学習により精度が向上
Googleの音声認識サービス「Cloud Speech-to-Text」大幅強化、句読点挿入も可能
アップデートされたGoogleの音声認識テキスト変換サービスは、機械学習により精度が向上した。Googleは、変換されたテキストに自動的に句読点を追加するツールもリリースしている。(2018/4/27)

モバイルアプリ開発の最前線(後編)
音声認識と拡張現実がモバイルアプリの主戦場になる理由
モバイルアプリに限らず、音声認識や拡張現実の重要性は高まっていく。それはなぜなのか。開発者はどの技術に注目すべきか。今後のために何をすべきなのか。(2018/4/27)

人工知能ニュース:
AIでウチのドアが執事に、YKK APの「未来ドア」は2020年発売を目標に
建材メーカー大手のYKK APは未来の窓やドアを形にする「未来窓」の第3弾となる「UPDATE GATE」の記者説明会を開催した。顔認証やAI(人工知能)、音声認識などを利用した自動開閉、遠隔見守り機能、伝言や情報配信機能などを備えたドアシステムであり、「ドアが執事のようにふるまう」ことをイメージしている。(2018/4/26)

特集・音声言語インタフェース最前線:
“ほんやくコンニャク”の実現はいつ? 音声認識・翻訳技術は「言語」の壁を取り払うか
未来のひみつ道具を実現する最新テクノロジー。(2018/4/20)

モバイルアプリ開発の最前線(後編):
音声認識と拡張現実がモバイルアプリの主戦場になる理由
モバイルアプリに限らず、音声認識や拡張現実の重要性は高まっていく。それはなぜかのか。開発者はどの技術に注目すべきか。今後のために何をすべきなのか。(2018/4/19)

特集・音声言語インタフェース最前線:
さみしい「独り身」を救う? 3人の音声アシスタントと会話して可能性を探ってみた
昨今、クラウドAIベースの「音声認識アシスタント」が流行の兆しを見せている。中にはある程度“対話”できるものもあるという。どの程度の対話がこなせるものだろうか。ある高名な「先生」が、実践を通して可能性を探る。(2018/4/14)

特集・音声言語インタフェース最前線:
機械と対話できる日は来るのか アドバンスト・メディアに聞く、音声認識の課題と可能性
「音声認識」がクローズアップされることが増えた。音声認識が主な操作法であるスマートスピーカーやロボットも登場している。では、現在の音声認識技術は、どのレベルまで到達しているのか。アドバンスト・メディアに話を聞いた。(2018/4/6)

車載情報機器:
車載Linux「AGL」が音声認識と車両クラウド間接続にフォーカス
車載システム向けLinuxの共同開発プロジェクトAutomotive Grade Linuxは、音声認識にフォーカスしたSpeech EGと、車両クラウド間接続にフォーカスしたV2C EGという2つのエキスパートグループを発足した。(2018/3/22)

損保ジャパン日本興亜、音声認識AIによるコールセンター支援システムを本格導入 NTT Comと新機能の共同実証も
損保ジャパン日本興亜が、NTTの音声認識エンジンとAIエンジンを活用した「アドバイザー自動知識支援システム」を全国のコールセンターに本格導入。問い合わせに最適な回答を表示してオペレーターを支援する。併せて、用件の抽出や学習を自動化する新機能の実証実験を行う。(2018/3/20)

VRニュース:
HoloLensを使って季節感あふれるMR体験ができる「菊MR」を発表、商業施設など向けに
Nomura Open Innovation LABは、ヘッドマウントディスプレイのMicrosoft HoloLensの専用アプリのプロトタイプ「菊MR」を発表。実空間に配置された花に対し、関連の産地情報や、虫や動物といった生き物、月や雲などの自然の風景の3D画像などを重ねて表示する。「かぜ」というと風を吹かせるなど音声認識でのコントロールにも対応する。(2018/3/13)

レベルは入門者から英検準1級またはTOEIC700点程度まで対応:
AI搭載でユーザーの英語力に合わせて会話、CAIメディアが英会話の学習用ロボット「チャーピー」を発売
CAIメディアは、英会話の学習用ロボット「チャーピー」を発売する。クラウドプラットフォームとしてAzureを採用した。音声認識機能を備え、ユーザーの英語力に合わせて話しかけてくる。身近に英語を話せる環境を作り、英会話力を育成する。(2018/3/5)

指なぞり入力の「Swype」、NuanceがiOS/Androidともに提供終了へ
Nuanceが2011年に買収した指なぞり入力モバイルキーボードの「Swype」の提供を終了する。企業向け音声認識・音声入力サービスに集中するためとしている。(2018/2/20)

「りんなライブ」視聴者が対象:
女子高生AI「りんな」が進化 音声認識でユーザーと電話 “恋バナ”もOK
日本マイクロソフトの女子高生AI「りんな」が進化。ユーザーと電話で会話できる機能を追加した。「りんなライブ」視聴者が対象で、恋愛トークにも対応する。(2018/2/13)

CES 2018レポート:
AIとIoTに5Gも加わった「CES 2018」、そして全てのモノがデジタル化される
情報通信総合研究所が「CES 2018」について報告。グーグルとアマゾンによる音声認識AIの激しいつばぜり合いや動画配信サービスによる業界再編などについて紹介した他、AIとIoTに5Gが融合しつつあることもポイントとして取り上げた。(2018/2/5)

製造ITニュース:
ダイハツが販売店の整備に音声認識技術を導入、点検結果を自動入力
ダイハツ工業は、定期的なクルマの点検/整備時に、整備士の音声を認識し、点検結果が自動入力されるシステムを新開発した。販売会社で約1年間の実証実験を行い改良を重ねたもので、2018年2月3日に新装開店となる高知ダイハツ販売の南国店に正式導入される。(2018/2/2)

利便性よりもセキュリティ、パスワードよりも生体認証――IBM、IDや認証に関する意識調査を発表
IBMの「IDの未来に関する調査」によると、デバイスやアプリケーションなどにログインする際には、利便性よりもセキュリティが優先される傾向が強く、指紋読み取り、顔認識、音声認識といった生体認証テクノロジーのメリットを認識している回答が多かった。この傾向が強い若年層が今後の市場をけん引する可能性も指摘する。(2018/1/31)

App Town ライフスタイル:
PC連携で文字検索も可能 音声入力メモアプリ「AmiVoice iVoX Personal」iOS版が登場
アドバンスト・メディアは、1月11日に音声入力メモアプリ「AmiVoice iVoX Personal」のiOS版を配信開始した。最新の音声認識エンジンにより高い認識率を誇り、スマートフォンとPCで音声・文字・写真データの連携管理が行える。(2018/1/12)

特集「Connect 2018」:
画像認識や音声認識、APIで“いいとこ取り”できる時代に――ハンズラボ・長谷川社長
基幹システムのフルクラウド化という“大仕事”が終わったハンズラボ。次なる目標は、画像や音声認識を取り入れることだという。APIを使って気軽にシステムが組める今、長谷川社長は「システムを“選ぶ”必要性がなくなった」と話す。(2018/1/3)

「Googleアシスタント」のSDKが日本語をサポート 日本語を話す端末開発が可能に
Googleが、音声認識AIアシスタント「Googleアシスタント」をサードパーティ製端末に搭載するためのSDKで日本語をサポートした。また、Amazonの「Alexa」のスキルのように、端末固有の機能を操作できるようにする「Device Actions」を追加した。(2017/12/22)

AIサービス競争はこれから本格化
大手のAIサービスは画像認識や音声認識の次のレベルへ
ACCAのトルーデル会長は、AIがクラウドコンピューティングのキラーアプリになると考えている。同氏は各社の取り組み、そして今後のAIサービスの動向をどのように予想しているのか?(2017/12/19)

AIで英会話のレベル分析、効果的な学習を支援――英会話のGABAとNTTデータが実証実験へ
GABAとNTTデータは、AIを活用して英会話レッスン中の音声から学習レベルを分析し、効果的な学習に活用するための実証実験を行う。音声認識技術の活用による、効率的な英語学習の実現を目指す。(2017/12/18)

NEC、ディープラーニングの自動最適化技術を開発 認識精度向上へ
NECがディープラーニングの自動最適化技術を開発。ニューラルネットワークの学習の進み具合をその構造に応じて自動的に最適化する技術で、画像認識や音声認識などで従来より高い認識精度を容易に実現できるという。(2017/12/12)

XMOSがET展で開発ボードを展示:
マイクとレーダーを併用、より正確に音声を捕捉
音声制御ICなどを手掛ける英国XMOSは、「Embedded Technology 2017(ET2017)/IoT Technology 2017」で、レーダーとマイクを組み合わせた音声認識システム向け開発ボードなどを展示した。(2017/11/28)

「入ってる化粧」「緑白」 天龍源一郎がブログ開設、音声認識がまるで仕事しない滑舌を見せつける
これはいいシングルマッチ。(2017/11/14)

UCaaSは群雄割拠の時代
SlackやAlexaとの統合も常識に ビジネスコミュニケーションツールの次の一手は
ユニファイドコミュニケーションツールの先進的なベンダーは利用の広がる「Slack」などのビジネスチャットツールや、音声認識技術との統合に乗り出している。(2017/11/13)

“コールセンターに音声認識”で時短とコスト削減を レオパレス21が導入へ
応対品質の向上とオペレーター業務の支援を目的に、全国5拠点のコールセンターに「AmiVoice Communication Suite3」を導入。年間で約2633時間の作業時間削減を見込む。(2017/11/9)

AIを搭載すれば複雑な質問にも答える
「Alexa」「Google Home」で注目、音声アシスタント市場はどこまで広がる?
スマートホーム、コネクテッドカーなど、モノのインターネット(IoT)が音声認識技術と連携すると、ディスプレイを必要とするデータ入力の制限から解放されるだろう。(2017/10/31)

即席!3分で分かるITトレンド:
コレ1枚で分かる「“人に寄り添うIT”を目指す音声認識」
次世代のUI(ユーザーインタフェース)と期待される音声認識技術がいかにして登場したのでしょうか? PCを操作するために生まれたキーボードと人との関係から振り返ってみましょう。(2017/10/16)

ロボット開発ニュース:
人への「心づかい」を表現できるロボットの受託/開発を開始
ユカイ工学は、東芝映像ソリューションの音声認識ソリューション「A/UN」を使用した次世代型の音声認識ロボットの受託/開発を始めた。人の声やセンサー上のデータを認識して、人への「心づかい」を表現できる。(2017/10/13)

Google Home Miniは6000円:
スマートスピーカー「Google Home」が日本上陸、検索・音声認識技術を武器に
グーグルは2017年10月5日、日本語に対応した同社のスマートスピーカー「Google Home」を、日本で販売すると発表した。販売されるのは、2016年11月から存在している機種「Google Home」と、本社が発表したばかりのコンパクトなAmazon Echo Dot対抗機種の「Google Home Mini」。検索・音声認識を武器に展開する。(2017/10/5)

ニュース
マジェンシー、人工知能(AI)を備えた会議ソリューションを発表
フランスのスタートアップ企業マジェンシーは、タブレットによる情報共有を可能にする会議ソリューションに、人工知能(AI)を活用した音声認識機能やデータ分析機能を追加した新製品を発表した。(2017/9/29)

バイドゥが自動翻訳機を発表、80カ国対応のWi-Fiルーターで展開
バイドゥは、9月19日に名古屋大学で開催された「MT Summit XVI」で自動翻訳機を発表。同社の音声認識技術と機械翻訳技術を採用し、ボタン一つで自動的に言語を認識して翻訳できる。(2017/9/20)

Over the AI ―― AIの向こう側に(14):
開き直る人工知能 〜 「完璧さ」を捨てた故に進歩した稀有な技術
音声認識技術に対して、長らく憎悪にも近い感情を抱いていた筆者ですが、最近の音声認識技術の進歩には目を見張るものがあります。当初は、とても使いものにはならなかったこの技術は、なぜそこまでの発展を遂げられたのか――。そこには、「音声なんぞ完璧に聞き取れるわけない!」という、ある種の“開き直り”があったのではないでしょうか。(2017/8/29)

Google、音声認識システム訓練用データセットをオープンソースで提供
Googleが、クラウドソーシングで集めた6万5000件の短い英単語の音声録音のデータセット「Speech Commands Dataset」をオープンソースで公開した。Mozillaも年内の1万時間分のデータ公開を目指している。(2017/8/28)

単語エラー率5.1%を達成:
Microsoftの音声認識技術、「テープ起こしのプロ」の精度に 研究チームが発表
Microsoftの研究チームは、Switchboard音声認識タスクで「5.1%」の単語エラー率を達成したと告知。2016年に「音声文字起こしのプロ並みにエラーが少ない」とした単語エラー率5.9%を上回る数値を記録した。(2017/8/23)



ビットコインの大暴騰、「億り人」と呼ばれる仮想通貨長者の誕生、マウントゴックス以来の大事件となったNEM流出など、派手な話題に事欠かない。世界各国政府も対応に手を焼いているようだが、中には政府が公式に仮想通貨を発行する動きも出てきており、国家と通貨の関係性にも大きな変化が起こりつつある。

Amazonが先鞭をつけたAIスピーカープラットフォーム。スマホのアプリが巨大な市場を成したように、スマートスピーカー向けのスキル/アプリ、関連機器についても、大きな市場が生まれる可能性がある。ガジェットフリークのものと思われがちだが、画面とにらめっこが必要なスマホよりも優しいUIであり、子どもやシニアにもなじみやすいようだ。

「若者のテレビ離れが進んでいる」と言われるが、子どもが将来なりたい職業としてYouTuberがランクインする時代になった。Twitter上でのトレンドトピックがテレビから大きな影響を受けていることからも、マスメディア代表としてのテレビの地位はまだまだ盤石に感じるが、テレビよりもYouTubeを好む今の子ども達が大きくなっていくにつけ、少なくとも誰もが同じ情報に触れることは少なくなっていくのだろう。