ITmedia総合  >  キーワード一覧  > 

「音声認識」関連の最新 ニュース・レビュー・解説 記事 まとめ

「音声認識」に関する情報が集まったページです。

話した言葉、指でなぞった軌跡に表示「しゃべり描きアプリ」公開 聴覚障害者など向け、10カ国語対応
話した言葉を音声認識でテキスト化し、指でなぞった軌跡にそのテキストを表示する「しゃべり描きアプリ」が公開。日本語や英語、中国語など10言語に対応。外国人や聴覚障害者とのコミュニケーションなどでの活用を見込む。(2019/6/11)

日本でもいよいよ提供開始:
Amazon Alexaの「スキル内課金機能」についてアマゾンジャパンのエバンジェリストが説明
Alexaエージェンシーと音声認識技術に関わる企業9社が音声認識技術の最新トレンドを共有するイベントをアマゾンジャパン協賛にて開催。Amazonジャパンからは新たな発表もあった。(2019/6/3)

AzureにAI機能を拡充、Microsoftが「Build 2019」で新技術発表
Microsoftは「Microsoft Build 2019」で、AzureにAI機能を拡充することを発表した。画像認識や音声認識などの機能を提供するAPIや、機械学習モデルの構築や学習、展開といったプロセスを簡素化する機能を追加した。(2019/5/9)

「ネコは自分の名前を聞き分けられる」 上智大学がネコの音声認識に関する研究結果を発表
分かってくれてると思ってた。(2019/4/8)

車載ソフトウェア:
オープンソースの音声認識APIを特徴とする車載Linuxの最新版を発表
Automotive Grade Linux(AGL)は、オープンソースの音声認識APIを特徴とする車載Linuxの最新版「Unified Code Base(UCB)7.0」をリリースした。また、AGLに新たに加盟した5社について発表した。(2019/3/26)

組み込み開発ニュース:
音声認識機能の実装期間を短縮するMCUベースソリューション
NXPセミコンダクターズは、Amazon Alexa Voice Serviceに準拠した「MCUベースソリューション」を発表した。音声制御機能や信号処理機能が組み込まれているため、OEM企業が製品にAlexaを実装する際の開発期間を短縮する。(2019/3/20)

Google、インドの子どもたち向けAI採用英語学習アプリ「Bolo」リリース
Googleが、インドの小学生向けにヒンディー語と英語を音読しながら学習するAndroidアプリ「Bolo」を公開した。音声認識とテキスト読み上げ技術を採用し、AIアシスタントのディアが勉強を手伝う。(2019/3/11)

モスバーガーが「AIセルフレジ」の実証実験 無人レジが音声認識で店員のように接客
関内店で2月15日〜27日の期間限定で実施。(2019/2/14)

車載情報機器:
「ここ左?」「まだ直進です」とナビが即答、音声エージェントへの呼びかけは不要に
三菱電機は2019年1月22日、東京都内で記者説明会を開き、同社の情報技術総合研究所が手掛ける車載セキュリティやHMI(ヒューマンマシンインタフェース)の技術を発表した。車載セキュリティの新技術はウイルスの種類ではなく侵入の手口に着目して攻撃を検知する点が特徴だ。HMIは、視線の向きに合わせて的確に警告を発し、音声認識機能の煩わしさを低減する。いずれの技術も、クラウドと連携せず、組み込みで効果を発揮する点を強みとする。(2019/1/23)

NTT Com、自然言語解析APIサービスに「言い淀み除去」「音声認識誤り検知」「感情分析」などを追加
NTTコミュニケーションズは、自然言語解析APIサービス「COTOHA API」のラインアップを強化。「ええと」などの言いよどみを除去するAPI、言い間違いや音声認識の誤りを検知するAPIなどを追加し、音声認識の精度向上と日本語解析の高度化を図った。(2019/1/16)

CES2019:
音声認識に視線や感情、眠気検知を組み合わせ、より柔軟なエージェントに
Nuance Communications(ニュアンス)は、消費者向けエレクトロニクス展示会「CES 2019」(2019年1月8〜11日、米国ネバダ州ラスベガス)において、カメラによる視線検知と音声認識技術を組み合わせた開発中の新機能を披露した。開発技術は、POI(Point of Interest)検索やストリーミングサービス、リアルタイムな情報を得る場合にはクラウド連携が必要だが、それ以外については車載情報機器側で処理が終えられるという。(2019/1/15)

トンネル工事:
騒音下の工事でも円滑な会話可能に、“音声認識AI”で通話相手を特定する「骨伝導ヘッドセット」開発
清水建設は、京セラと共同で、トンネル内の騒音下でも、入坑者が防塵(じん)マスクや防音耳栓を着用したまま、コミュニケーションが可能な通話システム「骨伝導ヘッドセット(仮称)」を開発した。既に施工中の九州新幹線西九州ルートのトンネル工事で、実証実験に成功している。今後は、作業者の体調を測定する機能追加も検討して、2019年中の完成を目標とし、2020年度には商品化も視野に入れる。(2019/1/7)

AI時代の仕事術:
テープ起こしをするなら音声認識が最強
会議の議事録づくりをしたことがありますか? 録音されたデータを聞きながら、文字にしていくテープ起こし作業はかなりやっかい。しかし、技術はちゃんと進歩していて、音声認識を使えばかなり楽になる。ただし、録音データをそのまま文字にしてくれるのはまだ将来の話のようだ。(2018/12/23)

iPhoneで録音して議事録を作成 アドバンスト・メディアのiOS向け「ProVoXT」
アドバンスト・メディアは、12月19日に音声認識文字起こしクラウドサービス「ProVoXT」のiOSアプリをリリース。インターネットに接続せずアプリ上で録音が行える他、音声認識結果のテキストもアプリにダウンロード可能。(2018/12/20)

電話機2万6000台の通話データを高精度にテキスト化 分析基盤と連携活用も――野村證券、日立の音声テキスト化システムを導入
野村證券は、日立の音声認識技術を活用した音声テキスト化システムを導入。営業店と本社で利用する電話機約2万6000台分の通話録音データを、雑音に強い音声認識エンジンによって高精度かつ高速にテキスト化する。テキスト化したデータは、対応品質の向上やサービス改善に活用する。(2018/12/20)

Googleが提供する音声認識テキスト変換APIを活用:
音声認識から字幕表示まで約1秒――AbemaTV、AIによるリアルタイム字幕をニュース番組に試験導入
AbemaTVは昼のニュース番組「けやきヒルズ」で、AI(人工知能)によるリアルタイム字幕システム「AI(あい)ポン」を試験的に導入する。このシステムは、AbemaTVとテレビ朝日が共同開発した。(2018/12/11)

音声入力の新配筋検査システム、全数検査を効率化しチェック漏れも防ぐ
アドバンスト・メディアは2018年11月1日、音声認識技術を活用した建築工程管理プラットフォーム「AmiVoice スーパーインスペクションプラットフォーム」の新サービス「配筋検査II」を発売した。(2018/11/7)

音声を自動でテキスト化→解析 無料ツール、ユーザーローカルが公開
ユーザーローカルは、テキストを解析できる無料のWebツールに、音声を自動でテキスト化する機能を追加した「音声認識テキストマイニング」を公開した。(2018/11/5)

医師や看護師は何に満足したか
ボストン小児病院で「Alexa」が活躍、ハンズフリー操作や、治療手順の検索に貢献
ボストン小児病院では、音声認識技術を臨床現場で利用した3つのパイロットスタディーを実施し、一定の成果が得られたという。現場で使われたのは「Echo Dot」をはじめとするさまざまなAmazonデバイスだった。(2018/10/25)

車載情報機器:
クルマの操作に関する音声認識は自前で、だからこそ「ハーイ、メルセデス」
メルセデス・ベンツ日本は2018年10月18日、東京都内で会見を開き、コンパクトカー「Aクラス」の新モデルを発表した。音声認識機能を充実させた新開発のインフォテインメントシステム「MBUX(メルセデスベンツユーザーエクスペリエンス)」を初めて採用したモデルとなる。(2018/10/19)

ほぼ無音の「吸った声」で音声認識 マイクロソフト研究
(2018/10/18)

「インストール!」で変身ロック解除 音声認識搭載「電磁戦隊メガレンジャー」デジタイザー&バトルライザー、大人向けに発売
「電磁戦隊メガレンジャー」の「デジタイザー」「バトルライザー」をセットにした大人向け玩具が登場。音声認識機能を搭載し、音声操作が可能だ。(2018/7/13)

IoT・生産性向上ソリューション講習会開催、ヒューマンタッチ総研
ヒューマンタッチ総研は、「建設技術者のためのIoT・生産性向上ソリューション講習会」を開催し、音声認識技術やウェアラブルIoT製品、ドローン点検などが紹介された。(2018/6/20)

Watsonがリアルタイムで議事録を作成――オカムラと日本IBM、議事録作成支援ソリューション「TalkView」を提供
オカムラと日本IBMは、IBM Watsonの音声認識サービスを活用して、会議の音声をリアルタイムにテキスト変換する議事録作成支援ソリューション「TalkView」を発表。会議の効率化を支援する。(2018/6/7)

計測結果の転記、PC入力作業を「音声」で:
トヨタ系完成車メーカーが車両監査業務で音声認識キーボード入力システムを活用
トヨタ車体グループの完成車メーカーである岐阜車体工業は車両監査業務において、アドバンスト・メディアの音声認識キーボード入力システム「AmiVoice Keyboard」を採用した。(2018/6/7)

3年間で3億円の売り上げを目指す:
AI活用し複雑な対話が可能、CTCがチャットbot開発プラットフォームを提供開始
伊藤忠テクノソリューションズは、ユーザーとの対話型システムを構築するための開発プラットフォーム「Benefitter」の提供を開始した。パターン化されていない質問には、AIを活用して対応可能。音声認識機能を拡充し、スマートスピーカーにも対応予定だ。(2018/6/6)

「きました500円!」 しゃべるスマート貯金箱、タカラトミーアーツから
タカラトミーア―ツが、しゃべる「スマート貯金箱」を発売。人感センサーや音声認識機能を搭載し、コミュニケーションを取ることができる。(2018/6/5)

ユニファイドコミュニケーション(UC)の可能性を広げる
人工知能(AI)の進化が生む「音声認識」の新たな用途とは
人工知能(AI)技術の成熟は、音声認識技術の用途をさらに広げる可能性がある。実際にどのような用途が考えられるのか。(2018/5/31)

Google Cloud Speech APIを活用:
大和総研がAI音声認識システムを開発 CRMへの営業記録を音声入力で効率化
大和総研は、「Google Cloud Speech API」を活用して「AI音声認識機能」を開発し、大和証券のCRMシステムに導入。同社の営業員による音声入力を可能にし、日々の営業活動記録作業を効率化する。(2018/5/22)

ドライバーの声で感情を認識 雑音環境でも使えるAI ドコモらが開発
NTTドコモと感情認識AI開発のEmpathが、ドライバーの声で感情を認識するAIを開発。雑音環境でも音声認識できるのが特徴だ。(2018/5/8)

機械学習により精度が向上
Googleの音声認識サービス「Cloud Speech-to-Text」大幅強化、句読点挿入も可能
アップデートされたGoogleの音声認識テキスト変換サービスは、機械学習により精度が向上した。Googleは、変換されたテキストに自動的に句読点を追加するツールもリリースしている。(2018/4/27)

モバイルアプリ開発の最前線(後編)
音声認識と拡張現実がモバイルアプリの主戦場になる理由
モバイルアプリに限らず、音声認識や拡張現実の重要性は高まっていく。それはなぜなのか。開発者はどの技術に注目すべきか。今後のために何をすべきなのか。(2018/4/27)

人工知能ニュース:
AIでウチのドアが執事に、YKK APの「未来ドア」は2020年発売を目標に
建材メーカー大手のYKK APは未来の窓やドアを形にする「未来窓」の第3弾となる「UPDATE GATE」の記者説明会を開催した。顔認証やAI(人工知能)、音声認識などを利用した自動開閉、遠隔見守り機能、伝言や情報配信機能などを備えたドアシステムであり、「ドアが執事のようにふるまう」ことをイメージしている。(2018/4/26)

特集・音声言語インタフェース最前線:
“ほんやくコンニャク”の実現はいつ? 音声認識・翻訳技術は「言語」の壁を取り払うか
未来のひみつ道具を実現する最新テクノロジー。(2018/4/20)

モバイルアプリ開発の最前線(後編):
音声認識と拡張現実がモバイルアプリの主戦場になる理由
モバイルアプリに限らず、音声認識や拡張現実の重要性は高まっていく。それはなぜかのか。開発者はどの技術に注目すべきか。今後のために何をすべきなのか。(2018/4/19)

特集・音声言語インタフェース最前線:
さみしい「独り身」を救う? 3人の音声アシスタントと会話して可能性を探ってみた
昨今、クラウドAIベースの「音声認識アシスタント」が流行の兆しを見せている。中にはある程度“対話”できるものもあるという。どの程度の対話がこなせるものだろうか。ある高名な「先生」が、実践を通して可能性を探る。(2018/4/14)

特集・音声言語インタフェース最前線:
機械と対話できる日は来るのか アドバンスト・メディアに聞く、音声認識の課題と可能性
「音声認識」がクローズアップされることが増えた。音声認識が主な操作法であるスマートスピーカーやロボットも登場している。では、現在の音声認識技術は、どのレベルまで到達しているのか。アドバンスト・メディアに話を聞いた。(2018/4/6)

車載情報機器:
車載Linux「AGL」が音声認識と車両クラウド間接続にフォーカス
車載システム向けLinuxの共同開発プロジェクトAutomotive Grade Linuxは、音声認識にフォーカスしたSpeech EGと、車両クラウド間接続にフォーカスしたV2C EGという2つのエキスパートグループを発足した。(2018/3/22)

損保ジャパン日本興亜、音声認識AIによるコールセンター支援システムを本格導入 NTT Comと新機能の共同実証も
損保ジャパン日本興亜が、NTTの音声認識エンジンとAIエンジンを活用した「アドバイザー自動知識支援システム」を全国のコールセンターに本格導入。問い合わせに最適な回答を表示してオペレーターを支援する。併せて、用件の抽出や学習を自動化する新機能の実証実験を行う。(2018/3/20)

VRニュース:
HoloLensを使って季節感あふれるMR体験ができる「菊MR」を発表、商業施設など向けに
Nomura Open Innovation LABは、ヘッドマウントディスプレイのMicrosoft HoloLensの専用アプリのプロトタイプ「菊MR」を発表。実空間に配置された花に対し、関連の産地情報や、虫や動物といった生き物、月や雲などの自然の風景の3D画像などを重ねて表示する。「かぜ」というと風を吹かせるなど音声認識でのコントロールにも対応する。(2018/3/13)

レベルは入門者から英検準1級またはTOEIC700点程度まで対応:
AI搭載でユーザーの英語力に合わせて会話、CAIメディアが英会話の学習用ロボット「チャーピー」を発売
CAIメディアは、英会話の学習用ロボット「チャーピー」を発売する。クラウドプラットフォームとしてAzureを採用した。音声認識機能を備え、ユーザーの英語力に合わせて話しかけてくる。身近に英語を話せる環境を作り、英会話力を育成する。(2018/3/5)

指なぞり入力の「Swype」、NuanceがiOS/Androidともに提供終了へ
Nuanceが2011年に買収した指なぞり入力モバイルキーボードの「Swype」の提供を終了する。企業向け音声認識・音声入力サービスに集中するためとしている。(2018/2/20)

「りんなライブ」視聴者が対象:
女子高生AI「りんな」が進化 音声認識でユーザーと電話 “恋バナ”もOK
日本マイクロソフトの女子高生AI「りんな」が進化。ユーザーと電話で会話できる機能を追加した。「りんなライブ」視聴者が対象で、恋愛トークにも対応する。(2018/2/13)

CES 2018レポート:
AIとIoTに5Gも加わった「CES 2018」、そして全てのモノがデジタル化される
情報通信総合研究所が「CES 2018」について報告。グーグルとアマゾンによる音声認識AIの激しいつばぜり合いや動画配信サービスによる業界再編などについて紹介した他、AIとIoTに5Gが融合しつつあることもポイントとして取り上げた。(2018/2/5)

製造ITニュース:
ダイハツが販売店の整備に音声認識技術を導入、点検結果を自動入力
ダイハツ工業は、定期的なクルマの点検/整備時に、整備士の音声を認識し、点検結果が自動入力されるシステムを新開発した。販売会社で約1年間の実証実験を行い改良を重ねたもので、2018年2月3日に新装開店となる高知ダイハツ販売の南国店に正式導入される。(2018/2/2)

利便性よりもセキュリティ、パスワードよりも生体認証――IBM、IDや認証に関する意識調査を発表
IBMの「IDの未来に関する調査」によると、デバイスやアプリケーションなどにログインする際には、利便性よりもセキュリティが優先される傾向が強く、指紋読み取り、顔認識、音声認識といった生体認証テクノロジーのメリットを認識している回答が多かった。この傾向が強い若年層が今後の市場をけん引する可能性も指摘する。(2018/1/31)

App Town ライフスタイル:
PC連携で文字検索も可能 音声入力メモアプリ「AmiVoice iVoX Personal」iOS版が登場
アドバンスト・メディアは、1月11日に音声入力メモアプリ「AmiVoice iVoX Personal」のiOS版を配信開始した。最新の音声認識エンジンにより高い認識率を誇り、スマートフォンとPCで音声・文字・写真データの連携管理が行える。(2018/1/12)

特集「Connect 2018」:
画像認識や音声認識、APIで“いいとこ取り”できる時代に――ハンズラボ・長谷川社長
基幹システムのフルクラウド化という“大仕事”が終わったハンズラボ。次なる目標は、画像や音声認識を取り入れることだという。APIを使って気軽にシステムが組める今、長谷川社長は「システムを“選ぶ”必要性がなくなった」と話す。(2018/1/3)

「Googleアシスタント」のSDKが日本語をサポート 日本語を話す端末開発が可能に
Googleが、音声認識AIアシスタント「Googleアシスタント」をサードパーティ製端末に搭載するためのSDKで日本語をサポートした。また、Amazonの「Alexa」のスキルのように、端末固有の機能を操作できるようにする「Device Actions」を追加した。(2017/12/22)

AIサービス競争はこれから本格化
大手のAIサービスは画像認識や音声認識の次のレベルへ
ACCAのトルーデル会長は、AIがクラウドコンピューティングのキラーアプリになると考えている。同氏は各社の取り組み、そして今後のAIサービスの動向をどのように予想しているのか?(2017/12/19)



2013年のα7発売から5年経ち、キヤノン、ニコン、パナソニック、シグマがフルサイズミラーレスを相次いで発表した。デジタルだからこそのミラーレス方式は、技術改良を積み重ねて一眼レフ方式に劣っていた点を克服してきており、高級カメラとしても勢いは明らかだ。

言葉としてもはや真新しいものではないが、半導体、デバイス、ネットワーク等のインフラが成熟し、過去の夢想であったクラウドのコンセプトが真に現実化する段階に来ている。
【こちらもご覧ください】
Cloud USER by ITmedia NEWS
クラウドサービスのレビューサイト:ITreview

これからの世の中を大きく変えるであろうテクノロジーのひとつが自動運転だろう。現状のトップランナーにはIT企業が目立ち、自動車市場/交通・輸送サービス市場を中心に激変は避けられない。日本の産業構造にも大きな影響を持つ、まさに破壊的イノベーションとなりそうだ。