キーワードを探す
検索

「音声認識」関連の最新 ニュース・レビュー・解説 記事 まとめ

最新記事一覧

2024年問題を目前に、建設DXによる業務効率化が急務となっている。だが、デジタルツールを導入してみたものの、使いこなせず成果を得られない中小企業は多い。建設業に特化したAI音声認識サービスを提供するアドバンスト・メディアに、建設現場でのデジタル活用の課題や解決につながる生成AIを活用した新サービスなどを聞いた。

()

米Microsoftが、大規模言語モデル「GPT-4」などのAPIをクラウドサービス「Microsoft Azure」経由で使える「Azure OpenAI Service」の新機能を発表した。米OpenAIが発表したばかりの「GPT-4 Turbo」や「GPT-3.5 Turbo」の新バージョンに対応する他、画像生成AI「DALL-E 3」や音声認識システム「Whisper 3」もサポートするという。

()

Speakeasy Labsは、英語スピーキングに特化した特化型学習アプリ「Speak(スピーク)」の日本語正式版を2023年2月9日にリリースした。独自開発の自動音声認識技術やChatGPTを支えるAI技術、英語学習ノウハウにより対人英会話以上の体験を提供するとしている。

()

Amazonのスマートディスプレイ「Echo Show 15」にソフトウェア更新が行われ、新たにFire TVとして利用できる機能が追加される。別売の音声認識リモコンを用意すれば、通常のFire TVシリーズと同じように使える(タッチパネル上の仮想リモコンでも操作は可能)。

()

精度向上により、近年利用が広まっている「ニューラル機械翻訳」。その仕組みを、自分で動かしながら学んでみましょう。第3回は「JoeyNMT」を音声に対応させて、音声認識や音声翻訳のタスクをエンドツーエンドで解くモデルを構築してみましょう。

()

Amazonの映像デバイス「Fire TVシリーズ」に対応する音声認識リモコンに、Amazon Musicボタンの代わりに「ABEMA(アベマ)ボタン」が搭載されたものが登場する。ボタンを押すと「ABEMA」アプリが一発起動するもので、Amazon.co.jpや家電量販店ではこのリモコンが付属するFire TVシリーズも順次発売される。

()

Microsoftは音声認識大手Nuance Communicationsの買収を完了した。「ヘルスケア、金融、サービス、小売、通信を含む業界全体の会話型AIおよびアンビエントインテリジェンスのリーダー」である同社と成果ベースのAIを構築していく。

()

三菱電機は2022年2月28日、高精度な音声認識技術や多関節ロボットの最適化によりティーチング(教示)の負荷を大きく低減した形で動作プログラミングを自動生成する複合技術「ティーチングレスロボットシステム技術」の開発を発表した。ロボット活用のハードルを下げることで、従来ロボットが使われてこなかった食品工場などでの用途拡大を狙う。

()

Googleのオリジナルスマートフォン「Pixel 6 Pro」は、独自プロセッサ「Google Tensor」を搭載している。これが、機械学習ベースのAI処理に大きな改善をもたらしており、カメラの画像処理だけでなく音声認識処理で大活躍する。普段使いのスマホとしての利便性と合わせてチェックしていこう。

()

ルネサス エレクトロニクスが拡充を発表したオンラインの評価ボードテスト環境「Lab on the Cloud」。今回の拡充で総計23種類のボードが利用可能になったが、実際にどのような感じで利用できるのだろうか。「超低消費電力なREマイコンによるIoTエッジ向け音声認識ソリューション」を例に見ていこう。

()
キーワードを探す
ページトップに戻る