文字起こしができるボイスレコーダー「AutoMemo S」発表 画面付きで確認しやすく(1/2 ページ)
ソースネクストは12月9日、AIボイスレコーダーの新モデル「AutoMemo(オートメモ) S」を発表した。価格は2万4800円(税込み)で、2022年1月21日に発売する。新モデルでは2.83型のディスプレイを搭載し、文字起こしした内容をレコーダー本体で確認できるようにした。
ソースネクストは12月9日、AIボイスレコーダーの新モデル「AutoMemo(オートメモ) S」を発表した。価格は2万4800円(税込み、以下同)で、2022年1月21日に発売する。
AutoMemo Sは、録音した内容を文字起こしできるボイスレコーダー。名刺サイズのコンパクトなボイスレコーダーで、録音した内容を自動でクラウドストレージに転送して、テキスト化までできるという手軽さが特徴となっている。
新モデルでは2.83型のディスプレイを搭載し、文字起こしした内容をレコーダー本体で確認できるようにした。録音データはスマートフォンアプリに同期されて、同じ操作感で確認できる。
録音の操作はシンプルで、電源オン時なら本体の録音ボタンを押すだけで開始、終了できる。録音データの転送やテキスト化は、Wi-Fi接続時に自動で行われる。ディスプレイはタッチパネルになっており、スマホのアプリと同様の操作感で操作できる。
テキスト化は日本語の他、英語、中国語など計72言語に対応する。翻訳機能はなく、複数の言語が混ざった会話は1つの言語を選んでテキスト化することになる。
録音・再生の操作はオフライン環境でも行えるが、リアルタイムでのテキスト化はできない。録音終了後、Wi-Fiに接続すると録音の内容がクラウドサーバに転送されて、サーバ上でテキスト化の処理が実行される。
録音データと文字起こしされた内容は、メールアドレスに自動で送信できる他、Google DriveやOneDrive、Dropboxといったクラウドストレージに自動保存することも可能。
AutoMemo Sの主なスペック
Wi-FiはWi-Fi5(IEEE802.11a/b/g/n)をサポート。BluetoothはBluetooth 4.2に対応し、Bluetoothヘッドセットを接続できる。
本体には充電用のUSB Type-C端子の他、音声入力用の3.5mm3極マイクジャック、出力用の3.5mm4極マイクジャックをそれぞれ備える。スマートフォンアプリはiOS 13.0とAndroid 6.0以上に対応する。大きさは約92×54×12mm、重さは約88g。
CPUはARM Cortex A53クアッドコアを搭載し、メインメモリは1GB。ストレージは16GBを内蔵する。録音形式はFLACだが、テキスト化の際にmp3形式に変換される。録音データはクラウドストレージへ保存後適宜削除されるため、内蔵ストレージの残量を気にせず利用できる。バッテリー容量は1800mAhで、連続録音時間は約16時間。
AutoMemo Sの月額料金
AutoMemo S本体での録音および再生は無料だが、テキスト化にはクラウドサービスを使用するため、テキスト化した録音時間に応じて料金がかかる。
標準プランの「ベーシックプラン」では毎月1時間までの録音を無料でテキスト化できる。月額980円の「プレミアムプラン」に加入すれば、毎月30時間までのテキスト化が可能となる。より長い時間の録音をテキスト化した場合、10時間単位で購入できる「10時間チャージ」(1480円)も用意される。AutoMemo Sの発売に合わせて、購入から3カ月間、プレミアムプランの利用料が無料となるキャンペーンが実施される。
なお、ディスプレイなしの従来製品「AutoMemo」も継続して販売される。オートメモシリーズでは日本語の音声認識エンジンを12月16日に更新し、会話などのシーンでの翻訳精度が向上するとしている。エンジンの更新は旧製品のAutoMemoにも適用される予定で、その際の製品アップデートなどは不要となっている。
リモート会議を翻訳「ポケトーク字幕」
翻訳ツール「ポケトーク」シリーズの新製品として「ポケトーク字幕」も発表された。Windows/Mac対応のソフトウェアで、2022年1月より順次発売予定。料金は月額1100円、年額1万3200円のサブスクリプションモデルを採用する。なお、2022年3月まで無料で提供される。
ポケトーク字幕は、Zoomなどのビデオ通話で使える翻訳ソフトウェア。翻訳した内容を字幕としてリアルタイム表示できるのが特徴。字幕機能はこれまで、ポケトーク本体のオプション機能として提供されていたが、単体のソフトウェアとして販売されることになった。
ポケトーク字幕の出力は、ビデオ会議ツール側からはビデオカメラとして認識される仕組みで、ZoomやGoogle トーク、Cisco Webexなど多数のビデオ会議システムで利用可能。
翻訳から字幕表示までの速度が1秒以下と、リアルタイムに近い翻訳速度によって、円滑な通話が可能としている。ただし、翻訳・字幕表示が可能なのは通話者本人が話した内容のみで、通話相手の会話を翻訳するためには、通話相手がポケトーク字幕を導入する必要がある。また、録音機能や翻訳ログを残す機能は備えていない。
「ポケトーク字幕」は現時点ではPCのみの対応となっており、スマートフォン版の開発について具体的な計画はないとしている。
関連記事
独自プロセッサ×音声認識が“文字起こし”に革命を? 「Pixel 6 Pro」全力レビュー(後編)
Googleのオリジナルスマートフォン「Pixel 6 Pro」は、独自プロセッサ「Google Tensor」を搭載している。これが、機械学習ベースのAI処理に大きな改善をもたらしており、カメラの画像処理だけでなく音声認識処理で大活躍する。普段使いのスマホとしての利便性と合わせてチェックしていこう。ソースネクストの「ポケトーク」に新機能 グループ翻訳とWeb会議への字幕付与に対応
7~8月にかけて、ソースネクストのクラウド翻訳機「ポケトーク」に新機能が追加される。初代モデルを除く全モデルにおいて、最大100人とコミュニケーションを取れる「グループ翻訳」と、Windows PCのカメラ画像に翻訳字幕をリアルタイムに合成する「ポケトーク字幕」が利用できるようになる。英語音声を自動で文字起こし ドコモが「Otter」のBusinessプランを発売
NTTドコモは、Otter.aiが提供する英語音声を自動で文字起こしをする音声認識AIサービス「Otter」のBusinessプランを販売開始した。利用料金は1アカウントで1年あたり3万3000円(税込み)。ポケトークが翻訳エンジンに「DeepL翻訳」採用、「英語(ゆっくり)」も追加
ソースネクストは、11月11日からAI通訳機「POCKETALK W」「POCKETALK S」「POCKETALK S Plus」を無償アップデート。対応言語の拡大や翻訳エンジンの一部へ「DeepL翻訳」を採用した。連続待受時間が伸びるよう改善。カセットテープ風の録音アプリ「Qyur2(キュルキュル)」 有料の文字起こし機能はどこまで使えるか?
カセットテープ風のボイスレコーダーアプリ「Qyur2(キュルキュル)」に有料の文字起こし機能が追加された。ビジネスで使えるレベルなのか、実際に試してみることにした。「キーワード頭出し ボイスレコーダー」で記事執筆の効率化なるか? とある編集部員の場合
カシオのiPhone用録音アプリ「キーワード頭出し ボイスレコーダー」。聞きたいフレーズを入力すると、録音データから素早く検索し再生してくれるという。記事を書く効率が上がるのか使ってみた。
Copyright © ITmedia, Inc. All Rights Reserved.