最新記事一覧
サンワサプライがMagSafeで装着できるスマホ向けの音声通話録音ガジェットを発売した。実際の使い勝手を実機で試してみた。
()
バッファローは、スマートフォン用CDレコーダー「ラクレコ」の専用アプリに新機能を追加した。機能名は「楽曲リンク」。ラクレコ専用アプリを介して取り込んだ曲とスマホ内の曲をまるっと聴けるようになった。
()
ヤマハは、音声や映像、照明の制御信号などファイル形式の異なるデータを、オーディオデータ形式に統一して記録、再生するシステム「GPAP」を開発した。また、会場規模に合わせてサイズを変更できるパネル型スクリーンを発表した。
()
2023年に公開したMONOist メカ設計フォーラムの全記事を対象とした「人気記事ランキング TOP10」(集計期間:2023年1月1日〜12月21日)をご紹介します。
()
“解析専任者に連絡する前に設計者がやるべきこと”を主眼に置き、CAEと計測技術を用いた振動・騒音対策の考え方やその手順を解説する連載。連載第19回では、吸音材と遮音材を使ったら騒音を何デシベル低減できるのかを計算してみる。
()
ゲオストアは、手のひらサイズのゲオ限定「Bluetooth コンパクトスピーカー」を発売。ワイヤレス接続で最大出力5Wの音楽再生が可能で、8種のイルミネーション機能を搭載する。
()
セイコーエプソンは、音声再生専用LSI「S1V3F351」「S1V3F352」のサンプル出荷を開始した。ブザー音声機能や音声データ向けフラッシュメモリ、発振回路を内蔵している。
()
9月1日にソニーが国内投入を発表した「Xperia 5 V」。キャリアからの発表も待たれる秋冬商戦向けの新モデルとなる。先代「Xperia 5 IV」から何が進化したのかを実機でチェックした。
()
「祝Apple Music on Tesla」ということで、Apple Musicアプリの使用感に加え、Model 3に標準搭載されているオーディオについて、音楽制作者としての考察を交えながらマニアックに語ります。同時に、Model 3車内に録音機材を持ち込んでの周波数の計測実験も行ったのでその結果も報告します。
()
Windows 11では、起動時に「ピィポォ」という音が鳴る。起動したことが音で分かるメリットはあるものの、会社などでは起動するたびに音が鳴るため、周りに迷惑を掛けてしまう場合もある。そこで、この起動音を無効化する方法や音を変更する方法を紹介しよう。
()
Metaは、音声技術の対応言語を拡大することを目指す「Massively Multilingual Speech」(MMS)プロジェクトの成果として、音声認識モデル、音声合成モデル、言語識別モデルとコードをGitHubで公開した。
()
Metaは、4000以上の音声言語を理解する多言語大規模言語モデル「MMS」をオープンソースで公開した。同様の既存技術の40倍の能力だとしている。これにより、たとえばメタバースでもユーザーは互いの母国語で会話できるようになるだろう。
()
作業に時間のかかる文字起こしを圧倒的に時短してくれる「オートメモ S」。文字起こしの方法や仕組み、精度などを紹介する。翻訳機能はないが、多言語に対応しているので、とりあえずテキスト化しておき、翻訳アプリにかけるという使い方も。
()
“解析専任者に連絡する前に、設計者がやるべきこと”を主眼に、CAEと計測技術を用いた振動・騒音対策の考え方やその手順を解説する連載。連載第5回では、測定データをExcelに取り込んで周波数分析を行う。
()
Bingさんがアップデートするのなら、ワシも負けておられんよ。そのお悩み、ビッタビタに解決してやるわい。
()
OpenAIは、対話に特化した言語モデル「ChatGPT」と音声認識モデル「Whisper」をAPIで利用できるようにした。
()
VRのクラブなら、おうちから0秒で遊びに行けます。
()
連載「CAEと計測技術を使った振動・騒音対策」では、“解析専任者に連絡する前に、設計者がやるべきこと”を主眼に、CAEと計測技術を用いた機械の振動対策と騒音対策の考え方や、その手順について詳しく解説する。連載第3回では「周波数分析」について取り上げる。
()
三角関数の基本を確認し、Pythonでプログラミングしてみよう。練習問題では、三角関数を使ってサウンドを作成したり、サウンドデータを読み込んで波形を表示したりするための初歩的なプログラムを作成する。また、サウンドを分析するために使われる離散フーリエ変換の利用についても発展的な話題として簡単に触れる。
()
米Adobeは、映像向けクラウドサービス「Frame.io」のアップデートとして、富士フイルムとRED製カメラからのデータの直接アップロードに対応したと発表した。これにより、物理メディアを介さずに写真/映像データをクラウドから取得して編集作業に移ることができる。
()
精度向上により、近年利用が広まっている「ニューラル機械翻訳」。その仕組みを、自分で動かしながら学んでみましょう。第3回は「JoeyNMT」を音声に対応させて、音声認識や音声翻訳のタスクをエンドツーエンドで解くモデルを構築してみましょう。
()
注目デバイスの活用で組み込み開発の幅を広げることが狙いの本連載。第2回は、シグナルジェネレータ「Si5351A」をデジタル変調器として活用できるかを試してみる。
()
セイコーエプソンは、音声再生専用ハードウェアを内蔵した32ビットマイクロコントローラー「S1C31D41」を発表した。話速変換、音声ピッチ変換を備えており、音声を使った家電製品や健康機器、ビル、工場の音声付き警報機などに適する。
()
Appleはサードパーティーのポッドキャストホスティングプロバイダーと連携する機能を発表した。
()
Tesla Model 3 ロングレンジは14個のスピーカーを搭載している。これらを駆使してどのようなサウンドを奏でることができるのか、ご紹介しよう。
()
曲名を入力するだけで自動作曲できるWebサイト「ポンコツ自動作曲ちゃん」が話題になっている。作詞や作曲、Web制作などを手掛けるクリエイターのdaniwellさんが制作したもので、好きな言葉を入れることで、数秒〜数十秒程度の短めの音楽を自動生成する。
()
フリー素材サイトとしては「いらすとや」や「Adobe Stock」などのサービスが有名だが、それ以外にもユニークなサービスが2022年になってからも続々と立ち上がっている。過去に記事として取り上げた、商用利用可能なフリー素材サービスを5つ紹介する。
()
電通は、タップやフリック、文字入力などの操作を想定したオリジナルのシステム操作音をフリー素材として公開した。「SND」と名付けられたこの音声は、ソフトウェアのUX開発者向けに開発したもので、商用利用も可能としている。
()
Logic Proの空間オーディオ機能を活用し、モデリング音源と仮想マイクでホール収録を再現する試み。
()
カメラで写したものをAIで認識して、即興でラップ化するWebアプリケーション「Giorgio Cam」で遊んだ。ペンや楽器、本物の猫などで試してみると、AIの得意/不得意が見えてきた。誤認識されてもラップでテンションは上がるので心配なし!
()
レーベルを運営する筆者が、M1 MacBook ProとLogic Proを使って自社の作品をDolby Atmos空間オーディオに対応させる過程をお見せする。
()
シャオミ(Xiaomi)から、Google アシスタント対応のスマートスピーカーが登場した。税込みで実売6480円という手頃なモデルを使ってみた。
()
ファーウェイ・ジャパンは、スマートウォッチ「HUAWEI WATCH 3」のアップデートを実施。手洗い検出機能やSMSメッセージ返信機能への対応、有料の文字盤の5分間無料トライアルなどが行えるようになる。
()
AWS活用における便利な小技を簡潔に紹介する連載「AWSチートシート」。今回は、AWSのAI文字起こしサービス「Amazon Transcribe」をPythonで利用する方法を紹介する。
()
いつでもどこで迫力のSLサウンドを聞けちゃう。
()
ロスレスコーデックのApple LosslessがApple Musicに対応することが判明した。
()
Yellstonが、Webブラウザで使えるAI音声合成サービスを公開。利用料は無料で、プレゼンやゲーム実況動画といった用途を見込む。法人・個人を問わず商用利用を認める。
()
アーティスト・Aimerのプロデューサーが監修するAI作曲アプリ「FIMMIGRM」。搭載しているAIは膨大な数のヒット曲の特徴を学習しているという。AIは一体、人気曲のどんな部分を学習しているのか。
()
AIがオリジナル楽曲を自動で生成する音楽アプリ「FIMMIGRM」の提供を、テクノロジーを活用した音楽プロデュースを手掛けるスタートアップのTMIK(東京都渋谷区)が始めた。
()
特集は、分かっていても失敗してしまう災害復旧の原因解説、CPU市場動向、GoogleやFacebookの規制に対する疑問の3本。他にWAVファイルに隠されたマルウェア問題、Androidアプリをクラウド化する「Anbox Cloud」、AI事例などの記事をお届けする。
()
ユーザーローカルが、AIが人間の声を分析し、その中に含まれる感情を7種類に分類するサービスを無償で公開。感情の度合いを数値化したり、グラフ化したりできる。
()
「Microsoft Word」の文字起こし機能「Transcribe」は、音声ファイルを文字に書き起こすプロセスの合理化を図る。文字起こしに苦労している人にとっての“救世主”となるのか。
()
音声が不完全もしくはない状態でも、映像さえあればリアルな話し言葉に変換できる。
()
昨今、急きょ「テレワーク」をすることになった人や、「巣ごもり」のために動画の視聴やオンラインゲームのプレイが増えたという人は少なくないだろう。そこで発生した困りごとを解決したいという人にお勧めしたいのが、TP-LinkのWi-Fi 6(IEEE 802.11ax)対応ルーターとWi-Fi中継器だ。
()
小さなマイクロコンピュータ「Raspberry Pi」(通称ラズパイ)で作る、自分だけのガジェット。今回は米Amazonが開発したAIアシスタント「Alexa」をラズパイで使えるようにしてみます。
()
WAVファイルにマルウェアを組み込んで拡散する手法が発見された。どのような仕組みのマルウェアなのか。そしてこのマルウェアからPCを守る方法とは何か。
()
Facebook AI Researchは、オンライン音声認識に使用可能な推論フレームワーク「wav2letter@anywhere」を開発し、オープンソースソフトウェアとして公開した。
()
NECブランドのPC事業40周年に合わせてハル研究所が開発した「PasocomMini PC-8001」とPC-8001の周辺機器「PCG8100」のミニチュア版のセットが一般販売されることになった。PCG8100のミニチュア版は単品販売も行われる。
()
無線LAN標準化団体のWi-Fi Allianceが、「Wi-Fi 6」(「IEEE 802.11ax」の一般向け名称)の認証プログラムを開始した。最初に認定を受けるスマートフォンは韓国Samsung Electronicsの「Galaxy S10」だ。
()
AppleはiTunes Storeのダウンロード音源を「可能な限りマスター品質に近い形で配信が可能」にするというマスタリングスキームを提供している。本当にそうなのか? 実際に試してみた。
()