最新記事一覧
慶應義塾大学は、口元の映像だけから本人の過去の声を再現するAIを開発した。喉頭摘出後や音声障害の患者が自分の声で会話できる可能性を示した。
()
ヤマハは25日、クラウドファンディング事業を手掛けるCAMPFIREと共同で、既存のキャラクターを「VOCALOID(ボーカロイド)」にしたいIP事業者を支援する「VOCALOID FAN-ding」を始めた。
()
3分あれば10曲チェックでき、「日々のすきま時間で新たな楽曲に出会える」としている。
()
NTT西日本が、声優・俳優の権利を守るAI音声事業「VOICENCE」を開始。フェイク音声対策と正規ライセンス市場の整備で、声の価値を未来へつなぐ1000億円市場を目指す。
()
今回はDSPの話を取り上げたい。DSPといえば、Texas Instruments(TI)の「TMS320」は欠かせないが、TMS320登場に至るまでには長い道のりがあった。
()
ITRによると、対話型AIエンジン/デジタルヒューマン市場は、サービス創出や接客業務の効率化などを目的に導入が進み、2029年度には55億円規模に達する予測だ。企業が導入するに当たっての課題は何か。
()
Googleは、「Google Meet」にリアルタイム音声翻訳機能を追加した。まずはイタリア語、ポルトガル語、ドイツ語、フランス語に対応する。
()
Appleの「AirPods Pro 3」は、内部のSoCは先代から変わりないものの、中身はフルモデルチェンジと言っても過言ではないレベルで刷新されている。発売に先駆けて、その実力をチェックしてみよう。
()
ドコモAI社長が記者会見を行う日は到来するのだろうか――。NTTドコモの前田義晃社長を模したAIアバター「アバター前田社長」は、すでに社内でキャリア相談に活用されている。見た目は本物そっくりで、公開資料を確認する限り違和感はほとんどないように見えるが、実際のところはどうなのか。
()
NTTドコモが、自社の前田義晃社長を模したAIアバター「アバター前田社長」の活用事例を紹介した。公開画像は本物の前田氏にそっくりだ。社員が話しかけると、まるで目の前に本物の前田氏がいるかのように、アバターが相談に応じる──。
()
7月30日に発生した、マグニチュード8.8のカムチャツカ半島地震。この時、NHKによる特設ニュース番組の画面に「分かりやすい」と反響が集まった。広報担当者に“見やすさ”の工夫を聞いた。
()
プロイラストレーターのrefeiaさんに、Googleの新型スマートフォン「Pixel 10 Pro XL」を試してもらいました。そこから見えてきたこととは……。
()
iPhoneに採用される次期バージョン「iOS 26」で、新たな「安全・安心」機能が追加される。一足先に内容を見ていこう。
()
「あのゆっくり解説で大人気の東方projectが原宿にやってきた」──そんな宣伝文句を掲載したWebサイトが一部ユーザーの間で話題になっている。
()
グローバル化が加速する中、日本の製造業でも海外拠点や海外企業との協業や取引が日常化しつつある。だが一方で、言語の壁はいまだ高く、多国間でのコミュニケーションの負荷は大きい。この課題をAIで解決した同時通訳ツールがあるという。本稿では、同サービスの仕組みと導入メリット、今後の展開について詳しく紹介する。
()
JR東日本は7月23日、生成AIを活用した自動電話案内サービス「どこトレダイヤル」を開始する。路線名や駅名を電話で伝えると、列車の遅延や運転見合わせ、走行位置などの情報を合成音声で案内する仕組み。
()
音声合成ソフト用音源のテーマキャラクター「結月(ゆづき)ゆかり」「紲星(きずな)あかり」を企画するバンピーファクトリーが、両キャラの利用ガイドラインを更新し、生成AIで出力したキャラクターイラストの有償頒布や、イラストなどを使った動画・Webサイトの収益化を一部禁止した。
()
YouTubeは、収益化対象コンテンツのポリシーを改定し、AIによって大量に自動生成されたコンテンツを収益化の対象外とする方針を明らかにした。背景には、視聴者の満足度低下や広告効果の減退に対する懸念──だけではない理由があると考えられる。
()
かつて斜陽産業とも呼ばれた漫画は現在、デジタル化で再成長を遂げている。その背景に、生成AIの存在がある。生成AIの登場で、アシスタントや漫画家の仕事はなくなってしまうのだろうか……?
()
富士通は、AIアバターがPowerPointの資料を読み込み、自動でプレゼンテーションを実施して質疑応答に対応する技術を開発した。設定したAIアバターを介して音声でインタラクティブな質疑応答ができる。
()
動画編集での喋りを書き出してテキストベースで編集できるようになってしばらくたつが、韓国の動画編集ツール「Vrew」が3.0で劇的進化していた。AIが台本作成から画像生成、音声合成まで一括処理。撮影機材も出演者も不要で、アイデアだけで完成度の高い動画コンテンツが制作可能という。実際に試してみた。
()
NXP SemiconductorsのAI戦略/技術部門担当グローバルディレクターを務めるAli Ors氏は「Embedded Vision Summit 2025」において、エッジデバイス上で大規模言語モデル(LLM)推論を実現するという同社の戦略の詳細を説明した。
()
6月9日(米国太平洋夏時間)に行われた、Appleの開発者会議「World Developers Conference(WWDC) 2025」の基調講演では、いろいろな発表がなされた。その概要を見つつ、その意図を俯瞰(ふかん)してみたい。
()
Appleが優れたデザインと社会的価値を表彰する「Apple Design Awards 2025」について、林信行氏がまとめた。
()
EDIX 東京 2025では、さまざまな基調講演が行われた。中でも4月23日にはGoogleと日本マイクロソフトという二大プラットフォーマーが相次いで講演を行った。この記事は、その内容をお伝えする。
()
楽天グループが、2025年第1四半期決算を発表した。全セグメントが順調に増収増益を達成し、四半期単独だがモバイルセグメントが始めて黒字となった。
()
カリフォルニア大学バークレー校とサンフランシスコ校の研究者チームは、脳信号をほぼリアルタイムで可聴音声に合成する技術を開発した。これにより、重度のまひを持つ人々が自然な音声で発話できるようになるという。
()
大阪・関西万博のNTTパビリオンの隠れた注目ポイントを紹介。ネットワーク技術IOWNが展示を支える。万博ならではの建築技法も見どころだ。NTTグループはガイドアプリやメタバースも手掛けている。
()
Googleは、イルカの会話を解読するための新LLM「DolphinGemma」を発表した。また、イルカと会話するためのシステム「CHAT」向けに「Pixel 9」を提供していることも紹介した。
()
2025年4月1日、Appleの生成AI機能「Apple Intelligence」が日本語対応を果たした。サムスン電子ジャパンは「いち早く日本語対応を果たした」AI機能を、あえてこのタイミングでアピールした。Galaxy AI/Bixbyの強みも語られた。
()
AHSは1日、AI音声合成技術を用いた文字読み上げソフト「VOICEPEAK 重音テト(かさね・てと)」を同月24日に発売すると発表した。
()
東日本電信電話(NTT東日本)と西日本電信電話(NTT西日本)は、2025年3月31日に天気予報サービス「177」を終了する。177番をダイヤルすれば、電話をかけている地域の天気予報を確認できる。サービス終了の背景や、スマホ世代なら知らないであろう通話料金や由来を少し解説する。
()
OpenAIは、新しい音声認識モデル「gpt-4o-transcribe」と「gpt-4o-mini-transcribe」および音声合成モデル「gpt-4o-mini-tts」のAPIを提供開始した。
()
エッジデバイス上でAI推論を行う「エッジAI」の導入が拡大する中、ルネサス エレクトロニクスはマイコンやMPUといったハードウェアに加え、ソフトウェアでもエッジAI対応を強化している。同社が提供するエッジAI向け開発ツールやそれを用いた事例について聞いた。
()
NHKは、「新プロジェクトX〜挑戦者たち〜」(総合テレビ)で、「情熱の連鎖が生んだ音楽革命 〜初音ミク誕生秘話〜」を4月19日に放送する。
()
Audibleは、黒柳徹子さん自身の声と、音声合成技術で黒柳さんの声を再現したデジタル音声を組み合わせたオーディオブック「続 窓ぎわのトットちゃん」のオーディオブックの配信を始めた。
()
ChatGPTを対話システムと見なし、これまでの対話システムで用いられてきた技術との違いを整理しながら、どのようにして人間のような自然で流ちょうな対話が実現できているのかを解説する本連載。最終回は、対話システムが有する知識、共感、個性について解説する。
()
日本テキサスインスツルメンツ(日本TI)が「CES 2025」で発表した新製品である、車室内向け60GHz帯ミリ波レーダーセンサー「AWRL6844」、車載オーディオ処理用のMCU「AM275x-Q1」とプロセッサ「AM62D-Q1」について説明した。
()
音声認識が普及し、当たり前になっていくことによってUI(ユーザーインターフェース)革命が起こります。スマートフォンやコンピューターなどに入力する手段が大きく変わるのです。
()
AIの効果的な活用にはデータが不可欠だ。企業のデータに目を向けてみると、主に画像・テキスト・音声の3つに分類されるため、この3つの領域でそれぞれ活用が進む。
()
ゲーム開発などを手掛けるインフィニットループは、3DキャラクターをPCデスクトップ上で動かすソフトウェア「Desktop Mate」を発表した。
()
生成AIはコンテンツ制作の形をどのように変えていくのか――。コンテンツIPビジネスを国内外で手掛けるMinto代表取締役の水野和寛が解説する。
()
「初音ミク」運営元が二次創作クリエイターに声明。「ガイドラインの範囲を超えた利用についての声を多く確認し、心を痛めている」
()
パナソニックホールディングスとPHP研究所は松下幸之助氏を再現したAIを開発した。現在も改良を重ねている。
()
声優・梶裕貴さんが、自身の声を基にした公式AI音声「梵(そよぎ)そよぎ」を発売した。音声合成ソフトウェア「CeVIO AI」と「Voisona」向けに、歌声用の音源とトーク用の音源をそれぞれ提供する。
()
生成AI(人工知能)がさまざまな業界で普及が進んでおり、今では企業のビジネスを成長させる上で無視できない存在になっている。ただ、その進化のスピードは速く、どのように活用していけばよいのか迷う企業も多いだろう。本稿では「Cloud Operator Days Tokyo 2024」のセミナーを基に、急激に進化する生成AIと企業の関わり方について解説する。
()
KADOKAWAの文庫レーベル・電撃文庫は、YouTubeチャンネル上で動画「【 #SAOクリア 】キリトとアスナがゆっくり解説!《ソードアート・オンライン》クリアまで」を公開した。
()
1日にβ版を公開したAI音声生成サービス「DMMボイス」が、公開から4日間で概算700万文字の音声を生成するなどクリエイターの注目を集めている。
()
プロセッサの技術はAI技術の台頭とともに様変わりしている。使われているのはCPUやGPUだけではない。AI関連のタスクに使用するプロセッサの一つである「TPU」について紹介する。
()
さまざまなキャラクターの声でテキストを音声合成できるAI音声合成サービスがDMMグループから。
()