「音声合成」関連の最新ニュース・レビュー・解説記事まとめ

メリットも多いが、悪用リスクも：OpenAIが開発した音声生成モデル「Voice Engine」が見せた実力と課題

OpenAIは音声生成モデル「Voice Engine」の小規模プレビューから得られた予備的な知見と結果を公表した。このプレビューから合成音声生成の持つ可能性と課題が浮き彫りとなった。

(2024/4/20)

「スナックバス江」の“謎のYouTubeアニメ”が話題　原作者が爆速で拡散、しかし関係性は不明

「スナックバス江」の自主制作アニメがYouTube上に突如投稿され、Xなどで話題になっている。YouTubeに投稿されたアニメは合成音声などを使っており、テレビアニメとの関連は不明だが、原作者・フォビドゥン澁川さん本人が自身のXで取り上げている。

(2024/4/10)

Galaxy S24シリーズの目玉機能「Galaxy AI」を全方位で検証　スマホ体験が大きく拡張される！

Galaxy AIの（ほぼ）全機能をスマホでレビュー。通話翻訳や文字起こし、要約……多彩な新機能を徹底解説する。

(2024/4/11)

石野純也のMobile Eye：「Galaxy AI」を打ち出すサムスンの端末戦略を解説　AI対応が“処理能力”だけで決まらないワケ

サムスン電子は、4月11日にフラグシップモデルの「Galaxy S24」「Galaxy S24 Ultra」を発売する。最大の特徴は、Googleの「Gemini Pro」や「Gemini Nano」などをAIモデルのベースにした「Galaxy AI」を端末の機能として密接に統合しているところにある。一方で、Galaxy AI自体はGalaxy S24／S24 Ultraだけでなく、アップデートを通じて過去のモデルにも適用される。

(2024/4/6)

OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る

OpenAIは、人の声を再現する生成AIモデル「Voice Engine」を発表した。動画生成の「Sora」同様「重大なリスク」があることを認識しており、広範囲に提供は（当面は）しない。

(2024/3/30)

突然ブームになった「好きな惣菜発表ドラゴン」とは？　ほっこりするニコ動の動画、作者に制作のきっかけを聞く

2023年8月にニコニコ動画に投稿された動画がブームに。

(2024/3/28)

HIKAKINやかまいたちも絶賛、おしゃべりAI「Cotomo」　自然な会話はどう実現？　創業者に聞く

自然な会話が話題のおしゃべりAI「Cotomo」。開発の背景や目指すビジネスモデルを創業者に聞いた。

(2024/3/29)

動画の一括編集、データ分析に役立つ：YouTube運営がもっと楽に？　「YouTubeLabs」で自動化を支援するスクリプトを提供、Google

GoogleはGitHub上に「YouTubeLabs」を立ち上げ、パートナーやクリエイターの作業効率化を支援するスクリプトを公開した。これにより一般的なユースケースの自動化が可能になる。本記事ではYouTubeLabsの概要を紹介する。

(2024/3/2)

セキュリティニュースアラート：AI時代の要注意脅威アクターとは？　Microsoftが調査レポート「Cyber Signals」を公開

MicrosoftはAIの登場によってサイバーセキュリティが大きな変革を迎えているとし、AIを使った攻撃対処や人材不足への対応など新たな取り組みを「Cyber Signals」第6版において伝えた。

(2024/2/19)

深層学習モデルの仕組み【前編】画像認識や生成技術の基礎「CNN」「GAN」とは？　押さえたい特徴と違い

主要な深層学習モデルとして「畳み込みニューラルネットワーク」（CNN）と「敵対的生成ネットワーク」（GAN）がある。両者には似通う点があるが、仕組みや使い方は異なる。その成り立ちから解説する。

(2024/2/19)

データサイエンスのモデル入門【第1回】ギャンブルが起源「データサイエンス」の基礎が分かる“4つの予測モデル”とは？

データ駆動型の意思決定がビジネスに欠かせなくなった。企業は予測モデルを構築してシミュレーションを重ねることで、深い洞察を得ることができる。代表的な4つのモデルについて、その起源や特徴を解説する。

(2024/2/14)

IIFES 2024：日立産機が“設備コンシュルジュ”を参考出展、生成AIとIoTサービスを組み合わせ

日立産機システムは、「IIFES 2024」において、生成AIとIoT接続による遠隔設備監視が可能な「FitLiveサービス」の組み合わせによる、設備コンシェルジュサービスを参考出展した。社内での実証を経て、2024年度以降の市場投入を検討している。

(2024/2/2)

AIと恋愛できるiOSアプリ「恋するAI」　マッチングアプリ「タップル」提供元が開発「少子化問題を解決したい」　

AIと恋愛できるiOSアプリ「恋するAI」登場　マッチングアプリ「タップル」提供元が開発「少子化問題を解決したい」　

(2024/1/15)

AI活用で“電話予約対応”をどう変革した？　ある和食チェーンの挑戦

和食・しゃぶしゃぶチェーン店「かごの屋」を運営するKRフードサービスが、ボトルネックになっていた電話予約対応業務の改善により、売上向上とコスト削減、業務負担減を成功させた。

(2024/2/1)

歌声合成にダークホース？　「ペッパー」が、AI歌声合成ソフト「VoiSona」の新ボイスに登場

AI歌声合成ソフトを手掛けるテクノスピーチは、AI技術で人間の歌声を再現できるソフト「VoiSona」に、人型ロボット「Pepper」のボイスライブラリを追加した。

(2024/1/11)

Gartner Insights Pickup（332）：AIベースのマシンが顧客になる未来に備える

この先、AIベースのマシンカスタマー（顧客としてのマシン）は増加し、洗練され、強力で独立した意思決定者、取引者となる見通しだ。本稿では、ビジネスリーダーに向けて、マシンカスタマーを引きつける5つの方法を紹介しよう。

(2024/1/5)

Microsoftが「Azure AI」に新機能投入【後編】NVIDIA、OpenAIとコラボするMicrosoft「Azure強化」の中身とは

Microsoftは2023年11月、AI技術に関する新サービスや新機能を相次いで発表した。同社がNVIDIAとの連携を強化して取り組もうとする「Microsoft Azure」のサービス強化などのアップデート情報を取り上げる。

(2024/1/4)

Innovative Tech：装着していないVRヘッドセットが"動く対話ロボット”に　置き台ごと変形　北海道大「OMEME」開発

北海道大学のヒューマンコンピュータインタラクション研究室に所属する研究者らは、VRヘッドマウントディスプレイ（HMD）を置くと置き台ごと動くコンパニオンロボットになるシステムを提案した研究報告を発表した。

(2023/12/28)

Gartner Insights Pickup（330）：マシンカスタマーとは？　どう対応すべきか

顧客が人間であることは当たり前に思えるが、顧客が人間ではなくなったらどうなるだろうか？　既に、AIによる人間以外の顧客が何らかの形で存在している。その利用に向けた準備を整えるべき時だ。

(2023/12/15)

「イナズマイレブン」「妖怪ウォッチ」で画像生成AIを活用　レベルファイブのAI利用例が公開に

「イナズマイレブン」「レイトン教授」シリーズなどで知られるゲーム会社・レベルファイブは、画像生成AIの業務利用例を紹介した資料を公開した。

(2023/12/12)

Innovative Tech：人には正しく聞こえるが“AIにはゆがんで聞こえる声”に変えるツール　合成音声に使われないために保護

米セントルイス・ワシントン大学に所属する研究者らは、自分の声が音声合成されないための防御ツールを提案した研究報告を発表した。

(2023/12/11)

「クレデンシャルをSlackに書くな高校校歌」freeeが公開　なぜ作った

ああクレデンシャルをSlackに書くな高校、創設の歴史──。

(2023/12/6)

Innovative Tech：「本人の声とそっくりな合成音声」の悪用に対して法的権利はあるか？　NTT社会情報研究所が調査

NTT社会情報研究所と慶應義塾大学の研究者らは、音声合成技術によって生成された、本人の声と酷似した合成音声が利用される場面において主張しうる権利について、著作権、パブリシティ権、個人情報の観点からの解釈を探求した研究報告を発表した。

(2023/11/22)

Gartner Insights Pickup（326）：公共機関における生成AI利用の意義と課題

公共機関はAI（人工知能）技術への理解を徐々に深めており、サービス提供の改善に向けて投資を増やしている。だが、「ChatGPT」のようなモデルによる生成AIの台頭に伴う課題が生じており、新たなマインドセットが必要とされている。

(2023/11/17)

HW構成で開発工数を大幅に削減：xEV車に向けたAVAS専用の音声合成LSIを開発

ロームグループのラピステクノロジーは、xEV車に向けたAVAS（車両接近通報装置）専用の音声合成LSI「ML22120xx」を開発した。ハードウェア構成のため、マイコン応用のシステムに比べ、開発工数や期間を大幅に短縮できるという。

(2023/11/15)

セキュリティニュースアラート：OpenAI、ChatGPTのメジャーアップデート発表も直後に3度の障害　DDoS攻撃関与か？

OpenAIはGPT-4 Turboモデルを含むサービスのメジャーアップデートを発表した。しかしその後すぐに3度の障害発生を報告し、最後の障害についてはDDoS攻撃によるものだったと伝えている。

(2023/11/13)

あなたの声がひろゆきボイスに　無料のAIボイスチェンジャー登場

AI音声合成サービスを手掛けるCoeFontが、自身の声を西村博之（ひろゆき）さんの声を再現したAI合成音声に変換できるAIボイスチェンジャー「なりきりひろゆきメーカー」を公開した。Webブラウザから無料で利用できる。

(2023/11/2)

あなたの声が森川智之ボイスに　AIボイスチェンジャー公開　“AIひろゆき”提供元から

CoeFontが、Windows向けボイスチェンジャーアプリ「CoeFontボイスチェンジャー」の正式版をリリース。これまで提供していたβ版では変換できる音声の種類が3種類だったが、正式版では10種類に。声優・森川智之さんの声を基にした音声も追加する。

(2023/10/26)

ゆっくり見ていってね！　「ヤマハの歴史コピペ」をヤマハが解説　「ニコニコ動画」のノリが満載の特設サイトも

ネタにガチすぎるでしょ。

(2023/10/13)

「Plus」と「Enterprise」のユーザーは2週間以内に利用可能に：「ChatGPT」が音声と画像に対応　音声を生成したり、「冷蔵庫内の写真」から献立を決めたりできる

OpenAIは対話型生成AI「ChatGPT」に音声機能と画像機能を導入すると発表した。有料プランの「Plus」と「Enterprise」のユーザーに、今後2週間以内に提供開始予定だ。

(2023/9/28)

SpotifyのPodcast、OpenAIの技術で本人の声での多言語吹き替えが可能に

Spotifyは、OpenAIの生成AI音声技術を採用し、Podcastのホストの声のまま他の言語に吹き替える「Voice Translation」を発表した。まずは英語からスペイン語に吹き替えた番組を公開した。

(2023/9/26)

ChatGPT、“目”と“耳”の実装を発表　写真の内容を認識、発話機能でおしゃべりも可能に

米OpenAIのチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載された。今後2週間かけて、PlusユーザーとEnterpriseユーザーに展開するという。

(2023/9/25)

スマートスピーカーに生成AI、Amazonが先行　会話を記憶、ボディランゲージやアイコンタクトも理解

米Amazonが、同社の音声アシスタント「Alexa」に生成AIを搭載する。これにより、継続した会話の他、会話の記憶や各家庭向けのパーソナライズも可能になるという。まずは米国のユーザー向けに今後数カ月以内に提供を始める。

(2023/9/21)

“メカ平野レミ” と平野レミが対面　ChatGPT搭載ロボ登場　本人そっくりのAI音声で会話

森永乳業が、料理研究家の平野レミさんを模したロボット「AI平野レミロイド」を公開した。新製品のプロモーションに加え「試食会などの販促や営業・商談の場でロボットが活躍する可能性を見越し、プロトタイプとして開発した」という。

(2023/9/20)

25年前の名作SFアニメ「lain」がAIに　世界観に浸りながら主人公「玲音」とチャット

Aniqueが、1998年放送のSFアニメ「serial experiments lain」モチーフの対話型AIサービス「AI lain」を6カ月の期間限定で提供する。チャット画面から文章を送るとキャラクター「玲音」が文字と音声で返答する。

(2023/9/5)

声優・梶裕貴が合成音声化　サンプル動画も公開

声優の梶裕貴さんが、合成音声ソフトの開発プロジェクトを発表した。YouTubeやX（旧Twitter）で、梶さんの声を基にした合成音声のサンプルを公開している。

(2023/9/4)

単一モデルで吹き替え、音声テキスト変換などに対応：Meta、オールインワン型初のマルチモーダル多言語AI翻訳モデル「SeamlessM4T」を発表

Metaは、初のオールインワン型のマルチモーダル多言語AI翻訳モデル「SeamlessM4T」を発表した。

(2023/8/25)

「ボイスbot市場」が急拡大　チャットbotよりも優れている点は？

ITRの調査によると、2022年度のボイスbot市場は高成長となり、今後も高成長が続く。チャットbotと比較してボイスbotが優れている点とは？

(2023/8/24)

陰りを見せる「AI」ブーム【前編】「生成AIブーム」が長くは続かない訳　人気衰退は“必然”か

世界中で人工知能（AI）技術がブームになっているが、この状況は近いうちに終わるという見方がある。AI技術の今後の普及に大きく影響する、ある深刻な問題とは何か。

(2023/8/8)

円谷プロ、「ウルトラセブン」の音声合成AIを開発　「モロボシ・ダン」「友里アンヌ」の声を再現

円谷プロダクションは、1967年放送の特撮ドラマ「ウルトラセブン」に関する音声生成AIを開発したと発表した。

(2023/8/7)

AIラジオパーソナリティ「クンドロイド」、FMヨコハマの番組に出演　「AIひろゆき」と同じ技術

INCLUSIVEは4日、AI音声を使ったラジオパーソナリティ「クンドロイド」を発表した。FM ヨコハマで放送するラジオ番組「FUTURESCAPE」に出演する。

(2023/8/4)

あなたも森川智之ボイスに？　新しいAIボイスチェンジャー登場、“AIひろゆき”開発元が無料提供

CoeFont（東京都港区）が、PC向けの新しいボイスチェンジャーアプリをリリースした。発話者の声を、リアルタイムで同社のAI合成音声に変換できるもので、まずは3種類の声を無料で提供する。今後は声優・森川智之さんの声を基にした音声も提供する予定。

(2023/8/4)

「将来なりたい職業」ランキング　中高生の1位は？　目標年収は？

全国の中学生・高校生に将来なりたい職業を聞くと、男子中学生の1位は……。

(2023/7/31)

医療機器ニュース：ALS共生者のより豊かなコミュニケーションに向けた取り組みを開始

NTTは、WITH ALS、Dentsu Lab Tokyoと連携して、ALS共生者の豊かなコミュニケーションに向けた取り組みを開始した。筋電センサーや筋電気刺激を利用して、非言語表現の拡張を目指す。

(2023/6/26)

医療機器ニュース：AIによる自動音声対応で医療用酸素ボンベを注文できるサービスを開始

NTTコミュニケーションズと帝人ヘルスケアは、在宅酸素療法の治療を受ける患者向けに、AI自動音声対応による医療用酸素ボンベの注文受付サービスを開始する。24時間365日対応可能だ。

(2023/6/19)

日本俳優連合が“生成AI”に提言　「新たな法律の制定を強く望む」　声の肖像権確立など求める

日本俳優連合が「生成系AI技術の活用に関する提言」を発表した。著作権法の運用見直しやルール作り、「声の肖像権」の確立などを業界や国に求める。

(2023/6/14)

AIと「モッツァレラチーズゲーム」をしたら“人類が完敗”する様子に笑いと恐怖　「声出して笑った」「人間はテンションですらAIに勝てない」

無限にテンション上げてくる。

(2023/6/11)

対話システムの歴史から見たChatGPT（1）：ChatGPTはこれまでの対話システムと何が違う？　対話システムの歴史を探る

ChatGPTを対話システムと見なし、これまでの対話システムで用いられてきた技術との違いを整理しながら、どのようにして人間のような自然で流ちょうな対話が実現できているのかを解説する本連載。第1回は、ChatGPTの対話例を示しながらその特徴を俯瞰（ふかん）し、対話システムの歴史の概観を探る。