最新記事一覧
OpenAIは音声生成モデル「Voice Engine」の小規模プレビューから得られた予備的な知見と結果を公表した。このプレビューから合成音声生成の持つ可能性と課題が浮き彫りとなった。
()
「スナックバス江」の自主制作アニメがYouTube上に突如投稿され、Xなどで話題になっている。YouTubeに投稿されたアニメは合成音声などを使っており、テレビアニメとの関連は不明だが、原作者・フォビドゥン澁川さん本人が自身のXで取り上げている。
()
Galaxy AIの(ほぼ)全機能をスマホでレビュー。通話翻訳や文字起こし、要約……多彩な新機能を徹底解説する。
()
サムスン電子は、4月11日にフラグシップモデルの「Galaxy S24」「Galaxy S24 Ultra」を発売する。最大の特徴は、Googleの「Gemini Pro」や「Gemini Nano」などをAIモデルのベースにした「Galaxy AI」を端末の機能として密接に統合しているところにある。一方で、Galaxy AI自体はGalaxy S24/S24 Ultraだけでなく、アップデートを通じて過去のモデルにも適用される。
()
OpenAIは、人の声を再現する生成AIモデル「Voice Engine」を発表した。動画生成の「Sora」同様「重大なリスク」があることを認識しており、広範囲に提供は(当面は)しない。
()
2023年8月にニコニコ動画に投稿された動画がブームに。
()
自然な会話が話題のおしゃべりAI「Cotomo」。開発の背景や目指すビジネスモデルを創業者に聞いた。
()
GoogleはGitHub上に「YouTubeLabs」を立ち上げ、パートナーやクリエイターの作業効率化を支援するスクリプトを公開した。これにより一般的なユースケースの自動化が可能になる。本記事ではYouTubeLabsの概要を紹介する。
()
MicrosoftはAIの登場によってサイバーセキュリティが大きな変革を迎えているとし、AIを使った攻撃対処や人材不足への対応など新たな取り組みを「Cyber Signals」第6版において伝えた。
()
主要な深層学習モデルとして「畳み込みニューラルネットワーク」(CNN)と「敵対的生成ネットワーク」(GAN)がある。両者には似通う点があるが、仕組みや使い方は異なる。その成り立ちから解説する。
()
データ駆動型の意思決定がビジネスに欠かせなくなった。企業は予測モデルを構築してシミュレーションを重ねることで、深い洞察を得ることができる。代表的な4つのモデルについて、その起源や特徴を解説する。
()
日立産機システムは、「IIFES 2024」において、生成AIとIoT接続による遠隔設備監視が可能な「FitLiveサービス」の組み合わせによる、設備コンシェルジュサービスを参考出展した。社内での実証を経て、2024年度以降の市場投入を検討している。
()
AIと恋愛できるiOSアプリ「恋するAI」登場 マッチングアプリ「タップル」提供元が開発 「少子化問題を解決したい」
()
和食・しゃぶしゃぶチェーン店「かごの屋」を運営するKRフードサービスが、ボトルネックになっていた電話予約対応業務の改善により、売上向上とコスト削減、業務負担減を成功させた。
()
AI歌声合成ソフトを手掛けるテクノスピーチは、AI技術で人間の歌声を再現できるソフト「VoiSona」に、人型ロボット「Pepper」のボイスライブラリを追加した。
()
この先、AIベースのマシンカスタマー(顧客としてのマシン)は増加し、洗練され、強力で独立した意思決定者、取引者となる見通しだ。本稿では、ビジネスリーダーに向けて、マシンカスタマーを引きつける5つの方法を紹介しよう。
()
Microsoftは2023年11月、AI技術に関する新サービスや新機能を相次いで発表した。同社がNVIDIAとの連携を強化して取り組もうとする「Microsoft Azure」のサービス強化などのアップデート情報を取り上げる。
()
北海道大学のヒューマンコンピュータインタラクション研究室に所属する研究者らは、VRヘッドマウントディスプレイ(HMD)を置くと置き台ごと動くコンパニオンロボットになるシステムを提案した研究報告を発表した。
()
顧客が人間であることは当たり前に思えるが、顧客が人間ではなくなったらどうなるだろうか? 既に、AIによる人間以外の顧客が何らかの形で存在している。その利用に向けた準備を整えるべき時だ。
()
「イナズマイレブン」「レイトン教授」シリーズなどで知られるゲーム会社・レベルファイブは、画像生成AIの業務利用例を紹介した資料を公開した。
()
米セントルイス・ワシントン大学に所属する研究者らは、自分の声が音声合成されないための防御ツールを提案した研究報告を発表した。
()
ああクレデンシャルをSlackに書くな高校、創設の歴史──。
()
NTT社会情報研究所と慶應義塾大学の研究者らは、音声合成技術によって生成された、本人の声と酷似した合成音声が利用される場面において主張しうる権利について、著作権、パブリシティ権、個人情報の観点からの解釈を探求した研究報告を発表した。
()
公共機関はAI(人工知能)技術への理解を徐々に深めており、サービス提供の改善に向けて投資を増やしている。だが、「ChatGPT」のようなモデルによる生成AIの台頭に伴う課題が生じており、新たなマインドセットが必要とされている。
()
ロームグループのラピステクノロジーは、xEV車に向けたAVAS(車両接近通報装置)専用の音声合成LSI「ML22120xx」を開発した。ハードウェア構成のため、マイコン応用のシステムに比べ、開発工数や期間を大幅に短縮できるという。
()
OpenAIはGPT-4 Turboモデルを含むサービスのメジャーアップデートを発表した。しかしその後すぐに3度の障害発生を報告し、最後の障害についてはDDoS攻撃によるものだったと伝えている。
()
AI音声合成サービスを手掛けるCoeFontが、自身の声を西村博之(ひろゆき)さんの声を再現したAI合成音声に変換できるAIボイスチェンジャー「なりきりひろゆきメーカー」を公開した。Webブラウザから無料で利用できる。
()
CoeFontが、Windows向けボイスチェンジャーアプリ「CoeFontボイスチェンジャー」の正式版をリリース。これまで提供していたβ版では変換できる音声の種類が3種類だったが、正式版では10種類に。声優・森川智之さんの声を基にした音声も追加する。
()
ネタにガチすぎるでしょ。
()
OpenAIは対話型生成AI「ChatGPT」に音声機能と画像機能を導入すると発表した。有料プランの「Plus」と「Enterprise」のユーザーに、今後2週間以内に提供開始予定だ。
()
Spotifyは、OpenAIの生成AI音声技術を採用し、Podcastのホストの声のまま他の言語に吹き替える「Voice Translation」を発表した。まずは英語からスペイン語に吹き替えた番組を公開した。
()
米OpenAIのチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載された。今後2週間かけて、PlusユーザーとEnterpriseユーザーに展開するという。
()
米Amazonが、同社の音声アシスタント「Alexa」に生成AIを搭載する。これにより、継続した会話の他、会話の記憶や各家庭向けのパーソナライズも可能になるという。まずは米国のユーザー向けに今後数カ月以内に提供を始める。
()
森永乳業が、料理研究家の平野レミさんを模したロボット「AI平野レミロイド」を公開した。新製品のプロモーションに加え「試食会などの販促や営業・商談の場でロボットが活躍する可能性を見越し、プロトタイプとして開発した」という。
()
Aniqueが、1998年放送のSFアニメ「serial experiments lain」モチーフの対話型AIサービス「AI lain」を6カ月の期間限定で提供する。チャット画面から文章を送るとキャラクター「玲音」が文字と音声で返答する。
()
声優の梶裕貴さんが、合成音声ソフトの開発プロジェクトを発表した。YouTubeやX(旧Twitter)で、梶さんの声を基にした合成音声のサンプルを公開している。
()
Metaは、初のオールインワン型のマルチモーダル多言語AI翻訳モデル「SeamlessM4T」を発表した。
()
ITRの調査によると、2022年度のボイスbot市場は高成長となり、今後も高成長が続く。チャットbotと比較してボイスbotが優れている点とは?
()
世界中で人工知能(AI)技術がブームになっているが、この状況は近いうちに終わるという見方がある。AI技術の今後の普及に大きく影響する、ある深刻な問題とは何か。
()
円谷プロダクションは、1967年放送の特撮ドラマ「ウルトラセブン」に関する音声生成AIを開発したと発表した。
()
INCLUSIVEは4日、AI音声を使ったラジオパーソナリティ「クンドロイド」を発表した。FM ヨコハマで放送するラジオ番組「FUTURESCAPE」に出演する。
()
CoeFont(東京都港区)が、PC向けの新しいボイスチェンジャーアプリをリリースした。発話者の声を、リアルタイムで同社のAI合成音声に変換できるもので、まずは3種類の声を無料で提供する。今後は声優・森川智之さんの声を基にした音声も提供する予定。
()
全国の中学生・高校生に将来なりたい職業を聞くと、男子中学生の1位は……。
()
NTTは、WITH ALS、Dentsu Lab Tokyoと連携して、ALS共生者の豊かなコミュニケーションに向けた取り組みを開始した。筋電センサーや筋電気刺激を利用して、非言語表現の拡張を目指す。
()
NTTコミュニケーションズと帝人ヘルスケアは、在宅酸素療法の治療を受ける患者向けに、AI自動音声対応による医療用酸素ボンベの注文受付サービスを開始する。24時間365日対応可能だ。
()
日本俳優連合が「生成系AI技術の活用に関する提言」を発表した。著作権法の運用見直しやルール作り、「声の肖像権」の確立などを業界や国に求める。
()
()
ChatGPTを対話システムと見なし、これまでの対話システムで用いられてきた技術との違いを整理しながら、どのようにして人間のような自然で流ちょうな対話が実現できているのかを解説する本連載。第1回は、ChatGPTの対話例を示しながらその特徴を俯瞰(ふかん)し、対話システムの歴史の概観を探る。
()
Cloudflareは、Cloudflare Workersで機械学習モデルを利用した推論を可能にする「Constellation」を発表した。
()
Amazonは、2019年に米国で開始したAlexaの声を俳優の声に変えるサービスを終了した。サミュエル・L・ジャクソンなど3人の声を各4.99ドルで販売していた。終了の理由は説明していないが、同社は大規模リストラ対象にAlexaチームを含めていた。
()