Microsoft Edgeに視覚障害者向け音声による画像説明機能 「Azure Cognitive Services」で
MicrosoftがWebブラウザ「Edge」の音声読み上げで、altテキストのない画像の概要も読み上げる機能を追加した。「Azure Cognitive Services」のAIツール「Computer Vision API」を使う。日本語にも対応する。
米Microsoftは3月17日(現地時間)、Webブラウザ「Microsoft Edge」のアクセシビリティ設定で、altテキストのないWebページ上の画像の概要を音声で説明する機能を追加したと発表した。「Azure Cognitive Services」のAIツール「Computer Vision API」を使う。
利用するには、[設定]→[アクセシビリティ]で「スクリーン リーダー用に Microsoft から画像の説明を取得する」を有効にする。
altテキストは、画像など非テキストコンテンツがWebブラウザで表示できない場合に代わりに表示するためにパブリッシャーが入力しておく代替テキストだ。音声読み上げツールが読み上げるため、アクセシビリティの向上にも役立つが、用意されていないWebサイトも多い。
Edgeの新機能は、そうしたaltテキストのない画像の概要説明を自動生成して音声で読み上げるというものだ。
音声読み上げツールがaltテキストがついていない画像を見つけると、画像を機械学習アルゴリズムで自動処理して概要をテキストで記述し、それを読み上げる。
jpg、png、gif、webpなど、Webで一般的な画像をサポートし、日本語を含む5つの国語で概要をテキスト化する。
画像は自動処理のためにAzure Cognitive Servicesに送信されるが、同サービスのプライバシールールに守られる。
なお、アイコンサイズ以下の画像や大きすぎる画像、Vision APIがコンテンツをポルノや残酷な描写だと分類した画像は概要を読み上げない。
関連記事
- Microsoft、ARとAIで視覚障害者のコミュニケーションを支援する「PeopleLens」
Microsoftは、視覚障害者が周囲の他者と交流するためのAI技術「PeopleLens」を発表した。ARメガネでキャッチした周囲の人との距離や視線の方向のデータをリアルタイムで音声に変換し、装着者に状況を知らせる。 - Microsoft、障害者向けAI開発プログラム「AI for Accessibility」に2500万ドル投入
AIの障害者支援活用に注力するMicrosoftが、向こう5年間で2500万ドルを投じる新たなAI開発プログラム「AI for Accessibility」を立ち上げた。 - Microsoft、視覚情報を音声で伝えるiPhoneアプリ「Seeing AI」公開
バーコードで製品の情報を読み取り、人の表情も伝えてくれる。 - Microsoft、ゲーム開発者向けアクセシビリティテストプログラム提供へ
Microsoftは、XboxおよびPC向けゲーム開発者がゲームのアクセシビリティを確認できるプログラムを立ち上げた。実際に障害を持つプレイヤーにゲームを評価してもらえる。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.