ITmedia NEWS > STUDIO >
ITmedia AI+ AI活用のいまが分かる

Microsoft Edgeに視覚障害者向け音声による画像説明機能 「Azure Cognitive Services」で

» 2022年03月20日 09時01分 公開
[ITmedia]

 米Microsoftは3月17日(現地時間)、Webブラウザ「Microsoft Edge」のアクセシビリティ設定で、altテキストのないWebページ上の画像の概要を音声で説明する機能を追加したと発表した。「Azure Cognitive Services」のAIツール「Computer Vision API」を使う。

 利用するには、[設定]→[アクセシビリティ]で「スクリーン リーダー用に Microsoft から画像の説明を取得する」を有効にする。

 read

 altテキストは、画像など非テキストコンテンツがWebブラウザで表示できない場合に代わりに表示するためにパブリッシャーが入力しておく代替テキストだ。音声読み上げツールが読み上げるため、アクセシビリティの向上にも役立つが、用意されていないWebサイトも多い。

 Edgeの新機能は、そうしたaltテキストのない画像の概要説明を自動生成して音声で読み上げるというものだ。

 音声読み上げツールがaltテキストがついていない画像を見つけると、画像を機械学習アルゴリズムで自動処理して概要をテキストで記述し、それを読み上げる。

 jpg、png、gif、webpなど、Webで一般的な画像をサポートし、日本語を含む5つの国語で概要をテキスト化する。

 画像は自動処理のためにAzure Cognitive Servicesに送信されるが、同サービスのプライバシールールに守られる。

 なお、アイコンサイズ以下の画像や大きすぎる画像、Vision APIがコンテンツをポルノや残酷な描写だと分類した画像は概要を読み上げない。


Copyright © ITmedia, Inc. All Rights Reserved.