Microsoft Edgeに視覚障害者向け音声による画像説明機能　「Azure Cognitive Services」で

MicrosoftがWebブラウザ「Edge」の音声読み上げで、altテキストのない画像の概要も読み上げる機能を追加した。「Azure Cognitive Services」のAIツール「Computer Vision API」を使う。日本語にも対応する。

[ITmedia] PC用表示関連情報

LINE

Hatena

AI活用のいまが分かる

　米Microsoftは3月17日（現地時間）、Webブラウザ「Microsoft Edge」のアクセシビリティ設定で、altテキストのないWebページ上の画像の概要を音声で説明する機能を追加したと発表した。「Azure Cognitive Services」のAIツール「Computer Vision API」を使う。

　利用するには、［設定］→［アクセシビリティ］で「スクリーンリーダー用に Microsoft から画像の説明を取得する」を有効にする。

　altテキストは、画像など非テキストコンテンツがWebブラウザで表示できない場合に代わりに表示するためにパブリッシャーが入力しておく代替テキストだ。音声読み上げツールが読み上げるため、アクセシビリティの向上にも役立つが、用意されていないWebサイトも多い。

　Edgeの新機能は、そうしたaltテキストのない画像の概要説明を自動生成して音声で読み上げるというものだ。

　音声読み上げツールがaltテキストがついていない画像を見つけると、画像を機械学習アルゴリズムで自動処理して概要をテキストで記述し、それを読み上げる。

　jpg、png、gif、webpなど、Webで一般的な画像をサポートし、日本語を含む5つの国語で概要をテキスト化する。

　画像は自動処理のためにAzure Cognitive Servicesに送信されるが、同サービスのプライバシールールに守られる。

　なお、アイコンサイズ以下の画像や大きすぎる画像、Vision APIがコンテンツをポルノや残酷な描写だと分類した画像は概要を読み上げない。

Microsoft Edgeに視覚障害者向け音声による画像説明機能　「Azure Cognitive Services」で

関連記事

関連リンク

Microsoft Edgeに視覚障害者向け音声による画像説明機能 「Azure Cognitive Services」で

関連記事

関連リンク

Microsoft Edgeに視覚障害者向け音声による画像説明機能　「Azure Cognitive Services」で