プロナビ

画面の表示内容を文字起こし! 「Microsoft PowerToys」向けOCR機能の開発が進行中

» 2022年08月19日 19時50分 公開
[山本竜也ITmedia]

 MicrosoftがWindows 11向けにリリースしている公式ユーティリティーアプリ「PowerToys」に、画面の表示内容や画像ファイルに含まれる文字を読み取る「OCR機能」が追加される予定だ。現在、実装に向けた作業がGitHub上で進められている。

PowerToy PowerToyの現行バージョンは「0.6.1.1」である

 PowerToysは、ディスプレイの指定した位置にウィンドウをスナップ配置できる「FancyZones」や複数のファイル名を一括で変更できる「PowerRename」、右クリックメニューから画像サイズを変更できる「Image Resizer」など、複数のユーティリティーを内包している。

 開発が進められているOCR機能もユーティリティーの1つとして開発が進んでおり、画面内の指定された領域または画像ファイルに含まれる文字を認識してテキストとして取り込めるという。

 画像ファイルのOCR機能は、GoogleのWebブラウザ「Chrome」でも「Google Lens」として実装されている。それに対して、PowerToysに実装される予定の機能は任意のアプリで利用できることが大きなメリットである。

OCR GitHubに公開されているOCR機能が実際に動作している様子

 なお、現時点ではマルチディスプレイへの対応作業などが残っており、一般公開バージョンへの実装にはしばらく時間がかかるかもしれない。

Copyright © ITmedia, Inc. All Rights Reserved.

最新トピックスPR

過去記事カレンダー