プロナビ

画面の表示内容を文字起こし! 「Microsoft PowerToys」向けOCR機能の開発が進行中

» 2022年08月19日 19時50分 公開
[山本竜也ITmedia]

 MicrosoftがWindows 11向けにリリースしている公式ユーティリティーアプリ「PowerToys」に、画面の表示内容や画像ファイルに含まれる文字を読み取る「OCR機能」が追加される予定だ。現在、実装に向けた作業がGitHub上で進められている。

PowerToy PowerToyの現行バージョンは「0.6.1.1」である

 PowerToysは、ディスプレイの指定した位置にウィンドウをスナップ配置できる「FancyZones」や複数のファイル名を一括で変更できる「PowerRename」、右クリックメニューから画像サイズを変更できる「Image Resizer」など、複数のユーティリティーを内包している。

 開発が進められているOCR機能もユーティリティーの1つとして開発が進んでおり、画面内の指定された領域または画像ファイルに含まれる文字を認識してテキストとして取り込めるという。

 画像ファイルのOCR機能は、GoogleのWebブラウザ「Chrome」でも「Google Lens」として実装されている。それに対して、PowerToysに実装される予定の機能は任意のアプリで利用できることが大きなメリットである。

OCR GitHubに公開されているOCR機能が実際に動作している様子

 なお、現時点ではマルチディスプレイへの対応作業などが残っており、一般公開バージョンへの実装にはしばらく時間がかかるかもしれない。

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年10月16日 更新
  1. 骨伝導イヤフォンの弱点を空気伝導ドライバー併用で克服した「OpenRun Pro 2」を試す (2024年10月15日)
  2. 「iPhone 16」「iPhone 16 Pro」のカメラ機能は想像以上に進化していた 1〜2年前のiPhoneユーザーも買い換えたくなるくらい (2024年10月14日)
  3. 「Adobe Creative Cloud」が2025年版に より一層の生成AI活用とコンテンツ制作効率向上を実現 (2024年10月14日)
  4. “14型で約634g(ムサシ)”の直販モデルも! 富士通クライアントコンピューティングが「FMV LIFEBOOK」の新モデルを投入 (2024年10月15日)
  5. メルコホールディングスがバッファローを2025年4月に吸収合併へ 新商号は「バッファロー」に (2024年10月12日)
  6. NPUを統合したIntelの新型CPU「Core Ultra 200S」シリーズの予約受付がスタート 一部は予約終了モデルも (2024年10月15日)
  7. インテルが「Core Ultra 200Sプロセッサ」発売記念イベントを開催 10月26日に秋葉原で (2024年10月15日)
  8. Windowsの「パスキー」について発表 利便性が向上/Wordで保存後にファイルが削除される不具合発生 (2024年10月13日)
  9. Core Ultra(シリーズ2)にデスクトップ/ハイエンドモバイル向けモデルが登場! これまでのIntel製CPUとの決定的な違い (2024年10月11日)
  10. MINISFORUM、Ryzen AI 9を搭載したミニデスクトップPC「EliteMini AI370」を予告 (2024年10月15日)
最新トピックスPR

過去記事カレンダー