「読んde!!ココVer.11」活用のススメ〜データ再利用にはPDFテキスト化がベスト〜(1/3 ページ)

» 2005年06月07日 00時00分 公開
[小川夏樹,ITmedia]

突然ファイルが消失。それを救ってくれたのがOCRソフト

 私事で恐縮だが、筆者は「OCRソフトはPCソフトの中で“必須ツール”である」と固く信じている。これは、筆者がOCRソフトに危機的状況を何度か救われたことがあるためだ。

 筆者はPC系雑誌の編集を経て現在著述業を生業としているが、編集者時代にOCRソフトによって救われた経験がある。また、OCRソフトによって救われた編集者を何度も見てきている。そういった経験から、OCRソフトはPCを利用して文書ファイルを扱う仕事に携わる人間にとって必須ツールであると思うのだ。

 話は10年ほど前のWindows 95の時代に遡る。ITmediaの読者なら覚えている方も少なくないと思うが、Windows 95が登場したことで世間はお祭り騒ぎとなった。

 「PCを買わないとまずいんじゃない?」「なんだか分からないが、今度のWindowsってすごいらしい」などと、お祭り騒ぎに煽られてPCの購入に走る消費者も多かったのだ。PCは売れに売れ、「オタクのための機械」から一家に1台の道具へと一気に昇格したのである。このため、PC初心者が大量に発生。各出版社からPC入門から活用まで、新雑誌の創刊が相次ぐこととなった。

 一方、創刊ラッシュによって新雑誌が続々と生まれたため、出版者側は慢性的な人手不足に陥ってしまった。専門誌であるPC雑誌の編集には、編集スキルに加えて、PCの知識が必須条件だ。当時、そういったスキルのある人間はまだ少なく、仕方なく少ない部員数で雑誌を作らなければならないという事態になった。

 しかし、登場したばかりのWin9xカーネルは、MS-DOSに皮をかぶせただけのWindows 3.1より使い勝手はマシだったものの、すぐにブルースクリーンが表示され、アプリケーションを抱えた状態で落ちてしまう代物だった。現在のWindows XP(NTカーネル)のように、長期間の連続稼働に耐えるようなものではなかったのだ。そんなOSと格闘しながら、PC雑誌の編集者たちは連日徹夜を繰り返し、原稿整理していたのである。

 不安定なOSを使っているのだから、当然事故は起きる。必死で編集した原稿が突然のブルースクリーンで水泡に帰すなどということは、日常茶飯事であった。例えば、6時間かけて編集した原稿が編集前の生原稿の状態まで戻ってしまったり、ヘタをすると原稿自体がどこかに消えてしまうという不運な事故が、各編集部で毎回のように発生していたのである。

いざというときのための必須レスキューツール

 ある日のこと、筆者が徹夜で編集した原稿(A4用紙で12ページ分)を印刷し、それをホッチキスで止めて自分の机の上に置き、そのまま眠りに落ちた。数時間後に目を覚ますと、PCの画面はブルースクリーンが表示されて停止していた。

 こんなことは当たり前だったので、迷わずリセットボタンを押してPCを再起動。印刷した原稿を読みながら、PCに保存しておいた原稿を修正しようとした。しかし、HDDのどこを探しても、徹夜で編集した原稿が見つからないのである。単にテキストに名前を付けて保存していなかったのか、それともブルースクリーンによってファイルが消失してしまったのか、今となっては分からないが、締め切りは数時間後に迫っている。12ページ分の原稿を初めから編集し直す余裕などない。

 筆者が取った行動は、印刷した原稿をスキャナに読み取らせ、それをOCRソフトでテキスト化することであった。もちろん当時のOCRソフトは、現在のものと比較にならないほど認識率が低い。しかし、最初から入力し直す手間に比べると、OCRソフトで読み取らせたテキストを修正する方が効率的だったのである。

 このおかげでなんとか締め切りに間に合わせることができた。筆者は、この事故以降、いざというときのためにOCRソフトを用意しておくのは、テキストを扱うユーザーには必須ではないかと思うようになったわけだ。印刷されたテキストデータが残っていれば、たとえHDDが飛んでデータが失われてしまっても、OCRソフトを利用して被害を最小限に抑えることができるかもしれないからである。

OCRソフトとの連携で、さらなる有効活用を実現

 話を一般的なケースに戻そう。

 小型両面カラードキュメントスキャナのScanSnap「fi-5110EOX3」は、筆者にとっても非常に魅力的な製品であるが、添付されている日本語OCRソフト「読んde!!ココVer.11」(以下、読んde!!ココ)は、製品版ではなく体験版である。利用できる機能が制限されていたり、利用できる期間がインストールから15日間に限られている。そこで、ここでは読んde!!ココの製品版を用意し、ScanSnapとの強力な連携機能について見ていくことにしたい。

 なお、注意点としては、読んde!!ココからScanSnapを呼び出して利用することができない。これはScanSnapの仕様によるもので、ScanSnapの利用時に読んde!!ココを起動するように設定しておく必要がある。

「ScanSnap Manager」で読んde!!ココを使用するアプリケーションに設定しておくことで、ScanSnapと読んde!!ココとの連携が可能になる
ScanSnapで読み取ったデータは読んde!!ココに送られてOCR処理が実行され、認識結果が表示される
       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2025年03月21日 更新
  1. シリーズ初の「1kg切り」「2in1モデル」登場! 見どころたくさんのThinkPad 2025年モデルが日本上陸 3月18日から順次発売 (2025年03月18日)
  2. いよいよPCやプリンタに浸透する“AI活用” HPが年次イベントで80種類以上の新製品を一挙に発表 (2025年03月20日)
  3. Windows 11の「セキュリティ更新」に不具合 「Microsoft Copilot」アプリが意図せず削除される恐れ (2025年03月19日)
  4. Microsoft Excelで「ユニバーサル プリント」を使うと結果を出力できない可能性(暫定対応策あり) (2025年03月19日)
  5. 8年ぶりの新モデル、ロジクールのワイヤレス充電マウスパッド「POWERPLAY 2」は機能を省いて安価になった (2025年03月18日)
  6. 「Windows 11 2024 Update(バージョン24H2)」の既知の不具合まとめ【2025年3月5日現在】 (2025年03月05日)
  7. 「テンキー」の売れ筋ランキング 数字入力の多い業務で活躍【2025年3月19日版】 (2025年03月19日)
  8. ゼンハイザー、バランスの取れたサウンドを実現する軽量設計の開放型ヘッドフォン (2025年03月19日)
  9. デル、スタンダード設計のビジネス向けディスプレイ「P」シリーズに4Kモデルなど7製品を追加 (2025年03月19日)
  10. デルが新デスクトップPC「Dell Slim」「Dell Tower」を3月28日発売 Coreプロセッサ(第14世代)とCore Ultra 200Sプロセッサから選択可能 (2025年03月14日)
最新トピックスPR

過去記事カレンダー

2025年