PDF内のテキストをまとめて書き出したい場合は:ビジネスの悩みを解決するPDFドリル
PDFの中に書かれているテキストを、別の書類に使いたいという場合がある。Adobe Acrobat XIであれば、あらかじめテキストになっているデータはもちろん、画像の中に含まれているデータでも、テキスト認識機能を併用して抽出できてしまうのだ。
連載「ビジネスの悩みを解決するPDFドリル」とは
ビジネスの各シーンで利用するPDFファイル。このドリルを練習して、PDFを上手に活用できれば業務効率が向上し、コストの削減ができるはず! さらに、ビジネスのいろいろな問題も解決できるかもしれませんよ。
PDFの中に書かれているテキストを、別の書類に使いたいという場合がある。部分的に取り出すだけであれば範囲を選択して右クリック → コピーをすればよいが、選択範囲が複雑に入り組んでいたり、何ページにもわたるようなときは面倒だ。
こうした場合は、Adobe Acrobat XIでテキストを丸ごと書きだしてしまえばよい。対象のPDFを表示した状態で「ファイル」→「その他の形式で保存」→「その他のオプション」→「テキスト(プレーン)」を選択すると、PDF内にあるテキストデータが丸ごと書き出される。範囲選択がしにくい個所や、うっかり見落としがちな個所までまとめて書き出せるので、再利用も容易になるというわけだ。
画像として取り込んだPDFや、文書内の画像の中にある文章もテキスト化できる
もっとも、これだけなら実はAdobe Readerでも同じことができる。「その他の形式で保存」→「テキスト」を選択すればよいのだ。しかしAdobe Readerでは不可能な、Adobe Acrobat XIにしかできない技が「画像の中のテキストまで保存する」※。対象のPDFが、スキャンした画像データだった場合や、テキスト入りの図などが中に含まれる場合でも、テキスト認識機能を併用して、画像中のテキストデータを抜き出して保存することができるのだ。
具体的には、「表示」→「ツール」→「テキスト認識」を選択して、ツールパネルウィンドウに表示されるメニューから「このファイル内」をクリックし、対象のPDFの中にある文字をテキストデータに変換。その後、さきほどと同じ手順でテキスト書き出しの処理を実行すると、画像中に含まれていたテキストがファイルに書き出されるというわけだ。
Acrobat Readerはテキストとして保存するだけだが、Adobe Acrobat XIであればこのほか、Word形式などに書き出せる機能も持っている。今回はテキストを書き出す方法を紹介したが、最終的にWord文書として使用するのであればそちらの方法を使うのもお勧めだ。
関連記事
- ビジネスの悩みを解決するPDFドリル:PDFの画像を一時的に補正するには――PDFからJPGに、JPGからPDFに
PDFを一時的にJPGに書き出して画像補正を行いたい場合がある。そんな時に便利なテクニックがあるのだ。Adobe Acrobat XIを使えば、PDFからJPG、さらにJPGからPDFへの変換が、簡単に行うことができる。 - ビジネスの悩みを解決するPDFドリル:プレゼンで複数ファイルの見せる順番を間違えないようにするには
プレゼン時に、PowerPointだけでなく動画や音声、画像などの複数ファイルを織り交ぜてプレゼンする人が増えてきた。こうした時、順番を間違えないようにすることが重要だ。 - 新連載:ビジネスの悩みを解決するPDFドリル:プレゼン直前のPDFを今すぐ修正したい場合は
特にプレゼンテーションや営業提案など先方に見せたり提出したりするPDF資料にちょっとした間違いを発見した時、「すぐに直したい」と思うことはないだろうか。 - いざという時に便利! 目的特化型のPDFテンプレートサイト5選
電話メモやブックカバー、のしや賞状など、目的特化型のPDFテンプレートサイトを紹介する。いずれも多くのテンプレートが掲載されているほか、カスタマイズに対応したサイトも多いので、自分にぴったりのテンプレートを入手できるはずだ。 - PDFで無料ダウンロードできてすぐ使える、ノートやグラフ用紙の配布サイト
ノートやグラフ用紙をPDF形式で無料ダウンロードできるサイトをいくつか紹介しよう。カスタマイズできたり、たくさんのテンプレートを用意したりしているので、あらゆる用途に対応すること間違いなしだ。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.