WebページをPDF化して保存したい場合、大きく分けて2つの方法がある。テキストや画像を選択できる状態で保存する方法と、ページ全体を1枚の画像として保存する方法だ。目的に応じてどちらも利用できるようにしておくと便利だ。
保管コストの削減はもとより、劣化の防止や検索性の向上、再利用の促進などさまざまな利点が認められ、徐々に広がりつつある紙の文書や帳票のデジタルデータ化ですが、用途や目的を考慮せずにむやみにスキャンすることでかえって効率が悪くなったり、作業に手戻りを発生させてしまうことも少なくありません。
また商法や税法で保管が義務付けられている文書の場合、電子帳簿保存法やe-文書法などのルールに則った手順を踏む必要があり、自分の判断でやみくもにデータ化するわけにいかないといった事情もあります。
本連載ではこうした現在の状況を踏まえつつ、文書のデータ化にまつわる情報、さらにはフォーマットであるPDFや変換機器であるスキャナ、保存先となるストレージに至るまで、業務現場と情報システム部門に役立つ知識やTips、活用術を幅広く紹介していきます(著者より)
Webページの内容をそのままPDFで保存しておきたい場合は多い。変更履歴をアーカイブで保存したいという目的のほか、最近ではスマホの普及でやや機会は少なくなった感はあるが、PDFに変換して持ち出すことでオフラインで閲覧するというのも便利な使い方の一つだ。
WebページをPDFに変換するもっとも一般的な方法は、Adobe Acrobatをインストールするとブラウザに組み込まれるツールバーもしくは拡張機能を利用することだが、これにはAcrobatを所有していることが前提になる。ページの一部分だけを保存できるなどの利点もあるが、そのためだけにAcrobatを購入するのは予算的に難しい場合もあるだろう。
もし、利用しているブラウザがChromeであれば、Chromeが標準で備える印刷機能を利用すればよい。ChromeはデフォルトでPDFへの出力機能を備えているので、印刷機能を選択して送信先を「PDFに保存」を選ぶだけで、ウェブページをPDFに変換して保存できる。ハイパーリンクも機能する状態のまま保存できるので、あとからリンク先を参照するのも容易だ。このほかSafariもPDF保存機能を備えている。
もっともこの方法の場合、APIの機能制限により、Flashを用いたナビゲーションは空白となってしまうなど、ページの見た目をうまく再現できないケースも少なくない。あとからテキストデータや画像を抜き出せるといった利点はあるが、肝心のパーツが保存できていない場合もあるわけだ。
ページの変更履歴をアーカイブする場合など、Webページの見た目をそのまま保存したければ、ページ全体を画像化した上でPDF保存する拡張機能を使うのがおすすめだ。
例えばChromeの拡張機能「FireShot」ならページ全体のほか、現在表示しているエリア、さらには任意の領域まで、PDF化の範囲を自在に選択できる。画像化して保存するため、Flashを利用したナビゲーションもそのままの見た目で取得できる。ただしハイパーリンクは無視されてしまうので、あとからリンク先を参照するといった用途には向かない。
まとめると、多少の再現性が劣ってもあとからパーツ単位で再利用したりリンクを参照するのならChrome標準の印刷機能、見た目の再現性を重視するのなら「FireShot」などの拡張機能といった具合に、ケースバイケースで使い分けるのがおすすめということになる。
IEやFirefoxにもPDF保存のプラグインはあるが、PDFとの親和性の高さという点ではChromeが優れているので、ふだんはChromeを利用していなくとも、WebページのPDF化のためだけに、Chromeを使えるよう準備しておくのはありだろう。
なお気をつけたいのは、機能拡張の中には、今回紹介した「FireShot」のように機能拡張だけでPDF変換が完結するタイプのほか、外部のWebサービスと連携するタイプがあること。このタイプはWebページのURLを外部に送信してその先のサーバで処理し、結果だけを受け取る形になるため、企業での利用が運用上NGというケースも考えられる。またその仕組み上、社内イントラネット上のページをPDF保存する用途にも使えないので注意したい。
Copyright © ITmedia, Inc. All Rights Reserved.