PDFファイルの表をエクセルにコピーする方法を書きたいと思います。
エクセルにコピーしたい理由は、数値データをそのまま使いたいからだと思います。
つまり、PDFの表をエクセルに画像として貼り付けたのでは意味がないと言うことです。
以前、買っておくと何かと便利ですよ、と書きました「ADOBE ACROBAT PRO」を使います。無料のACROBAT READERではできないと思います。どうしても無償でやりたい方は、記事の一番下をご覧下さい。
やり方は簡単で、PDFの表を選択 ⇒ 右クリックして、開いたメニューから「テーブルとしてコピー」。
これをエクセルに普通に貼り付けるだけ。
色々やってみたのですが、この方法が一番簡単です。問題は、数字が文字として貼り付けられるので、数字変換したり、数字の前の空白を削除したりする必要があります。これを一括で行うアドインがたぶんあると思います。例として、無料アドインの「WSJ集計 (Excel ワークシート集計)」なんかが役に立つと思います。これは文字の前後の空白を一括して削除できます。
複雑な表の場合
表が複雑な時は、上の方法でうまくいかない場合があります。その時は、以下のやり方もあります。
1.PDFファイルを開き、「ファイル」⇒「名前を付けて保存」で、「ファイルの種類」を「Microsoft Word文書(*.doc)」を選択し保存。
2.Wordでこの保存したファイルを開く。表形式に認識されているので、表をコピー。そしてExcelに普通に貼り付ける。
貼り付けがうまくできない時には、選択範囲をオブジェクト全体(表左上の十字マーク)ではなく、個別に選択するればうまく貼り付けることができます。表を一回クリックした後、[CTRL]+[A]で範囲選択、[CTRL]+[C]でコピー、という方法が良いかと思います。
なお、PDFファイルには、いろいろロックがかかっているものも多く、実際にはそう簡単ではないと思います。ロックのかかっているPDFファイルのロック解除は、当然PDFファイル作成者の意図しないことなので、ルールを守りましょう。
また、PDFファイルの表が画像の場合もあります。この場合は、ACROBAT PROのメニューバーの[文書]⇒[OCRテキスト認識]でテキストとして認識させてから作業をします。
あまり「無料」にこだわると、貴重な時間を無駄にします。
どうしても無料でやりたい方のために、その方法を書きます。
フリーソフトの「OpenOffice」なら、今回ご紹介している内容の処理は可能です。
このソフトの機能は、Windows Officeに酷似していて、使い勝手がよいと思います。それに、いろいろ便利な使い方ができるので、古いバージョンを保存しておくことをお奨めします。理由は、いつかご紹介します。
別の方法 【追記】2011.08.02
実は、上の方法でできない時もあります。
そんな時にやる最後の手段をご紹介します。実は昨日、この方法でPDFのセンサスをEXCELにコピーしました。
【方法】
1.PFDファイルをHTML形式で保存します。
2.保存したHTMLファイルを開きます。お使いのブラウザが起動して開くと思います。
3.必要な箇所をコピーしてEXCELに貼り付けます。
以下は管理人の場合です。
データがスペイン語だったため、3桁毎の区切りがカンマではなくコロンになっています。数値データの入っている所を選択し、検索の置き換えでコロンをカンマに置き換えます。すると、数字として認識してくれます。