2013-03-26

文書をスキャナで読み取って整理する

年度末なので書類を整理しています。
あまり大事でない書類はスキャナで読みとってから捨ててしまおうと思います。
このような用途ではScansnapが有名ですが、岡山大学が一括で購入している用紙の品質がScansnapには合わないようで、途中で2枚読み込んで止まることがよくあります。
その場合何枚目まで正常に読み込めたのかを調べてその続きから読み込みなおす作業が必要になり、それが頻発するので使うのを止めていました。
数年ぶりに最新のiX500を買いましたが、全然改善していません。
パソコン雑誌では絶賛されているので、パソコン雑誌のように品質の良い紙ならちゃんと読み込んでくれるのでしょう。
岡山大学の紙でも、スキャナのADFを使うとちゃんと読み込んでくれます。
決してScansnapが駄目なのではなく、Adobe Acrobat付で5万円以下のScansnapと、ADFだけで10万円近くのスキャナでは比較になりません。
またエクセルのカラーのグラフを印刷した文書の場合、ScansnapでPDFで保存しようとするとJPEG形式の非可逆圧縮されたカラー画像になりますが、写真のような微妙な色の変化は必要ないので256色のPNGにした方が良いですし、その意味でもjpegとPDFしか保存できないScansnapより普通のスキャナを使った方が良いです。

ソフト

傾き補正にはeTilTranが使えました。
スキャナでTIFF形式で読み取ったあと、最初にこのソフトで傾きを修整しましょう。
ただ、傾いていない原稿を間違えて傾けてしまうこともあるので、一通りチェックして傾いている時だけ使った方が良いです。

私はデジカメの写真用にRalphaPlusを買っています。
これは256色減色ツールの呼び出しも含めて多数の画像に対して一括処理が出来ます。
グレースケール化も出来ますし、レベル補正によって、紙の裏の文字が薄く見えるのも真っ白に出来ます。
ファイルの形式変更や縮小などの処理はこれを使いましょう。
レベル補正は無料版のRalphaでは出来ませんが、eTilTranでも出来るらしいです。

カラーの文書は256色に減色します。
減色ツールの比較もなされています。
通常は減色の際にはデザリングした方が良いのですが、エクセルのグラフなどは微妙な色合いは不要なのでデザリングはファイルサイズが増えるデメリットの方が大きいです。
Yukariの減色方法 懲りすぎると時間がかかるのでほどほどに。

ORC結果を埋め込むにはPDFにまとめる必要があります。BtoPDF画像梱包で出来るようです。
説明を読んだ印象では、画像梱包はヘッダーなどをつけてまとめるだけと明記されているので、まずこちらを試そうと思います。 逆にPDF-XChange Viewerを使うとPDFファイルをJPEGなどの画像ファイルとして保存できるそうです。
スキャナで1ページだけ読み取ったPDFファイルの拡張子をJPGに変更したら、JPEGファイルとして開けたそうです。PDFをJPGに変換するのは可能でしょうか?
これが出来るならSepPDFで1ページずつファイルを分ければ良いでしょう。 ChainLPならば、PDFに限らず色々な形式で一つのファイルにまとめられた画像に対して、余白削除などの一括処理を行えますが、私は設定を変にしてしまったらしく途中で止まるようになってしまいました。
良く分からないうちにあれこれいじらない方が良いです。

Androidで読むにはPerfect Viewerが良いそうです。
でも書類をわざわざ持ち出してAndroidで読むことはないと思います。

手順

  1. スキャンスナップ、あるいはオートシートフィーダー付のスキャナで読み込んで1ページずつTIFFなどの画像ファイルで保存。
  2. 原稿と見比べながら白紙のファイルを削除し、向きを揃える。
  3. 傾いているページがあればeTilTranで傾き補正
  4. カラーと白黒のファイルを別のフォルダーに分ける
  5. RalphaPlusで、
    レベル補正を使って裏移りを白く飛ばして縮小して8bitPNGで保存。
    白黒のファイルはグレースケール化、カラーのファイルは256色に減色。レベル補正の時に紙の色による偏りも補正するので、グレースケール化はその後で。
    カラーの減色には外部ツールとしてpngnqi.exeを使いますが、それ以外の処理はRalphaPlus内蔵の機能の方が速いのでそちらを利用。
  6. 画像梱包でPDFにまとめる。
こう書くと手順が大変に見えますが、読み込み、傾き補正、画像処理はそれぞれ一括で出来ますので、つきっきりでやる必要はありません。
会議や講義に行く前に始めておけば、戻って来るまでには終わっています。
むしろ一つのソフトで全自動でやろうとすると、途中で向きやカラーと白黒を間違えられた時のやり直しが大変です。

おまえは今までスキャンした本の冊数をおぼえているのか?
EPSON EP-901A ドライバ手動インストール古い機種ですが、LAN経由でプリントアウトだけでなくスキャンも出来ます。

0 件のコメント: