“自炊”のための「ドキュメントスキャナ再入門講座」

今回利用するPFUの「ScanSnap 1500」



 これまで「ビジネス文書の電子化」ということで活用/進化を続けてきたドキュメントの電子化。当初は大型コピー機の付属機能でしかなかったが、安価なフラットベッドスキャナの登場により、より身近な存在になっている。そしてこれまでお硬く「文書の電子化」と称されていたその行為が、今では「書籍や雑誌を“自炊”する」と俗語で呼ばれるようになった。もちろんその意味は、書籍や雑誌をスキャンしてデータ化するということだ。つまり印刷物のデータ化は、ビジネスの枠を越え「いつでもどこで誰でもカンタンに使える」手段として進化し、エンターテインメント要素も加わり、一般家庭でも子供のプリントを保存する手段などとして、その裾野を大きく広げているのだ。

 昨年から火がつきはじめた通称「自炊」だが、時期尚早として様子を見ていた読者に、改めて現在の自炊の手軽さと便利さを紹介していくことにしたい。

 今回は、「なんか気になってたけどドキュメントスキャナって使えるの?」、とか、「自炊って興味はあるけど具体的にはどうするの?」、というユーザー向けに、改めてドキュメントスキャナの機能をご説明しようという趣旨の記事だ。ずっと動向を追ってきた読者には、「いまさら」と感じる場面もあると思うが、再入門のための「まとめ」記事としてご覧いただきたい。

自炊した本をiPadに入れておけば、何十~何百冊もの本を持ち歩けるので、移動時間を有効に活用できるレシピをスクラップしておけば、こんな使い方もできる。その可能性は無限大だ

●破格のシートフィードスキャナでもボタン一発で電子化OK!

 一概に雑誌や書籍を電子化すると言っても、何枚ものJPEG画像として保存する方法や、何枚かの画像を1つの画像ファイルにするTIFFのマルチページを使う方法などがある。しかし自炊の王道は、やはり汎用性の高いPDFで決まり。PDFであれば、PCはもちろん、iPadやGALAXYのようなタブレット端末、そしてスマートフォンなどでも閲覧できるからだ。

 そこで必要になるのがスキャナだ。ただし一般的なフラッドベットスキャナは自炊に不向き。数百ページに及ぶ本を1ページずつスキャンする手間を考えたら、本のまま持って歩く方がマシだろう。

フラッドベットスキャナで自炊するのは重労働。しかも仕上がりがよくない

 自炊にとって必須のスキャナとは「シートフィードスキャナ」だ。紙の束をコピー機に載せると、原稿を次々に読み取りコピーしてくれるADF(Auto Document Feeder:オートドキュメントフィーダー)付きのコピーのように、ボタン一発で数百ページ近い本でも次々にPDF化してくれる。

 見た目はインクジェットプリンタだが中には印字ヘッドではなく、スキャナのCCDユニットが原稿の表裏を挟むように設置されているので、原稿を1度通すと表と裏を同時にスキャンしてくれる。

 操作性や機能は、この上なくシンプルになっているため、スキャナの新規購入を考えている読者には、初心者用のスキャナとしてもお薦めしたい。また価格もほぼインクジェットプリンタと同じような価格帯になっているため、リーズナブルな点も今導入を薦める理由の1つだ。

ドキュメントスキャナならコンパクトでスキャンにかかる時間も数分で済むトレイをあちこち引き出すと、大きな本でもキレイにスキャンできる
使わないときは、たたんでおくとインクジェットプリンタの2/3程度の大きさ。しかもたたむと自動的に電源が切れるシートフィーダ側から見た内部。CCDユニットが原稿の表裏を同時にスキャンする

●シートフィードスキャナの賢い選び方

 一般的に「スキャナ選びのポイントは解像度」と言われているが、印刷物のスキャンが中心であれば400dpiもあれば十分だ。

 次にシートフィードスキャナならではの機種選定のポイントを見ていこう。

 第1の必須条件は「原稿の給紙がスムーズ」という点だ。自炊では、少なくても100ページ、多ければ数百ページもスキャンしなければならないので、給紙のスムーズさが使い勝手を大きく左右する。

ドキュメントスキャナで用意されているのは、この程度の解像度だが、印刷物をスキャンするには十分だスキャン中のエラーを即時レポートするのも重要な機能。あるとないとでは、作業効率に天と地の差が出る

 次に重要な条件が、紙詰まりなどを起こしたときの対応性だ。原稿が曲がっていて紙詰まりを起こしてしまった場合など、どこまで正しくスキャンできて、どのページで紙詰まりしたかを、紙詰まりを起こした瞬間に報告してくれなければ、あとでPDFを切ったり貼ったりで大変な労力を強いられることになる。

 また「紙がくっついていて2枚同時に給紙されてしまった」というエラー判定も、自炊の作業効率を大きく左右することになる。後で読んでいたら「クライマックスシーンだけスッポリ抜けてた」なんてことになりかねないのだ。

 第3の条件は、添付ソフトウェアの良し悪しだ。紙詰まりや2枚同時給紙エラーの即時レポートなどは、スキャナ自体のセンサーに加え、レポートするソフトウェアも重要になる。また文字中心の書籍であれば、文字認識(OCR)ソフトの添付はもちろん、精度や速さも求められる。


【ポイント:文字認識ソフトが必須のワケ】
 文字認識ソフトを使いPDFに文字情報も付加しておくと、全文が検索できるだけでなく、しおりや索引代わりに利用できる。


 またPDFを加工するソフトも必須となる。場合によっては、カバーをトリミングして表紙にしたり、本文は白黒でスキャンして、後から口絵のカラーページをスキャンして合体させたりと、PDFを加工する作業が僅かにあるためだ。

 これらの条件をすべてクリアする製品は、ドキュメントスキャナ数あれど数製品しかないというのが現実。今回は、PFUの「ScanSnap S1500」を選んだ。ScanSnapはシートフィーダー付のドキュメントスキャナの代表的なシリーズで、現在でも多くの自炊ユーザーに使われている。

ScanSnapの文字認識機能PDFをカンタンに編集できるScanSnap Organizerも標準添付なんとAbobe Acrobat 9 Standrd 日本語版も標準で付いてくる
名刺をスキャンしてデータベース化する「名刺ファイルリングOCR」もなかなか便利に使える。これも標準添付ソフト作成したPDFをスクラップブックのように管理できる楽2ライブラリは、セットモデルに添付されている。

●操作は「自炊」そのもの。慣れとコツを掴め

 本を電子化する「自炊」は、ご飯を作る「自炊」と同じで、やってみるまでは面倒にしか思えないが、いざやってみると意外にカンタンだ。ここでは、自炊のコツを交えながらScanSnap 1500で書籍や雑誌をPDFにしていく様子を紹介しよう。

1) 本の解体

 本の代表的な綴じ方は大きく分けて2つあり、コミックのように平らな背表紙がある「平綴じ」と呼ばれる本と、週刊誌のようにステープラで綴じて背表紙がない「中綴じ」というものがある。

 平綴じは接着剤で綴じているので、そこを切り取ればバラバラにできるが、平綴じにも何種類かあり、それぞれ接着剤の浸透している度合いが違っているため、切断する幅の違いがある。


【ポイント:平綴じの切断幅】
 背表紙から5~8mmのあたりを切断すれば、種類に関係なくバラバラにできる。


 一番リーズナブルな切断方法は、定規とカッターを使うやり方だ。しかし数百ページもある本だと、かなり上手に切らないと最初のページと最後のページで幅が変わってしまう。キレイな仕上がりとスムーズな給紙を目指す場合は、裁断機を使うといい。価格は大きさによりまちまちだが、ここで使っているA4対応のPLUS製「PK-513L 26-106」は、実売価格で3万円程度となっている。便利だが、50cm四方もありデカくて重いことと、案外高いのが玉に瑕だ。

自炊では定番となっているPLUSの裁断機。欠点はデカくて重いこと切断ラインが赤い光りで本に投影されるので位置決めがしやすいレバーを倒せば一瞬でキレイに切断できる。カッターと定規に比べると数百倍は早くキレイに仕上がるだろう

 自分で裁断まではちょっとという人は、製本サービスなどを行なう店舗で裁断サービスを利用するといいだろう。例えばフェデックス キンコーズでは、厚さ1cmの本の場合、105円で裁断してくれる。

 どんな方法でも接着部分の切断を終えたら、すぺてのページがバラバラになっているかを必ず確認すること。

本の最初のページと最後のページは、他のページより接着剤が浸透しているので注意5mm切断しても、それ以上に表紙と本文の間には接着剤が浸透している場合があるので、必ず1ページずつ分離できているかをチェックする

 一方、ステープラで綴じてある中綴じの解体は、内容によって切断する場所が変わってくる。中綴じの雑誌は、本の根元まで開けるため、平綴じに比べて背表紙側の余白が少ない。またグラビアやマンガなどは、見開きで1枚の写真や絵になっている場合が多い。なので、内容に応じて次のように切断するといいだろう。


【ポイント:中綴じ(余白があるもの)の場合】
 雑誌の厚みにもよるが、背表紙(ステープラ)から5mm程度の場所を切断。これによるメリットは、紙の大きさが均等になり、スキャンミスが発生しずらいという点だが、見開きの1枚絵の一部が切れてしまうというデメリットがある。
【ポイント:中綴じ(余白がないもの)の場合】
 本を閉じているステープラを外し、本を開いた状態にして中央を切断する。メリットは見開きの1枚絵でもかけてしまうことがない点だが、デメリットは本の中央分は紙の幅が狭くなり、表紙や裏表紙にいくにつれ幅が広くなる点だ。面倒でなければ、2つに分断した切断面を合わせて、ページがズレている部分を切断すると、紙の大きさを均一にできる。

ステープラで綴じられている部分を丸ごと切断する。慣れないうちは、ステープラを外してから切断すると針に刃が当たらないので安心だあらかじめステープラを外し中央で裁断する
中綴じを中央で切断すると、どうしても本の表紙の方は幅が広く、中央部分は狭くなっしまうズレている部分を改めて切断すると、幅を均一にできてスキャンしやすくなる

 またスキャン幅を超えてしまう「A4変形」というサイズの雑誌もよく見かける。この場合は接着部分に加えて、天地(上下)と綴じられていない側の余白を3方から裁断して、A4サイズに収めるようにするといいだろう。

サイズが大きくてスキャンできない場合は、余白を切断すると一回り小さくできる4方の余白を切断すれば、A4変形でもB5判程度まで小さくできるはずだ

2) 原稿を捌いてScanSnapにセット

 バラバラになったページは、よく捌いてから給紙口にセットするが、ここにもコツがある。


【ポイント:空気を入れて、捌いて、ズラす】
 一度に給紙口にセットするだけのページを取り出し、まず角から息を吹き込む。次にページの両端を持ち、波打たせるように捌く。さらにここでもう一度息を吹き込むといいだろう。最後は、原稿を平らな机の上などでならすが、その後でスロープができるようにページを少しずつズラすと給紙がスムーズになる

息を吹き込んで紙をよく捌いたら、原稿台にセットする

 原稿を捌かない256ページの文庫本では、2、3回給紙エラーが出てしまったが、よく捌くとエラーなしで全ページをまとめてスキャンできる。

3)「ScanSnap Managerの設定」を起動して解像度やサイズを指定

 スキャニングソフトの「ScanSnap Manager」には、原稿サイズ自動認識や原稿がカラーか白黒かを見分けるオートモードも搭載されているが、ワンランク上の自炊を目指すなら、積極的に「ScanSnap Managerの設定」で手動設定するといい。

 初心者向けのカンタン設定ボタンが上部にまとめられているが、ここでは「カスタマイズ」を選ぶ。細かな設定は6つのタブで行なうが、頻繁に設定を変えるのは「読み取りモード」と「原稿」タブだ。

スキャンの細かな設定は「ScanSnap Managerの設定」で行なう「読み取りモード」タブでの設定。仕上がりを左右する設定項目が並ぶ

 「読み取りモード」タブの設定は、できあがりのPDFの美しさを大きく左右するため、本気で説明すると、かなり長くなってしまうので、ここでは設定例をお見せしよう。


【ポイント:本の種類による画質とカラー設定】

本の種類画質の選択カラーモードの選択
白黒印刷の書籍ファイン白黒
書籍のカラー口絵やカバースーパーファインカラー
さほど写真に意味がない雑誌(情報紙系)ファインカラー
写真をキレイに見たい雑誌(料理本など)スーパーファインカラー

 白黒印刷の書籍は解像度から言えば「ノーマル」の「グレースケール」でもいいのだが、多くの書籍は読みやすく黄色い「書籍用紙」というタイプが使われているので、グレースケールで読み取ると影が出てしまう場合がある。そこで画質を「ファイン」にして「白黒」で読み取ると影が出にくく、文字は真っ黒、地は真っ白の読みやすいPDFになる。グレーの階調分を解像度でカバーするというアプローチだ。

 また口絵やカバーは、白黒の本文とは別でスキャンするといい。別にスキャンするとPDFが複数できてしまうが、後述する添付ソフトを使えば、カンタンに合体できる。

「読み取りモード」タブのオプション。「文字をくっきりします」と「文字列の傾きを自動的に補正します」(書籍の場合)はチェックしておくといいだろう

 さらにオプションボタンを押すと右の画面が表示される。

 読み取り濃度は、標準がかなり濃い目に設定されているようなので、それより2、3段階薄めにすると調子がいいようだ。必ずチェックするのは「文字をくっきりします」だが、他の設定は次のような働きをするので適宜に設定するといいだろう。


設定項目設定備考
白紙ページを自動的に削除しますチェックしないページがズレてしまうので
文字列の傾きを自動的に補正します書籍など文字中心ではチェック、雑誌は文字がいろんな方向に配置されているのでチェックしない傾いた原稿の「行」を認識して傾きを補正する機能
原稿の向きを自動的に補正します自炊ではチェックしない文字として読める方向を検知する傾き補正。添付ソフトの名刺OCRでは有効にするといい
原稿を上向きにセットしますチェックしない原稿の上側を給紙口に向けてセットする

「原稿」タブでの設定は、おもに原稿の読み取りサイズを指定する

 「原稿」タブで指定するのは「原稿サイズの選択」だ。選択肢には「サイズ自動検出」も用意されているが、自炊はあらかじめサイズが分かっているので、サイズを手動で指定したほうが効率がいい。なお雑誌の場合は、規格サイズから外れた○○変形というものがほとんどなので、「カスタマイズ」ボタンを使い独自のサイズを追加するといい。



【ポイント:断裁して既定サイズより小さくなっても元のサイズを指定してもいい】
 接着剤の部分を断裁すると元のサイズより5~8mm分短くなる。本来であれば「カスタマイズ」で断裁分を引いた大きさを設定するべきだが、元のA6サイズを指定してもさほど違和感がなかった。


 「マルチフィード検出」は、二重給紙をどのように検知するかを選ぶが「重なりで検出(超音波)」の精度が飛び切り高いので、これ以外を選ぶことはまずない。

 やや余談となるが、ScanSnapで一番感心した機能が、二重に給紙してしまった場合にそれを自動的に検知する「マルチフィード検出」だ。その精度は驚くほど高いが、購入前の読者にとっては伝わりにくい。しかもPFUは、カタログなどであまり謳っていないので、ここで技術解説をしておこう。

 超音波は反射しやすいという性質がある。これは車のカーステレオを大音響で鳴らしても、窓を閉め切っていると「ドンドン」というバスの音しか聞こえず、シンバルやトラペットなどの高い音が聞こえないことからもわかる。つまり周波数の高い音は、車のボディーや窓に反射してしまい、外に漏れてこないのだ。

 ScanSnapのマルチフィード検出も、この物理法則を応用したものだ。

原稿を挟み込むように設置された超音波センサー。このセンサーの恩恵は絶大だ

 装置には対になった超音波センサーが向かい合っていて、紙が通過した時、どれだけの音が紙越しに漏れ聞こえてくるかをチェックしている。

 給紙された紙が1枚であれば、受信側のセンサーにはそれなりに大きな音が漏れ聞こえるが、ここに2枚以上の紙が給紙されると音が極端に小さくなる。マルチフィード検出は、このような仕組みで二重の紙送りを高い精度で検出するのだ。

給紙された紙が1枚であれば、超音波がある程度通り抜け、向かい合うセンサーには比較的大きな音が届く2枚給紙されると、2枚の紙に超音波が反射されるため、向かい合うセンサーにはほとんど音が届かない

 ただし、スキャンする紙の厚さはさまざまなので、音がどれだけ小さくなった時点で複数枚の紙を吸い込んだとするかという「しきい値」は、どれだけ多くの紙でテストしたかというデータ量に精度が大きく依存する。PFUはドキュメントスキャナがビジネス機だけの時代から、実際のオフィスや研究所で蓄積したデータを持っているため、安価なScanSnap 1500でもその「しきい値」がビジネス機からフィードバックされ驚くほどの精度を見せてくれるというわけだ。

4) ボタン一発でスキャン

最後に読み取ったページが正しくスキャンできたかどうかを指定して、継続して読み取りさせられる。ファイルが2つに分割されることもなく便利だ。

 「ScanSnap Managerの設定」で設定を終えたらスキャンの開始だ。それには、本体の青いボタンを押すだけ。たったコレだけだ。読み取り速度は、160ページのコミックサイズのカラー本を300dpi(スーパーファイン)でスキャンした場合で2分半ほど。もし途中で紙詰まりや二重に給紙されても、ほとんど手間がかからない点も使いやすい。

 読み込みエラーが発生した場合、エラーリポートに直前にスキャンした画像が何枚か表示されるので、どこまで正しくスキャンできたかを選ぶだけ。スキャンミスしたページをもう一度給紙装置にセットし、再び青いボタンを押すとスキャンが再開され、1つのPDFファイルとして出力してくれる。


5) ScanSnap Organizerで文字認識と編集

ScanSnap Organizerでは、スキャンしてPDF化した本をさまざまに加工できる

 全ページのスキャンを終えると、ScanSnap Magagerと連携してPDFの編集ができるScanSnap Organizerが起動する(設定により連携するアプリケーションを変更したり、連携させないことも可能)。ScanSnap Organizerでは、本文とは別にスキャンしたカバーを加工して表紙にしたり、カラー口絵のみのPDFと合体させたりといったことが可能だ。

 さらに蛍光ペンでマークしたキーワードをもとにPDFを自動的に振り分けたり、キーワードをPDFに埋め込んだりといったことも可能。また出力したPDFに文字認識を別途行ない、文字情報を付加することも可能だ(スキャン終了時に自動的に文字認識させることも可能)。文字認識にかかる時間はCPUに依存されるが、筆者のCore i7-870でコミックサイズの書籍を160ページを試したところ6分だった。

 ScanSnap Organizerでの編集は、Abobe Acrobat 9 Standerdでも可能だが、後者では機能が豊富すぎて、逆に初心者にはほぼ手が出せないといってもいい。また、根っからのWindowsっ子という人には、Appleっぽいユーザーインターフェースが使いにくい場合もあるだろう。一度使ってみて「こりゃダメだ……」という場合は、ScanSnap Organizerがお薦めだ。

6) Acrobat Readerで表示してみよう

 完成したPDFをPCで見るとこのようになる。

通常の本と遜色なく読めるPDFが完成文字情報は透明な文字として埋め込まれているので、全文を検索するとこもできる

 文字認識ソフトで埋め込まれた文字情報は、画像中の文字の場所に透明な文字として埋め込まれている。だからPDFの検索機能を使えば、画像の自炊PDFでも文字列検索も可能だ。

 気になるOCRの文字認識率だが、100%正しく解析するのは無理。文字数をカウントしたわけではないが、感覚的には70~80%の認識率という感じだ。とはいえ「こんなこと書いてあったのドコだっけ?」という場合に、強力な機能となるのは筆者が保証しよう。

●PDF活用術!iPadだけじゃなくてファミリーでも使える
子供のいる家庭にありがちな、プリントのインフレ。コルクボードをいくら拡張しても、片っ端から埋まっていくから不思議だ

 書籍や雑誌をPDF化する「自炊」は、慣れてしまえば非常に簡単で素早くできるが、自炊よりもっと手軽で便利に使えるシーンがある。それが子供のプリントの管理だ。とくにウチのように子供が3人もいると、配られるプリントがとても多い。毎月配られる学年ごとの予定表や家庭数に配られる学校全体の予定表、通学路の見回り当番表、給食の献立などなど。子供が小中高に分かれているとなると、これが3倍の量になり、塾や習い事の月間予定表などもあいまって、どんなに大きなコルクボードを買っても、重なり合ってしまいどれがどれやら分からなくなるものだ。

 そんなときに便利なのがScanSnapをはじめとしたドキュメントスキャナである。プリントを貰ったらその場でスキャンしてPDF化。これならなくなったり破れたりすることもなく、探すのもカンタンだ。また学校関係のプリントはB4やA3になっている場合が多いが、添付の「A3キャリアシート」を使うと、大きな紙を表裏に分割してスキャンができるので、A4対応のScanSnapでも問題ない。しかもScanSnapには「楽2ライブラリ パーソナル」なるものが添付されており(セットモデルのみ)、PCが苦手なお母さんでもPDFをカンタンに管理できる。

学校のプリントには、B4やA3サイズも多くあるので、A3キャリアシートを使うとB5やA4の表裏として読み込める。見開きにすれば、B4やA3の状態で読めるというわけだ「マイドキュメント」フォルダがグチャグチャでも、バインダーでPDFを管理できるのでカンタンに整理できるバインダーをダブルクリックすれば、内容をスグに確認できるのも魅力

 見た目は事務用バインダーのようになっており、子供ごとのバインダーを作っておけば、必要なプリントもスグに見つかるし、「すべてのファイルはマイドキュメント(フォルダ)にある」という使い方をしている人でも、PDFを目的ごとに整理できるから便利だ。楽2ライブラリは、初心者でもカンタンに使いこなせる、いわばPDFのスクラップブックのように使えるのが魅力。

 また、PDFは、iPadなどのタブレット端末とも抜群の相性だ。たとえばiPadの場合、色々なPDFリーダーが用意されているが、一番のおすすめは「i文庫HD」。アメリカ生まれのiPadでは、縦書きで右開きに対応しているPDFリーダーは少ないが、i文庫HDは純国産製なのでバッチリ縦書きに対応する。価格は600円で、機能と使いやすさを考えたら破格値と言えるだろう。

リーダーとしておすすめなのは「i文庫HD」。特にWindows派の人は、これしか選択肢はないと言ってもいいだろうFTPサーバー内蔵なので、表示されているIPアドレスのポート2100番にPCからFTPクライアントを使って転送できるのが良い

 iPadへはiTunesを使わずに転送できる。転送するには、まずi文庫HD内蔵のFTPサーバーを起動する。小さい画面には、サーバーのIPアドレスが表示されるので、あとはフリーウェアのFTPクライアントを使って、iPadにアップロードするだけ。シンプルかつ明快な転送だ。

PC側のFTPクライアント(FFFTP)。ユーザーはanonymous(匿名)として、ファイル一覧はLISTコマンドを使うように設定するだけ。あとはドラッグ&ドロップでファイル転送できる

 いったんPDFを転送してしまえば、iPad(というかi文庫HD)でフォルダ分けしたり、本棚に登録したりも簡単。ノートPCでもカンタンにPDFを閲覧できるが、さすがにiPadまで手軽とは言いがたい。

 もちろん通勤電車の中でPDFを読む端末としても持ってこい。「自炊」とタブレット端末のマッチングは、これ以上にない相性といっていい。

 とくに通勤時間が長い人、移動時間や待ち時間が長い職業の場合は、自炊した本を何十冊も端末に入れて持ち運べば、今まで本を持っていたのがバカらしくなるだろう。また解体して自炊した本を捨てる勇気を持てば、大きくてかさばる本棚を破棄でき、広い廊下やリビングを有効活用できるようになるだろう。

【ScanSnap S1500仕様】
読み取り速度20ページ/毎分(表裏同時スキャン)
解像度300dpi~1,200dpi(カラー)/300~600dpi(グレー)
原稿サイズ名刺サイズ~A4超(216×360mm)、A3キャリアシートの利用でA3表をA4表裏として読み込み可能
セットできる原稿枚数50枚(一般的なコピー用紙換算)
インターフェイスUSB 2.0/USB 1.1
寸法292×159×158mm(幅×奥行き×高さ)
添付ソフトウェアScanSnap Manager V5.0(Macintosh版の3.0も付属)(ドライバ・スキャンニング)、ScanSnap Organizer V4.1(PDF・JPEG整理・閲覧)、名刺ファイリングOCR V3.1(名刺管理)、Adobe Acrobat 9 Standard 日本語版 Windows版(PDF編集)、ABBYY FineReader for ScanSnap 4.1(OCR)、Scan to Microsoft SharePoint 3.3.5(ECM連携)

(2011年 2月 18日)

[Reported by 藤山 哲人]