本の置き場所をなくしてスッキリ! 今日から始める「自炊」超入門



 紙の本を裁断してデータ化し、スマートフォンやタブレットで読む「自炊」がブームだ。持ち歩きが容易、紙と違って劣化しない、複数のデバイスで読めるといったメリットはもちろんのこと、紙の本が占めていた置き場所が不要になる点は、日本の住宅事情を考えると大きな利点だ。

 本稿では、先日新モデルが発表されたPFUのドキュメントスキャナ「ScanSnap S1500」を用いた「自炊」の手順と、その参考になるであろう細かいTipsについて紹介する。これから年末年始にかけ、本の「自炊」によって部屋の整理整頓をしたいと考えている方の参考となれば幸いだ。

書棚に詰め込まれた大量の本。場所をとるうえ、見た目も乱雑「自炊」で本をデジタルデータ化すればすっきりする。置き場所の節約、検索性の向上、デジタルデータであるが故に劣化しないなど、メリットは数多い
ドキュメントスキャナ。背面のシートフィーダに数十枚の原稿をセットしてスタートボタンを押すだけで、両面を同時に読み取れる。右がPFUの「ScanSnap S1500」、左がコンパクトモデルの「S1300」

 ちなみに筆者が本のデータ化を始めたのは、1995年の阪神・淡路大震災の際、本を満載したカラーボックスがまるごとベッド上に落下するという事故に遭遇し、身辺から少しでも本を減らそうと思ったのがきっかけだ。もっともその当時、スキャナといえばCMYKを1色ずつ読み取るために4往復するような初期のフラットベッドタイプの製品しかなく、雑誌の必要なページだけを抜粋してスキャンするにしてもかなりの手間だった。今回紹介する「ScanSnap S1500」のように、数十枚の原稿をまとめてセットして両面を同時にスキャンできるドキュメントスキャナの登場は、まさに僥倖だったと言っていい。

 ところで近頃すっかり一般名詞化した「自炊」という用語は、本を自分でデジタルに「吸い上げる」というニュアンスが転じたものとされる。昨今の自炊ブームは、前述のドキュメントスキャナの低価格化に加え、KindleやiPadなど可搬性の高いビューアが登場したことが要因として大きい。さらに深堀りすると、国内で提供される電子書籍の数がいまだ少ないというのが、その背景にあると言って過言ではないだろう。

 とはいえ、電子書籍のラインナップが今後拡充し、すべての本に電子版が用意されるようになったとしても、既存の本をいちいち買い直すには莫大なコストがかかる。紙の本の購入者にはタダで配布しろというのも、これから作られる本については可能であっても、過去にさかのぼって提供しろというのは、出版社にとって酷な話だろう。

 その点、いったん紙に出力されたデータを再びデジタルに戻すという根本的な矛盾、本を裁断してバラバラにする勿体なさ、作業にかかる手間、機器の置き場所といった問題点はあるにせよ、上記のような事情を勘案すると、今手元にある蔵書を「自炊」によってデジタルデータ化するというのは、現実的な解決策だと言える。自炊の目的は本を読むことだけにあるわけではない。置き場所を減らしたいというのも、自炊のりっぱな動機だといえる。


●ステップ1:裁断

 さて、本の自炊は、おおよそ3つの工程に分けられる。裁断、スキャン、加工だ。順に説明していこう。

 まず裁断。本ののりづけされている部分を切り落とし、ドキュメントスキャナで読み取れるようにする作業だ。近頃は本を解体せずにスキャンする方法も個人、あるいは業務ユースで研究が進みつつあるが、クオリティや手間のバランスを考慮すると、現状では裁断がもっとも効率のよい方法だと言える。非破壊型の自炊では、スキャン後の本が古書店を通じて再流通することも懸念されるため、著者への還元が圧迫される点も無視できない。

 本の裁断作業は、カッターを使うのでももちろん構わないのだが、本1冊をまるごとカッターで解体するのは手間もかかる上、裁断面が不揃いになるとスキャン時に斜行する危険がある。あとで余計な工数を増やさないためにも、裁断機を使うのがおすすめだ。

 裁断機の価格はピンキリだが、斜めから刃を入れる数千円ほどのローエンド製品は端までカットできない場合も少なくないので、できればプラスの「PK-513L」のような垂直裁断式の製品を選びたい。実売3万円前後とやや値は張るが、これならおよそ15mmまでの紙の束をレバー操作で一度に裁断でき、ズレの発生もほとんどない。

自炊用として定評のある垂直裁断式の裁断機、プラスの「PK-513L」。最近は刃の交換手順を簡略化した「PK-513LN」もAmazon向けに販売されている「PK-513L」では、裁断される位置を赤い光のラインで表示してくれるので、裁断ミスも起こりにくい
本を台に載せ、裁断位置を決めたのち、ロックを外してレバーを下まで押し下げることでカットされるカットした本。一度に15mm=PPC用紙で約160~180枚を一度に裁断できる。15mmを超える厚みがある本は、カッターなどで中央から2分割したのち裁断する

 本を裁断する位置は背表紙から5mm程度……と均一な値を示せればよいのだが、のりづけの深さは本にもよるので、5mm前後を目安に、のりの残り具合を見ながら1冊ごとに調整する。深く切りすぎて本文が欠けると泣くに泣けないので、優先度が低い本や再入手が容易な本から試すことをおすすめする。文庫や新書といった判型ごとに作業したほうが、要領が把握しやすくてよいだろう。

 また、カバーについてはあらかじめ取り除いておく。カバーの処理については、まるごとスキャンして最終的に本文と合体させたり、表紙部分だけをカッターで切り取って本文とまとめてスキャンしたりと、いくつかの方法がある。詳細は後述する。

 なお、昨今は自炊のプロセスをまとめて代行してくれる「スキャン代行業者」が問題になることが多い。これは所有者に代わってスキャンを請け負う行為が著作権法違反となる可能性が高いためだが、裁断だけであれば問題になる余地はないので、キンコーズなど裁断を請け負ってくれる業者に依頼するのも1つの方法だ。

●ステップ2:スキャン

 本を裁断したら次はスキャンだ。一度に50枚もの原稿をまとめてセットできるPFUの「ScanSnap S1500」なら、本1冊(200ページ=100枚)を2回に分けてセットするだけで済む。スキャン速度は毎分20枚(40面)と高速なので、ものの5分もあれば本1冊分のデジタルデータ化が完了する計算だ。言うまでもないが、両面を同時にスキャンできるので、フラットベッドスキャナのように原稿をひっくり返す手間はかからない。

人気の高いドキュメントスキャナ、PFUの「ScanSnap S1500」。一度に50枚をセットできるまずは背面のシートフィーダに原稿をセット。ページ上部を先頭にして挿入する原稿のセットが終わったら本体前面のScanボタンを押す
スキャン開始。原稿が前面から排出される生成された自炊データ(PDF)をPC上で表示したところiPadに転送して表示したところ。見開きにこだわらなければ、スマートフォンなど画面の小さな端末でも閲覧可能

 スキャンの実行方法は、原稿を背面のシートフィーダにセットしてScanボタンを押すだけなので、とくに難しいことはない。ただし、クオリティの高い自炊データを効率よく生成したい場合、さまざまなTipsがある。以下、項目別に紹介する。


○カラーと白黒の原稿をうまく切り替えて読み取るには?

 1冊の本の中には、カラーページと白黒ページ、両方のページが混在しているのが普通だ。ScanSnapは原稿のカラー/グレー/白黒を自動判別して読み取るモードを備えているが、紙が黄ばんだ白黒ページをカラーだと勘違いして読み取ってしまう場合もあり、こと本の自炊においてはあまり役に立たない。他社のユーティリティでも、傾向はほぼ同じだ。

 そのため、カラー用とグレー用の2つの読み取り設定を作っておき、手動で切り替えながらスキャンすることをおすすめする。筆者が用いているパラメータは以下の画像のとおりなので、参考にしてほしい。重要度がそれほど高くない本は、処理速度を優先して、すべて自動モードで読み取るという考え方もありだろう。

ScanSnapの読み取り設定でカラーモードを「自動」にしておけば原稿のカラー/グレー/白黒を自動判別してくれるが、自炊用途では黄ばんだ紙をスキャンすることがあるため、うまく機能しないことも多い筆者が使用している取り込み設定。これはカラーページを読み取る場合の設定
筆者が使用している取り込み設定。これは白黒ページを読み取る場合の設定

○白黒モードとグレーモードはどう使い分ける?

 今回例として紹介している「ScanSnap」に限らず、多くのドキュメントスキャナは白黒ページを読み取るためのモードとして「白黒」と「グレー」の2つを搭載している。白黒モードはその名の通り白と黒の2値なので、薄墨で塗ったような原稿を白黒モードで取り込むと階調が完全に飛んでしまうか、もしくは真っ黒に塗りつぶされてしまう。いったん飛んでしまった階調は補正ソフトを使おうが復元ができないので、この場合はグレーモードが妥当ということになる。

 一方、白黒モードにするとデータ量が大幅に削減できるほか、紙の地の色を飛ばせるというメリットもある。グレーモードを基本としつつ、ページが文字中心でデータ量を抑えたい場合や、黄ばんだ紙の色を消したい場合に、白黒モードの利用を検討してみてもよいだろう。

黄ばんだ紙をそのまま自動モードで読み取ると、白黒ページでもカラーと判定されてしまうことがあるさきのページを自動モードで読み取ったところ。黄ばんだ紙がカラーページと認識されてしまっている
強制的にグレーモードで読み取ったところ。おおむね正確に読み取られている
同じく白黒モードで読み取ったところ。文字は問題がないのだが、イラスト中の薄墨で塗られた箇所が真っ白に飛んでしまっている

○ファイル形式はPDF? それともJPEG?

 ScanSnapでの取り込みフォーマットは、PDFか、もしくはJPEGのいずれかを選択する。JPEGファイルだと1ページにつき1ファイルが生成されるが、まとめてZIP圧縮すれば、書庫ファイルとして各種ビューアでの閲覧が可能になる。両フォーマットでファイルサイズにそれほど違いはなく、画質に差があるわけでもないので、手軽に取り込めるという点でPDFがおすすめだが、もちろんJPEGにもメリットがある。以下、具体的に違いを見ていこう。

 まず対応ビューアの多さだが、これはPDFのほうが圧倒的に有利だ。事実上の標準フォーマットとしてサポートされており、無料で配布されているソフトやアプリも多数あるため、ビューアが見つからずに困ることはまずない。電子書籍の専用端末で閲覧する場合も同様だ。海外のビューアで右綴じの表示に対応していない場合があるのが、注意点と言えるくらいだ。

 また、OCRによるテキスト埋め込みはPDFならではの機能なので、自炊データで文字検索を可能にしたければ、PDF一択となる。また、JPEGで取り込んだファイルを書庫として扱うには取り込み後にZIPに圧縮する手間がかかるため、手軽に取り込んですぐに見たければ、やはりPDFのほうがおすすめということになる。

 とはいえ、JPEGにも利点は多い。1つはページの補正や差し替えが容易なこと。単純なページの連結や削除であればPDFでも問題なく行なえるが、レベル補正による濃淡の調整や傾き補正などの加工を行なう場合、PDFだといったんJPEGに書きだしてから作業を行なうことになるため、最初からJPEGで取り込んでおいたほうが手間が省ける。

 また、後述する加工ツール「eTilTran」や「ChainLP」はPDFの読み込みに対応していないため、最終的にPDFを生成するにしても、取り込みの段階ではプレーンなJPEGにしておいたほうが作業効率がアップする。筆者の場合、保存が主目的で画質にこだわらない本はPDF、そうでなければJPEGといった具合に使い分けている。

○ページの傾きはどう補正する?

 自炊データの本文があからさまに傾いていると、読む気をなくしてしまうもの。ページの傾きを補正する方法は、大きく3つに分けられる。

 まず基本となるのが、スキャン時に斜行しないようにすること。規定枚数を超える原稿を無理にセットしたり、また用紙を左右から押さえるガイドに隙間があったりすると、傾いたまま読み取られがちだ。後者についてはガイドを左右から手で抑えるのも効果的といえる。なお、ページの裁断した側はナナメにカットされている可能性があるので、もともと本の端だった側を基準にしたほうが、斜行は低減できる。

ドキュメントスキャナのガイド。用紙との間に隙間があると斜行しやすいガイドを左右から手で軽く押さえてやるのも効果的
ScanSnapでは、読み取りモードのオプションに「文字列の傾きを自動的に補正します」という項目があるので、ここにチェックを入れる。ちなみに向き補正は別物だ

 ドキュメントスキャナの傾き補正機能を使うのも有効だ。読み取ったページ内の文字列を検出し、水平または垂直になるように補正してくれるので、プラスマイナス5度程度の範囲の傾きであればこれでおおむね対応できる。ただし挿絵ページなど、ページ内に文字がないとあらぬ角度で補正されてしまう場合がある。またコミックの場合も誤検出が発生しやすいので、傾き補正はオフにして読み取るのが鉄則だ。


「eTilTran」では傾きを自動検出して補正してくれる。またグリッドに沿って目視での修正も可能

 もう1つ、取り込み後に「eTilTran」などの加工ツールで補正する方法もある。取り込んだあとで回転させるので画質面への影響を考えるとあまり好ましくはないが、先の方法と同じく自動検出に対応するほか、グリッド線を重ねて0.01度単位での手動回転もできるので、細かな修正が可能だ。詳しくは後述する。


○解像度はどのくらいがよい?

 蔵書はなるべく高解像度で取り込んで美しく残したいのが人情だが、あまりに解像度を高くしすぎるとデータ量が増えてストレージ容量を圧迫するほか、データ転送にも時間がかかるようになる。またビューアによってはページめくりの速度に影響を及ぼす場合もあるので、美しさを損なわない範囲で解像度は控えめにしておいたほうがよい。ドキュメントスキャナの設定値で言うと300dpiあたりがバランスの取れた値だといえる。文字中心なら200dpiでもいいだろう。

 もっとも、後述する加工ツールで最適化することを前提に、取り込み時はなるべく高解像度にしておくといった考え方もある。筆者の場合、先の取り込み設定にもあるようにカラー/グレーともに300dpiで統一している。

○カバーはどうスキャンする?
本体のScanボタンを長押しし、点滅するのを待って指を離せば、カバーなどの長尺の原稿であっても端が切れずにまるごとスキャンできる

 カバーは、表紙部分のみを裁断して本と一緒に取り込む方法もあるが、カバーのみ別にスキャンし、取り込み後に画像編集ソフトでトリミングして本に合体させるほうが一般的だ。

 カバーは縦に長いため、普通にスキャンすると端が切れてしまう場合があるが、ScanSnapの長尺モードを使えばカバーを裁断せずにそのままスキャンできる。方法は、本体のScanボタンを長押しし、点滅するのを待って指を離すだけ。
○紙が重送する場合の対策は?

 自炊用途でドキュメントスキャナを長く使っていると、紙の粉による読み取り部の汚れのほか、パッドやローラの摩耗によって、紙送りに支障が出る場合がある。ScanSnapでは「ScanAid」というメンテナンスキットが別売されており、清掃に使う綿棒や布のほか、消耗品であるパッドユニットやピックローラユニットが同梱されている。

 自炊では1冊につき100枚ほどのスキャンを行なうため、何百冊とスキャンすることで、パッドユニットやピックローラユニットの交換時期が意外に早く訪れる(パッドユニットは5万枚または1年ごと、ピックローラユニットは10万枚または1年ごとが交換の目安)。紙送りに支障が出るようになったら、ユーティリティで通算読取枚数をチェックし、必要に応じてこのメンテナンスキットの購入を検討するとよいだろう。

原稿を上から抑えるパッドユニット。これは磨耗した状態で、先端部(向かって右端)のゴムがとがってしまっている。紙の粉も大量に付着しており、紙の重送の原因になりやすいこちらは新品のパッドユニット。先端部のゴムがすり減っておらず、きちんと厚みがある

●ステップ3:加工

 スキャナで読み取った自炊データは、たいていのデバイスではそのまま転送するだけで読むことができるが、ページが微妙に傾いていたり、周囲の余白の面積がやたらと広いままだと読みづらい。こうした場合は「eTilTran」、「ChainLP」といった加工ツールで補正してから転送するとよい。データサイズも圧縮されるので、ストレージの容量削減や転送時間の軽減にもつながる。

「eTilTran」。0.01度単位でページを回転できる。自動補正はもちろん手動での調整も可能

 「eTilTran(エチルトラン)」は傾きを補正するツールで、文字列の傾きを検出して自動補正を行える。前述のスキャン時の補正と異なり、手動での角度調整も行なえるので、自動検出ではうまく補正できない場合でも対応は容易だ。


「ChainLP」。余白をカットしたり、画像のリサイズが行なえる。さきにeTilTranで傾きを修正したのち、このChainLPで余白をカットするのが正しい手順となる

 「ChainLP」は余白を検出してカットしてくれるツールで、あわせて画像のリサイズも行なえる。スマートフォンなど画面が小さい端末では余白を減らして本文の表示領域をなるべく大きくしたほうが読みやすくなるほか、KindleやReaderなどのE Ink端末も画面の有効解像度に合わせて画像をリサイズしてやったほうが文字のつぶれがなくなるため、本ツールを使うことで自炊データは格段に読みやすくなる。

 上記2つのツールはいずれもフォルダや圧縮ファイルからの読み込みには対応するが、PDFを直接読み込むことはできない(いったんJPEGに書き出す必要がある)。スキャン時にPDFではなくJPEGにしておけば、このプロセスを省略できる。なお、加工後の出力ではJPEGのほか、PDFを選択することもできる。

 また、カラーと白黒ページを分けてスキャンしていたり、カバーだけが別のファイルに分かれているといった場合は、この段階で結合する。PDFの場合はAdobe Acrobatのほか、フリーソフトでも結合が行なえるソフトが多数あるので、それを利用する。JPEGの場合はZIPアーカイブ内にファイルを追加するだけでOKだが、表示される順序はファイル名の昇順になるので、タイムスタンプがファイル名になっていると、カバー画像が最後に来てしまう場合がある。カバー画像がうまく先頭に並ぶよう、ファイル名を「00.jpg」などにするとよい。


●データの転送方法

 完成した自炊データはPC上でそのまま閲覧することも可能なほか、スマートフォンやタブレット、さらにはKindleやReaderといった電子書籍端末に転送して読むことができる。デバイスの種類ごとにおおよその転送方法を紹介する。

 まず、iPhoneおよびiPad。これまではiTunesを経由して転送するのが一般的だったが、ScanSnap S1500に新たに追加された「iPhone/iPad連携機能」を使えば、iTunesを経由せずにすばやく転送できる。利用にあたっては、iPhone/iPadに専用アプリ「ScanSnap Connect Application」(無料)をインストールしておく。

 手順は次のとおり。まずはScanSnapのユーティリティ「ScanSnap Manager」の最新版に含まれる「モバイルに保存」を起動したのち、iPhone/iPad側で前述のアプリを起動し、PC側からiPhoneを認識できることを確認しておく。つづいて「ScanSnap Organizer」を起動し、転送したい自炊データを「モバイルに保存」にドラッグ&ドロップすれば、転送が実行されるというわけだ。

 転送完了後にデータを開こうとするとどのアプリで開くかを尋ねられるので、iBooksなり、ComicGlassなり、i文庫S(iPadではi文庫HD)なり、自分が使いたいアプリを選べばよい。なお、ここではPC内にいったん保存してから転送する方法を紹介しているが、スキャンと同時に転送することもできる。

ScanSnapで「モバイルに保存」を起動。タスクトレイに「S」のアイコンが表示される。この段階ではアイコンは黄色アプリを起動する。正しくPC側から認識できていれば、この時点でPC側のタスクトレイのアイコンが黄色から青色に変わる。うまく認識できなければIPアドレスを手入力する「ScanSnap Organizer」で転送したい自炊データを選択し、左下の「モバイルに保存」にドラッグ&ドロップする。右クリックで「モバイルに保存」を選択してもよい
iPhone/iPadにデータが転送される転送中の様子をiPhoneの側から見たところ。転送速度はかなり速い転送が完了すると、リストに自炊データが表示される
自炊データをタップすると、どのアプリで開くかを尋ねられる。ここでは「i文庫S」を選択自炊データが表示された。閉じて別のアプリで開き直すことも可能だ
Android端末で「i文庫 for Android」を用いて自炊データを表示したところ。もちろんスマホだけでなくタブレットでも表示可能。7インチタブレットなら単行本サイズで読書には最適だ

 続いてAndroid。Androidのスマートフォンやタブレットであれば、microSDを経由して自炊データを読み込ませることができる。アプリは本家Adobe Readerや各種Officeアプリも利用できるが、大容量ファイルだと表示が重くなったり、右綴じに対応しないことも少なくないため、PDF/ZIP圧縮JPEGに両対応した「i文庫 for Android」をおすすめする。このほか「Perfect Viewer」や、PDFなら「ezPDF Reader」もよいだろう。

 ReaderやKindleなど、電子書籍専用端末でも読むことができる。両者ともにUSB接続でPCからマスストレージとして認識できるので、直接データをドラッグ&ドロップでコピーすればよい。ReaderであればmicroSDを経由して読み込ませることもできる。なおKindleはZIP圧縮JPEGの表示が可能だが、Readerは対応しない。

 このほか、DropboxやSugarSyncなどのオンラインストレージに対応するデバイスであれば、クラウド上に自炊データを保存し、必要になるたびにダウンロードする方法もある。ダウンロードする時間のぶん待たされることになるが、クラウド上に自分専用のライブラリがあるという安心感、また必要に応じてどの端末でも読めるという快適さはほかの方法にはないものだ。

 なお、これらWebサービスの共有機能を用いてデータを不特定多数に公開すると著作権法違反になるので、くれぐれも注意したい。


●データの保存

 稀に「本を自炊するとデータの消失が怖い」という意見を耳にするが、デジタルデータはそもそもバックアップが常識であり、むしろコピーしても劣化しないことが特徴でもあるわけで、この意見は少々的外れの感がある。もっとも、バックアップの取り方によってはデータを失いやすくなるのは事実なので、ある程度冗長性を持たせた方法を選びたい。

 まずはドライブの冗長化。データの保存先をRAID対応のNASなどにしておけば、ローカルドライブに保存するのに比べて冗長性は高くなる。自炊データ1冊あたりの容量が、原本+加工済みデータをあわせて100MBとするならば、100冊で10GB、500冊で50GBの容量が必要だ。NASであればLAN内のほかのPCからも参照できるので、リファレンス系の書籍をデスクトップPCとノートPCで交互に見る場合に重宝する。

 自炊データがある程度溜まれば、DVD-ROMなどにバックアップするとよい。RAID対応のNASといえど停電時にまとめてクラッシュする可能性はなくはないので、その予防にもなる。さらに念を入れるならば、先に述べたDropboxやSugarSyncなどクラウドにデータを置いて二重化する方法もある。いずれの場合もコストとの兼ね合いになるうえ、閲覧目的か保存目的かによっても選択肢は変化する。目的や予算に応じてベストな方法を選びたい。

●おまけ:スキャナがあればこんなメリットも

 自炊の手順とTipsは以上なのだが、自炊を行なう上で大きなネックになるのが、裁断機やスキャナの置き場所だ。いくら自炊によって本の置き場所を減らせるからといって、そのために購入した機器で占有スペースの差し引きがゼロになるのであれば、購入はためらわれる。機器の置き場所がネックになっていまいち自炊を始められないという人もいることだろう。

 もっともドキュメントスキャナについては、本以外にもメモや書類、さらには料金明細やチラシの類といった家庭内のさまざまな紙の書類をスキャンできるなど、用途はきわめて広い。本格的に自炊を始めるまで裁断はひとまずカッターなどで代替し、スキャナだけは揃えるというのが、選択肢として現実的だろう。

 余談だが、ScanSnapのセットモデルに付属する「楽2ライブラリ」は、スキャンした年賀状のお年玉番号を自動判定するといったユニークな機能もあるので、年末のこの時期は使いでのある製品だ。本に限らず、身の回りから紙の束をなくす快感を味わうという意味でも、まずはスキャナから入るのが順当だと言えそうだ。

まずはScanSnapで年賀状をスキャン。読み取り設定は、プリセットされている「年賀状取り込み」を選択しておけば、自動的に「楽2ライブラリ」の年賀はがきデスクに保管される「楽2ライブラリ」の画面を開くと、OCR処理でお年玉番号がテキストデータ化されているのが分かる
「楽2ライブラリ」のデスク画面で、年賀状が収められたキャビネットを選択して[右クリック]→[お年玉番号当せんチェック]を選択するオンラインで自動的に読み込んだ当せん番号と照合され、当せんハガキがあれば付せんがつけられる。大量の年賀状も一瞬で検索できる

(2011年 11月 28日)

[Reported by 山口 真弘]