山田祥平のRe:config.sys

グーテンベルクの願い、アルダスの夢




 ヨハン・グーテンベルクは活版印刷術を実用化し、その数十年後、アルダス・マヌティウスは持ち歩ける本を作った。出先では本や雑誌、新聞を読み、家では音楽を聴きTVを見るぼくらの日常は彼らの仕事に源を持つ。彼らの功績からほぼ500年。いつのまにか、印刷コンテンツより音楽や動画コンテンツの方が持ち出しやすくなってしまってはいないか。でも、10インチのディスプレイは、文庫本のほぼ見開きサイズ。ならば、パソコンで文庫を読んでみよう。そう思って書籍のデジタル化を試みてみた。紙の本と比べていったいどうなのか。

●スキャンのために本を裁断する

 インターネットを探せば電子ブックを購入できるサイトはずいぶんたくさんあるように見える。でも、そこに読みたいコンテンツがあるかどうかは別問題だ。やはり、書店に積まれた新刊書の方が、まだまだ魅力があり、本を読むとなると、どうしても、書店に赴いたり、通販サイトを物色して、紙の書籍を手に入れることになる。

 ところが自宅で読書のための時間を確保するのは意外に難しい。ならば、移動中に読みやすいように電子化してみようというのが今回のテーマだ。

 書籍の電子化には、そのスキャンが必須となる。手元には、複合機やフラットベッド、ページスキャナなど、複数台のスキャナがあるが、手でページをめくり見開きごとにスキャンしていくのは手間がかかりすぎて現実的ではない。そこで、PFUの「ScanSnap S500」を使うことを前提に準備を進めることにした。

 ページスキャナで自動給送させてスキャンするためには書籍をばらさなければならないが、それにはいろいろな方法がある。ほとんどの書籍は無線綴じなので、数十ページずつチギリとり、ペーパーカッターなどで裁断すればいい。数十枚を美しく裁断できるディスクカッターなどの製品も人気のようだが、書籍1冊が100ページ以下ということはまずないので、これまた手間と時間がかかってしまう。

 ふと思いついて、フェデックスキンコーズに問い合わせてみたところ、裁断サービスが提供されているというので試しに持ち込んでみることにした。

 まずは、実用度チェックということで、手元にあった本3冊を新宿南口店に持ち込んで裁断してもらった。持ち込んだのは「嫌われ松子の一生(上)」(幻冬舎文庫352ページ約15mm厚)、「電波利権」(新潮新書190ページ約10mm厚)、「ザ・サーチ」(日経BP440ページ約25mm厚)の3冊だ。文庫、新書、単行本の3種類を試してみたのだ。20分ほど待っているうちに、文庫と新書はそのまま背の部分をバッサリ、単行本は表紙をはずした状態で同様にバッサリと裁断されてきた。担当係の方によれば、文庫と新書は約1mm、単行本は2mmを裁断したという。裁断した背の部分も戻してもらえた。接着剤があれば簡単に元に戻せそうな気がするくらいに裁断面は鮮やかだ。料金は1冊あたり税込みで105円。かなりリーズナブルだと思う。ただ、この価格には、ちょっとしたマジックがある。それについてはあとで詳説する。

●インクのシミをデジタルに

 まるで札束のように美しく裁断された書籍を自宅に持ち帰り、さっそくスキャンを試してみた。

 ScanSnap S500は、約50枚の用紙を自動的に給紙しながら18枚/分で高速両面スキャンができるイメージスキャナで、普段は、書類のスキャンに重宝している。もはや、この機械なしでは、書類整理は考えられないくらいだ。

 今回は、ユーティリティの設定を、

・スーパーファイン(約600dpi相当)
・カラーモード:自動
・両面読み取り
・継続読み取り有効
・ファイル形式:PDF
・全ページテキスト認識して検索可能に
・サイズ自動検出
・白紙ページを自動的に削除しない
・文字列の傾きを自動的に補正
・原稿の向きを自動的に補正

として試してみた。

 継続読み取りをオンにしておくと、シートフィーダに紙がなくなったところで、ダイアログボックスを表示し、続けてスキャンするかどうかをたずねてくる。これで、約50枚ずつしか自動給紙できなくても、書籍1冊を全部スキャンして1つのファイルにまとめることができる。あとで連結してもいいのだが、こちらの方が手間がかからない。

 全ページテキスト認識は、読み取ったイメージをOCR処理し、透明テキストをPDFのイメージ上に貼り付ける。認識率は完全ではないが、几帳面に活字が並ぶ書籍では、検索に困らない程度の精度が出る。スーパーファインでスキャンしたのは、大きなディスプレイで表示したときのジャギーが気になることもあるが、テキスト認識の精度を多少なりとも上げようという魂胆だ。

 また、白紙ページが検出された場合は削除することもでき、書類のスキャンでは便利なのだが、書籍の場合は、白紙ページにも意味があると判断し、削除はしないようにした。これで、ページ番号と枚数がずれてしまうこともない。

 スキャン中にはトラブルも発生する。当然のごとく送りが不安定になってジャム、すなわち用紙詰まりが起こるのだ。だが、複数枚送りは発生しなかった。ジャムも、その原因は、すべてが接着剤残りによるものだった。のどの部分にわずかに接着剤が残り、ページがくっついていることがあるのだ。あまりにも美しく裁断されているので油断してしまったが、スキャナにセットする前に、紙をよくさばいてページのくっつきを排除しておく必要がある。今回は、特に文庫本で接着剤残りが散見された。

 スキャン中にジャムったページははじいておいて、最後に再スキャンし、ファイルの末尾に追加しておき、あとでページを差し替える。ScanSnap S500には、Acrobat Standardもバンドルされているので、できあがったPDFの編集もできる。

 スキャンに要した時間は、スーパーファインというモードながら、紙の再セットなどを含んでも文庫本300ページで約15分、440ページの単行本でも20分程度だ。TVでも見ながらこなせばすぐに終わってしまう。テキスト認識には、さらに時間がかかるが、これは、ユーティリティがPCのアイドル時間を見計らって勝手にやってくれる。テキスト認識させておくと検索ができるので、読むよりも参照することが多い資料本などでは重宝するし、推理小説などで、犯行現場の描写を読み返したりするような場合にも、すぐに当該箇所を探せ出せるので便利だ。

 できあがったPDFは十分に満足できるものだ。サイズは文庫本が13MB、新書が9.7MB、単行本が24MBだった。デジカメ写真に比べたらものすごく効率が良いように感じる。

 読むためには、Adobe ReaderとAcrobatの両方を試してみたが、自分でしおりを挟めるという点で、Acrobatの方が便利だ。シオリを挟めれば、どこまで読んだかがすぐにわかる。中断するときに、ショートカットのCtrl+Bを打鍵すれば、その位置にシオリが挟み込まれる。メモやコメントを書き込める点でもポイントは高い。

【お詫びと訂正】初出時にAcrobatの見開き表示機能において、縦書きの右開きに対応していない旨の記述がありましたが、[文書のプロパティ]-[詳細設定]-[綴じ方]で設定を変えることができます。お詫びして修正させていただくとともに、ご教示いただいた読者の皆様にお礼申し上げます。

●PDFを読んでみる

 まずは試しにと「嫌われ松子の一生(上)」を10.4型ディスプレイの「Let'snote Light R4」で読み始めた。ディスプレイのサイズは、見開き表示でほぼ実物大だ。画面を縦位置表示にし、前回紹介したノートパソコン縦置きスタイルで読むと、文字もかなり大きくなって読みやすい。文庫本なのに、まるで単行本を読んでいるような錯覚に陥ってしまう。多少暗いところで本を読むと、版面のコントラストが低くなり、小さな文字が読みにくいのだが、パソコンの画面なら大丈夫だ。比較のため、同装丁の下巻は紙の文庫を読んだ。このくらいの装丁なら150ページ/時と、読むために要する時間もそんなに変わらない。

 読むときのスタイルも自由だ。ぼくは、読書のときにはきちんと机に向かうことが多い。きちんとした灯りが欲しいからだ。でも、パソコンのディスプレイなら、環境光をさほど気にする必要はない。コーヒーショップのテーブルなど、パソコンを普通に置けるなら見開きで、立ったままの電車の中では縦位置表示のノートパソコンを手で支える。普通にパソコンを置いて縦位置表示すれば、寝っ転がって読むのにもちょうどいい。

 さらに、いろんなデバイスで読んでみた。PDFを扱えないデバイスに関しては1ページごとをJPGファイルにして試してみた。

 小さい方からいってみると、まず、携帯電話。ぼくの使っているNTTドコモの「P902i」は、2.4型のディスプレイを持ち、Adobe ReaderでPDFも表示できるが、当然ながらページ全体表示では文字がまったく読めない。そこで、ズームを使う。150%表示くらいで文字が読めるサイズになるものの、スクロールが遅くて実用にならない。読む速度にスクロールが追いつかず、ストレスがたまるばかりだ。

 次にNECのメディアプレーヤー「VoToL」 で試してみた。こちらは2.7型のディスプレイで携帯電話よりちょっと大きい。PDFファイルは直接開けないので、各ページをJPG化した。また、仕様上640×480ドット以下の画像までしか表示ができないため、リサイズし、画像方向も横に倒した。この状態で表示させてみたが、文字が小さすぎてまったく読めず完全な企画倒れだった。ズーム機能もないのであきらめるしかない。

 さらに、セイコーエプソンのフォトビューア「P-4500」で試してみた。こちらもPDFは開けないのでJPGファイルだが、Acrobatの吐き出した約800万画素のJPGファイルをそのまま表示できる。3.8型のディスプレイにページ全体を表示させると、それなりに読めるが当然文庫本の実物よりは小さい。ぼくの視力にはちょっとつらいが、若い方ならこれで十分という方もいるだろう。ちょっと拡大表示させると読みやすくなるが、スクロールさせながら行末まで読むには速度的に十分だが、次行頭に戻る操作がわずらわしい。1ページに16行あれば、この操作を16回繰り返すことになる。ちなみに、3.8型というサイズは、「VAIO type U」の4.5型ワイドとそんなに変わらない。したがって、この方法で本を読むときの使い勝手も似たようなものだろうが、ルーペツールなどをうまく使えば、もう少し実用になるかもしれない。

 大きなディスプレイでも試してみた。仕事場では横置き20型と縦置き21型をマルチディスプレイで使っているが、横置きで見開き表示、縦置きで単ページ表示で、どちらも申し分なく快適に読める。このくらいのサイズになると、文字も大きく画面から距離をおき、リラックスして読める上に、視界にページ以外のものが入ってきにくいため、本に集中できるというメリットも見いだせた。

 当たり前の話だが、PDFファイルなので、コピーが簡単にできる。だから、ノートパソコンとデスクトップパソコンの両方にファイルを置いておくなり、相互にファイルを行き来させて、出先ではノートで読み、自宅では大きなディスプレイで読むといったことができる。Windows Vistaの時代には、ファイルの同期がかなりスマートにできるようになるので、自宅に戻ってパソコンをネットワークにつなぐだけで、しおりを挟んだまさに読みかけの本を、複数のパソコンでオフライン読書できるようになると思う。

●丸背本に注意

 これは便利だと納得し、いつか読もうと思いつつ積んであったハードカバー本を追加で7冊裁断した。受付時に3時間程度見て欲しいというので、時間をつぶして店に戻り、料金を請求されて驚いた。持ち込んだ冊数は7冊なのに、金額が2,000円を超えていたからだ。理由は、本の仕様によるものだった。

 手元に本があったらちょっと観察してみてほしい。400ページを超えるような分厚いハードカバー本は、ほぼ間違いなく丸背になっている。本ののど側がふくらみ、小口側はUの字にへこんでいる。高級感があっていいのだが、これを裁断するのがむずかしい。そのまま裁断機にかけると、紙の大きさがまちまちになり、最悪の場合、のど側の文字が印刷されている部分まで捨てられることになってしまうという。

 最初に持ち込んだハードカバー本は、たまたま角背だったために、この問題が発生せず、スンナリと裁断できたということだったのだ。

 丸背の問題を回避するためには、あらかじめ2〜3分冊にバラしてそれぞれを裁断後、サイズ合わせのためにそれをもう1度裁断するという手間が発生する。税込み105円という価格は、1裁断あたりの料金なので、1冊に複数回の裁断が発生した結果、このような価格になったわけだ。また、表紙をはがす作業にも105円が必要なので、持ち込む際には表紙を自分ではがしてきてほしいという説明を受けた。分厚く重量があるハードカバーの丸背本こそ、電子化のメリットが高い。それだけに、これには参った。

●電子ブックショップの充実を夢見て

 きちんと製本された書籍を、あえてバラバラにするというのは勇気がいるものだ。文庫本や新書では、それほど抵抗がないが、ハードカバー本はちょっとためらってしまう。でも、読まないでいつまでも積んでおくよりは、バラバラにしてでも読んだ方がいいと割り切ることにした。

 こうまでして本を読むというのは、よほどの合理主義者か、本が好きな人だろう。本好きであれば、美しく装丁された本をバラバラにするなど許せないというかもしれない。ぼく自身もかなり抵抗はある。バラバラにしたことで、その本は、本ではなくなる。古書店に持ち込んでも売ることはできないだろう。ただ、本は、古書店と読書家の間を何度往復しても著者には1円の還元もないので、むしろその方がいいのかもしれない。

 自分のものとして自宅で読むという用途であれば、バラバラでも大丈夫だが、うっかり手を滑らせて床に散らばらせてしまったら、ページ順に揃えるのもたいへんだ。それが心配なら再製本するという手もある。フェデックスキンコーズならおおむね1冊315円と価格表にある。もちろん自分で簡易製本してもいいだろう。

 個人的には600円前後で買える文庫本や新書を105円かけて裁断するのはちょっとコスト的に合わないし、本のまま持ち歩いてもそう負担はない。電子化に要する30分の時間で1/4近くを読んでしまえるボリュームでは作業の意味もなさそうだ。でも、1,500円を超えるハードカバーならいいかなと思う。一度読んだら、おそらくもう読むことはないであろう文芸書は微妙だが、あとで調べ物に使ったりする可能性のある本は、その価値がかえって高まるだろう。学生であれば、講義ごとに持参しなければならない教科書を電子化するのもいいと思う。個人的には蔵書をすべて電子化するという気にはならないが、これから読む本については、ハードカバーを中心に積極的に電子化しようという気になった。

 ちなみに、今回裁断した文庫本は170g。追加で裁断したハードカバー本はすべて500gを超え、もっとも重いものは744gあった。10冊まとめれば5kg以上ある本をPDF化したが、ファイルの総容量はたった252MBだった。これはちょっとした感動だ。

 おそらくはDTPで制作されているであろう書籍をスキャンしながら、なんだか、ずいぶん虚しい作業をしているなと自分で思った。音楽では、CDのリッピングも書籍の電子化ほどには手間がかからない。それに、ヒットチャート上位10曲の半分近くは電子データとして購入できる。この比率はさらに伸びていくはずだ。書籍の世界も、せめて、今の音楽くらいのトレンドに追いついてほしいものだ。

□関連記事
【7月7日】【山田】点のモバイル、線のモバイル
http://pc.watch.impress.co.jp/docs/2006/0707/config113.htm
【5月5日】【山田】デファクトスタンダードとNEC VoToLの素晴らしき他力本願
http://pc.watch.impress.co.jp/docs/2006/0505/config104.htm
【3月15日】エプソン、高機能フォトストレージ「P-4500」(DC)
http://dc.watch.impress.co.jp/cda/accessories/2006/03/15/3433.html
【2月2日】PFU、ドキュメントスキャナ「ScanSnap」をモデルチェンジ
http://pc.watch.impress.co.jp/docs/2006/0202/pfu.htm

バックナンバー

(2006年7月14日)

[Reported by 山田祥平]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp ご質問に対して、個別にご回答はいたしません

Copyright (c) 2006 Impress Watch Corporation, an Impress Group company. All rights reserved.