山田祥平のRe:config.sys

「見ること」と「在ること」



 まず、最初に、このシリーズを読んでくださっている方々に、あやまらなければならないことがある。というのも、ぼくが、前回、ひとつの実験をしてしまったからだ。

 前回のサブタイトルには、Googleにおける検索キーワード上位の女性タレントの名前を含めた。そのことが、いったい、どのくらいページビューに影響を与えるのか知りたかったのだ。犯行はぼくの独断によるものであって、編集部によるものではない。また、当然のことではあるが悪意もなかった。

 そして、結果として、前回の倍以上のビュー数を得た。この数字は、もちろん、このコラム本来の実力ではない。読者の方からはご叱責のメールもいただいた。こうした行為は、本当に読みたい記事を探すためのノイズとなってしまう。決してほめられたことではないのだ。

 普段を大幅に上回るページビュー数は、検索ページでの検索結果リストから参照されたものだろう。おそらくは、普段なら、絶対に、このコラムを読むことなどないであろう人たちが、ページを開いたにちがいない。そして、タイトルから期待した内容とは、ほど遠い文章にがっかりしてしまっただろう。しかも、連載初回に宣言したように、このサイトには似つかわしくない役に立たない情報なのだから目も当てられない。

 もっとも、ページビュー数は、ページを開いたビューの数であり、そこに書かれている内容を、しっかりと読んだことを保証するものではない。ビュー数と同時に滞在時間もわかるような仕掛けがあれば、もっと興味深い数値が得られるのにとも思う。

 いずれにしても、人騒がせな行為であることにはまちがいない。この場をお借りしてお詫び申し上げたい。

●写真の素性

 デジタルデータは、それそのものが持っている情報以上のものを伝えてしまうことがある。今回のビュー数の増加は、それを数値化して証明したものともいえる。たとえば、このシリーズが単行本として書店に並んでいて、その第6章に同じサブタイトルがついていたとしても、くだんの女性タレントにしか興味がない人は、その存在にすら気がつくことはあるまい。

 文字という、比較的軽い情報であり、検索ロボットというサーチエンジンが有効に機能した結果、さまざまな意図を超えた情報が伝わってしまう。掲載の翌朝には、いろいろな検索ページで検索結果に含まれてしまうのだ。これは、印刷された出版物では考えられない現象だ。

 このことを図像で考えてみるとどうなるだろう。

 前回書いたように、写真は何も語らない。ロラン・バルトがいうようにコードなきメッセージが写真であるからだ。ところが、デジタル画像には、簡単にメッセージを持たせることができる。

 冒頭の画像にリンクされているファイルの実体は、前回「デジタルカメラで撮影した画像なら」というサンプルとして用意したものに、多少の手を加えたものだ。圧縮率が異なるので、厳密には違うかもしれないが、ブラウザで見る限りは、ほとんど同じものとして目に見えるはずだ。

 ただ、この画像には、IPTC準拠のメタデータを埋め込んである。IPTCは、International Press Telecommunications Councilの頭文字をとったもので、文字通り、報道におけるテレコミュニケーション推進の団体だ。

 このメタデータは、コダックが提供するPhotodeskというアプリケーションを使い、Job Tracker infoという機能を使って埋め込んだものだが、Photoshopなどのアプリケーションで開くと、ファイル情報として、いろいろなデータを確認することができるはずだ。

 USA、CaliforniaのYosemite National Parkといった場所の情報に加え、作成者、すなわち、ぼく自身のコピーライト情報も入っている。ちなみに、撮影に使ったコダックの14nというデジタルカメラは、カメラ自体にこのメタデータを保存しておき、シャッターを切るたびに、撮影画像に、そのデータを埋め込む機能がある。

 元来は、送稿するデジタル図像に対して、様々な情報を埋め込むために考えられたものだが、この仕組みを使えば「何も語らない」はずの画像データを思い切り饒舌なものにすることができる。

●画像に埋め込まれたキーワード

 ぼくらは、デジタルデータを閲覧する場合、必ずなんらかのアプリケーションソフトを使う。この画像の場合は、JPEGファイルなので、きわめて多くの種類のアプリケーションで表示ができるはずだ。また、Windowsでは、プロパティを表示させることで、画像の素性を、多少は知ることができる。撮影日、シャッター速度、絞り、ISOスピードレートなど、EXIFのメタデータに含まれる情報がそうだ。

 今回のファイルには、さらに、タイトルとキーワードとして、“figure4pcwatchreconfigsys6”という文字列を埋め込んである。かなり長い文字列なので、インターネット的にも一意なものであり続けると思う。

 実は、このファイルは、検証のために、この原稿が掲載される5日前から、同じ位置に置いてあるのだが、執筆時点で、このキーワードを発見した検索ロボットはいないようだ。だから、現時点では、"figure4pcwatchreconfigsys6"という検索ワードで、この写真が指し示されることはないし、まして、Yosemite National Parkというワードでも見つからない。でも、近い将来は、検索ロボットが、探し出した画像ひとつひとつに含まれるメタデータを拾い上げることになるだろう。

 実際、Googleの検索結果にはPDFが含まれるし、検索オプションでは、Postscript、Microsoft Word、Microsoft Excel、Microsoft PowerPoint、Rich Text Formatを指定し、そこに含まれる文字列をキーにファイルを探し出すこともできる。

 さらに、Googleのイメージ検索では、隣接するテキスト、画像のキャプションなどをたよりに判定し、それをインデックス化しているようだ。その判定要素として、これらのメタデータが含まれるようになれば、インターネットを使って参照できる膨大な数の画像から、目的のものを探し出すことができるようになるにちがいない。

●アプリケーションは他者のまなざし

 ここで大事なことは、データを人間の目に見えるようにするために使うアプリケーションが、そのデータに含まれる情報を、すべて見せてくれるとは限らないということだ。

 多くの場合、アプリケーションは、他人が作ったものを使う。自分でアプリケーションを作るにしても、それを実行形式に変えるコンパイラは、他人の手になるものだ。つまり、ぼくらがデジタルデータを見るときには、必ず、他人のまなざしを通していることになる。しかも、このことは、データを作る場合にもいえることなのだ。

 たとえば、Wordで文書を書き、それに名前をつけて保存した場合、自分で入力した以外の情報が保存されていることに気がつく。単純なものではファイルの作成日付だが、インストール時に設定した作成者名や会社名なども含まれる。さらに、更新日時やアクセス日、印刷日時、改訂番号、最終保存者名、編集時間といった情報が既定値として埋め込まれる。これらは、ファイルメニューからプロパティを開くだけでわかることなので、徹夜して作ったといって資料のファイルを上司に渡すときには、編集時間が5分になっていないことを念入りに確認しておかなければならない。

 「見えるもの」と「在るもの」の間には、大きな隔たりがある。写真はたとえ撮影者が撮影時に意図したにせよ、しなかったにせよ、最終的に印画紙に焼き付けられて「見えるもの」がそのすべてであり「在るもの」に相当するが、デジタルデータは、どうもそうではなさそうだ。


□IPTCのホームページ
http://www.iptc.org/pages/index.php

バックナンバー

(2004年7月2日)

[Reported by 山田祥平]

【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp 個別にご回答することはいたしかねます。

Copyright (c) 2004 Impress Corporation All rights reserved.