この記事では、情報の視覚化を行うプログラムの紹介と、その開発に関する感想を記します。が、どうも個人的な内容になってしまいました。しかも、挫折感に満ちております。あらかじめご了承ください。

 以下に示す一連の図版は、2005年7月に制作した「習作」プログラムの記録画像です。このプログラムは、日本語のテキストを入力すると、テキストに含まれる個々の文字の並び方を解析し、その結果をリアルタイムに三次元空間内に描画します。開発にはC++/OpenGLを用いました。

 日本語は、漢字仮名交じり文という特殊な表記体型を持ち、漢字の字種は、数万字を超えています。それにもかかわらず、頻繁に使用される漢字は三〇〇〇字程度で、一般的な文章に出現する漢字の九九%以上をカバーできるという調査結果もあるようです[注]。

注 ぜひ、千都フォント|連載三「ゴマンとある漢字」をご覧ください。漢字の使用頻度と書体設計について、分かりやすく、興味深く書かれています。

 その使用度数の分布を見てみると、ひところ頻繁に耳にした「ロングテール」曲線を描いています。であれば、単純に字種間の関係性を解析するだけで、そこにある種の特徴が垣間見えるのではないか、などということを考えたわけです。

 映像を掲載できるとよいのですが、残念ながら、開発を行っていたパソコンのハードディスクが飛んでしまい、実行ファイル、ソースもろとも失ってしまいました。以下の画像は、かろうじて残ったもので、夏目漱石の「夢十夜」を入力した時の描画の過程を断続的にキャプチャしたものです。

図 2005年に開発した情報の視覚化を行う習作プログラムの一連の描画。テキストデータを与えると、テキストに含まれる個々の文字の並び方が解析され、その結果がリアルタイムに三次元空間内に描かれる。

 テキスト解析・描画のロジック

 ごく大まかな説明をすると、このプログラムは以下のロジックにしたがってテキスト解析・描画処理を行っています。

 個々の文字は、次の二つの属性を持っており、読み込まれたテキスト内容に応じて属性の更新が行われます。個々の文字は、更新された属性に基づいた力を加えられた状態で三次元空間内に描画されます。

 ① その文字の登場頻度……登場頻度の高い文字は、三次元空間の外側に飛び出そうとします。

 ② 前後に登場した文字とその登場頻度……前後に登場した文字は線(辺)で接続され、互いに引き合います。前後に登場した回数が高いほど、両者を引きつける力は大きくなります。

 さらに、すべての文字は、生得的に前後に並んだ文字との角度を六十度に維持しようとする力を与えられています。この性質を与えることにより、個々の文字は、前後の文字との関係性を維持しながら、空間いっぱいに広がろうとします。ただし、登場頻度の低い文字は、徐々に三次元空間内の中心に吸い込まれていき、ある一定以上中心に近づくと消去されます。

 このロジックにしたがって、解析/描画を続けると、「は」・「が」・「へ」などの助詞に用いられるひらがなが、多数の文字と接続され、かつ中心から離れたところに位置するという結果が得られます。最終的に、この球体はより露骨に文字の登場頻度を反映したかたちに変化します。

 とまれ、ご覧の通り、その描画内容は、かたちとしてはおもしろいものかもしれないけれど、非常に分かりにくいものです。さらに工夫を重ねれば、満足のいく結果が得られる可能性はありますが、私の開発能力からいって、そのためには膨大な開発/学習コストが必要となるのが目に見えており、ここで手を引きました。

 魅惑の情報の視覚化

 すでにお気づきの方もあるかと思いますが、このソフトウェアにはお手本があります。冒頭で、「習作」とわざわざ括弧書きしたのはそのためです。

 それは、Processingの開発・提供者として著名なベン・フライ(Ben Fry)がMITメディアラボの修士時代に開発をはじめたヴァレンス(Valence)というソフトウェアです。彼自身が『情報デザイン—分かりやすさの設計』(情報デザインアソシエイツ〔編〕、グラフィック社、2002年2月25日)で述べている説明によれば、このソフトウェアは、膨大なデータの構造と要素間の関係を「有機的な情報視覚化の特徴を用いて」効果的に表現しようとしたものです。『情報デザイン』に掲載されたヴァレンスは、シェイクスピアの作品に登場する単語を逐次的に処理しながら、単語間の関係性を視覚化するというものでした。

 そもそも、この手のインフォメーショングラフィックスが好きな私にとって、ベン・フライが提示した「有機的な情報デザイン」(Organic Information Design)は、かなり魅力的なものであり〈やってみたい、見てみたい〉という気持ちを引きおこすのに充分でした。先ほど掲げた図版も、こうして眺めるだけであれば、決して嫌いではありません。

 情報の視覚化は、世界理解の方法としてはきわめて有効なものですが、すでに起こっている現象をかたちを変えて再現したものである、という限界を超えることはできないように思います。視覚化自体が目的ならば何ら問題はありませんが、それが有益なものとなるためには、視覚化の過程とその結果によってもたらされる一連の情報が、さらなる疑問、好奇心、着眼、行動を導かなければなりません(当たり前すぎることかもしれません)。自分にとって、この習作の最大の問題点は、この段階で得られた結果が、次の一手を導くものではない、という点にありました。