GIGO
ーBig dataとやらのゴミの山をやり過ごすー

誰にとっても、1年は365日、一日は24時間。世界は平等にできている。ではどこで不平等が生じるか?もちろんそれは時間の使い方の上手下手による。時間を効率的に使えない人は、物事の優先順位がつけられない。忙しい人は大切なこととどうでもいいことの区別がつかない。だから自分は常に忙しいと勝手に自慢している。あるいは他人のために忙しくさせられていると勝手に被害的になっている。そう、「忙しい」というのは、あくまで自称である。自称「忙しい」=他人から見て「暇人」。この等式は、あなたのこれからの人生で、少なくとも三平方の定理よりずっと役に立つだろう。

ところが、あなたは忙しくない。忙しければ、こんなところは読んでいないはずだからね。私はそんな素敵な愛読者と、より効率的な仕事の仕方、すなわちゴミを分別するこつを、このホームページを通して共有したいと思っている。

我々とは違って、耳慣れないカタカナ言葉と聞くと何かそれだけで、「素晴らしいこと」と思考停止する人たちがいる。たとえば、「ビッグデータ」と聞くと、データがサウンドとノイズから成り立っているという、中世、いや、ギリシャ時代以前から人類が持っている知恵はもちろん、今までもっと小さなゴミの山の中に埋もれて息も絶え絶えになっていた自分の経験さえもすっかり忘れて(*1)、大層な名前のついた巨大なゴミの山の中に飛び込んで行く人たちがいる。 高尾山しか知らないのに、エベレストに登ろうとするのと同じ愚行である。

データが大きくなればなるほど、相手にするゴミの量も増えて、宝が見つけにくくなる。問題はそれだけに留まらない。世の中はデータだけでできているわけではないからだ。データとして表現できるものは現実世界のうちの1%にも届かない。「自分は常にデータに基づいて行動している」と信じられる人間がいたら、そいつは何らかの新興宗教家であるとしても絶対科学者じゃない。私が昨日データに基づいて行動したことがあるとしたら、帰りの電車の時刻表を確認したほんの数秒だけだ。今日は休日で通勤しないから、一秒たりともデータに基づいて行動しないだろう。

大切なものは目に見えない(*2)。この世は膨大なゴミの山と、その中に紛れている目に見えない宝ものだけで成り立っている。私の大切な時間、私の輝く才能はビッグデータのようなゴミの山の分析のためにあるのではない。ビッグデータjは、それが宝のだと信じられる、舌切り雀のおばあさん並の知能の持ち主のためにある。GIGO Garbage In Garbage Out それがビッグデータ研究の本質である。

*1 愚者は経験に学び、賢者は歴史に学ぶ (Otto von Bismarck)
*2 星の王子様

二条河原へ戻る