ビッグデータの時代である。私が生業とする生命科学の分野も例外ではない。全遺伝情報を解析するゲノム(genome)や、タンパク(protein)の発現をまるごと解析するプロテオーム(proteome)など、オーム(-ome)がうるさく幅を利かせるこのごろだ。
『オーム解析』は、私のように、古典的な生物学から研究をはじめ、手作業の分子生物学の時代にしか実験をしてこなかった者にとっては、いささか手強い相手である。生のデータを相手にするのではない。もちろん、元々は個々の生データなのであるが、それを一定のフレームで切り取 り、膨大な数のデータをコンピューターで解析する。
昔の研究は、いってみればここ掘れワンワンみたいなものであって、運と勘、あるいは、目利きといったものが必要であった。しかし、ビッグデータをあつかう網羅的解析は違う。宝があるかどうかわからないけれど、とりあえずドカッとブルドーザーで掘って、ある程度の大きさの篩(ふるい)にかけるような方法だ。小さな宝は相手にせず、篩で残ったある程度以上の宝だけをとりだして、さてさてと都合のいい方法で品定めするようなものである。
オーム解析、なんとか出されたデータを解釈することはできるけれど、データの解析自体、私にはまったく手に負えない。正直に告白いたしますと、生命科学研究におけるこのような解析、バイオインフォマティクス、のことはようわからんと研究してますねん。すんません。メカニズムのわからないブラックボックスをとおして綺麗に磨き上げられた宝物を見るようなものであるから、隔靴掻痒の感は否めない。
時代なので、そういったデータを出し、いや、若い人に出してもらい、論文にすることがあるし、もちろん他の研究室からのデータも見る。しかし、どうしても基本的なところを理解できていないので、完全に信じることができない。もともと疑い深いし…。それなら勉強しろよ、と言われそうではございますが、もう定年まで10年を切っておりますし、そこまでようせんわ、という状況なのでございます。すんません。
ここまでが、長い前置きである。何がいいたいかというと、自分が関わっている生命科学研究で感じているのと同じような印象を、ビッグデータ全般に対して持っているということなのだ。ひとことでいうと、常に、ちょっとした胡散臭さと騙された感を抱いているのである。私が勝手なせいかもしれないが、自分に都合のいい結果に対しては、さすがビッグデータ、と思えるのであるが、逆に、都合の悪い結果は、ちょっと怪しいんとちゃうかと思ってしまう。
ようやく、本の紹介。ウェアラブルセンサーで個人の活動を計測し、そのビッグデータをコンピューターで解析するという内容だ。そんなもんで何がわかるんや、と思われるかもしれない。が、まずは、体の動きを感知するセンサーをずっとつけ続けたデータ解析が紹介されているこの『編集者の自腹ワンコイン広告』を読んでもらいたい。計測したところで、もちろん一日二日ではばらつきが出る。が、一年も計測すると、その人固有のパターンが出てくるのである。
かなり規則正しい私などの場合はきれいなパターンがでるはずだ。5時半ころ動き出して、6時25分きっかりから10分間、けっこうな運動になるテレビ体操のお時間。12時と1時の間には、2~30分じっとしているお昼寝の時間。というように。
もちろん、各個人では異なっているが、多人数のデータ解析をすると、一定の法則が見えてくるというのだ。まぁ、さもありなんという気はする。が、執筆活動の限界を算定する数式があって、それで計算したら、1日の活動時間のうち約29%が原稿執筆に割ける時間の限界だ、と言われても。そんなもん、ほっといてくれよと言いたくなる。
だいたい、その数式が熱力学に由来しているというのが気に入らん。というか、なんでいきなり熱力学なんかというのがわからんやないか。天の邪鬼としては、よし、そんなこと熱力学がいうのやったら、35%ほど執筆してこましたろやんけ、と思うけど、根気がないからできはしない。やっぱり熱力学が正しいのかもしれん…。やっぱり、すんません。
ここまでは、まぁ そんなもんかという気がする。が、話はどんどんとディープになっていく。職場の生産性は、休憩時間における体の動きの多さ、すなわち動きが活発であるほど高い、 というのである。う~ん、ほんまかいな、と思うけど、ビッグデータ様に逆らうわけにはいかないので、納得したことにして次へ。
それも、ある人と会ってからの時間をTとすると、再会の確率が1/Tに比例して、すなわち、会わなかった時間に反比例して減っていく、という、アホみたいに単純な方程式なのだ。ウソちゃうんか、という気がするのであるが、メールに対して返信する時間も同じ方程式になるらしい。そういわれてみたら、しばらく返事をしなかったら、どんどんしづらくなって、ほったらかしになることがけっこうある。でも、それって確率で話ができるんかいな、という素朴な疑問がないではない。ここでは熱力学はでてこんでええんか、とか、わかってないくせに、意味なくつぶやいたくなったりもする。
こういったことから、人間の行動を定量化して人間の行動についての方程式を作ることができるのではないかと話は進んでいく。は?さすがにそんなもん無理やろ…。ところが、である。ある人とある人が会うことを調べることができるウェアラブルセンサーで調べた研究から、びっくりするほど単純な「方程式」が導かれてしまったという。
運を良くする方法や組織の作り方も、同じように、人と人が会うことを感知するセンサーで探ることができる。また、そのセンサーを客と店員につけてもらって解析したら、どこに店員を配置したら売り上げがよくなるかがわかって、その配置は経験ある店長にも予想できないものだった。そして、会話の質は身体運動、それも高度な身体性などでははなくて、単によく動くかどうかでわかる。
えらそに言うな!ビッグデータって そんなことまで知ってんのか。ほんでもって、人間の行動って、そんなに単純なんか。そやからビッグデータはいややねん。こういう予想外の事実を見つけて、正しいねんぞと、つきつけてきたりするから。ううむ、なんか腹立つ。誰か、ビッグデータなんか役に立たない、ということを示してくれる人がいたらうれしいなぁ。が、おそらくないだろうけれど、たとえあったとしても、それはビッグデータを駆使して得られる結果にちがいなから、やっぱり腹がたったままみたいな気がする。
この本、ビッグデータってすごいみたいやけど、ようわからんなぁと思っている人にオススメである。ビッグデータってやっぱりすごいがなと思うようになるに違いない。どっちやねん、あはは。そして、なんとなくもやもやした気分を高めて、ビッグデータなんかやっぱり好かんやんけという仲間になりましょう。
<画像提供:草思社>
膨大なデータを単純に解析した方が直感や経験より正しい。そうかもしれんけど、世の中それではおもろないやろ。でも、こういう本がおもろい、いうのが問題である。