ビジネスのあすを予測するデータ解析技術
数理情報学専攻 鹿島久嗣(ひさし)准教授

複雑なネットワーク構造を扱う解析技術を駆使
『学習数理情報学』研究のもう一人の担い手

 2009年8月に学究の世界(東大)に飛び込んできた彼に託された任務は、数理情報学専攻が打ち出した『学習数理情報学』の研究。そこに企業勤務10年の知識と経験を生かして切り込んでいる。鹿島准教授が攻めている研究は、人工知能の一分野である『機械学習』と呼ばれる研究分野。そのターゲットにデータからの有用な知識発見を目指すデータマイニングを据え、ビジネスの世界でも特に重要な『予測モデリング』の研究にフォーカスしている。ある商品を顧客が購入するかどうかの予測結果は、そのまま企業の売り上げに影響を及ぼし、予測精度が1%でも向上すれば大幅な利益アップやコスト削減などに結びつく。予測モデリングは新薬の開発などにおいても重要で、企業の競争力の向上にも寄与するだけに、学生たちにもデータ解析による予測技術の重要性を浸透させたいとシナリオを練っている。

データマイニングの可能性を広げる

 データ解析には、データの中で何が起きているかを把握するための「分析的」なモデリングもあるが、鹿島准教授が力を入れているのは、データに基づいて未来を予測する「予測的」なモデリングである。中でも、化学物質の形を表す化学式のように、点とそれらを結ぶ辺で結ばれたネットワーク構造に注目し、これを基にして未来を予測する方法論を構築することで、データマイニングの可能性を大きく広げようとしている。

 「化合物は原子が共有結合などによって結びついたもの、人間社会は人間同士がさまざまな関係によって結びついたもの。このように人、モノ、コトとそれらの間の関係によって形づくられるネットワーク構造を対象とした予測を実現したい」

さまざまな対象を表現できるネットワーク構造に着目し、データマイニングの可能性を広げる
さまざまな対象を表現できるネットワーク構造に着目し、
データマイニングの可能性を広げる

 たとえば、新薬を開発するためには、膨大な化合物の中から効能の高い候補を選び出し、その効能を実験で確認していく必要があるが、数千、数万にも上る候補の化合物についてその効能を1つひとつ実験し、数種類の候補を組み合わせて生まれる効能までも確かめるのは容易なことではない。そこで、コンピュータによって原子とそれらの間の結びつきを表すネットワーク構造を解析し、効能を事前に予測する。つまり、これまでのデータに基づき、未来のデータについての予測を行うのである。

 従来の機械学習アルゴリズムでは、このようなネットワーク構造を扱うことができず、扱えるのは、たとえば、ある人の特徴を表すのに身長、体重、性別などといった一定数の決まった項目が並んでいるようなスプレッドシート型のデータ形式に限られていた。 鹿島准教授は、この壁を打ち破り、データマイニングの適用範囲をこれまでは使えなかったところにまで拡大する研究を進めている。

現実の多様な制約や要請に挑むことで、よ
り多くの分野でデータマイニングを役立てる
現実の多様な制約や要請に挑むことで、
より多くの分野でデータマイニングを役立てる

 予測技術を使うときのポイントになるのは「対象をどのように表現するかに尽きます」。先ほどの例のように、人間だと身長、体重、性別で表現するか、ある店舗でこれまでに購入した商品で表現するか、あるいは、その人のもつDNAの配列で表現するかによって予測の結果はまったく異なってくる。どんなにすごいアルゴリズムを使ったところで、ある人が近い将来に病気になるかどうかを、その人の買い物の傾向から予測するというのはほとんど不可能であるのは明らかであろう。目的に応じて対象をどのように表現するかが予測の精度に最も効いてくるところで「実はそこがデータマイニングの最も重要で、同時に、最もむずかしいところです。ネットワーク構造に注目するというのは、これをできるだけ自動的に行えるようにするためのひとつのアプローチでもあります」。狙いは、洗練された数理工学の手法を取り入れ、なるべくカンや経験に頼らない汎用的な予測の方法論をつくり上げることにある。

予測モデリングは製品やサービスの付加価値向上の決め手

 「ロボットが動作をするとか、キレイな絵が出てくるとか、見た目にアピールする結果が出てくるわけではないのです。 “何かが起こる確率は何%”というような、地味なのですよね」。 しかし、地味ながらも、商品の購買パターンの予測結果などは、直接的に売り上げに結びつく、企業にとっては極めて貴重な情報になる。

 自社製品やサービスの競争力を強化したい企業にとって、いまやその関心はデータをどのように集めて蓄積するかといった段階から、集まったデータを解析して、いかに自社製品やサービスの付加価値アップに結びつけていくかという段階にシフトしてきている。検索サービスやオンラインショッピングなどでの成功事例をみてもわかるように、データ解析技術は、ビジネス上の差別化のカギとして認識され始めている。その一方で、データ解析技術を正しく使いこなすにはかなりの専門性を必要とする。鹿島准教授は、その隘路を払拭し、もっと多くの場面で先進的なデータ解析技術を活用できるようにしたいのだ。 「現状の機械学習アルゴリズムでは、まだまだ現実世界の多くの制約や要請を十分に捉えきれていませんし、ビジネスマンや一般の人々が気軽にその恩恵を受けることができるところまでにも至っていません」。 洗練された理論と厳しい現実の、両者の橋渡しを目指している。

 鹿島准教授は京都大学工学部数理工学科を卒業後、修士課程を修了した1999年に日本IBM東京基礎研究所に就職、その後10年間にわたって機械学習、データマイニングの研究とそのビジネス応用に携わった。「特定の顧客だけではなく、もっと多くの人にこの技術を使ってほしい、身につけてほしい」という思いもあり、大学への移籍を決意した。 学生には「データ解析技術を身につけておけば、今後いろいろな場面で本当に役に立つ。 世の中に貢献する仕事ができる」と力説する。5年後、10年後にまた産業界に戻ることは「あるかもしれません」ときっぱり。日本では、産業とアカデミアの人的交流が活発に行われているとは言い難い。この交流が進めば、大学が社会を知り、社会が大学の知によって新しい姿に代わるのを示すことが可能と強調する。「現実から目を離さないように常にウオッチしながら、学生と一緒にさまざまな問題と取り組んでいきたいですね」。産業とアカデミアの双方に目配りした教育を実践していく。

ISTyくん