機械の“目”を付加した情報端末で生活を変革する
システム情報学専攻 小室 孝 講師

速さ、即時性で群を抜くビジョン技術をテコに
キーボードの代わりに指の動きで情報入力も

 『機械に目を』といったら、イメージしやすいのはロボットだろう。多くの研究者が人間の目のような高度な視覚機能の実現にしのぎを削っているが、小室講師の視点は違う。たとえば、家電や携帯機器など情報端末にビジョン技術を駆使して目(マシンビジョン)を付加し、その端末を日常生活で使うと、ライフスタイルがどう変わるかを見届けたいのだ。機械の目を搭載して現在の情報端末が抱える課題を解決し、もっと便利に使いやすくするのは当然だが、もっと大胆に社会や生活を変えていく新しいツールにするのが狙いである。独自のセンサー、コンピュータ、アルゴリズムを組み合わせてつくり込んだ機械の目を、どのような用途から実用化すると最大の効果を上げられるか、キラーアプリケーションの具体化にダッシュを駆けている。

キラーアプリケーションを示すとき

指の動きを認識して文字入力に利用
※画面をクリックしてムービーをご覧下さい

 サンプルをお見せしよう。携帯機器にカメラを取り付け、人間の指の動きを認識して文字入力に利用する研究の様子だ。携帯機器は小型化される一方で、情報を表示する画面は広がっている。情報を入力するためのキーボードは小さくなり、代わってタッチパネルで行うものも登場している。慣れの問題もあるだろうが、入力のし辛さが付きまとう。それを解決する手段として、小室講師は、空中で指を動かすだけで、その動きをカメラで読み取り、情報入力ができるアイデアを打ち出した。キーボードやタッチパネルだと、指で触ったことを自覚すると操作したことがわかるが、空中で行う指の動きと情報の入力がリンクしているのを何で知るのか。「たとえば、画面をピカッと光らせるとか、音を出すとか、別の感覚でフィードバックすればいいのです」

 指の動きをビデオフレームレートの毎秒30枚よりも数倍速い、1秒間に100枚~200枚の連続した画像(動画)で捉えると、情報入力が正しく行えたかどうかの判定がしやすくなるという。1枚の画像から指などの動きの情報を取り出そうとしても、正解にたどり着くのがむずかしいが、動画を連続的に追いかけることで動く指の状態を正しくトラッキングできるそうだ。

 産業界では、製品の組み立てや検査などに視覚情報(マシンビジョン)がすでに活躍しているが、今後は、リアルタイムの視覚情報処理がより一層要求される知能ロボットやクルマ、情報家電にも広がることが予想される。カメラと汎用プロセッサーで構成する従来のマシンビジョンでは、速さ、リアルタイム性、携帯性のいずれも制約があり、高度なシステム向けには十分な性能が得られない可能性がある。小室講師の目的は、大量の画像をキャッチする視覚センサー、情報量の多いセンサー情報を超高速で処理するプロセッサー、最適な機能を実現するアルゴリズム、そして、どういうアプリケーションから具体化するか、いわゆる4点セットで画像処理の新しい世界を拓こうとしているのである。その先駆けとなる機械の目をすでに提案している。解像度を高めたイメージセンサーと画像処理回路をワンチップ化したもので、ロボットの瞬時の制御や工作機械の位置決め、異物検査、監視・セキュリティなどFAを中心に広範な用途が期待される例を示した。

 重点研究の1つ、視覚センサーについて、小室講師は研究の視点を明確にしている。現在のイメージセンサーはカメラ用につくられていて、これをそのままマシンビジョンとして使おうとすると、必ずしもマッチングしない。機械の目にふさわしい性能に絞り、安価で小型化すると、応用は拡大する。これにより、実用化に当たって克服すべきコスト問題にも踏み込むことができる。研究者としてもコスト目線を養う考えだ。

手の形状を3次元で計測するシステム ボヤけた画像(上)も、復元処理を行えば、はっきり見えるようになる(下)
※画面をクリックして拡大画像をご覧下さい

 こんな例も紹介してくれた。「暗いところでモノをきれいに撮りたい―だれしも思いますよね。特に、動いているモノを」と言いながら、PC画面上に何が写っているのかわかりにくい映像を映し出した。その画像を操作してコントラストを上げたり、ノイズを除去したりして画像復元処理をすると、鮮明な画像に早変わり。同じような画像の集合体だから処理できるという説明を加えてくれた。ペットのネコをデジカメで撮りたいという発想から始まったこの研究は、夜間、ビルに侵入する不届き者の監視や、クルマのナンバープレートの判別などに発展しそうだ。

論文よりも実用化を視野に入れる研究者

 一方、1秒間に1000枚もの画像を撮影し、処理できるビジョンチップがある。石川・小室研究室オリジナルの高速画像処理技術の中核を成すものだ。1000点のドットパターンを投影できるプロジェクターを用意する。この上に手をかざし、手の動きに合わせて点の位置が動く様子をカメラで捉えることで、手の3次元計測も自在に行える。1つの物体の3次元形状を撮るのに、何枚も画像を撮らなければならないようだと時間がかかるし、スキャンしている間に対象物が動いてゆがんでしまうことがあるが、動いているものを画像を歪まずに処理できるのは、ビジョンチップの大きな効果である。このような画像について、産業界の評価は高い。

 「東大工学部計数工学科の計測コースを卒業後、大学に残らず、企業に就職してみなさんが手に取るような製品をつくりたいと思っていました。でも、企業でなくても、大学でもモノづくりはできると諭されて学究生活に入った」と言う小室講師、自ら開発した製品をみんなに使ってもらいたいという夢を持ち続けている。新原理に基づくFA用、情報端末用のビジョン技術をまとめ上げ、大学の強みを生かして産業・社会を変えるシステムとして提供したいのだ。

 「私のアイデアによる機械の目を搭載した情報端末が登場したら、たぶん、売り場まで出向くと思いますね。だって、いままでになかった携帯機器を手に取って、どうやって楽しもうか、使いこなそうかと目を輝かせている若者たちを想像するだけでもワクワクします」。そのカギを握るのは、アプリケーションだろう。長年にわたって書き連ねたセンサー研究の膨大な日記の中に、そのヒントがある…。

ISTyくん