言語を理解して行動する知能を備えたロボットを
知能機械情報学専攻 高野 渉 講師

人間から学んだ運動機能を言語に翻訳し解釈
2つの独創的なモデルを統合し、実現の道探る

 子どもが大人の動作を見て学び、自分の運動機能として高めて成長していくように、ロボットが人間の身振り手振りを覚えて知能を蓄え、「あのお年寄りはいま、階段を上がろうとしているが、少々よろけているので、手を取って助けてあげよう」というように行動できると、ロボットは人間の良きパートナーに近づく。高野講師は、ロボットが人の動きを見習って運動する機能を持たせることに成功しているが、さらに上位のインタラクションの手段として、言語(日本語)を付け加えようとしている。これはロボットが運動を言語として翻訳し、解釈できるようにする独創的な試みで、言語推論を通じて行動する知能ロボットへの第一歩となるものだ。「ゴールはまだまだ先ですが」と言いながら、目線は夢の扉をどう開こうかという一点に絞られている。

知の本質である推論をいかに読み解くか

 高野講師は、人の身振り手振りの見まね学習によって、ロボットに歩く、キックする、パンチするといった身体運動パターンを与えてきた。運動パターンデータを統計モデルによって学習したものを運動の記号(シンボル)と呼び、この記号をロボットが蓄積することによって、多様な運動を記号として認識すること、および自身の運動を生成することができる。しかし、人がジョギング後に休憩している様子をロボットが観察し、「ジョギング」や「休憩」の記号から「のどの渇き」「飲む」などのさまざまな連想を広げることによって、ロボット自身で飲み物を提供することや飲料販売店を教えるような動きを取るまでには至っていない。実際には、ロボットにコマンドを送り、そのコマンドに相当する記号から、ロボットが飲み物を差し出す運動をつくっている。高野講師の次の目標は、ロボットが状況を理解し、言語の連想・推論処理をすることで、そうした動きをロボット自ら決められるようにすることだ。運動のバリエーションを増やし、関節などをスムーズに動かす機能を充実させるのはもちろんだが、「次の行動を自分で考えられるようになったら、画期的ですよね」

 「身振り手振りでコミュニケーションの7割くらいが伝えられるという話もありますが、最も重要な手段はやはり言語。これがあるからこそ、人間は自分の考え、思いを効率的に伝えることができます。人間の知能の本質のひとつでしょう」。ロボットが言語を操れるようにしたいという思いは、高野講師が運動の記号化研究を始める前から持っていたが、運動パターンを記号としてロボットに蓄積するというパラダイムが言語のパラダイムと次第に接近し、両方を組み合わせることでロボットの知能化を推し進める環境が整ってきたのだ。

※画面をクリックして拡大画像をご覧下さい
超ディペンダブルプロセッサ・テストベッド
図1:運動記号と単語間の連想を表現するモデルと、単語の並びを表現するモデルを融合することによって、運動を言語として解釈すること、および言語から運動を連想する情報処理の概略図
超ディペンダブルプロセッサ
図2:図1のモデルを使った実験結果

 なかでも「最もむずかしいのは、実環境のデータと言語がどのように結びついているのかを整理し、つかむことです」。その結びつきがわかったとしても、人の言語の推論がいったいどのようになされているのかを知るという難題も控えている。イスを例にしよう。「これは座れる」、「単独に置かれるよりも、机とセットとして使われるケースが多い」、「この上に乗ったら、高いところにあるモノを取れる」―こういう推論がどのようにして生まれてくるかを知りたいのだ。「子どもたちが走っている、ボールを蹴っている」と理解するところまでは、ロボットでも何とかできつつある。しかしこれは、「ロボットがサッカーをしている子どもたちの動きを見て実況中継しているようなものなんですね」。その奥にある推論という機構を計算論的に実現できるか、これが自ら行動するロボットへの大きなヤマとみている。

 それを解く道筋がまったくないわけではない。自ら考案しているモデルを駆使することだ。まず、これまで蓄積した運動の記号から単語を連想するモデルがある。「歩く」という記号から、「歩く」という動詞のほかに、「歩行者」、「人」、「道」といった関連する単語を導き出し、その単語を並び替えて文章をつくる。並び替えるときに自然言語研究で使われる形態素解析のモデルを利用する。単語に区切り、名詞、動詞、形容詞などに分けて一連の行動を文章として表現すると、それがどのくらい文法的に正しいかも評価できる。この2つのモデル(自然言語モデルと単語の連想から導き出す運動言語モデル)の統合によって突破することを考えているのだ。「このモデル統合研究は始めたばかりで、運動の記号が10種類、単語も数10個レベル。これを増やしていけば、運動+言語を持つロボットは、夢から現実へと変わるでしょう」と自信に揺るぎはない。

トライアル&エラーで具体化へ突破口

 具体的な応用例としてはどのようなものが考えられるのだろうか。家庭用、産業用を問わず、広範なロボットとして利用できる広がりが期待できる。たとえば、PCを扱うのが苦手で、キーボード検索などとても無理というお年寄りが「あれがほしい」と身振り手振り言葉を交えてロボットに示すと、ロボットは「ケータイを取ってほしいのだな」とそのリクエストを直感的に理解し、取って差し出すといった情報支援の絵が描ける。

 このほか、自動車運転支援にも利用できる。普通にクルマを運転しているドライバーの運転行動を観察したデータをロボットが持っていて、道路をまっすぐ運転しているはずなのに多少方向を外れると、「あれっ、ちょっとおかしいですよ」と注意を喚起したり、アクセルの量、ハンドルの角度を修正するサインを出したりして安全運転へ支援をするのだ。

 高野講師は、京都大学機械系の出身。修士は精密工学に進み、非線形振動の研究にタッチした。卒業後、企業に就職し、自動車運転支援の研究を行う過程で機械の知能化に興味を持つ。特にロボットの知能化研究を深めたいという希望から、情報理工の知能機械情報学専攻に転じ、中村仁彦教授のもとでドクターを取得した。「学生を指導するのも、試行錯誤の連続です」と笑うが、知能ロボットへの研究も、トライアル&エラーで攻めていく。企業での経験が産業・社会に役に立つ成果を提供したいという熱意に結びついている。

ISTyくん