品質管理を『統計的モデル』で追究
数理情報学専攻 清 智也 助教

バラツキの要因を勾配写像の手法で探る
従来法をしのぐ高い正確性に大きな期待

 システム全体の製造コスト、性能などとも絡む部品の品質管理―。清助教は、材料や生産現場での製造条件などによって生じる部品の品質のバラツキを、勾配写像という統計学的モデルで捉えようとしている。バラツキの要因のもとになっているのは何かを、新たな発想によって多くのデータの中から探し出そうとしているのだ。「たとえば、部品の寸法、温度、機械の加工速さといった3つの変量をもとに、これらがどのように関係してバラツキに結びついているかを、勾配写像に書き直すことによってつかめるようにすることです」。変量を増やすことができれば、バラツキをつかむ精度が高まり、応用は一段と広がる。そのバリアは高いが、これまでにない手法だけに、数年内にはモデルを確立したいと意欲を示す。

多変量正規分布との整合性を図る

第3の変量によって残り2つの変量のバラツキが変わる例
図1:第3の変量によって残り2つの変量のバラツキが変わる例
※画面をクリックして拡大画像をご覧下さい

 勾配写像というのは、変数変換の一種。たとえば、目盛りが1、2、3…と刻まれた方眼紙に測定した値を点としてプロットし、それを線で結ぶと右肩上がりの曲線になったとしよう。その測定点を今度は1、10、100…の両対数グラフにプロットすると、45度の直線になったりする。これが変数変換の特殊な例で、変数変換を使うとデータの特徴を表現しやすくなる。清助教は品質管理のバラツキをつかむのに勾配写像に目をつけた。

 バラツキを見るのに、これまでは正規分布という手法が使われてきた。子どもたちの身長を棒グラフで表すと、その人数分の年齢別の子どもたちの身長の傾向を見ることができる。身長という1つの変量なら、正規分布で傾向を捉えられるが、ここに体重という要素が加わると、身長と体重の2つの要素を加味して判断しなければならない。2つ以上の変量を扱うことから多変量正規分布と呼ばれ、数値(相関)に直して解くことによって、身長と体重による子どもたちの傾向を把握できるので、有力な手法として活用されている。ただし、変量が3つ以上に多くなるほど不十分な情報になりがち。そこで、勾配写像を使うと、多変量正規分布よりも正確性の高い勾配モデルが得られるという。勾配モデルは正規分布による確率モデルを凸関数の勾配写像で書き直すことでつくられる統計的モデルで、勾配写像を変えることにより多様なモデルが得られる利点がある。

 この勾配写像の手法を部品の品質のバラツキに当てはめると、バラツキの方向を矢印で示す凸関数の勾配写像に書き直すことでその方向性がわかるのだ。部品の長さ、製造時の温度、加工の速さがどのように影響しあっているかをみるとき、たとえば、温度が10℃か20℃かに応じて、長さや加工速さの縮尺を変えてみたりする。このデータを読むことによって、複数の変量の影響によるバラツキがどのようにして発生しているかがわかってくる。ここが清助教の研究視点である。

第3の変量によって残り2つの変量のバラツキが変わる例
図2:勾配写像による変数変換の例
※画面をクリックして拡大画像をご覧下さい

 では、部品の長さと温度が比例関係にあり、加工の速さを変えていくと、バラツキにどのような影響が生じるかなどはわかるのだろうか。「答えはイエス。第3の変量によって、残り2つの比例関係が変わったりすることもつかめます。これは多変量正規分布では表現できない、勾配写像のよさですね」。こうした結果が正しいかどうかについては、統計の手法を使って検証することが可能です」。しかし、実際の部品の品質管理に当たっては、3つだけではない、もっと多くの変量がある。また、どのくらい複雑な条件まで扱えるようにできたらいいのかも課題だろう。これについて清助教は、オーバーフィッティングの問題と言う。入試問題と同様に、過去の問題ばかりを解いていると、未来の問題が解けない場合がある。いま得られているデータで完全に説明できても、新しく測定したときにピタリと当てはまるかどうかは不透明。だから、あまり複雑にしすぎてもいけないと言うのだ。現在、主力となっている多変量正規分布は強力な手法であるため、これとかけ離れていては逆に使ってもらえない可能性が出てくるので、整合性があり、かつ使いやすい―ここに当面の目標を置いている。

モンジュの最適輸送問題がきっかけ

 高専で電子制御工学を専攻しながら、東大では計数工学(数理)を選び、2005年4月に助教に就く前の大学院博士課程では、確率微分方程式にもとづく統計モデルの研究を展開した。そこで興味を持ったのが変数変換で、勾配写像研究に引き込まれたのは、モンジュの最適輸送問題に触れてからだ。「盛り上げられた砂山の砂を、別の場所に移動せよ。トラックで運ぶにせよ、列車で運ぶにせよ、輸送コストを最小にする輸送方法を求めよ」―それほどむずかしくなさそうにみえるが、フランス人のモンジュによってこの課題が提起されたのは18世紀後半。これが数学的に完全に解かれたのは、何と200年余も経った2000年になってからで、それを解く手法として用いられたのが勾配写像だった。清助教と勾配写像を結びつけたのは、モンジュの最適輸送問題だったのである。

 清助教は現在、文部科学省科研費の若手研究の一環として勾配写像を利用した研究を推進している。先の部品品質のバラツキに関わる3つの変量が1時間ごとに変化したデータを1年間、観測したら、どのような解析データが得られるか―といった問題にチャレンジしている。その狙いは、時間ごとに変化するデータを操る方法はいろいろあるが、これまでの手法では捉えきれなかった現象を勾配写像でつかむことができるかもしれない、その可能性を見いだすことに賭けているのだ。『数学って、おもしろいですか』。「おもしろいですよ。わからなかったこと、ぼやっとしていることがはっきりできるのですから」

 清助教のホームページを開くと、勾配カレンダーが掲載されている。ひらがな、カタカナ、英文字などでつくられた図形や文字が1日の中に1個ずつ表現されていて、勾配写像のおもしろさを物語っている。


数理第四研究室

ISTyくん