タグ:原理 ( 1 ) タグの人気記事

機械が学習するってどういうこと

少し前の記事を見つけた。ITMedia毎日見てるのにこれ、見落としてたなあ。
ITmedia ライフスタイル:「QRIO」、“勉強”に目覚める? (1/3)

ソニーの「QRIO」は、軽いボディと自由度の多さでスゴいダンスを踊っちゃったりしてとてもよくできた「人型ラジコン」だ。

あらかじめプログラムされた動きをなぞるだけだから、ロボットというにはちょっと自律性が足りなかった。今までは。(もちろん体の振動を足の微妙な力加減で吸収したりとかっていう細かい自律動作だけでも結構な技術なんだけど)

この記事ではQRIOに動作を学習させて、「ベルを見つけたら叩いて鳴らす」という行動をとらせている。学習、と簡単に書かれているけど、この学習ていうのがとにかく難しい。そこでなぜかtockri的「学習とは」。

最初に目の前に置いたベルを叩かせて音が鳴った(「面白い」という報酬が与えられる)、というとき、普通の人間であれば、即座に
「ベルが鳴った」
と類推するけれど、QRIOはまだ
「右腕を上下に動かすとどこからか音がした」
としか認識していない。QRIOの中にはまだ目の前にある赤い物体と報酬の間にあまり関連がない。

乳児をよく観察すると、これと似た状態にあることがわかる(らしい。僕子供いないし)。ガラガラを持って手を振ると音が鳴って面白いから喜び、握力がないからガラガラを離しちゃうけど手を振り続ける。

QRIOの前のベルの場所を左右に移動して、それを叩く動作を強制的にさせる。するとだんだん、手を上下に動かす位置と目で見たベルの位置が同じであるときに報酬が得られるというルールがQRIOの中にできあがっていく。

「ルールができあがっていく」なんていうと、なんだか自分で生物的にプログラムを発生させてるように見えてしまって、なんだかこのQRIOが研究所を逃げ出して野良になったらとんでもないイタズラ小僧が出来上がっちゃうんじゃないかなーんて心配になるけれど、実はやってることはもっと数学的というか力技。

機械学習について、かなりウソを含んだ説明をしてみよう。ここに3つの重量センサーと3つの可動針と1ひきの猫からなる機械があったとする。この機械に最初から与えられたルールは、
  • 針を動かした直後に大きな音がして重量センサーの値が0になると報酬を受け取る
  • 針を動かしてもそうならない場合は減点される
というとても簡単なもの。
c0041583_11335949.gifまず最初に3x3=9個の変数を用意しておく。つまり可能な認識と可能な行動の組み合わせを全て網羅しておく。次にどの針を動かすかは、この表の値に従う。

で、センサーBに猫を載せる。
表の数値はみんな同じなので、機械は適当に針を動かして、たまたま猫にヒットする。猫は「ギャー」と鳴いてとびあがり、機械は報酬を得られる。

c0041583_11344779.gifこのとき9個の変数のうち、猫が載っていたセンサーBにあたる3つと、動かした針にあたる3つに加点する。
次の行動をとるときは、この変数の値が大きいところの針を動かす確率を高くする。そして報酬が得られないときは減点したりして、これを何度も繰り返していくと、結局

c0041583_11352663.gifこんな感じになって、重量を感じているセンサーのところの針ばかり動かすようになる。

これが、「機械がセンサーの位置と針を動かす位置の関連を学習した」ということ。ここまでくると生物的なにおいはしなくなる。まだまだロボットが人間に反抗したりとか独立したりとかっていうSF的な世界はずーっと遠くにあるからご安心を。

で、ロボット屋さんの偉いのは、ここから類推してもらうしかないわけだけども、要はQRIOがカメラ画像で認識できる情報ってものすごく多くて、できる行動のパターンも無数にあって、この例みたく掛け算の表にするなんて無理なのに、あっちをゴマカしこっちをゴマカしてここまで持ってきたってこと。


ちなみにロボットの学習についてはもっととんがったコトしてる人がいる。
なんと見よう見まねでエアホッケーが出来るようになったという、役に立つんだか立たないんだかどうなの!的な(いや、将来すごく役に立つ予定なんだけど)研究。
[PR]
by tockri | 2005-05-11 11:27 | ├ コンピュータ
 
移転しました。
by tockri
S M T W T F S
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30
最新のトラックバック
[media][gove..
from bewaad institu..
甘やかされた男たち
from とっくりばー
~が下手
from たのしい検索・ゆかいな検索
例えバトン
from ひまわりてんびんへの道
例えバトン
from 明日は明日のホラを吹く-To..
リンク
ライセンス

クリエイティブ・コモンズ・ライセンス

このブログのテキストおよび画像は、クリエイティブ・コモンズ・ライセンスの下でライセンスされています。




検索
ファン
ブログジャンル
画像一覧