これからのロボット――いわゆる次世代サービスロボットには、人間を助ける役回りが期待されている。しかしながら独立行政法人理化学研究所 理研BSI-トヨタ連携センター自律行動制御連携ユニット ユニットリーダーの下田真吾氏は「家庭内や災害現場などで活躍することが求められているロボットは、これまでの産業用ロボットや現在のヒューマノイド研究の延長線上には存在していない」と語る。「ヒントは脳にある」というのが下田氏らの研究のスタンスだ。研究中の身長およそ1mほどの歩行ロボットのデモを見ながら話を聞いた。
これまでのロボットは基本的には決められた環境内で決められた動作を繰り返し行なうことを前提として研究開発されてきた。新しい環境や未知の環境で動くためには、ロボットの学習が求められる。学習の一つのやり方が評価関数などを用いたいわゆる「教師あり学習」だ。設計者がロボットにさせたい動きを決め、それに対して評価を与えることでロボットに動作パターンを学習させていく。

|
独立行政法人理化学研究所 理研BSI-トヨタ連携センター自律行動制御連携ユニット ユニットリーダー 下田真吾氏
|
しかしこのやり方には問題がある。環境変化に適応することができないところだ。想定した環境以外では適切な動作を生み出すことができない。たとえば関節を動かすモーターが一個故障してもロボットは動けなくなる。ロボット自らが、それなりに動ける新しい動作パターンを生み出すことはない。生物のように臨機応変に「適当に」振る舞うことはない。ロボットが災害現場や家庭内で活躍するためには何が足りないのか。いっぽう動物は、未知の環境における臨機応変はむしろ得意だ。この差はどこにあるのだろうか。
動物は、脳によって制御されている。脳は未知の環境に巧みに適応し、未知を克服する能力を持っている。未知なのは周囲の環境だけではない。自分自身の身体状況も含む。たとえば4つ足の動物が、脚を1本くじいてしまったとする。だが残った3本を使ってなんとかして、さまざまな移動パターンを生み出すことができる。今のロボットにはこれは困難だ。下田氏は「環境情報や身体における『身体的な未知』を克服する能力こそが、『概念的な未知』を克服する能力に繋がっている」と考えている。「生物制御の源を見つけたい」という。
|
|
|
これまでのロボットの特徴
|
いまのロボットは環境変化に適応できない
|
生物制御の基礎は未知の克服
|
現在、生物制御における学習の具体的な課題として取り組んでいるのが、環境に適応した歩行の実現だ。動物の脳の制御を見直してみると、基本的にはループになっていると見なせる。センサーがたくさんついており、そこからの入力が神経細胞ネットワークである脳に入ってきて、神経細胞の活動として表現され、それが筋肉の出力となって環境に働きかけ、それが環境入力となって再び脳に入るというループを描いている。
そして、生物の制御は、脳活動のレベルに限定されていない。脳、臓器、細胞と、それぞれ異なるレベルで、時々刻々変化する環境に対応して制御が実行されている。細胞レベルの制御は個体行動レベルの制御とはまったく別次元だが、基本的には同じようなループと見なせる、と下田氏は見ている。なんらかのセンサーがついていて、それが内部のネットワークに変化を起こし、出力が環境をとおして再びフィードバックするという見方で見ると、細胞レベルでの制御と、脳レベルでの制御は同じであり、そこには何らかの共通する原理があるのではないか、という。
では、それはどんなものか。制御器の構造に着目すると、生物は等質な、同一の計算素子を使って処理を行っていると見なせるという。細胞レベルの計算素子はたんぱく質、神経ネットワークレベルではニューロンだ。たんぱく質の反応や、ニューロンの応答性そのものは決定論的で、そのネットワークが存在する。それが異なるレベルで階層化されていることが生物の計算システムの本質なのではないかという。下田氏らはこれを「複合制御(Compound Control)」と名づけている。今は理研BSIートヨタ連携センターのセンター長である木村英紀氏が中心となって行った生物制御システム研究チームの活動から生まれた概念である。このアーキテクチュアとアルゴリズムによって制御を実現することが目標だ。
計算ネットワークは活動が定義された計算素子からなり、脳、身体、環境を含む。ある初期状態から、入力と計算素子の自律的活動によりネットワークが変更され、出力する。適応的行動の獲得は計算素子の活動の結果、必然的に起こる。「学習」と「制御」に区別がないのが生物の制御/学習の特徴であり、動物の計算ネットワークは「常に制御し、かつ学習している」という。
|
|
|
脳制御の特徴
|
細胞内制御
|
複合制御(Compound Control)
|
だが、「活動が定義された素子」と「未知環境に適応する行動」との間には矛盾が生じるように思える。どのように結合するのか。そこに明確な回答なしに適応できる生物ネットワークの秘密、学習の基本があるという。
まず、各計算素子の自律的な活動により内部パラメータが変化することは、素子単位で局所的に学習していると見なせる。このとき、大域的な視点からの教師信号はない。すなわち全体としての目的やゴールは設定しない。
ただし、各素子の結合状態はランダムではなく、初期状態として基本的な構造は持っているものとする。たとえば、歩くときのバランス維持手法そのものは知らなくても、足の曲げ伸ばしについては事前に与えておく。すると、環境とロボット、身体との相互作用による初歩的な「反射」行動が備わったような状態、こうなったらこうなるということが起きる状態になる。ロボットは、この反射行動を通じて環境情報を取り込む。こうして、ロボット身体、環境、計算素子の間のネットワークが制御と学習を行なえるような状態になるという。
各計算素子の閾値と結合は、神経科学では基本的な「マカロ-ピッツ」型と「Hebb(ヘッブ)則」に基づいて変化する。「マカロ-ピッツ」型素子では、素子にそれぞれある閾値があって、入力がくると、それが閾値以上であれば1、以下であれば0の出力を出す。そして発火したら閾値が上がり、しなかったら下がる。これによって同じ入力では発火しなくなるし、逆もまた同様のことが言える。これによってネットワーク全体では各素子が発火しすぎたり、しなさすぎたりすることを防ぐようになっている。
ヘッブ則とはニューロン同士の結びつきの規則を表現したもので、結合しているニューロン同士が両方とも発火すると、その結びつきが強くなる。下田氏らは3つのニューロンを組みとして考え、3つとも発火したときに結合が強くなる、もしくは弱くなるというネットワークを考えた。この仕組みの特徴は、ネットワークのなかに容易にフィードバックループを作れることだ。
|
|
|
反射行動に基づいた環境情報の取り込みが学習に繋がる
|
マカローピッツ型のニューロン結合を想定
|
ヘッブ則に基づいて結合強度は変わる
|
このネットワークに上述のような反射的要素を与える。たとえばモーターがある角速度で動くと、その反対に動く力を出すといった系を考える。すると何もしなくても、だいたい真ん中あたりにリンクを持っていけるようになる。どのくらいの角度で収束するかは、ネットワークが勝手に判断する。
これを3自由度のマニピュレータに応用する。すると、最初は目標付近で揺れてしまうが、学習が進むに連れ、目標付近にきちんと持っていけるようになる。獲得軌道は、先端の重りの重量にもよって異なるが、だんだん適切な軌道に安定してくる。これは、人間が物体を持って腕を動かすときに、大抵の人が概ね同じパスを通る形で自分自身の腕を操るのに似ている、という。
次のステップとして、このやりかたを使って脚式ロボットの歩行を試みた。実際に歩行ロボットを作る前に、2つの予備実験を行なった。1つ目は2自由度のロボットを作り、上の関節を45度曲げるという動作を行なわせた。すると基部の関節が自然とバランスを取るように動くようになった。アーム先端にウェイトを置くと、それに応じてバランスの取り方も変わった。なおこのロボットにはモデルを与えていないし、ウエイトの重さはなんであってもかまわない。
もう1つの予備実験は、姿勢と姿勢を切り替える、すなわち目標を切り替えることによってリズムを自律的に生成させるもの。すると収束する速度が自律的に定まり、姿勢だけではなく切り替えるタイミングも学習するようになることが分かった。リズムの周波数も自律的に変化する。
|
|
ネットワーク構造
|
【動画】2自由度のアームを使った実験。基部関節には何も指令値を与えていないが自然に曲がる
|
|
|
ロボットのアームが「自然な動き」に
|
【動画】姿勢を切り替えさせるタイミングが自律的に決まる様子
|
これらの予備実験を踏まえて、ロボットの歩行実験を行なった。右足に体重を載せて左足を上げ、左足を前に出し、踏み込んでいったん姿勢を安定化したら、逆の足で同じ事をする。歩くことにおける基本的な姿勢は人間が与えて、バランス制御や歩行テンポはロボットに自律的に学習させる。目標値は与えない。つまりある程度動く術は知っているが、環境についての情報は完璧ではないという状況だ。この仕組みを使うと、ロボットは「自分にあった歩き方ができるようになる」という。自分にあった歩き方とは、身体制御と環境がうまく適応して、非常に効率よく歩けるようになったという意味だ。現在、およそ10分程度の学習後、布や人工芝の上を歩かせることに成功しているという。
基本姿勢や、姿勢の切り替えは大域的視点から与えなければならないが、それは今後の課題だという。モデルを作って安定性補償をやらないですむことが大きな利点だ。
計算素子のネットワークは各関節独立で動いており、現状では高次構造もないため、基本的には互いに関係していない。だが他の部分とはリンクで繋がれているため、ある関節が動くことが別の関節に対する入力となり、その情報を使って関節間の協調的な動作が自然と生まれ、互いにバランスを取って動くようになるのだという。
|
|
|
2脚ロボット。12自由度、重量3.2kg
|
【動画】歩行の様子
|
【動画】歩行の様子その2
|
|
|
|
背骨、腕、頭を持たせた全身型のロボット。自由度は34(脚7×2、腕6×2、腰背骨5、頭部3)
|
頭部にジャイロを搭載
|
脚部付け根のロール軸に対してはジャイロを効かせている
|
|
|
|
靴を脱がせたところ。つま先部分にはバネも
|
頭部にはカメラも積んでいる
|
制御コンピュータは外部に
|
|
|
|
【動画】全身を持たせたロボットの歩行
|
【動画】左足がなかなか前へ出ず、ひきずりながら歩く
|
【動画】学習させていると、だんだん歩行がうまくなってくるという
|
今後の目標は、複雑なタスクを混ぜ合わせたときにロボット自身がプログラムされることなく、抽象化された目標を自分で再設定して「なんとかできる」ようにすることだ。たとえば、人間は水の入ったコップを持って歩かせると、自然とそっと歩く。人間のロバスト性の高さは、制御だけで実現されているわけではない。もともときちんと目標値に対して制御するという面では人間は機械に及ばない。人間が仕事を巧みにこなせるのは、目標を再設定し、行動を変えて、できないことをできることに切り替えて、実行していくからだ。そのような行動を、1つ1つプログラムして目標値を関節に与えたりすることなく「創発」させることだという。
もちろん、モーターのトルクの制約や通信速度の限界はある。現状の機械は、不可能であっても命令されると実行して失敗するが、人間はできないことはしない。「将来的には、そういう判断までいけるといいですね」(下田氏)
できれば5年後くらいには「もうちょっと知能を感じさせる動き」を実現させたいという。これまでは運動を主なターゲットとしてきたが、今後は「複合制御」の枠組みのなかで、ビジョンにもトライしていくそうだ。これまでの画像処理システムとは違って、ごく簡単なループをとっていく方式で研究を進めていくことで、認識処理が必然的に眼球運動、そして姿勢のセンシングに繋げられるような仕組みを実現することが目標だ。
たとえば、線虫(C.elegans)という動物は959個(雌雄同体の場合)の細胞からなり、うち、神経細胞が302個を占める。そのそれぞれの繋がり方は分かっている。だが現在の科学・技術は、いまだ線虫と同じように動く機械を作るには至っていない。線虫レベルでも動物は環境に対して非常に巧みに、しなやかに適応して動く。それが不思議でしょうがない、という。
下田氏はもともと宇宙ロボットの研究をしていたが、通信に遅れが生じる宇宙空間でロボットが本当に活躍するためには、真の意味での知能が不可欠だ。その答えは、我々自身の脳のなかにある。それを解き明かし、宇宙で地球外生命を探索するロボットを開発することが目標だそうだ。
● 理研BSI-トヨタ連携センターの取り組み

|
理研BSI-トヨタ連携センター・センター長 木村英紀氏
|
今回の取材では、理化学研究所とトヨタ自動車による包括的な連携で生まれた「理研BSI-トヨタ連携センター(BTCC)」の取り組みについても簡単にだが伺うことができた。理研BSI-トヨタ連携センター・センター長の木村英紀氏によれば「脳科学と技術の統合によってイノベーションを作り出す」のが同センターの目標だ。脳科学には基礎研究としての側面だけではなく、今や応用が期待される時代になっているという。
研究領域は大別して3つ。1) ニューロドライビング、2) ニューロロボテイックス、3) 健康である。
ドライビングは乗り物内での高速移動であり操作である。その状況下での脳活動を調べるのが「ニューロドライビング」領域だ。
もう1つはロボットだが、ロボットが世の中に入っていったら何が起こるか、世の中に入れるためにはどうすればいいか。そのカギとなるテクノロジーが脳にあるのではないかという見方があるのだという。自動車の場合でも前世紀のはじめに自動車が売り出されたとき、現在抱えるさまざまな問題が起こるとはあまり考えられていなかった。ロボットも同じだという。それらの問題を解く鍵として脳科学が期待されているのだそうだ。
最後の「健康」領域は、乗れば乗るほど健康になる車を開発することが目的だ。健康とドライブの関係を調べ、運転におけるQOLを数値化する。
このような連携はいまだかつて日本になく、大変ユニークだという。企業が単に資金を出して寄付講座を作ったり、個別のテーマにおいて共同研究するパターンはよくあるが、さまざまなテーマを扱う「包括連携」という形をとっているからだ。BTCC内ではラボは全部で9つあるという。理研による脳科学と、トヨタにおける車やロボット関連のものづくり技術。両者が組み合わさることで面白い技術が誕生することを期待したい。
■URL
理研BSI-トヨタ連携センター
http://btcc.brain.riken.jp/
■ 関連記事
・ トヨタと理研、脳の構造を解明する共同研究施設を開設(2007/12/14)
・ 将棋で探る「直感」の秘密 ~理研と富士通、日本将棋連盟が脳の高次機能に関する共同研究プロジェクトを開始(2007/08/07)
・ 理研と東海ゴム、介護ロボットの実用化を目指す「人間共存ロボット連携センター」を開設(2007/08/03)
・ シンポジウム「理研における人間共生ロボティクス」レポート(2006/11/01)
( 森山和道 )
2008/06/06 13:57
- ページの先頭へ-
|