人間を作る - 人間のあるべき姿の探索

はじめに

人間を作るために必要な要素を技術的な観点から考察する．勿論研究者や技術者として活動されている方や世に出ていなくとも手を動かしている方は沢山いて，その人達の知見の方が基本的には有用だと思う．なので，深く考えず読み物程度に読んでもらえると助かる．また，執筆に関する体力的な問題で大雑把な表現を多用している為，適宜正確ではない表現であることを認めて読み進めてほしい．

おそらく，ソフトウェア及びハードウェアの両方を設計する必要があり，それぞれ2つずつポイントが存在すると考える．よって，これらを記載する．

また，人間を作ること，ではあるが実際には完全に再現する必要がない場合もある．これは目的によって変わってくる．「より良いコミュニケーションを行うこと」を目的とするのであれば，産業用ロボットが人型ではないことが最適であるように，コミュニケーションを行うロボットであっても人間と同じ形・振る舞いをしない方が良いかもしれない．また，再現せずとも人間がその機能を補完する事でうまく機能させる方向性も存在する．結局，ただ人間を作るのみではなくその身体や機能の設計はより多くのことを考える必要がある*1．

ここでは特に扱わないが，人形は動かず完全な人体とは質感が異なるが魅力的であり，弱いロボットはタスクを行う能力が不足しているが積極的に補助してもらうよう人間の行動を引き出してもらうことで機能している．

ソフトウェア

知機能

一般的に人工知能と聞いて思い浮かぶのはおそらく機械学習だと思われる．最近コンピュータの性能の向上やアルゴリズム面での一つのブレイクスルーがきた為，このイメージが強い人も多いだろう．これらは人間を再現しているとは言い難いものが多いが，構成論的アプローチで人間を再現する過程にいると考える人もいるし，実タスクへの適用の為に開発を進める人もいる*2．

また，認知科学は人間の知機能をモデリングする方法に関する知見を与えてくれる．人間を特定の入力に対して特定の出力を返す装置であると仮定した場合に，この関係を記述することが人間の再現につながるが，認知科学はその過程で内部構造をシステム的に表現する．中国人の部屋の話のようにただ出力を決定するのみではなく，その過程まで考慮される．

また，現状特定のタスクをクリアすることはできるが，汎用人工知能にはなれていない．例えばテニスの試合を考えてみると，階層的に，「試合に勝ちたい」→「特定の箇所にボールを入れたい」→「ラケットをこのように振る」といった風に人間の行動を表現することもできる．システムはラケットの振り方を学習することはできたが，どこにボールを入れるべきかといった判断も必要になる．勿論この階層はより複雑で，どのような粒度で表現するべきかも考えなければいけない．しかも，実際の人間が階層構造で施工しているかどうかもわからない．具体的な実装に関しては議論を追った方が良いが，なんにしろこれは必要である．

コミュニケーションを行う能動的な主体としての機能

しかし，ただ入力に対して出力をするのみでは，自然なコミュニケーションにはなり得ない．部屋の中に辞書が置いてあるか中国人がいるか，そのどちらでも良いが，中国人がいると思わせる必要はある．ただ辞書が置いてあると思われてしまった場合，人間と同等のコミュニケーションを行う能力があると認められない可能性がある．

Human-Agent Interaction分野は人間と知能を持ったがよりよく相互作用し，基本的には社会的に受け入れられる為の振る舞い全般の設計方法について研究している*3．例えば，人間同士の対話で相手の目を見て話すとか，相手に触れながら話すとか，そういったことをするには身体が必要になる．コマンドライン出力が「画像が猫である確率は98%です」というだけではなく，目を見てそれを口頭で言うとか，その出力のデザインが実際のコミュニケーションに際しては重要になる．

また，人間らしい方がその思考の過程を想像しやすい．Dennetは人間が他者の振る舞いを理解し予測するためのスタンスとして三つのスタンスを挙げている．りんごが落ちるように物理的法則に従う物理スタンス，機械がアルゴリズムに従って出力するように設計に従って行動する設計スタンス，何かしらの目的・意図に則って行動する意図スタンスである．特に意図スタンスであると認識されることが主体らしさ，能力を感じさせるために重要だと考える．

ハードウェア

機構

これは単なる技術的要件の話になるが，ソフトウェア的な振る舞いを決定した際，それを物理レイヤでどのように再現するか考える必要がある．身体のあるロボットでは，人間を再現するのは難しい．様々な要因はあるが，機械で人間のハードウェアを作るのは難しい．電気で動かすのか，計算や運動で発生する熱をどのように発散させるのか，とか．より小さい機構を用意しなければ人体のサイズに組み込むことも難しい．

質感

知機能としてはこの要素は要らないかもしれないが，コミュニケーションを行う上では人間らしくある必要があり，その点で機械の質感が重要になる．柔らかい手であるかとか，肌色かとか．手が冷たかったら違和感があるかもしれない．入出力的に再現できれば中身はどうでも良い立場に立ったとしても，人間は人体のいろんなところを見ていて，結局再現が必要になる．藤堂さんのSEERなどは，ハードウェアとして表現された人体として，違和感がほとんど生じない程度の自然さを持っている点でそれなりに珍しいと思っている．

考えていること

研究ではこれらの要素を総合的かつ質を求めて扱われることが少ないのではないか．

多くの論文・研究はそれ自体が目的ではなくチェックポイントとして何かしらの成果を公表するものであって，全ては通過点でしかない．どのような設計が良いか諸要素を可能な限り一般性のある形で分析しているが，実際それらをどのように組み合わせ，どうすれば人間のレベルまで持っていけるのか，といった総合的な部分が気になる．タスク間の比較で何かが向上することは分析に役立つが，それだけでは人間はできないんじゃないだろうか*4．

個人的な話

結局，個人的には，諸要素を分析するのではなく，総合的に人間を作る段階のことを考えたい．そして，多分研究されている方の中にも人間を作りたい人は多くて，そういった方へのリスペクトを忘れてはいけない．

余談

個々の論文を読むのみでは全体の概要を把握することはできないと思う．多くの研究者は自分の中に大きな目標や研究ストーリーを持って論文を出したり活動されていると思う*5が，二つのポイントに注意する必要がある．まず一つは，学会に通すにはその学会の趣旨に合わせていることである．一つの研究成果を学会に出す場合でも，理論的側面を重視する学会であればその背景を中心として論文を構成するし，実タスクでどれほど成果を出したか重視するのであれば，そのように論文を構成する．二つ目に，個々の研究はチェックポイントだと考える．何かしらの大きな目標のためにいくつかの論文・研究を引用することになるが，全て完成させてから公開，というわけではない．一つ目のポイントと関連するが，論文の文面はあくまで学会に出すためであって，それが目的とは限らない．”その人が何をしようとしているか”を把握する必要がある．個人ホームページに書いていたりどこかで夢を語っているのを探したり，場合によっては直接聞けたら聞いた方が良いかもしれない．

*1:実際のところ，人間を完全に再現するのは現在の技術や知見では難しい為，再現せずとも目標を達成する方向が発展したのではないかとも考えられる

*2:僕は前者でいるつもりだが

*3:大雑把な表現の為，調べてほしい

*4:これは全く否定的な意味を含んでいなくて，目的が違うだけだと思う

*5:要出典