ゲームで「心」をつくりたい。ゲーム開発者三宅陽一郎氏・北山功氏が語りあう、インディーシーンにおけるAIと哲学の可能性

2018-08-09 18:00

『Qualia』から『森世界』そして『アガルタ』

ーーそういえば『スペース・インベーダー』が流行ったときに、各社がよってたかって、あれを超えるゲームを作ろうとして、基板を解析していろいろなゲームを作られたそうなんですが、限界があってできなかったと。

北山:
なんの限界ですか？

ーーCPUの処理速度とメモリの容量ですね。そんなときにナムコから『ギャラクシアン』が出て、業界がびっくりしたんです。キャラクターが滑らかに動いて、バックに星がスクロールしていた。魔法の種が、スプライトのための専用回路の搭載でした。つまり、なんでもCPU上で、ソフトウェアで処理できるんだけど、それだと『スペース・インベーダー』と同じことしかできない。そこで、あえて描画用に専用のプロセッサをおいて、ハードウェアの力を借りたという。

北山:
なるほど。

ーーただ、そこで世界とキャラクターが分離されてしまったわけです。キャラクターはスプライトで描画されるわけですから。

北山:
ああ、確かに。

ーーそれで、このCPUとスプライトという関係性は、そのままファミコンにもCPUとPPUという形で継承されるんですよね。そして今でも全体を処理するCPUと、画像処理に特化したGPUとして、コンピュータの基本的なアーキテクチャとして継承されているという。

三宅:
それが今ではゲームデザインというレベルにまでつながっていて。

北山:
分離してしまっているわけだ。

ーーそれを全部CPUです。全部ソフトウェアです。全部環境ですという感じに戻すと、また新しい可能性が見えてくるんじゃないかという。やっとつながりました。

三宅:
まあ、でも今はしょうがない。

ーーもっと処理速度が早くなれば、いろいろできるかもしれませんね。

三宅:
繰り返しになりますが、『アガルタ』だと、表現の粒度とシミュレーションの精度が1対１ですよね。

北山:
そうですね。

三宅:
たぶん、もうちょっとするとシミュレーションの精度がピクセルの精度を超えるんですよ。今のCGって、だからきれいなんですけど。レンダリングするときにピクセル以下まで落としてくるので。実際、ピクセルを一つ描画するためだけに、何回も計算しているんですね。それと同じようにシミュレーションの精度が今のピクセルを超えた瞬間に、たぶんものすごくきれいになるし、CGより細かいシミュレーションができるようになる。今の3Dってピクセルが最小単位で、シミュレーションの粒度はもっと粗いですよね。

北山:
それがシミュレーションのほうが細かくなって……。

三宅:
それは多分、画期的なことなんです。そのためにはもちろん、もっとコンピュータの処理速度が上がらないといけないんですが。

北山:
それでもっといいモデルができたら、今度はゲームエンジンに「環境モデル」みたいな感じで搭載されるかもしれないですね。粒子モデルというか。すごく重くなるんでしょうが。

ーー『アガルタ』も今は2Dですが、3Dに拡張できたりするんですか？

北山:
できますよ。技術的には。すごく重くなるから、やらないだけで。

三宅:
『マインクラフト』くらいだと。

北山:
『マインクラフト』ってめちゃめちゃ粗いじゃないですか。

三宅:
あれは良い塩梅だったと思うんですよ。あの粒度だからインタラクションもできるし。あれが細かくなると、逆に遊びにくくなるだろうし。

ーー作者の評伝にも「子供の頃からレゴが好きだった」と書いてありましたね。

三宅:
グラフィックが上がっても、逆に触れないものが増えていくばかりで。昔は『レッキングクルー』なんかをみても、表示されているものが100あったら50は壊せたんですよ。『ロードランナー』とかもそうですよね。でも今は1000あったら、50くらいしか壊せない。このボタンを押してください、敵だけが壊れます、みたいな。でも、『マインクラフト』はスッキリしていた。なんでも壊していいんだという。

北山:
そうですね。僕も『バーチャファイター2』でアキラの鉢巻がひらひら舞っているのを見て、あれがゲームに影響したら、おもしろいなと思ったんですよ。

三宅:
あとゲームエフェクトも上から当てちゃうじゃないですか。

北山:
そうですね。自然にできたらいいんですけど。

ーーよくSFでは惑星自体に知性が宿っているみたいな設定がありますが、環境自体が意識を持っているみたいなゲームには興味はありませんか？

北山:
環境が生きているとかって話ですよね。おもしろいですね。

三宅:
有機的な意思を持った森とか。

北山:
実際に『QUALIA3 ～multi agent～』では、小さい細胞が連携していて、全体で攻撃してきたりするんですよ。それこそアニメ「ヤッターマン」のゾロメカみたいな感じで。

三宅:
だから最初にゲームを遊んだとき、すごく人工生命っぽい感じがしたんですよ。だけど聞いてみると、そこまで人工生命っぽくなくて。

北山:
『１』のときは波だけですね。

三宅:
そこが『２』『３』となって、『森世界』なって、どんどん人工生命になって行きました。そのへんは探求されている感じですか？

北山:
実験している感じですね。一通りやってみようという形です。細胞レベルまでシミュレーションすると、それはそれでおもしろくて。『アガルタ』だと土なら土のアルゴリズムが入っているだけで、プログラム的に10行くらい入っているだけなんですよ。でも細胞まで入れると、もうちょっと長くなるんです。近くの細胞と同じくらいの距離を保つとか、ここから来た命令をこっちに渡すとか。そうしたらけっこう複雑な動きができるんですよ。そうしたら、またいろんな疑問も湧いてきて。

ーーはいはい。

意識の問題は身体の必要性に行き着く

北山:
そういえばこの前、ここの爪が剥がれたんです。またきれいに同じように爪が生えてきたんです。なんで再生するのかとか。

三宅:
そこで、身体をちゃんと作り込めば、そこに意識もできるはずなんですよ。

北山:
身体が重要なんですか？

三宅:
たとえば我々の意識って、ほぼほぼ身体の意識と同じなんです。意識の筐体って体の筐体でもあるから。ゲームキャラクターって今はポリゴンのはりぼてで、神経が入ってませんよね。人工知能といっても、スカスカの体の中に脳があって、身体感覚がない。身体感覚がないということは、自分の意識を考えたときに、身体の意識がない感覚になっているから、ここにいるという感じがしないんです。

北山:
そうですね。そもそもAIは世界に対する現実感をもっていない。情報が外から入ってこないんで。

三宅:
今のディープラーニングって、情報処理の個体として作るでしょう？情報処理体と人工知能は違うんです。

北山:
情報処理体というのは、役に立つために作った人工知能みたいなものですか？

三宅:
左から情報が入ってきて、それを処理して、右側に出力するみたいなものを情報処理といっていて。その情報処理の大きな枠組みの中で人工知能を作ろうというのが、今の大きな世の中の流れで。でも、それは逆だと思うんです。人工知能のフレームはもっと大きくて、その一つの側面が情報処理なんです。例えば我々の知的活動の一部は、確かに情報処理。でも、それって、知能の一断面であって、一部の見方が情報処理なんです。もっと刺激だとか、感覚だとか、いろんなものを体験したり。

北山:
ああ、体もセットで人工知能だと。

三宅:
そうそう。でも、情報処理を考える人は、体なんかいらないといいがちなんですね。

北山:
だったら、たとえばゲームで、ポリゴンできれいなキャラクターを出した場合、その人にちゃんと画像情報を与えて、匂いも与えて、触覚も与えて、はじめてスタートという感じですかね？

三宅:
それだけじゃなくて、自分の身体の感覚とか、行動している感覚とか。

北山:
それは全脳シミュレーションにかかわってくるところですよね？

三宅:
それより、もうちょっと先の話で。全脳シミュレーションができたとしても、そこから先、クオリアだとか、自分の体の感覚だとか。

北山:
そこまでほしいわけですね。僕もさっきのクオリアみたいなプログラムがなにかしら必要だと思うんですよ。

三宅:
行動主体感とか、身体感覚だとか、自分が自分でいる感覚だとか。精神病になると失われる、自分の体がこのサイズだという感覚。これも言ってみればイメージだから。そういうのを持っているのが意識。

北山:
クオリアがないと体ってうまく動かないんですかね？　ニューロンだけじゃだめなんですかね？

三宅:
動かないです。自分の体の大きさがよくわからなくなる。

北山:
それはもとからあるクオリアが変調した場合ですよね。最初からクオリアがなかったら？　へんに共感覚みたいになっちゃう？

三宅:
たとえば自分の腕を動かしたとき、これは自分の腕だと感じるのがクオリアなんですが、もしクオリアがなくなると、自分の脳を動かしても、誰かに動かされているという感覚なんです。精神病は、いろんな人間についての知識を教えてくれます。我々のようにフルセットで健常だと、それがよくわからない。

北山:
障害を持つ方の体験があってはじめてわかる。

三宅:
たとえば自分の体が地球の重さと同じだと思ってしまう。我々はよくわからないんだけど、そう思ってしまうということですね。重くて動かないとか。

ーー脳の一部分が欠損すると、体の一部分がうまく動かなくなりますよね。そんな時、リハビリでは体の方をマッサージして、脳に刺激を与えて、別の回路をつなげたりすることがあるそうですね。脳と体が一対一で対応しているということですね。

ただ、いくら脳が回復しても、やる気がおきないと意味が無いので、まずやる気を最初に設定するそうです。料理がしたい、ディズニーランドに行きたい、そういった動機づけがリハビリに大事なようです。それはまさに、脳と体と世界の関係性なんですね。

三宅:
その三要素をコンピュータサイエンスは、最初からわけて考えるんですね。そして、その相互関係性を考えていく。それを考えるのが「人工知能の哲学塾　西洋編」で。そこでいろんな知見は貯まるんだけど。ゲームキャラクターの知能とかと結びついて、実感として溜まっていくんだけど、そこに限界が生まれてしまう。間のモデルを誰も作っていないからです。けっきょくモーションをいっぱいつくって、この場合は剣をふる、キックする、というふうに条件付けをしていく。

北山:
分離していますね。

三宅:
人間だったら、そこにいろんな柔軟性があるわけです。でもゲームキャラクターは一度、剣を振ることになったら、振り下ろすまでは変えられない。モーションを飛ばすか、再生が終わるまで待たなくちゃいけない。

北山:
三宅さんはそれを、どうやって統合しようとしているんですか？

三宅:
予測ができればいいかなと思っていて。これは「西洋編」にも書いたんですが、人間の脳は遠心性情報というものを持っていて。自分の体を動かす前に、自分の体の動きと環境のインタラクションを事前に予測するんですね。

北山:
フィードフォワードってよくいいますよね。

三宅:
それと似ていますね。足を動かして地面につけるとき、頭の中で「あと0.2秒後に反発が来る」と予測しているんですね。それが遠心性コピーと呼ばれるもので、頭の中で次の環境とのインタラクションを予測しているんですね。だからこそ、ここで床がすかっとなると、びっくりするわけです。それは予想が外れたから。予想をしていなければ、びっくりしようもないわけで。

北山:
なるほど。

三宅:
これが身体のイメージを作っていて。そのイメージが人工知能にはないんです。というのも、予測をしていないから。だから足を踏み外しても驚きようがない。つまり身体感覚がないんです。身体感覚に重要なのは予想だと思っていて。

北山:
そういうのは小脳でやっていると聞きました。

三宅:
そうそう。ずっと下の方でやっていて。ふだん意識にのぼってくることはほとんどないけれど、そこがおもしろいところで。うまくいっていれば意識にのぼらないんです。我々はふだん歩いていて、「歩いているなー」って意識することはない。でも、いきなり足を踏み外すと、意識に登るでしょう？つまり予測と実測が外れると意識に登る。これは他の意識もそうで。意識は今どこに集中するべきか常にモニタリングしているというか。

意識と無意識、そして意識の効用

北山:
研究者の前野隆司さんは、それをクオリアというのがサーチライトを当てているような感じだと説明されていました。それは記憶を作るためだという言い方をしているんです。

三宅:
劇場モデルというやつですね。そのモデルでも、舞台の上の役者は我々が無意識のうちに、常に動いているんですね。

北山:
それで、今どこに集中するかをクオリアが教えてくれて、そこにサーチライトがピッといく。

三宅:
それはなぜかというと、体の各部分というのは、常に自分が主役になろうとしているんです。他の部位と競合しているんですよ。たとえば歩きながらスマホをいじっているときは指先が主人公。でも足を踏み外すと足が主人公になる。これはどういうことかというと、普段は指先が足をおさえているわけ。でも踏み抜いた瞬間に足が主人公になる。そういう調整機能を意識は持っているんです。

北山:
なんで意識って、それをのぼらせないといけないんですかね？

三宅:
けっきょく身体の運動が複雑になりすぎて、いろんな制御系や情報が同時にインプットされているんですよね。

北山:
全部に集中することは無理だから、一部分だけ集中しようという考え方ですか？

三宅:
それをいかに的確に取捨選択できるかが、長い人間の歴史の中で、生存にかかわっていたんでしょうね。どれが本当の現実かが問題で、遠くで物音がしました、ひょっとしたら敵が降りてきたのか、たまたまどこかで爆発したのか、幻聴なのかわからない。でも、そのときって我々の中で3つの現実が同時に走っているんです。それはどれが本当かわからなくて、目の前に兵士が出現したときに、そのうちの1つが現実になる。

北山:
ああ、それは本に書かれていましたね。いま思い出しました。

三宅:
現実は常に一つではなくて。

北山:
いろんな状況を想定しているわけですね。

三宅:
それをたとえば、何かが起こってからシミュレーションして、ああだった、こうだったというのが、今の人工知能の作り方なんですね。情報が来てからモデルを作って制御するから遅い。そうじゃなくて、常にいろんな状況を仮定して走らせておいて、選択したほうが速い。

北山:
そんなふうに上がってきたやつにだけ、制御するんでしょうけど、なんでそのときにクオリアと連動しているんですかね？

三宅:
クオリアが人間の能力を特定の箇所に集中させる仕掛けになっているからでしょうね。世界のこの部分がいまいちばん重要なんだ。この部分に意識の集中がいくように、クオリアが制御している。たとえば、敵が憎いというクオリアをはらないと、キャラクターは動かないでしょう？憎いというクオリアが高まれば高まるほど、そこに意識が高まって、他を抑えているわけです。

北山:
クオリアというのは、人が集中したときに動かす情報処理みたいな。

三宅:
その抽象版というか。たとえばジャングルで赤い果物を食べたら死ぬと教えられると、赤と死が密着するわけです。人間の主観世界では客観世界と違って、いろんな内面と対象が結びつくんです。赤を見たら死、みたいな。そういうのを学習すると、赤いものを見たら常に死という概念がつきまとう。そういうショートカットが働くというか、自分が活動する上で一番ミニマムな世界が主観世界で構成される。闘牛場の闘牛士みたいな感じで。今の状況に一番省エネルギーで対応できる。

中でもスポーツは典型で、スポーツをやっている人はスポーツをやっているミニマムな世界が頭のなかにある。あれもクオリアの一種で、なんとなくゴールポストがこっちで、こっちのほうはやばいといった、客観的ではないミニマムなクオリア世界を作っている。

北山:
集中制御するのにむいているシステムであるという可能性がある。

三宅:
さっきの劇場の例でいうと、スポットライトが当たるミニマムな劇場をそこに作っちゃうんです。いろんな演劇がされているんだけど、今は関係ない。人間の脳をいろんな演目がなされている劇場だと捉えると、その場、その場で自分が参加したい演目にスポットライトが当たる。クオリアというのは役でもあるんです。この色が持っている意味というのは、世界を形作る役割を持っているわけで。

北山:
その情報処理システムがどうなっているかがわかれば、それを解読できますよね。

三宅:
そこは情報とはちょっと違うラインなんですよね。情報処理といってしまえばそうなんですが。赤＝死というのは情報じゃないんです。

北山:
量子力学がかかわっているから、僕らのニュートン力学が役に立たないだけで。本当は情報処理で片付けられる問題じゃない。

三宅:
情報処理じゃないですね。

北山:
難しい数学になっているだけで。

三宅:
体験を重視するというのは…

北山:
できないですけれど。

三宅:
それがクオリア問題で。

北山:
真剣に取り組まないといけない。

三宅:
ゲームの場合はどうするかというと、赤＝死というのをタグ付けしちゃうんです。

北山:
タグ付けすれば終わりですね。

三宅:
これは食べれますとか。アフォーダンスを世界の側に貼り付けることで、主観世界のかわりをさせるんです。

北山:
でも、それだと納得いかない。

三宅:
本当はジェネレーティブにやらないといけない。

北山:
僕は納得いかないですね。本物の劇場を作って実装したらどうなるか。

三宅:
それこそが意識を作る、心を作るってことだから。

北山:
みんな悩んでいますよね。

三宅:
それに関連したところで、CERA-CRANIUMアーキテクチャという研究があります。「西洋編」のデカルトの章で書きました。劇場モデルが三階層になっていて、その劇場を見ている小さな人工知能たちが、その下にぶら下がっているというモデルなんです。これってゲーム『アンリアルトーナメント』を使って、どのボットが人間でどのボットがAIでしょうというコンテストをやった時、優勝したモデルなんですね。いちおうそういった研究はあります。ただまあ、究極的なモデルはなくて、決定打もなくて、哲学的な議論がある。

ーーカクテルパーティ効果なども、それに近いですね。

北山:
ああ、そうですね。

Part2にもどる
 Part4につづく