コラム

そのイノベーションが、未来社会の当たり前になる。

清水亮×坂井直樹 人工知能を語る前に……そもそも人間の知能って何?

share

コンセプターの坂井直樹さんが、今起きている社会の変化の中でも、少し先の未来で「スタンダード」となり得そうな出来事、従来の慣習を覆すような新しい価値観を探る対談コラム。今回は、「ヒトとAIの共創環境の実現」を目指し設立されたギリアの代表取締役社長・清水亮さんとの対談です。人工知能について、令和時代の人工知能・AIはどうなるのか、人間の知能を再現できるのか。人間の知能はどんなものなのかを掘り下げます。

左から、清水亮 氏、坂井直樹 氏

Siriと話しても虚しいのはなぜか

坂井:ディープラーニングが注目されるようになってから、何でもかんでも人工知能、AIと呼ばれています。

清水:僕はむしろ人工知能の概念を広げて、電卓から人工知能と呼んでいいと思っているんです。人工知能とは何か。それは「人間の知能を、どんなものと認識するか」を考えるのと同じことです。人工知能が発展するプロセスは、実は、知能をどう認識するかの進化の話なんですよ。

例えば100年前だと、集計作業は機械にはできないと思われていたけれど、穴あきカードを発明して、穴の数を数える機械を作ったら、13年かかると言われていた集計期間が1年半に短縮できた。そうやって人間にしかできないと思われていた知的作業を、機械を使って効率的にやっていくことに関心が高まっていったんです。穴あきカードを作った会社はIBMという名前に変わって行くわけですけれど。

坂井直樹 氏

坂井:人力でやっていた情報処理を、機械が代わりにやることで、高速にできるようになりましたよね。

清水:集計は足し算ですが、次はもっと難しい計算ができるように考えて計算機ができました。だから電卓は、人工知能を目指す最初の道のりにあるわけです。

坂井:知能を機械化する試みの始まりですね。

清水:言葉と言葉の関係性も、計算機上で扱われるようになります。第2次世界大戦下では、暗号を解く機械がつくられました。

有名な話ですが、ドイツの潜水艦Uボートがどこに現われるかは暗号化されていて、解読のためにイギリス政府は数学者を集めました。ところが暗号の鍵を解くために、すべてのパターンを総当たりで試そうとすると、1つの暗号を解読するのに、1万人の数学者がいても2000年かかる。でも20分以内に解かないと意味がない。そこで数学者のアラン・チューリングは、人力ではなく暗号解読する機械を開発して、解読に成功します。

坂井:チューリングは、コンピュータの父と呼ばれるようになります。

清水亮 氏

清水:ここで知能とは何か、という話に戻しますが、最初は「計算が正確で早い人は賢くて知能が高いから、計算を機械化したら人間のように賢いモノがつくれる」と期待した。けれど、いざ計算機ができて、計算するスピードが上がっても、「求めていた知能と違う」となって、人工知能の研究は一度挫折するんです。

次に「賢くて知能が高い人は、たくさんのものを知っている。問題を解決する最適な手段が選べる」という仮説があって、いろんな情報処理方法、アルゴリズムをコンピュータで実行できるようにしました。けれど、やっぱり求めていた「知能」とは呼べなくて、人工知能の研究は行き先を見失ってしまった。これが1990年代初頭です。

坂井:人間の思考を機械が再現できているとは言えなかったわけですね。

清水:例えば、犬と猫の違いを写真だけ見て判断するというのは、アルゴリズムでは実証できません。でも猫は、相手が猫なのか違うのか、わかるわけですよ。

坂井:猫にもできることが、人間が作った人工知能では説明できない、と。

清水:「知能ってこういうものだよね」と仮説を立てて、それを再現しようとする人工知能の研究と並行して行われてきたのが、理屈は分からないけど生物の構造と同じものを人工的に作り出して知能を再現しようというアプローチです。チューリングが活躍したのは1940年代ですが、同時期にアメリカの神経学者のマカロックは人工ニューロンを発表します。神経細胞をコンピュータで人工的に作り出して、学習させて知能を再現しようとしました。

坂井:これがディープラーニングにつながっていくんですね。

清水:でも長いこと目が出なくて、人工知能の研究は縮小していきます。僕は小学生の頃から人工知能を作っていたけれど、就職する頃、人工知能だけで食べていくのはすごく難しくて、それでOSとかゲームの方に進んだんです。

坂井:それで清水さんはプログラマーになったんですね。今はプログラマーとしての視点から、人工知能を捉え直そうとしている。

清水:人工知能の研究者が、いろんな方向に進んだおかげで、生まれた技術もあるんです。Webやグーグルの検索エンジンも、その一つ。Webは「知能」には見えないですが。

坂井:副産物がたくさんあるんですね。

清水:2006年頃からディープラーニングが急激に進歩して、猫か犬かの画像判別を機械でできるようになると、人工知能がとたんに注目を浴びるようになります。ブレイクスルーが起きたんですが、面白いのは新しいことは何もいらなかったんですよ。今のディープラーニングの基礎は90年代に論文が出ていたんです。多少の工夫はありましたが、今まで高尚で素晴らしいものだと思って研究してきた人間の知能は、たいしたことがなかったと発見したんです。

坂井:幻想が破れてしまったんだ。そのショックは大きい。

清水:2016年に囲碁でトップ棋士を負かした人工知能も、ディープラーニングの成果です。囲碁をやったことのある人ならわかると思いますが、名人級に勝つのは相当難しい。その戦い方を見ていると、相手を誘導しているようにも見えて、機械に知能があるかのようです。

でも人工知能のフタをパカッとあけると実に簡単な仕組み。頭のいい象徴だと思われている棋士に、シンプルな機械が勝ててしまうとなると、頭がいいことの定義が根底から揺らぐわけです。人工知能の進化のプロセスで何度も出てきた、「知能って何なの?」という根源的な問いに、また戻るわけです。一方で、会話するロボットとかスマートスピーカーとかは、まだ知能があるようには思えない。今はそこで悩み始めているところなんじゃないか。というのが、人工知能に対する僕の現状認識です。

人工知能を作ること自体は、やってみると簡単だとわかってきていて、次は人工知能を使って何をするか、のコンセプトとか戦略の方に軸足が移ってくるんじゃないかと思います。インターネットが出てきた時と同じですね。HTMLについて、最初は珍しがられたけれど、今はHTMLを書くこと自体よりもユーザーにどんな体験をさせるかが大事になっています。

坂井:棋士に勝ったグーグルのアルファ碁だったり、レシピを提案してくれるIBMのシェフ・ワトソンだったり、専門分野に秀でた人工知能が出てきています。これから技術が進むと、何でも器用にできてしまう、人間が持つ能力をトータルに兼ね備えた人工知能の実現というのはあり得るのでしょうか?

清水:時間軸はわからないですけれど、今の科学の考え方でいったら、遠い未来にはあり得るでしょう。ただ“AI”って身体性を持ってないので、どこまで行っても嘘になるだろうなとは思います。

例えば人工知能を使った翻訳で考えてみましょう。カナダはフランス語と英語、両方とも公用語なので、英仏翻訳は大きなテーマです。英語の空間内にてXで表現される言葉を、フランス語の空間で x に変換して、もう1回英語の空間で逆翻訳してx’を作る。Xとx’の間に生まれた差を縮めていけば、人工知能はフランス語と英語の差を理解したと言える。これが今一番進んでいる人工知能での考え方です。ところがこれ、翻訳業務をしたことのない人の発想なんですよね。

わかりやすくするために英語と日本語で例えてみます。“I am Japanese”を日本語に翻訳すると、「私は日本人男性です」とも「俺は日本男児だ」とも訳せます。これを英語に逆翻訳しても、“I am Japanese”になるとは限らない。“I am a man born in Japan”かもしれないし、ほかの翻訳もあるでしょう。翻訳する人によっても、文脈や、カルチャーによっても表現は変わります。要はどんな環境で使われる言葉なのか、という視点が欠けているんです。

坂井:人間は、脳だけじゃなくて身体がありますからね。

清水:身体性があるから、それっぽく訳せるんです。人間の翻訳者は、日本語なら背景に日本のカルチャーがあることを理解しているけれど、機械はわかってない。逆翻訳したときの差を縮めればいいというのは、傲慢な前提なわけです。

坂井:差が縮まったとしても、人が期待するような日本語になるかといえば、必ずしもそうはならないわけですね。

清水:Siriやスマートスピーカーは僕たちと同じ言葉のようなものは使っています。でも受け答えがイマイチなのは、言葉の背景にある環境、カルチャーがないからなんです。だから、いくら話しても虚しい。自動販売機と話しているようなものです。でも、背景が伴ってくれば、話す価値が出てきて、第4世代の人工知能に行けるかもしれません。

坂井:相手の環境を理解する機械が出てきたら面白いことが起きそうです。

清水:先ほど、犬猫の画像を認識する人工知能の話をしましたが、猫の画像を見せると、猫度何パーセント、犬度何パーセント、ヤカン度何パーセントのように確率で出てきます。猫の画像に反応するニューロン、犬やヤカンの画像に反応するニューロンがあって、大量のデータを学習して画像を分類しています。同じように学習させた人工知能に、同じ猫の画像を見せても、どう認識するかは、個体によって異なるんです。ましてや個体どうしが分かり合うこともありません。

でも猫が2匹いたら、お互いに猫同士だと判別しているし、2匹がいる環境にエサがあったら、相手の動きを見ながら、あいつもこれを欲しがっているんだなとか、分かり合えるわけです。

坂井:機械が大量の情報を学習して画像を判別していると聞くと、なにやら高度なことをやっている気がするけれど、それは猫でもやっているということですね。

清水:そうです。生物の中でも人間が特別だとすると、それは、無数のパターンが生み出せる言葉を使って、ほかの個体と意思疎通ができること。しかも言語だけじゃなく、絵とかダンスとか、歌とか運動で表現することもできます。

坂井:相手の環境を理解して、意思疎通できるかどうか。今の人工知能と人間の知能の大きな差は、そういったところにあるんですね。

次ページ 「誰でもAIが使える世界を目指す」へ続く

Follow Us