SSブログ

No.233 - AI vs. 教科書が読めない子どもたち [技術]

今回は No.175「半沢直樹は機械化できる」No.196「東ロボにみるAIの可能性と限界」の続きです。

No.175 で、オックスフォード大学の研究者、カール・フレイとマイケル・オズボーンの両博士が2013年9月に発表した「雇用の未来:私たちの仕事はどこまでコンピュータに奪われるか?(The Future of Employment : How Susceptible are Jobs to Computerization ?)」という論文の内容を紹介しました。この論文は、「現存する職種の47%がAIに奪われる」として日本のメディアでもたびたび紹介されたものです。それに関連して、国立情報学研究所の新井紀子教授が「半沢直樹の仕事は人工知能(AI)で代替できる」と2013年に予想した話を書きました。半沢直樹は銀行のローン・オフィサー(貸付けの妥当性を判断する業務)であり、銀行に蓄積された過去の貸付けデータをもとにAI技術を使って機械的に行うことが可能だというものです。

No.196「東ロボにみるAIの可能性と限界」ではその新井教授が主導した「ロボットは東大に入れるか(略称:東ロボ)」プロジェクトの成果を紹介しました。これは大学入試(具体的にはセンター試験の模試)を題材にAIで何ができて何ができないのかを明らかにした貴重なプロジェクトです。

AI vs 教科書が読めない子どもたち.jpg
その新井教授が最近「AI vs. 教科書が読めない子どもたち」(東洋経済報社 2018.2)という本を出版されました(以下「本書」)。AIの強力さと弱点を「東ロボ」を例に実証的に説明し、AIが社会に浸透していく中で我々は何をすべきかを示した良い本だと思うので、その内容の一部を紹介したいと思います。

そもそも新井教授が「東ロボ」プロジェクトを始めるきっかけになったのは、人間の仕事がAIに奪われていくという危機感でした。実は、新井教授はオックスフォード大学の論文以前に、人間の仕事の半分がAIやコンピュータに奪われるという予測を発表していました。2010年に出版した「コンピュータが仕事を奪う」(日本経済新聞社。2010)です。ところが日本では誰もこの警告をに受けませんでした。


出版直後、私は東京駅前の大型書店に、この本がどこに置かれているかを見に行きました。ビジネス書の棚をいくら探しても見当たらない。結局どこに置かれていたかというと、SFのコーナーでした。その事実に私は慄然としました。日本人はこのシナリオをSFだと思うのか、と。

実はそれこそが、「ロボットは東大に入れるか」というプロジェクトをスタートさせようと考えた最初の動機でした。これが近い将来に間違いなく起こる事実であることを日本人に1日でも早く伝えたい。そのために一人ひとりに準備をしてほしい。その焦燥感が「ロボットは東大に入れるか」というフレーズに結晶したのだろうと思います。



偏差値 57.1 の成績をとった東ロボくん


ロボットは東大に入れるか.jpg
国立情報学研究所ニュース(NII Today)No.60(2013.6)。特集「ロボットは東大に入れるか」の表紙

東ロボの成果については、No.196「東ロボにみるAIの可能性と限界」に紹介したのですが、復習のために本書から引用します。


初めて "受験" した2013年の代々木ゼミナールの「第1回全国センター模試」では、5教科7科目900点満点の得点は387点。全国平均の459.5点を大きく下回り、偏差値は45でした。

ところが3年後の2016年に受験したセンター模試「2016年度進研模試 総合学力マーク模試・6月」では、5教科8科目950点満点で、平均得点の437.8点を上回る525点を獲得し、偏差値は57.1まで上昇しました。

偏差値57.1が何を意味するのか、合否判定でご説明します。全国には国公立大学が172あります(模試時点での大学コード発番数)が、東ロボくんはそのうち23大学の30学部53学科で合格可能性80%の判定をいただきました。思わず、ガッツポーズがでるレベルです。

私立大学は587校あります。短期大学は含みません。そのうち512大学の1343学部2993学科で合格可能性80%です。学部や学科は内緒ですけれど、中にはMARCH(明治大学、青山学院大学、立教大学、中央大学、法政大学)や関関同立(関西大学、関西学院大学、同志社大学、立命館大学)といった首都圏や関西の難関私立大学の一部の学科も含まれていました。両拳を突き上げたくなるレベルです。

さらに、将来の2次試験受験にそなえて、数学と世界史の2科目だけ記述式の模擬試験にも挑戦してみました。駿台予備学校の「東大入試実践模試」と代々木ゼミナールの「東大入試プレ」です。どちらも東大合格を目指す全国の優秀な受験生が受験する模試です。「2015/2016第1回東大入試実践模試」の世界史の問題の一つは、西欧とアジアの国家体制の変遷について600字以内の論文を書く難問でした。この問題で、東ロボくんは配点21点中9点を獲得し、受験生平均の4.3を大きく上回り偏差値61.8を獲得しました。東ロボくんに拍手。さらに「2016年度第1回東大入試プレ」の数学〈理系〉の問題では6問のうち4問に完答し、偏差値は76.2。全受験者のトップ1%に入る成績です。東ロボくんに拍手喝采。

「同上」

ちなみに偏差値57.1だった「2016年度進研模試 総合学力マーク模試・6月」において東ロボくんの得意・不得意を偏差値でみると、得意科目は世界史Bの66.3、数学IAの57.8、数学IIBの55.5などです。一方不得意科目は英語(筆記)の50.5、国語の49.7です。

大学入試センター模試(2016)の成績
ベネッセコーポレーション「進研模試」
(カッコ内は2015年の成績)
  得点 全国平均 偏差値
英語(筆記) 95(80) 92.9 50.5(48.4)
英語(リスニング) 14(16) 26.3 36.2(40.5)
国語(現代文+古文) 96(90) 96.8 49.7(45.1)
数学 I A 70(75) 54.4 57.8(64.0)
数学Ⅱ B 59(77) 46.5 55.5(65.8)
世界史 B 77(76) 44.8 66.3(66.5)
日本史 B 52(55) 47.3 52.9(54.8)
物理 62(42) 45.8 59.0(46.5)
合計(950点満点) 525(511) 437.8 57.1(57.8)
朝日新聞(2016.11.15)
No.196「東ロボにみるAIの可能性と限界」
に掲載した表を再掲。

偏差値 57.1が何を意味するかですが、これは全受験生の上位20%に東ロボくんが入ったということです。逆に言うと全受験生の80%は東ロボくんより成績が下だったわけです。

もちろんこの程度では東大には入学はできません。東大の偏差値は77以上であり、入学できるのは全受験生の0.4%以下です。新井教授は、このまま東ロボくんを成長させたとしても「偏差値60は運がよければ達成可能かもしれないが、偏差値65は不可能」と言っています。なぜ不可能なのか、その説明が本書の一つの目的だと言ってもいいでしょう。

とはいえ、東ロボくんがMARCHや関関同立の一部学科に入学可能というのは重大な事実です。AIの技術は急速に進歩していて、生活のあらゆる側面に入り込みつつあります。我々はそういう時代に生きているという認識がまず必要です。



以下、東ロボくんの得意科目(世界史、数学)と不得意科目(英語)について、どうやって問題を解いているのか、その一端を本書から紹介します。


東ロボくん:世界史の攻略法


世界史のセンター入試の7割程度は正誤判定問題、ないしは正誤判定に帰着できる問題です。たとえば次のような出題です。


カロリング朝フランク王国が建国された8世紀に起こった出来事について述べた文として正しいものを、次のうちから一つ選べ。

ピピンはランゴバルド王国を滅ぼした。
カール大帝は、マジャール人を撃退した。
唐の大宗の治世は、開元の治と呼ばれた。
ハールーン・アッラシードの治世が始まった。
「同上」

分析の結果、正誤判定問題においては多くの場合で問題文の条件は無視できることが分かりました。上の問題でいうと「(カロリング朝フランク王国が建国された)8世紀」の部分です。つまりこの問題の場合、選択肢の①②③は条件を無視して正誤判定が可能であり、④だけで「8世紀」という条件が必要になります。そこで東ロボくんはまず、条件を無視して正誤を判定します。どうやっているかが以下です。

たとえば「②カール大帝は、マジャール人を撃退した。」が正しいか誤っているかですが、まずこの文を回答とするような質問文を作り出します。たとえば「②カール大帝は、○○○を撃退した。この○○○は何か」という質問文です。

次にオントロジーを利用します。情報科学で言うオントロジーとは「概念体系」であり、さまざまな概念と概念の関係性を表したものです。たとえば「ハールーン・アッラシードは人名である」「ハールーン・アッラシードはカリフの一人である」「マジャール人は民族である」などです。「死んだ人はそれ以降の事項を起こせない」というのもオントロジーです。

世界史攻略のためのオントロジーが手作りで作成されました。そのオントロジーを用いると先ほどの質問文は「②カール大帝は、この民族を撃退した。この民族とは何か」と書き換えられます。この質問のように、単語で答える質問を "ファクトイド" と言います。実はファクトイド型の質問に答えて一躍有名になった人工知能があります。IBMのワトソンです。



ワトソンは2011年に、アメリカのテレビのクイズ番組「ジェパディ!」で人間のチャンピオンに勝って大きな話題になったコンピュータ・システムです。この「ジェパディ!」で出題される問題がファクトイドなのです。本書にその例があります。


Mozart's last & perhaps most powerful symphony shares its name with this planet.

モーツァルトの最後の、そして最も力強い交響曲には、ある惑星の名前が付けられています。

「同上」

この質問の "this" が何かを答えるのが「ジェパディ!」です。ワトソンでやっているのは基本的には人間がやるのと同じような「情報検索」です。人間ならこの質問に答えるにはどうするか。検索語を慎重に選んで「モーツァルト 最後 交響曲」で Google検索をすると、トップに出るのは Wikipedia の「交響曲第41番(モーツァルト)」の項です(2018.6.1 現在)。その「概要」のところは「本作はローマ神話の最高神ユーピテルにちなんで『ジュピター』(ドイツ語ではユーピター)のニックネームを持つが、・・・・・・」という文章で始まります。これで正解が「ジュピター」だ分かります。もちろん「ジュピター」が惑星の名前でもあることを知っているのが前提です。

もっと一般的には、検索でヒットしたテキストに、検索につかった単語がどのように現れるかを調べます。複数の単語がテキストにどのように現れるかを「共起」といい、共起関係を使って文にあたりをつけ、その文に含まれる「惑星」のカテゴリの単語を調べます。

ワトソンは問題文を単語に分解し、構文解析をし、検索にかけるべき重要な単語を判断します。また「ジュピターは惑星である」というようなオントロジーを備えているので質問に回答できるというわけです。



東ロボくんが「②カール大帝は、この民族を撃退した。この民族とは何か」という質問に答えるのも、基本的にワトソンと同じです。その結果、答として最も高いスコア、3.2 を獲得したのは「アヴァール人」でした。一方、もともとの問題文にあった「マジャール人」のスコアは 1.1 であり、その差は 2.1 です。この結果、東ロボくんは「②カール大帝は、マジャール人を撃退した。」を誤文と判定しました。

この差の 2.1 が正誤判定をするに十分に大きな数値なのかどうか、それは世界史の過去問を機械学習して決めました。つまり過去問のスコアを東ロボくんに計算させ、正解(正か誤のどちらか)と照らし合わせて、どの程度のスコア差が正誤判定になりうるかを学習したわけです。このようなやり方で、東ロボくんの世界史の偏差値は 66.5 までになりました。



以上の「世界史の攻略法」でポイントになっているのは、世界史の模試で出題できる歴史上の事実が限定されていること、つまり高校3年までに学習する範囲に限られることです。従ってオントロジーも手作りで作成できます。しかし、世界史の全知識が対象だったり、「ジェパディ!」のようにさまざまなジャンルの問題が出題される場合には、手作りでは難しい。従って、Wikipedia の全情報から文脈を解析してオントロジーを自動的に作るというような技術が必要になります。

ともかくセンター模試の世界史の結果から分かるのは、限定された情報の範囲の問題に対する回答は、データを蓄積した上での情報検索や統計処理で好成績をあげられることです。


東ロボくん:数学の攻略法


一方、世界史と並んで好成績あげた数学は、世界史とは全く対照的な方法がとられました。それは「数学の問題を自然言語処理で数式に "直訳" し、数式処理で問題を解く」という方法です。具体的な方法は専門的になるので本書には書いてありませんが、統計的・確率的にやるのではなく、論理だけで回答するということです。

数学では東大模試(理系)で6問中4問に完答し、偏差値77.2という驚異的な成績をあげました。大学入試の最難関は東大の理科3類ですが、ここを突破する鍵は数学の成績です。理3を受けるような受験生は、他の科目では大した差がつきません。数学で差がつきます。6問中4問に完答というのは、数学だけでいうと理3突破ラインです。これを数式処理でやったというのは東ロボくんの大きなブレークスルーであり、世界的に誇れる成果でしょう。

要するに、正確で限定的な語彙からなる問題文であれば、現在主流の統計的な自然言語処理ではなく、論理的な自然言語処理と数式処理で解けるということです。従って東ロボくんが「論理」を使って解くのは数学と物理の一部だけです。

ただし数学が理3突破ラインだといっても、東ロボくんが理3に合格できるわけではありません。それは不得意科目があるからです。その代表が英語です。


英語攻略法:150億文を暗記させても・・・・・・


英語の攻略法も、世界史と同じ統計的手法です。つまり大量の英語の例文を暗記させて、その情報検索と統計処理で回答するわけです。2016年の模試の際には、500億単語からなる16億文を暗記させたといいます。英語の文法(=論理)は一切使いません。この統計的やりかたで語順整序問題(問題に示されている数個の単語を正しい順に並べて文の穴を埋める問題)は100%の正解が出るまでになりました。

しかし東ロボくんがつまづいたのは、複文(会話文)の穴埋め問題、会話文完成問題でした。その例が本書にあります。


次の会話の空欄に入れるのに最も適当なものを、①~④の中から1つ選べ。

Nate : We're almost at the bookstore. We just have to walk for another few minutes.
Sunil : Wait.(    )
Nate : Oh, thank you. That always happens.
Sunil : Don't you tie your shoe just five minutes ago ?
Nate : Yes, I did. But I'll tie it more carefully this time.

① : We walked fo a long time.
② : We're almost there.
③ : Your shoes look expensive.
④ : Your shoelace is untied.

(訳)
ネイト:もうすぐ本屋だよ。あと2、3分かな。
スニール:ちょっと。(    )
ネイト:サンキュー。よくあるんだよね。
スニール:5分前に結んでなかったっけ?
ネイト:だね。今度はしっかり結んどくよ。

① : 随分歩いたね
② : もうすぐだね
③ : いい靴だね
④ : 靴の紐ほどけてるよ

「同上」

もちろん正解は④ですが、東ロボくんは②を選んでしまいました。2016年の会話文完成問題の正解率は4割を切ったそうです。

仮にこの問題が日本語の訳文で出題されたら、中学生や小学生(高学年)でも正解できるでしょう。子どもでもできる常識推論の問題だからです。これがセンター模試に出題されるのは "問題文が英語で書かれている" からであり、その英語が正しく理解できているかをテストしているわけです。英語さえ理解できれば、あとは子どもでも可能な推論になる。ところが東ロボくんにとってはその常識推論が難しいのです。

常識をコンピュータに教えればいいのではと思われるかもしれません。靴には紐がある、紐はほどける、紐は結ぶ、といった常識です。しかし中学生レベルの常識でも膨大にあります。新井教授は、


私たちにとっては「中学生が身につけている程度の常識」であっても、それは莫大な量の常識であり、それをAIやロボットに教えることは、とてつもなく難しいことなのです。

「同上」

と書いています。AIの研究でよくぶつかる「常識の壁」です。自然な会話の流れというのは、会話のバックにある常識を前提としています。また、発言によって引き起こされる "常識的な" 人の感情を前提としています。その常識や感情をコンピュータに教え込むのが難しい。だからこそ東ロボくんは、膨大な英語の例文を集めて情報検索と統計処理で問題を解く方針にしたのです。

東ロボくんに教えた例文は、最終的には150億文になったそうです。それでも会話文完成の4択問題の正答率を画期的には上げられなかったと本書にあります。では、もっとたくさんの例文を集めたらどうか。それは新井教授によると「ビッグデータ幻想」だと言います。


「150億なんてとるに足らない。今後、その百倍、万倍のデータが手に入るようになる」と予想した方がいました。けれども、それもまたビッグデータ幻想です。もちろん、ネット上には毎日大量の英文が書き込まれています。ツイッターだけでも物凄い量です。ですが、先にも触れたとおり、人間にとっては同じ英語でも、AIにとっては、特許の文書の英語と新聞の英語、センター試験の英語問題の英語はまったく別物です。

センター英語の正答率を高めるのに必要なのは「間違いのないお手本のような英語」です。ツイッター上のやりとりで、「お手本のような日本語」が使われている割合を考えれば、英語で書かれたツイッターでも、それがいかに少ないかは容易に想像できます。そんなものはいくら増えても何の役にも立ちません。

正しい文章を書ける人が限定的であり、文章を書くのに時間がかかり、そして、画像の教師データを「水増し」するように、手本となる文から自動的に意味を変えずに、一万倍に増やす方法が見つからない限り、150億文を万倍にすることなどできません。

「同上」



東ロボくんがセンター入試をどのように解いているのかの説明はこの程度にして、以下は社会に広まるAIの強力さと限界についてです。


社会に広まるAI


現代社会にはAI技術が広く使われ出しています。その例を本書から紹介しますと、まず顧客と企業の接点となるコールセンターです。上の "ファクトイド" のところで説明した IBM のワトソンもコールセンターに使われています。


コールセンターの役割は、問題を解決することではありません。用意されたFAQ(よく聞かれる質問とその回答集)に沿って応答し、複雑な問題の場合は担当部署に転送するのが業務です。ワトソンの役割は、顧客の問い合わせが、FAQのどれに該当するのかをオペレータに伝えることです。ここで、お得意の検索能力が力を発揮します。

ワトソンの画面には、音声認識機能でテキスト化された顧客とオペレータのやりとりがリアルタイムで表示されているはずです。それとほぼ同時に、FAQのランキングも表示されます。その仕組みはクイズに正解するのと同じです。現在の技術では、問い合わせに対する応答を一つに絞ることは困難ですが、時々刻々と進んでいくやりとりを入力して、適切な応答に近そうな順序にランキングすることはできるのです。

オペレータは表示されたランキングの中から、最も適切と思ったFAQを選んで顧客に説明します。間違っていれば別のFAQを選んで応対するということを繰り返します。そして、ワトソンが提案したFAQが正解だった場合は「正解」のボタンをクリックする。その情報が蓄積されることで、ワトソンが自律的に学習し、さらに賢くなっていくという仕組みになっているはずです。

私は、先ほどから「そうなっているはずです」を連発しました。私は実際にワトソンが導入された現場を見たことがないからです。けれど、現在のAIの実力を考えるとそれ以外のユーザーインタフェースは考えられません。ワトソンを導入した某銀行の方にそう申し上げたら、「まったくそのとおりですよ。寸分違いません」と教えてくださいました。

「同上」

ワトソンに限らす、コールセンターにAI技術を導入する場合は基本的に同じやりかたです。そこで使われている技術は、音声認識(声のテキスト化)、テキストの形態素分析(単語への分解)、構文解析、機械学習を使った情報検索などです。コールセンターは企業にとって顧客との接点となる重要な部門であり、的確な回答をしたり、問い合わせが終わるまでの時間を短縮することが企業にとっての大きな価値となります。

コールセンターにAI技術が有効な理由は、東ロボくんが世界史の模試を得意としているのと同じです。銀行のコールセンターで扱われる情報は「銀行が個人向けに提供している商品・サービスに関する情報」に限られます。それは多岐に渡っていて複雑でしょうが、とにかく枠組みが限定されていて、そこで使われる言葉や概念も限定できる。そこがポイントだと思います。

とは言え、クイズに答えていたワトソンが銀行のコールセンターで使われるということは、AI技術の汎用性を示しています。



AI技術が使われている別の例は、機械学習とディープラーニング(深層学習)を使った画像認識です。画像に写っている物体を検知し、それが何かを判別します。これは自動運転の "眼" に当たる部分や、CT画像からの病気の診断、監視カメラによる不審者検知、工場における不良品検出などに応用が広がっています。なぜ画像の認識がうまくいくのか。本書では2つの要因があげられています。

画像は、部分の単純な和が全体という、コンピュータが処理しやすい性質がある。

たとえば画像にイチゴが写っていたとすると、画像を拡大・縮小・回転・移動させてもイチゴである。この性質を利用して機械学習における教師データを「水増し」できる。

人間が外界から受け取る情報の大部分は眼からといいますが、画像認識は機械が(コンピュータが)眼を持ったことに相当します。No.175「半沢直樹は機械化できる」の「補記2」にアマゾンのレジなし店舗(Amazon GO)の話を書きましたが、レジ係りを不要にしたのは画像認識技術です。まさに "AIが仕事を奪う" そのものです。しかし本書には、画像認識が本質的に抱えている問題点も指摘されています。

ハードウェア(画像センサーとコンピュータなど)が向上し、より精密が画像が扱えるようになったとき、機械学習の教師データを全部作り直す(=全データについて精密な画像を用意する)必要がある。

画像認識の仕組みの細部を理解すると、画像認識ソフトを「だます」画像を作れる。つまり、どんな画像でも画像認識ソフトがイチゴだと判断するように細工できる。この細工は人間の目には分からない。このような悪意による改竄を防ぐのは本質的に難しい。

このような "落とし穴" は、よくあるAIの解説では指摘されないことだと思います。


AIの限界:AIとは数学のことである


社会に急速に浸透しつつあるAIですが、AIにはできないことや限界があります。この限界はコンピュータの性能が足りないからではありません。本書にその象徴的な話が出てきます。


プロジェクトを開始して間もなく、ある機関から「東ロボくんに是非うちのスパコンを使ってほしい」というオファーを頂きました。折角ですから、東ロボプロジェクトの研究者に希望者を募りました。すると、全員が大変困った顔をして、「使い道がない」というのです。中でも数学チームの指摘は興味深いものでした。

そこそこのサーバを使って5分で解けない問題は、スパコンを使っても、地球滅亡の日まで解けない」
「同上」

もの凄い速度のコンピュータが登場したら、あるいは量子コンピュータが登場したら、人間の知性と同等の(あるいはそれを上回る)AIができるということではないのです。AIの限界は計算機のスピードの問題ではありません。なぜ限界があるのか。人間の知性と同等のAIはなぜできないのか。本書の説明を簡潔に一言で言うと、その理由は、

AIとは数学のことだから、または、
AIは徹頭徹尾、数学でできているから

となるでしょう。数学に帰着できる問題はAIで解ける。数学の問題は最終的には計算問題になり、その計算をやるのがコンピュータ(=計算機)です。従って、数学の言葉で表現できない問題はAIでも解けない。

数学の言葉とは「論理」と「確率」と「統計」です。「論理」とは、たとえば「A=B で B=C なら A=C である」という三段論法に始まって、こうだからこうなるという体系のすべてです。方程式、関数、幾何学、行列、微積分など、高校3年までに習う数学の大部分は「論理」の範疇です。

「確率」は、必ずそうなるのではなくランダムに発生する事象、不確実性をもって発生する事象を表現する数学の言葉です。

一方、世の中にみられる事象は、確実に起こるのでもなくと、かといってランダムに起こるのでもないことが多数あります。こういった現実を観測して得られたデータを説明する数学の言葉が「統計」です。

数学の言葉は「論理」と「確率」と「統計」の3つであり、それしかありません。先ほどの東ロボくんのセンター入試でいうと、世界史の正誤問題と英会話の穴埋め問題は「統計」「確率」で解き、数学は「論理」でアプローチしていることになります。

「論理」「確率」「統計」の言葉で表現できないものは数学になじまず、従ってAI技術の適用ができなくなる。その例としてはまず、問題の枠組み(=フレーム)がはっきりしないものがあります。問題を考える範囲やスコープが曖昧なものや、解くときの条件が不明だったりするものです。それが曖昧だったり不明だと、解くために考慮すべきことが膨大に広がってしまい、現実には解けなくなります。いわゆる、AIにおける「フレーム問題」です。

  ちなみに、フレーム(問題の枠組み)が厳格に決まっているのがゲームです。厳格に決まっているという条件があれば、囲碁のような複雑極まりないゲームでもAI技術を使ったコンピュータ囲碁プログラムが人間を凌駕できるのです(No.180-181「アルファ碁の着手決定ロジック」参照)。

東ロボくんが世界史が得意という理由はここにあります。入試の世界史は、基本的には、学習指導要領、指導要領に沿って作られた教科書、教科書の理解を助けるための参考書という情報から作問できるものに限られます。これらの考えうるすべの情報をコンピュータに入れることも可能です。つまり「枠組み」がはっきりしている。従って上で例をあげた正誤判定だけでなく、たとえば次のような東大の2次試験の問題(模試)にも東ロボくんは回答できます。


(東大2次試験:世界史模試)

17世紀の東アジアと東南アジア地域での海上交易の繁栄と停滞の変遷とその要因について、東アジアと東南アジア諸国の交易の方針とヨーロッパ諸勢力のこの地域をめぐる動向に留意しならがら600字で論じなさい。

「同上」

大変に "難しそうな" 問題ですが、東ロボくんは大丈夫です。最初の引用にあったように、このような東大の2次の論述問題で東ロボくんは偏差値61.8を獲得しました。

これと真逆なのが「英語の会話文完成」問題です。会話文完成に必要なのは、自然な会話の流れを判定するために高校3年生であれば誰もがもっているであろう「常識」です。これは範囲が極めて曖昧であり、常識を書き出していくと膨大になります。「英語の会話文完成」がAIにとって難しい理由がここにあります。

数学でできないことはAIでもできないのですが、数学でできないことの一つに「意味」の記述があります。意味が重要になるものは言葉です。発話には意図があり、発話に応じることは意味の理解があるわけです。


言葉には明らかに記号の羅列以上の「意味」があります。ところが「意味」は観測不可能です。

そういうと一部のAI研究者は猛然と反論します。たとえば、「机の上にりんごと鉛筆がある」という文に対して、実際に机の上にりんごと鉛筆がのっている画像を合成できたら、それはAIが文の意味を理解したことになると主張します。

本当にそうでしょうか。では「太郎は花子が好きだ」はどんな画像にするのでしょう。「本当にそうでしょうか」は? さらに言えば、「『太郎は花子が好きだ』はどんな画像にするのだろう」という文は? 「そんなことは不可能だろう」という文は?

「同上」

意味を記述できる数学の言葉はありません。もちろん分野を限定すれば可能でしょう。東ロボくんは東大の2次試験・数学で偏差値 76.2 という驚異的な成績をあげましたが、それは問題文をその意味まで含めて「論理」という数学の言葉で記述できたからでしょう。しかしそのやりかたを一般の言葉にまで広げることはできない。言葉の意味を記述しているが辞書であるように、自然言語の意味は自然言語でしか記述できないのです。

本書にはIBMのワトソンがみずほ銀行のコールセンターに導入され、また東大の医科学研究所にも導入されて病気の診断に使われていることが紹介されています。まったく違った業種に同じコンピュータシステムが導入できるということは、ワトソンは「意味」を関知せずに「統計」と「確率」を駆使した情報検索で動いているからです。

自然言語処理は、自動翻訳システムや質問応答システムを作るときに必須です。しかし、AIに文法などの言葉のルールを教えて論理的な推論で言語を扱う研究は、ことごとく失敗に終わりました。だからこそ「統計」「確率」で自然言語処理を行うのが主流になったのです。

  余談ですが、このブログで以前にマイクロソフトやグーグルの機械翻訳チームの話を紹介しました(No.173「インフルエンザの流行はGoogleが予測する」参照)。

  グーグルの機械翻訳グループでは、メンバーの誰一人として話せない言語の翻訳に取り組んでいる。マイクロソフトの機械翻訳部門の統計専門家らは、「言語学の専門家がチームから去るたびに翻訳の質が上がる」と皮肉る始末だ。── 『ビッグデータの正体』(2013)からの引用

毎年バンクーバーで開催されるTED(Technology Entertainment Design)という会議があります。「広める価値のあるアイデア」を世界中から集めてプレゼンテーションが行われます。5日間ぶっ通しのチケットは150万円ですが、発売と同時に売り切れるそうです。新井教授は 2017年4月のTEDに招かれて講演したのですが、同じセッションに、代表的な質問応答システムである Siri の開発者であるトム・グルーバーがいました。


2017年4月にTEDに招かれて講演したとき、同じセッションにSiriのメインエンジニアであるトム・グルーバーがいました。当然、Siriがいかに言葉を理解するようになったかとういう内容の講演になるはずでした。意図したわけではありませんが、東ロボくんの講演で私が先にAIがどんな風に世界史の問題を解くかのネタバレをしてしまったので、トムはきっと話しづらかっただろうと思います。彼はそっと私に声をかけました。「紀子、君が言っていることは正しい。AIは意味を理解しない」 ───。

「同上」



以上のことからすると「人間の知性と同等ベルのAI = 真の意味でのAI」はまず無理なことがわかります。なぜかというと、まず人間の知能の原理が解明されていないからです。


(人間の知能の原理を数学的に解明して、それを工学的に再現するという方法は)原理的に無理だと、多くの研究者が内心思っています。なぜか。人間の知能を科学的に観測する方法がそもそもないからです。自分の脳がどう動いているか、何を感じていて、何を考えているかは、自分自身もモニターできません。文を読んで意味がわかるということがどういう活動なのかさえ、まったく解明できていないのです。

脳にセンサーを埋め込んでも残念ながらわかりません。センサーでモニタリングできるのは電気信号や血流などの物理的な動きだけです。しかも、それすら、動物実験でさえ厳しく制限されている現代に、健康な人の脳に直接センサーを埋め込むことなど到底許されません。「こういう原理で動いているのではないか?」という仮説を立てても、測定結果と比較して妥当性を検証しなければ話になりません。人間の知的活動をリアルに測定する方法がないのですから、人間の知能の科学的解明というスタートラインにすら立てないのです。

「同上」

AIはいくらそれが複雑になって、現状より遙かに優れたディープラーニングによるソフトウェアが搭載されても、所詮、コンピュータに過ぎません。コンピュータは計算機ですから、できることは計算だけです。計算するということは認識や事象を数式に置き換えるということです。

つまり「真の意味でのAI」が人間と同等の知能を得るには、私たちの脳が、意識無意識を問わず認識していることをすべて計算可能な数式に置き換えることができる、ということを意味します。しかし今のところ、数学で数式に置き換えることができるのは、論理的に言えること、統計的に言えること、確率的に言えることの3つだけです。そして、私たちの認識をすべて論理、統計、確率に還元することはできません。

脳科学が随分前に明らかにしたように、脳のシステムはある種の電気回路であることは間違いなさそうです。電気回路であるということは、on か off か、つまり 0 と 1 だけの世界に還元できることを意味します。基本的な原理は計算機と同じかもしれません。それが、「真の意味でのAI」や「シンギュラリティの到来」を期待させている一面はあると思います。けれども、原理は同じでも、脳がどのような方法で、私たちが認識していることを「0、1」の世界に還元しているのか。それを解明して数式に翻訳することができないかぎり、「真の意味でのAI」が登場したりシンギュラリティが到来したりすることはないのです。

「同上」

科学者は科学の限界に謙虚でなければなりません。それを新井教授は次のように言っています。


科学や技術とは「なんだかよくわからないけれども複雑なこと」を、数学の言葉を使って言語化し、説明していく営みです。それと同時に、言語化できなかったことを、痛みをもって記憶することでもあります。そして、前者以上に後者が大切です。

・・・・・・・・・・

言語化し数値化し測定し数理モデル化するということは、つまり「無理にかたづける」ことなのです。かたづかる腕力を持つのと同時に、そこで豊かさが失われることの痛みを知っている人だけが、一流の科学者や技術者たりうるのだと思います。

・・・・・・・・・・

私が科学者として肝に銘じていることがあります。それは、科学を過信せず、科学の限界に謙虚であることです。

「同上」


AI技術によって人間の仕事がなくなる


AIは以上のように限界があります。しかしその一方でAIは極めて強力な技術であり、東ロボくんはセンター模試で全受験生の80%より上にランクされるほどの実力を持ちました。オックスフォード大学「雇用の未来」では広範囲(約半分)の仕事がAI技術で置き換えられると想定しています(No.175「半沢直樹は機械化できる」参照)。

考えてみると「新しい発明や技術の登場で仕事がなくなる」のは今に始まったことではありません。むしろ人類の歴史はその繰り返しでした。新井教授も指摘しているのですが「便利になる」ということを突き詰めて考えると、それは「労働を置き換える」ということです。そして新技術は人類全体としては恩恵が多く、新技術の登場以前よりも社会がより豊かになってきました。そのことから「AI技術で無くなる仕事があったとしても、人類全体としてはそれを乗り越えてより豊かな世界を築いていけるに違いない」という楽観論があります。

しかし、そうとも言えないのです。その理由は2つあって、1つはAI技術で無くなると想定される仕事が極めて広範囲であることです。従来の新技術は特定の仕事が無くなるタイプでした。たとえば自動車が発明されて御者が無用になるといった ・・・・・・。それと比較してAI技術では全仕事の半数が無くなる(だろう)と予想されているのです。

2番目の理由ですが、AI技術でより豊かな世界になるためには「AIではできない仕事」や「AIで無くなる仕事に代わって新たに発生する仕事」に人が適応できることが必要ですが、そこに疑問があるからです。AIが不得意な仕事とは、コミュニケーション能力や読解力や常識が必要な仕事であり、加えて人間らしい柔軟な判断が必要な仕事です。


AIの弱点は、万個を教えられてようやく一を学ぶこと、応用がきかないこと、柔軟性がないこと、決められた(限定された)フレーム(枠組み)の中でしか計算処理ができないことなどです。繰り返し述べてきたとおり、AIには「意味がわからない」ということです。ですから、その反対の、一を聞いて十を知る能力や応用力、柔軟性、フレームに囚われない発想力などを備えていれば、AI恐るるに足らず、ということになります。

では、現代社会に生きる私たちの多くは、AIには肩代わりできない種類の仕事を不足なくうまくやっていけるだけの読解力や常識、あるいは柔軟性や発想力を十分に備えているでしょうか。常識の欠如した人が増えてきているのは嘆かわしいことですが、大半の人が持ち合わせていなければ、それはもはや常識とは言いませんから、常識や無意識の人間らしい合理的判断は大半の人が持ち合わせていることにしておきます。問題は読解力を基盤とする、コミュニケーション能力や理解力です。

「同上」

その大切な読解力が危機的な状況にあると、新井教授が明らかにしています。新井教授は東ロボくんのプロジェクトと並行して、中高生を対象にしたリーティング・スキル・テストを実施しました。その衝撃的な結果を次回に紹介します。



本書「AI vs.教科書が読めない子どもたち」の前半(AIについて)の感想ですが、No.196「東ロボにみるAIの可能性と限界」にも書いたように、

  大学入試(模試)という極めて具体的なチャレンジを通して判明したAIの強みと限界が実証的に書かれている

ことに好感しました。大学入試という限定した範囲だけれども、入試は人の知的な営みの成果を示す重要なシーンです。それをテーマにして実験をした結果をもとに論が展開されている。世の中には根拠も示さず「AIが人間の脳を越える」などと吹聴する論説がよくありますが、それらとは一線を画した本です。科学の基本的な方法論にのっとって書かれた本、そこに価値があると思いました。


nice!(1) 

nice! 1