SSブログ

No.235 - 三角関数を学ぶ理由 [社会]

No.233-4 で新井紀子著「AI vs.教科書が読めない子どもたち」の内容を紹介して感想を書いたのですが、引き続いてこの本の感想を書きます。

AI vs 教科書が読めない子どもたち.jpg
本書を読んで一番感じたのは「小学校・中学校・高校での勉強は大切だ」ということです。今さらバカバカしい、あたりまえじゃないかと思われそうですが、改めて「勉強は大切」と思ったのが本書を読んだ率直な感想です。それは、AI技術を駆使した東ロボくんの "勉強方法" や 模試の成績と関係しています。また本書で説明されている「リーディング・スキル・テスト」の結果とも関連します。なぜ勉強は大切と思ったのか、その理由を順序だてて書いてみます。

ここでは「勉強」の範囲を、東ロボくんがセンター模試と東大2次試験の模試に挑戦(2016年)した、国語・英語・数学・世界史・日本史・物理の科目とし、小中学校の場合はそれに相当する教科ということにします。もちろん学校での勉強はこれだけではありません。また各種の学校行事や部活も教育の一貫だし、何よりも集団生活をすることによる "学び" が大切でしょう。

以下、小中高校の「勉強」で我々は何を学ぶのか(学んだのか・学ぶべきか)を、何点かあげてみます。


論理的に考える


タイトルを「三角関数を学ぶ理由」としました。三角関数は現状の高校数学では数Ⅲであり、従って大学入試では理系ということになりますが、もちろん三角関数でなくてもいいし、また数学でなくてもかまいません。ただ、説明のしやすさの観点から数学を取り上げ、その例として三角関数から始めます。



下の図ですが、出発点は直角三角形による「三角比の定義」です。直角三角形なので、角度は 0°より大、90°未満です。その三角比を一般化したのが「三角関数の定義」です。角度の単位はラジアンで、その範囲に限定はありません。

三角関数の定義から「加法定理」を導くことができます。下図には加法定理が成り立つ理由の "図形的理解" を書きました。また加法定理からすぐに「和積の公式(和や差を積にする公式)」が導出できます。もちろんこれらは三角関数の定理や公式のごく一部です。

三角関数 図1.jpg
三角関数の微分ですが「sin x の微分が cos x になることを証明しなさい」と言われたらどうするか。下図では「和積の公式」を使って式を変形し、さらに三角関数の定義に立ち帰って sinθ/θ ⇒ 1(θ ⇒ 0)を証明して、sin x の微分が cos x になることの証明に使っています。
三角関数 図2.jpg
あたりまえですが、最初の定義から定理、公式、微分の証明までが、こうだからこうなるというように論理的にすべてつながっています。そのことを思い出すために、あえてここに書きました。



我々は社会のさまざまなシーンにおいて「論理的にものごとを考える」必要性が出てきます。人を説得したり自分の意見を主張するにも、"こうだからこうなる" という筋道が通った説明が重要です。ビジネスのシーンでも、分かりやすいプレゼンテーションをするにはスライドに書かれた主張内容の論理的なつながりが必須です。そして「論理的にものごとを考える」ための絶好の訓練になるのが、学校での数学の勉強です。数学は純粋に人間の考え出した論理だけでできているからです。そこが他の学問・勉強と違うところです。

三角関数を見てもわかるように、出発点となる定義(三角比)は大変にシンプルです。それが一般化され(三角関数)、定理が導かれ(加法定理)、そこから別の定理や公式が派生します(和積の公式)。実際に問題を解くときには(微分の証明の例)適用する定理・公式を選択し、ある時にはそもそもの三角関数の定義に立ち返って論理をつなげていくことになります。こういった定義・定理・公式の体系は、幹があり、そこから枝が伸び、その枝に葉がつくという構造になっている。そのような "ひとまとまりの体系" を学ぶことによって、我々は、

最も大切なことは何か、根幹は何か
そこから導かれる重要なことは何か
重要なことから派生して言えることは何か、それが成り立つための前提条件は何か

というように、段階的かつ論理的に考える訓練を自然にしています。この「原理・原則から始まって枝葉末節まで、階層的に整理された知識体系」は、社会のさまざまなジャンルに出てきます。数学を学ぶということは、そいういう風に頭を働かせる訓練をしていると考えられます。


曖昧に表現された問題を論理的に考える


数学の勉強は「論理的にものごとを考える」絶好の訓練ですが、No.233「AI vs.教科書が読めない子どもたち」で紹介した東ロボくんを振り返ってみたいと思います。

東ロボくんは東大2次試験の数学の模試(理系)で、偏差値 77.2 という驚異的な成績をあげました。これは問題文を数式に直訳し "数式処理" の技術で解くという、全く論理だけの処理でこの好成績をとったわけです。世界史や国語、英語などの教科が大量のデータを集めて統計処理で答えるのとは大きな違いです。No.233 で「正確で限定的な語彙からなる問題文であれば、論理的な自然言語処理と数式処理で解ける」としましたが、つまり、純粋な論理だけだとAIやコンピュータが得意なのです。

しかし現実社会や人生で与えられる "問題文" は「正確で限定的な語彙からなる」ものでは決してありません。そこには曖昧性があるし、解くために必要な情報が欠落しているし、また明示されていない "常識" が前提になっています。こういった現実社会の状況は、東ロボくんが最も苦手とするものです。しかし我々人間は、欠落している情報を補い、不足している条件には仮定を置き、あるいは推測を加えて "問題文" を読み解き、論理的に再構成することができる。それこそ人間の価値です。そのとき必要なのは、言葉をあやつる力に加えて「論理的にものごとを考える」能力です。曖昧性を排除した論理的な "問題文" にしてかつ論理的に答えるためには、それが必須なのです。

論理的思考の訓練のためには、学校における勉強では "論理しかない" 数学が最適でしょう。三角関数はその一つです。また数学における各種のジャンル(方程式、幾何、関数、・・・・・・)は、「論理的に考えることのさまざまな基礎的側面」を表しているのだと思います。


多くの情報を頭に詰め込み、それを自由に引き出せる


数学を離れて他の科目をみると、数学と並んで東ロボくんの得意科目に世界史がありました。No.233「AI vs.教科書が読めない子どもたち」で紹介した東大2次試験の世界史の模試は、次のような論述問題でした。

(東大2次試験:世界史模試)

17世紀の東アジアと東南アジア地域での海上交易の繁栄と停滞の変遷とその要因について、東アジアと東南アジア諸国の交易の方針とヨーロッパ諸勢力のこの地域をめぐる動向に留意しならがら600字で論じなさい。

新井 紀子
「AI vs.教科書が読めない子どもたち」
(東洋経済報社。2018.2)

大変に "難しそうな" 問題ですが、東ロボくんはこのような世界史の論述問題で偏差値 61.8 を獲得しました。

この問題の回答文を書くためには、どの時代の設問が出るわからないという前提で、まず世界史のさまざまな知識が頭の中に入っていなければなりません。かつ、それを各種の「引き出し」から取り出せるように整理した形で入れておく必要があります。「引き出し」とは、時代、地域、国、政治、経済、文化などの区分けです。上の問題でいうと

時代(17世紀)
地域(東アジア、東南アジア)
国(東アジア、東南アジア、ヨーロッパ諸国)
経済(海上貿易)
政治(貿易政策)

といった条件で知識を引っ張り出し、それを取捨選択して一連のストーリーにまとめ上げなければならない。また「論じなさい」となっているので、歴史上の事実を順に語るだけではなく、たとえばそれが次の時代にどう影響したかなどの「意味」を見つける必要があります。つまり答えるためには明らかに言葉を操る能力と論理的思考が必要です。しかし、その前にまず、

  歴史上の事項を暗記し、頭に中に整理したかたちで詰め込むことができる。それを各種の引き出しから自在に引き出せる。

ことが必須なのは明らかです。「頭に中に整理したかたちで」というのは「丸暗記」ではありません。教科書にある歴史記述の内容を理解し、それで得た「知識」を記憶することです。この東大の2次の問題はあくまで大学入試であり、また大学入試の中でも高校3年生にとっては非常に難しい問題でしょう。しかし我々が社会で生きていくことを考えると、

  それなりに多くの情報を、比較的短期間で頭の中に知識の形で詰め込み、かつ、それを自在に引き出す必要性

は、さままなシーンで出てきます。今、世界史の話をしましたが、世界史に限らず小中高校の勉強科目には、多かれ少なかれ「暗記」が必要です。子どもたちはさまざまなタイプの「暗記」をすることによって、社会で生きていくための訓練をしていると考えられます。

新井 紀子著「AI vs.教科書が読めない子どもたち」にあったように、東ロボくんは意味を解しません。意味が理解するのが人間であり、そこにこそ人間の価値があります。しかし現実の人間の活動は、東ロボくんのように「意味を関知しない情報処理」で行っていることが多々あります。センター試験で東ロボくんが "結構当たる(世界史では平均的な受験生以上に当たる)" ように、それで問題ないケースも多い。多忙な現代社会においては、いちいち意味を考えている余裕はありません。もちろん重要な問題、大切な問題、意志決定の必要な問題には、論理的思考とともに "意味" を十分に考えるわけです。だけど「意味を関知しない情報処理」もまた多い。その前提として「知識として暗記する力」が必要です。

学校で履修する科目のうち、特定の科目を「暗記科目」だとして "小馬鹿にする" 子どもがいたとしたら、大変可哀想な子だと思います。


提出された問題の意図を推察できる


東ロボくんが受験した東大2次試験の世界史模試をもう一度考えてみます(上の引用)。ここで「論じなさい」という設問を回答にどう盛り込むかです。考えるべきことは「問題の出題者はどういう意図でこの問題を出したのだろう」ということです。問題出題者が受験生に「論じて欲しい」論点があると考えられます。それはもちろん一つではないし、模範回答があるとしたら複数あるはずです。問題出題者は何を期待しているのか。たとえば上に書いたように、東アジア諸国の貿易が国の政策によって停滞に向かい、それがヨーロッパ諸国との関係において18世紀~19世紀に重要な影響を与えた(=次の時代とのかかわり)というのも、論点の一つでしょう。

センター試験の3択・4択問題のように、答が明白に一つに決まる問題は別です。しかし一般的にテストの問題の中には、問題の意図を推察することが大切なものがあります。こういった「意図の推察」はテストだけでなく、教室での先生の質問に答える場合も同じです。そして「質問の意図を推察する」のは社会においては大変に重要です。

質問や与えられた課題の意図はなにか、それを推察して我々は回答しようとします。たとえば企業において上司から「我が部門のこの10年の売上げと損益を分析した資料を作ってほしい」と言われたとき、それが「大変伸びている」という観点にするのか(対外報告資料など)、伸びが鈍化していて危機感を持つべきだという観点にするのか(部門内資料など)で作り方が全く違ってくるでしょう。同じ数字を使っても内容が違う資料になる。そもそもの課題の意図が何かによります。

出題者(質問者)はどういう回答を欲しいのか、それを推察して答えることを我々は始終やっているし、それは社会人としての重要なスキルです。


言葉の多様な側面を使いこなせる


我々は言葉で思考しています。言葉の多様な側面を使いこなせることが生きていく上で大切です。学校の教科の「国語」は言葉(日本語)の基礎の訓練ですが、その他の科目も(英語以外は)日本語で学習します。国語と数学と歴史の教科書に使われている日本語はずいぶん用語の種類が違うし、言葉の使い方や記述のスタイルが違います。我々はそういった勉強を通して日本語(=自然言語)の多様な側面に触れているのだと考えられます。

一方、数学には数式や図形が頻繁に出てきます。また各種のグラフは数学だけでなくいろいろな教科に出てきます。今後はコンピュータのプログラム言語も出てくるでしょう。こういった、数式、図形、グラフ、プログラムなどは、自然言語を拡張した、いわば "人工の言語" です。自然言語では表しにくい(伝えにくい)事項を簡潔に(かつ厳密に)表現するためのものです。このような人工の言語までを含めて「広い意味での言葉」と考えられるでしょう。

その "言葉" の視点から考えてみると、我々は文字でしるされる「書き言葉」が「話し言葉」とは違うことを理解しています。文章でしか使わない表現がいっぱいあるからです。それは理解しているものの、我々は暗黙に「会話・発声を正確に記録として残すために文字が出来た」と思っているのではないでしょうか。

しかし文字発祥の歴史はそうではありません。メソポタミアのシュメール人が作った世界最古の文字で書かれた初期の記録は、作物の出来高や徴税記録などの実用文書です。会話・発声では表現できないもの、あるいは表現しにくいものをしるそうとしたのが、歴史や神話や物語を記述する以前の文字の発端なのです。

その意味で、現代の学校の学習に出てくる各種の記号、絵文字、グラフ、数式、表、図、図形、プログラムなどは「拡張された言語」といえるでしょう。つまり広い意味での言葉です。我々は学校で「広い意味での言葉」を駆使する能力を学ぶのです。

その具体例をあげると、No.234「教科書が読めない子どもたち」で紹介した「リーディング・スキル・テスト」で「イメージ同定」がありました。文章を読んでその内容を表している図やグラフを答えるものですが、これは東ロボくんが苦手な(というより不可能な)ものでした。「イメージ同定」という基礎的読解力は社会において重要です。それは人にわかりやすく伝えるために的確な図やグラフを作れる能力でもある。図やグラフはさまざまな教科に出てきますが、「イメージ同定」も広い意味での言葉を使いこなすことだと思います。

この「イメージ同定」に限らず、リーディング・スキル・テストは日本語を操る能力のうちの「基礎的読解力」をテストするものでした。その基礎的読解力が子どもたちの「伸びしろ」を決めてしまうと、新井紀子著「AI vs.教科書が読めない子どもたち」にありました。ということは「言葉を使いこなす能力が子どもたちの将来を左右する」とも言えるでしょう。


なぜそうすべきか、理由が分からないことに真摯に取り組める


三角関数なんて勉強しても役にたたない、サイン・コサインなんて使い道がない、だから勉強しないという子どもがいたとします。また「入試に出るから仕方なしに勉強している」と思っている子がいたとします。

確かに、高校を卒業して以降は三角関数の使い道は限定的です。大学の理系の学部であれば出てくるし、ものづくり系の企業の設計部門でも必要でしょう。しかしその必要性は、高校生の全体からすると少ないと考えられます。また必要だとしても、高校で習う三角関数の定理・公式などのすべてが必要な訳ではありません。

三角関数はあくまで例ですが、問題は「この勉強は役に立たない、だから学ばない、ないしは適当にやり過ごす」という考え方です。ないしは「自分にとって利益があるか無いかで勉強を判断する態度」です。

この「学ぶべき理由が理解できるものしか学ばない」という考えが、人生において「何かを修得する」ことを阻害し、結局何も修得できないことになるのですね。

大変に逆説的ですが、人生における学習は学んだあと、あるいは学んでからかなりの時間がたってから学ぶべき理由が分かるというタイプが多いのです。その理由は学習に励んで自分を向上させ、その向上した視点で考えないと学ぶべき理由が分からないからです。あるいは学ぶべき理由が分かるようになることが、学ぶことの大きな目標の一つだからです。

人生において学ぶということはそういうことであり、特に人生で "大切な学習" はそうです。三角関数を例にして学ぶことの大切さ(この場合は "論理的にものごとを考える")を言いましたが、それは大人になった立場だからそう言えるのであって、高校生に真に理解してもらうのは大変でしょう。高校生相手に説明することを考えるとそう思います。



まったく別の例を一つあげますと「素読」という教育方法があります。江戸時代以降、戦前までは「漢文の素読」が教育の重要なものでした。素読とは文章(特に名文とされているの)を声をあげて読むことです。文章の意味はひとまず無視し、ただ単純に読みあげる。

東ロボくんは素読はしませんが、これは現在のAI技術で非常に進んでいる分野です。いわゆる「テキスト読み上げ」であり、テキストだけから極めて自然な、人間と見分けがつかない音声を合成できます。

漢文の素読は今はありませんが、最近の学校や塾では素読を取り入れているところがあるようです。夏目漱石の小説や、滝廉太郎の「荒城の月」のような詩を素読させたりしている。小学生だと意味が分からない単語がいろいろ出てくるでしょう。AI技術で完璧にできる素読を小学生にやらせることにどういう効用があるのか。

それは日本語の文章(名文)のリズムを体に染み込ませることだと思います。村上春樹さんは次のよう言っています(No.135「音楽の意外な効用(2)村上春樹」参照)。

[村上春樹]

(文章で)いちばん何が大事かっていうと、リズムですよね。文章にリズムがないと、そんなもの誰も読まないんです。前に前にと読み手を送っていく内在的な律動感というか ・・・・・・。機械のマニュアルブックって、読むのがわりに苦痛ですよね。あれがリズムのない文章のひとつの典型です。

小沢征爾・村上春樹
『小澤征爾さんと、音楽について話をする』
(新潮社 2011)

リズムとは「言葉の組み合わせ、センテンスの組み合わせ、パラグラフの組み合わせ、均衡と不均衡の組み合わせ、句読点の組み合わせ、トーンの組み合わせ」だと、村上さんは言っています。この発言の主旨は、その大切なリズムを音楽から学んだということですが、それはさておきます。音楽を持ち出す以前に、名文を素読して体に覚え込ませることは、リズムがある読みやすい文章を書くための訓練になるはずです。

別に小説家になるためというのではありません。人生においては「読みやすい文章を書く」ことはその人のスキルとして重要です。村上さんも言っているようにマニュアルブックを書くにも必要だし、そこまでいかなくても文章を書く必要性は社会において多々あります。

小学生を相手に「文章には、前に前にと読み手を送っていく内在的な律動感が重要で、そのために素読をやるのだ」と言ったところで、理解されないでしょう。それは大人になってからしか分からないし、大人になったとしてもそういう意識は全くないかもしれないのです。文章を書くことが身についてしまっている人にとっては ・・・・・・。



なぜそうすべきか、理由が分からないことに真摯に取り組めることは大変重要だと思います。「自分にとって有益だと理解できることを勉強する」のは "あたりまえ" です。「自分にとって有益だと分かっていても勉強しない」のは "怠惰" です。しかし大切なのは「自分にとって有益なことを勉強するのはもちろん、自分にとって有益かどうか分からないことでも勉強する」ことなのです。


社会が要請することに、まじめに取り組める


社会が成り立つためには「社会が要請することに個人がまじめに取り組む」ことが必要です。社会を構成するのは、国から始まって自治体に至る組織、企業、地域のコミュニティー、非営利団体などがありますが、そこには多かれ少なかれ個人に対する要請がある。

もちろん社会が要請しないことに取り組むこともあります。例えば今までに全くなかった仕事を発案し、ベンチャー企業(スタートアップ)やNPO法人を立ち上げるなどがそうです。それは社会の活力を生み、経済を成長させる上でも大変に重要ですが、これも社会の要請にまじめに答えている多数の人たちがバックにいるからこそ成り立つわけです。自分がやりたいことをやるというマインドは大切ですが、全ての人がやりたいことをやったのでは社会が成立しません。

小中高校における勉学は、現代の日本社会が6歳~18歳の子どもたちに要請していることです。なぜ勉強をすべきかはともかく、先生から言われたらまずそれにまじめに取り組む(取り組める)姿勢が大切です。

もちろん社会の要請に従順に従っているだけでは個人の進歩は望めないし、組織も発展しません。しかしまず "従順さ" をもってこなせることが社会の維持と発展には是非とも必要です。



さらに考えてみると小中高校の勉強は、少なくとも日本に生まれた日本国籍の人が "似たような経験をする" ことにこそ意義があるのかもしれません。もちろん学校によって(ないしは、公立か私立かによって)勉強の内容は違う部分があるでしょうが、それらは文科省の学習指導要領に沿っている "似たような勉強" です。また時代によっても勉強内容は変わりますが、何十年と "似たような勉強" をしてきた部分も多いのではないでしょうか。

このことは実は、日本人としてのアイデンティティーを育成するのに役立っていると思います。それは愛国心のあり方などという "高尚な" こと以前の問題です。しょせん現代人は国民国家の枠で生活をしていくのだから、政治信条の違い、地域の違い、年代の違いを超えた、国民としての何かしらの "一体感" が必要です。その一体感は何らかの "認識" や "体験" を共有していることから始まるはずです。小中高校の勉強や学校生活はその "体験" の一つだと思います。

わかりやすい例で言うと、誰もが知っている歌は小学校で習った曲であり、誰もが知っている絵画作品は中学の美術の教科書に出てきた絵、ということがあるのではないか。また多くの人が「京都・奈良へ修学旅行に行った」という共通体験を持っています。これは日本人だけの共通体験なのですね。国語、数学、歴史などの科目も「勉強という共通体験」の意味があると思います。

教育は時代とともに変わることも必要ですが、変わらないこともそれ以上に重要だと思います。50年前と似たような勉強をするということは、祖父母と孫の代が同じ経験をするということです。生活スタイルは50年前とは激変しているにもかわらず、勉強はそう違わない。そこが大変に重要だと思います。そして、こういったことの重要性 = 勉強をすべき理由は、小中高校生の段階では分からなくて当然です。つまり、分からなくても真面目に取り組むべきなのです。


努力を継続できる


もうひとつ、小中高校の勉強で獲得できる(獲得すべき)スキルを言うと、前回(No.234)にも少し書きましたが「努力を継続できる能力」でしょうか。あたりまえですが、テストで良い点を取るためには努力が必要です。やりたいことを我慢し、安易な方向に流れることがないようにし、参考書や問題集に取り組み、それを反復する必要があります。

そういう努力が苦にならないこと、また、努力することの価値や大切さが直感的に理解できることは人生にとって極めて大切でしょう。そういうマインドの醸成に勉強が知らず知らずのうちに役だっている、そう思います。


スターバックスで働くとしたら


唐突ですが「スターバックスで働く」ということと「学校での勉強」の関係を考えてみたいと思います。というのも、今この文章をスターバックスのある店で書いているからです。スターバックスで働きたいと思い、面接に合格し、研修を受け、店舗で働き出すとします。その過程でどういうスキルが必要かを考えてみます。

スターバックスの内情は知らないので(いわゆる "スタバ本" は読んだことがありません)想像で書くと、スターバックスでは接客方法、ドリンクやフードの提供方法、店舗運営などについてのマニュアルがあると想定できます。それはまず重要な心構えから始まって、基本事項から詳細へとブレークダウンされているはずです。接客だけでもシチュエーションはさまざまです。混雑時にどうするか、クレームへの対応、顧客からの要求・要望への対応など、細かいことやスペシャルケースまで、いろいろとあるはずです。どこまで明文化されているかは知りません。明文化されていない各店舗なりのルールがあるのかもしれません。

一つだけ公開されている情報があります。それはスターバックス・ジャパン(正式名:スターバックス コーヒー ジャパン)のホームぺージの「Our Mission and Values」というページです。ここには

  すべてのお客様へ最高のスターバックス体験(感動体験)を提供できるように行動指針を定め、日々体現しています

という前置きがあって、Our Mission と Our Values が書かれています。その Our Values のところには次のようにあります。


Our Values

私たちは、パートナー、コーヒー、お客様を中心とし、Values を日々体現します。

お互いにこころから認め合い、誰もが自分の居場所と感じられるような文化を作ります。

勇気をもって行動し、現状に満足せず、新しい方法を求めます。スターバックスと私たちの成長のために。

誠実に向き合い、威厳と尊敬をもって心を通わせる、その瞬間を大切にします。

一人ひとりが全力を尽くし、最後まで責任を持ちます。

私たちは人間らしさを大切にしながら、成長し続けます。


これはスターバックス・ジャパンがどういう「価値」を大切にしているかを宣言した文章です。ちなみに、ここに出てくる「パートナー」は "スタバ用語" というのでしょうか、正社員かアルバイトかにかかわらず「ともに働く仲間」という意味です(協力企業や仕入先の意味ではない)。こういう文章は初めの方に出てくる言葉ほど重要なのが一般的です。特徴的な言葉をピックアップして、かみ砕いて言うと、

私たちの目的は、お客様へ "スターバックス体験(=感動体験)"を提供することである。

その中心になるのは、パートナー(ともに働く仲間)とコーヒー(商品、ないしはサービス)、お客様である。

誰もが自分の居場所と感じられるような場所を作る。店舗が「自分の居場所」と感じられるような「スターバックス文化」を作る。

などです。ひとつのポイントは初めの方に出てくる "パートナー" でしょうか。また、誰もが(=お客様とパートナーが)自分の居場所と感じられるというところ、いわゆる「第3の場所、サード・プレイス」です。さらに、私たちはこう行動しますという言い方(=行動指針)で大切にしている「価値」を表現しているところもポイントです。

スターバックス・ジャパンが優秀な企業であれば(優秀な企業だと思いますが)、ここで宣言された Our Values がマニュアル(接客・商品提供・店舗運営など)の重要事項と直結しているはずだし、その重要事項にもとづいて細部が展開されているでしょう。スターバックスで働くためのスキルは、まず、そういった一連の情報を知識として短期間に(研修期間中に)修得できるスキルです。そして、店舗においてはマニュアルにそった行動をし、マニュアルに出てこないようなレアな状況に遭遇したときには守るべき心構えに沿って行動し、それでも迷ったら Our Values に立ち返って判断することです。

そういうことができるための基礎的なスキルは、実は、学校における勉強で得られるスキルと非常に似ていると思います。論理的に考えるとか、知識としていつでも引き出せるようにな形で情報を頭に入れるとか、そいういった基礎的なスキルです。Our Values にあるように「現状に満足せず、新しい方法を求める」にしても、まず基礎が必須です。"現状" をきっちりとこなせて初めて "新しい方法" が求められるのだから。

もちろん以上のようなことはスターバックスで働く場合だけでなく、社会のさまざまなシーンに出てくるのは、言うまでもありません。


AIと共存する時代


小中高校での各教科の勉強は、一見、社会で役立たないように見えるものがあるかもしれないけれど、実は我々が社会で一定のポジションをこなしていく上での極めてベーシックなスキルを育成しているのだと思います。そしてここが大切なのですが、小中高校での勉強で得られるものは、東ロボくん(AI)と共存していく必要がある現代人にとって、今まで以上にますます重要になると強く思います。新井紀子著「AI vs.教科書が読めない子どもたち」の最大の教訓は、そのことなのでした。




nice!(0) 

No.234 - 教科書が読めない子どもたち [社会]

前回より続く)

前回に引き続き、新井紀子著「AI vs.教科書が読めない子どもたち」(以下「本書」)の紹介と感想です。本書は前半と後半に分かれていて、前半のAIの部分を前回紹介しました。今回は後半の「リーティング・スキル・テスト」の部分です。


リーティング・スキル・テストの衝撃


AI vs 教科書が読めない子どもたち.jpg
新井教授は日本数学会の教育委員長として、東ロボがスタートした2011年に大学新入生を対象とした「大学生数学基本調査」を行いました。その結果、問題が解けないのは問題文の意味を理解できていない(=読解力がない)のではという疑問をもちました。そして本格的に中高生を対象とした読解力調査をすることにしました。

リーティング・スキル・テスト(RST。Reading Skill Test)は新井教授が主導して行った世界で初めての調査です。RSTとはどんなテストか、本書にその問題が例示してあります。問題は「係り受け」「照応解決」「同義文判定」「推論」「イメージ同定」「具体例同定」の6つのジャンルがあります。それがどういうものか、問題のサンプルを本書から引用します。

 係り受け 


次の文を読みなさい。

天の川銀河の中心には、太陽の400万倍程度の質量をもつブラックホールがあると推定されている。

この文脈において、以下の文中の空欄にあてはまる最も適当なものを選択肢のうちから1つ選びなさい。

天の川銀河の中心にあると推定されているのは(   )である。

天の川 ②銀河 ③ブラックホール ④太陽


「係り受け」とは、主語と述語の関係、修飾語と被修飾語の関係のように、一つの文の中で単語がどの単語に "係る" か、ある単語がどの単語を "受ける" か、を問うものです。係り受けをAIで判定する研究は進んでいて、80%以上が可能と本書にあります。

 照応解決 


次の文を読みなさい。

火星には、生命が存在する可能性がある。かつて大量の水があった証拠が見つかっており、現在も地下には水がある可能性がある。

この文脈において、以下の文中の空欄にあてはまる最も適当なものを1つ選びなさい。

かつて大量の水があった証拠が見つかっているのは(   )である。

火星 ②可能性 ③地下 ④生命

「同上」

文章には「これ」「それ」といった指示代名詞、あるいは人称代名詞が出てきます。その代名詞が何を指しているのかを、文をまたがって判断するのが「照応解決」です。日本語の文章でしばしば見られるように、上の文章には指示代名詞がありませんが「(ここには)かつて大量の水があった証拠が見つかっており」と省略されているとし、「ここ」を答える問題と考えると照応解決になります。照応解決は AI の研究が急速に進んでいる分野です。

しかし急速に進んでいるといっても、AIにとって難しい問題であることは変わりません。たとえば、次の2つの文があったとします。

① このハサミは私のペンシルケースに入らない。それが小さ過ぎるからだ。
② このハサミは私のペンシルケースに入らない。それが大き過ぎるからだ。

①の「それ」はペンシルケースですが、②の「それ」はハサミです。つまりこの例では「モノの大小」と「入る・入らない」の関係という "知識" をAIに教え込まないと正解できないのです。これはほんの一例であり、このような例が膨大にあることは明白です。

 同義文判定 


次の文を読みなさい。

義経は平氏を追いつめ、ついに壇ノ浦でほろぼした。

この文が表す内容と以下の文が表す内容は同じか。「同じである」「異なる」のうちから答えなさい。(引用注:原文は縦書きのため "この文" ではなく "右の文")

平氏は義経に追いつめられ、ついに壇ノ浦でほろぼされた。

同じである ②異なる

「同上」

同義文判定はAIではまだまだ難しい問題です。というのも、上の2つの文でも分かるように同義文の問題においては、同じ意味でも異なる意味でも出現する重要な単語がほぼ同じだからです。

そして以下の「推論」「イメージ同定」「具体例同定」は、現在のAI技術では全く歯が立たない問題です。AIは意味を理解せず、また常識をもっていないからです。この3つは「人間がAIに勝てる可能性のある」ジャンルです。

 推論 


次の文を読みなさい。

エベレストは世界で最も高い山である。

この文に書かれたことが正しいとき、以下の文に書かれたことは正しいか。「正しい」、「まちがっている」、これだけからは「判断できない」のうちから答えなさい。

エルブルス山はエベレストより低い。

正しい ②まちがっている ③判断できない

「同上」

「推論」は文章の構造を理解した上で、生活体験やさまざまな知識を総動員して文の意味を理解する力です。いわば「一を聞いて十を知る」能力であり、現代のAI技術では困難な問題です。「エルブルス山」というのは(ほとんどの)中高生が知らない(であろう)山です。実はエルブルス山は黒海とカスピ海の間にある山で、ロシアの最高峰です。もちろんエベレストより低い。それを知らなくても推論で答えるのがこの問題です。

高校3年ぐらいになると「エルブルス山」が実在の山なのか、それとも架空の山なのかによって答えが違ってくると考えるかもしれません。もし実在の山だと「①正しい」が正解です。しかし架空の山、たとえばファンタジー小説に出てくる山だと問題文だけでは「③判断できない」となる可能性があります。しかしここで「問題を作った側の意図」を推察し、これが1つを選ぶ3択問題だということを考える必要があります。もし「③判断できない」が正解だとすると「引っかけ」問題に近く、基礎的読解力を試す問題ではなくなります。エルブルス山は実在の山だと「推論」でき、「①正しい」が唯一の正解です。

 イメージ同定 


次の文の内容を表す図として適当なものをすべて選びなさい。

四角形の中に黒で塗りつぶされた円がある。

RST - イメージ同定.jpg
「同上」

イメージ同定は文章と図やグラフを見比べて、内容が一致しているかどうかを認識する能力です。現在のAI技術では全くできないものです。

 具体例同定 


次の文を読みなさい。

2で割り切れる数を偶数と言う。そうでない数を奇数と言う。

偶数をすべて選びなさい。

65 ② 8 ③ 0 ④ 110

「同上」

具体例同定は、定義を読んでそれと合致する具体例を認識する能力です。定義には国語辞典的な定義と数学的な定義があり、上は数学的な定義の例です。意味を理解しないAIでは全く歯が立たない問題です。



以上の6つのジャンルは、東ロボくんのプロジェクトにおいてAIに読解力をつけるための研究から生まれたものです。また問題に使った文章は、教科書と新聞(科学面や小中学生向けの記事)から採用されました。それが読解できないと人生において明らかに不利になるからです。

問題は各ジャンルで数百問作成され、受検者はパソコンで回答します。問題は各受検者に対してジャンルごとにランダムに表示され、かつ制限時間の間に順に解いていきます。ある受検者は20問解き、ある受検者は5問といった具合です。

問題が妥当かどうかの検証もされました。つまり多数の受検者のデータを集め、ジャンルごとに個々の受検者の「能力値」を6段階で決めます。「能力値が高いほど正解率が高まる」というシンプルな関係になれば、その問題は妥当ということになります。またヤル気がなくていいかげんに答える受検者を判別するしかけ(作問上の工夫や、受検者の回答パターンや回答時間からの推定)もあります。以下に掲げる正答率は、まじめに答えていないと判断された受検者を除いた値です。

テストを受けた人は総計25,000人にのぼりました。その結果は衝撃的です。その問題の例を以下にいくつか上げます。


宗教問題(係り受け)



次の文を読みなさい。

仏教は東南アジア、東アジアに、キリスト教はヨーロッパ、南北アメリカ、オセアニアに、イスラム教は北アフリカ、西アジア、中央アジア、東南アジアにおもに広がっている。

この文脈において、以下の文中の空欄にあてはまる最も適当なものを選択肢のうちから1つ選びなさい。

オセアニアに広がっているのは(   )である。

ヒンドゥー教 ②キリスト教 ③イスラム教 ④仏教

「同上」

正解はもちろん「②キリスト教」ですが、この問題の正答率は以下のとおりでした。

「宗教問題」の正答率


中学1年(197名) 63%
中学2年(223名) 55%
中学3年(203名) 70%
平均(623名) 62%


高校1年(428名) 73%
高校2年(196名) 73%
高校3年(121名) 66%
平均(745名) 72%

この結果の理解について、新井教授は次のように書いています。


中学生の3人に1人以上が、高校生の10人に3人近くが正解できなかったと理解すべきだと私は考えます。この問題に解答した745人の高校生が通っているのは進学率ほぼ100%の進学校です。私が講演に伺ったことのあるいくつかの高校の結果で、90分間AIの話を興味深く静かに聞くことができる高校生が受検者です。他の高校でこの問題の正答率も調査したかったのですが、新聞やTEDなどでこの問題が有名になってしまい、調査に使うことはできなくなってしまいました。因みに、国語が苦手な東ロボくんは、この問題に正解しました

「同上」


Alex問題(係り受け)



次の文を読みなさい。

Alex は男性にも女性にも使われる名前で、女性の名 Alexandra の愛称であるが、男性の名 Alexander の愛称でもある。

この文脈において、以下の文中の空欄にあてはまる最も適当なものを選択肢のうちから1つ選びなさい。

Alexandra の愛称は(   )である。

Alex ②Alexander ③男性 ④女性

「同上」

この問題は中学校の英語の教科書の註からとられたものです。もちろん「①Alex」が正しいのですが、その正答率は次の通りでした。

「Alex問題」の正答率


中学1年(68名) 23%
中学2年(62名) 31%
中学3年(105名) 51%
平均(235名) 38%


高校1年(205名) 65%
高校2年(150名) 68%
高校3年(77名) 57%
平均(432名) 65%

高校生の3分の1は不正解であり、中学生の正答率は半分を切っています。中学1年生の正答率は23%ですが、この問題は4択なので、あてずっぽうで答えても25%の正答率になります。つまりこの成績は「ランダム並み」「サイコロ並み」ということになります。

なぜこうなるのかが分析されています。つまり受検者の能力値で回答の傾向をみると、能力値の低い子は「④女性」を選ぶ傾向にあります。その理由は「愛称」という言葉の意味が分からず、それを飛ばして読んでいるのだと推測できます。つまり「Alexandra は女性である」は正しい文章だから「女性」と答えてしまう。そういう「読み」の習慣がついてしまっている。

思うのですが、文章をちゃんと読む習慣がついていると、たとえ「愛称」の意味が分からなくても正解できます。「愛称」のところを伏せ字にした問題を作ってみると、

次の文を読みなさい。〇〇にはある同じ言葉が入ります。

Alex は男性にも女性にも使われる名前で、女性の名 Alexandra の〇〇であるが、男性の名 Alexander の〇〇でもある。

この文脈において、以下の文中の(   )にあてはまる最も適当なものを選択肢のうちから1つ選びなさい。

Alexandra の〇〇は(   )である。

伏せ字で、かつ選択肢がなくても正解は「Alex」しかありません。たとえ一部の単語の意味が分からなくても、文の構造を理解して大意をつかむというのは、人が社会で生きていくための大変に重要なスキルです。しかしそういった「読み」の習慣がついていないのです。逆にいうと、読解力をつけるための処方箋のヒントがここにあると、新井教授は示唆しています。

この問題は「係り受け」の中でも正答率が低い問題です。「係り受け」全体の正答率は中学生が約70%、高校生が80%です。国語が苦手な東ロボくんは、だいたい高校生程度です。ただし東ロボくんは文の意味を理解しているわけではありません。それでも高校生程度には「当たる」のです。

少しは背筋に寒気を覚えていただけましたか ?」と、新井教授は書いています。


ポルトガル人問題(同義文判定)



次の文を読みなさい。

幕府は、1639年、ポルトガル人を追放し、大名には沿岸の警備を命じた。

上の文が示す内容と、以下の文が表す内容は同じか。「同じである」「異なる」のうちから答えなさい。

1639年、ポルトガル人は追放され、幕府は大名から沿岸の警備を命じられた。

「同上」

答えは当然「異なる」ですが、AIにとっては結構難しい問題です。2つの文に出てくる単語がほぼ同じだからです。では人間の方が優秀かというと残念ながらそうではないのです。ポルトガル人問題の正答率は次の通りです。

「ポルトガル人問題」の正答率


中学1年(301名) 56%
中学2年(270名) 61%
中学3年(286名) 55%
平均(857名) 57%


高校1年(627名) 71%
高校2年(360名) 71%
高校3年(152名) 76%
平均(1,139名) 71%

中学生の正答率は 57% しかありません。残りの43%の子どもは「一人で教科書を読んで勉強する」ということが出来ないでしょう。


円の問題(イメージ同定)



次の文の内容を表す図として適当なものを①~④のうちからすべて選びなさい。

原点 O と点 (1, 1) を通る円が x 軸と接している。

RST - 円の問題.jpg
「同上」

正解は①(=①だけ)ですが、このようなイメージ同定は、現在のAI技術では全く歯が立たない問題です。しかし人間には簡単なはずです。何も難しいことは聞いていないからです。数学の試験には絶対に出ないような "簡単な問題" です。しかし大変な結果になりました。

「円の問題」の正答率


中学1年(145名) 10%
中学2年(199名) 22%
中学3年(152名) 25%
平均(496名) 19%


高校1年(181名) 29%
高校2年(54名) 30%
高校3年(42名) 45%
平均(277名) 32%

この「円の問題」の正答率は他の問題とは傾向が違います。能力値で受検者を6段階に分けたとき、他の問題は能力値が高いほど正答率が上がるのですが、「円の問題」に限っては、能力値の中位(4以下)までは正答率が低いままであり、上位(5と6)になってようやく正答率が上がるのです。本書ではこのタイプの問題を「能力上位層をよく識別する問題」と呼んでいます。


AIが不得意な問題は、人間も不得意


RSTの結果をまとめた最新データが本書に載っています。小学6年から高校2年までのデータですが、その正答率を範囲で示してみたのが下の表です。小学6年が一番低く高校2年が一番高いのが普通ですが、一部に逆転現象もあります(ただし、有意な差ではない)。

RST問題 正答率
係り受け 65.1%~81.5%
照応解決 58.2%~82.6%
同義文判定 62.1%~81.0%
推論 57.3%~68.5%
イメージ同定 30.9%~55.3%
具体例同定(辞書) 31.0%~46.9%
具体例同定(数学) 19.6%~45.7%

この表には注意が必要です。RSTは選択式問題ですが、選択肢の数が問題によって違うからです。たとえば同義文判定は「同じ」「異なる」の2択なので、ランダムに答えても50%の正答率になります。本書にはそれを考慮して「ランダム並みよりましとは言えない受検者のパーセンテージ」示して分析してあるのですが、省略します。本書の分析の結論を要約すると以下になるでしょう。

表層的な読解力である「係り受け」「照応解決」成績が比較的良い。しかしこの分野ではAIも好成績がとれる。

AIと差別化しなければならないはずの「同義文判定」「推論」「イメージ同定」「具体例同定」の成績は、中高生も悪い。

こういった基礎的読解力は高校卒業までに出来上がります。つまり、RSTでみる限り「AIができないタスクやAIが難しいタスクは、人間にとっても難しい」と予想されるのです。


御三家の教育法は参考にならない


基礎的読解力を測定するRSTの問題は、上に掲げた例題でもわかるように "非常に基礎的な" ものです。こんな問題は中学入試にもまず出ません。従って「基礎的読解力がないよりはある方がいいに決まっているが、そんなに大騒ぎするほどのことでもない」と考える人もいます。しかし、その考えは甘いのです。基礎的読解力と高校の偏差値の相関関係を分析した表が本書に載っています。


これは(引用注:本書に載っている表をさす)、RSTを受検した高校の平均能力値と「家庭教師のトライ」と「偏差値net」が公表しているその高校の偏差値との相関を示したものです。RSTのほとんどの分野で 0.75 から 0.8 の相関があります。こんなに高い相関は、「身長と体重」とか「同じ広さのマンションの、駅からの距離と家賃」のようなもの以外では滅多にお目にかかれないほどの高い相関です。

さて、解釈は2つに一つです。「偏差値の高い高校に入ると基礎的読解力が上がる」か「基礎的読解力が高いと偏差値の高い高校に入れる」のどちらかです。前者はあり得ません。なぜなら、高校1年と2年の間に能力値の差が見られないからです。まさか基礎的読解力だけで高校入試を突破できるとは考えにくいので、もっとも正しい解釈は「基礎的読解力が低いと、偏差値の高い高校には入れない」でしょう。当然です。基礎的読解力がなければ、教科書だけでなく、試験問題の問題文も速く正確に読めないからです。

「同上」

さらに分析を進めると、高校の基礎的読解力の平均値とその高校の旧帝大進学率に高い相関があることもわかりました。旧帝大とは、東大・京大・東北大・阪大・名大・北大・九大の7つの国立大学です。


その事実を確認した私は、「御三家」と呼ばれるような超有名私立中高一貫校(引用注:首都圏男子校では開成・麻布・武蔵のこと)の教育方針は、教育改革をする上で何の参考にもならないという結論に達しました。理由がわかりますか? そのような学校では、12歳の段階で、公立進学校の高校3年生程度の読解能力のある生徒を入試でふるいにかけています。実際にそのような中学の入試問題を見ればわかります。まさにRSTで要求するような文を正確に、しかも集中してすらすら読めなければ、スタート地点に立つことさえできないように作られているのです。

そのような入試をパスできるような能力があれば、後の指導は楽です。高校2年まで部活に明け暮れて、赤点ぎりぎりでも、教科書や参考書を「読めばわかる」のですから、1年間受験勉強にいそしめば、旧帝大クラスに入学できてしまうのです。その学校の教育方針のせいで東大に入るのではなく、東大に入れる読解力が12歳の段階で身についているから東大に入れる可能性が他の生徒より圧倒的に高いのです。

「同上」

御三家の中学入試の問題は、新井教授の言う「能力上位層をよく識別する問題」がふんだんに盛り込まれているのでしょう。新井教授は「基礎的読解力が、その子のその後の伸びしろを決める」と書いています。それが人生というレベルでみれば格差を生み、結果として人生を左右するのです。



最近、大学や高校で "アクティブ・ラーニング" の重要性が強調されているそうです。文科省の用語集によると "アクティブ・ラーニング" とは、

  教員による一方的な講義形式の教育とは異なり、学修者の能動的な学修への参加を取り入れた教授・学習法の総称。学修者が能動的に学修することによって、認知的、倫理的、社会的能力、教養、知識、経験を含めた汎用的能力の育成を図る。発見学習、問題解決学習、体験学習、調査学習などが含まれるが、教室内でのグループディスカッション、ディベート、グループ・ワークなども有効なアクティブ・ラーニングの方法である。

と説明されています。しかし新井教授はこれに疑問を呈しています。教科書を読めない学生・生徒にアクティブ・ラーニングができるはずがない、アクティブ・ラーニングは現場の実態を知らない文部科学省、およびその委託をうけた中央教育審議会の人たちの発案した「絵に描いた餅」だと・・・・・・。


残された課題


新井教授が想定する "暗い未来" は、「仕事はいっぱいあるのに、その仕事をこなせる人間が僅かしかいない」という状況です。本書で繰り返し述べられているように、AIには限界があります。AIでできないことは多い。しかしその「AI ではできない仕事」をできる人間が少なくなっていく。これは労働市場の分断になります。こういった分断は技術革新によってすでに起こっていると思いますが、この傾向をAI技術が強力に加速する。中間層がいなくなると経済原則に従って個人消費が低迷し、"AI不況" に陥ります。

ではどうすればよいのか。どうやったら基礎的読解力はつくのか。新井教授はどのような生活習慣や学習習慣が読解力を育てるのか(逆に損なうのか)、中学の生徒たちに網羅的なアンケート調査をしました。しかし関係ありそうな要因が見つかりません。「読書習慣」「学習時間」「得意科目」「スマホを何時間使うか」「新聞を読むか」「ニュースはどの媒体から知るか」など、どれもが基礎的読解力と相関関係がないのです。小さいころから読書が好きと答えた生徒の読解力が高いわけでもない。

しかし新井教授は "はたと" 思い当たりました。そもそも「宗教問題」や「ポルトガル人問題」に答えられない生徒にアンケート調査をすること自体が無意味だと・・・・・・。

ただ、一つだけ気になる点があります。就学補助をうけている子どもの読解力が低いという、明らかな負の相関があるのです。貧困が読解力にマイナスの影響を与える・・・・・・。これは大きな問題です。

とはいえ、貧困だけが読解力に影響するわけでもないでしょう。何が読解力を決めるのか、それを明らかにするのが今後の課題です。また、たとえ大人になったとしても読解力が向上することを、新井教授は数々の例を引いて説明しています。このあたりの要因と対策が今後の課題です。


「教科書が読めない子どもたち」の感想


以降は新井紀子著「AI vs.教科書が読めない子どもたち」の後半部分、「リーティング・スキル・テスト」の感想です。

新井教授はリーディング・スキル・テスト(RST)を自ら実践するなかで中高校生の読解力不足を指摘したわけですが、これは現場の実態や現場の先生たちの意見と遊離している教育行政のあり方に一石を投じたものと言えるでしょう。本書の「アクティブ・ラーニングは絵に描いた餅」というところでは、いわゆる「ゆとり教育」を思い出しました。

「ゆとり教育」も「アクティブ・ラーニング」も、発想の基本が非常に似ていると思います。つまり「自ら考え、自発的に学ぶことが大切」という考えです。これは一面の真実であることは確かだと思います。間違ってはいない。「発見学習、問題解決学習、体験学習、調査学習」と文科省の資料にありますが、創造性を養う上で大切なことです。

しかし大学生はともかく中高生についていうと「自発的に学ぶ」ためには、それができるだけの基本スキルが身についていることが条件です。そのスキルの重要なポイントが読解力です。教科書、参考書は言うに及ばす、世の中に学ぶための情報、マテリアルが溢れています。読解力さえあれば自発的に学ぶことがいくらでもできる。問題解決学習で議論した結果を自ら検証することもできます。しかし読解力がなければそれが出来ない。まさに「絵に描いた餅」になるのです。

読解力があったとしても、さらに問題があります。「自発的に学ぶための、ゆとりの時間」が与えられたとき、勉強が楽しい一部の子どもは自ら学ぶと思いますが、多くの子どもは "怠ける" のではないでしょうか。怠ける子が悪いというのではなく、人間というのは安易な方向に流れやすいのであって、現実としてそうなっていくと思います。

おそらく日本の教育方針を決めている文科省の官僚や中教審の人たちは、「自発的に学ぶための、ゆとりの時間」が与えられたとしたら、喜々として自分の思うやり方でどんどん勉強するタイプの人たちではないでしょうか。教科書と同じことを繰り返す授業など退屈でしかなく、読めば分かることを授業で聞いても無意味だと思って "内職" に励んだのではないでしょうか。"分かる" からおもしろいし、おもしろいから努力を重ねてテストでよい点数を取ろうとする。

新井教授は「"御三家" と呼ばれるような超有名私立中高一貫校の教育方針は、教育改革をする上で何の参考にもならない」と書いています。「御三家」は、どちらかと言うと "自由放任主義" で知られていますね。かつ学校行事も多いようです。

御三家だけではありません。私の知っている神奈川県の県立高校は県下でもトップクラスの進学校ですが、学校行事が多いことで有名です。縄跳び大会やマラソン大会、合唱コンクールなど、伝統の行事が目白押しで、3年生が仕切る秋の体育祭まで続く。授業を受け、部活をし、そのうえ各種行事の練習までして息つく暇もない。いったいいつ勉強するのかと思うほどですが、それでいて国立難関大学や難関私立大への進学が多いわけです。結局、生徒たちは時間を作り出し、努力を重ねて勉強をし、3年生は体育祭が終わったら一心不乱に猛勉強をする。そういうことが出来る子が集まっているのですね。

日本の教育行政を指導している人たちも、おそらくそういった中高生の時代を過ごしたのではないでしょうか。だから「自発的に勉強できるゆとりの時間を与えると子どもたちは伸びる」と考えるわけです。なぜなら自分がそうだったから。

しかし現実はそういう子ばかりではありません。"ゆとり" を与えられると勉強しない子が少なからずいるだろうし、勉強しようと思っても基礎的読解力がなければ進みません。結局のところ「ゆとり」とか「アクティブ」という考え方は子どもたちを選別し、社会を分断していく方向に働くはずです。本書で公表されている RST の結果は、そのことを明確にしていると思いました。



本書を読んでいて非常に気になったは、RSTで明らかにされた中高生の読解力が「昔からそうだった」のか「近年、低下してきている」のか、ということです。直感的には、こういった極めて基礎的なスキルは「昔からそうだった」のではと思います。

基礎的読解力は何で差がつくのか、また、向上させるのはどうしたらよいのか。本書では「今後の課題」となっているのですが、こういう問題を考えるときにまず考慮すべきは遺伝の影響です。No.191「パーソナリティを決めるもの」で書いたように、行動遺伝学の知見から言うと一般知能(IQ)の遺伝率は10代で 0.6 程度です。つまり一般知能(IQ)の60%程度は「もって生まれたもの」で説明できるわけです。

基礎的読解力が一般知能(IQ)と同様かどうかは分かりません。しかし遺伝の影響があると強く推測できる証拠があります。ディスレクシアという症状の存在です。ディスレクシアは「難読症」「識字障害」とも言われ、本人の知性や聞く・話す能力は全く問題がないのに、読み書きができなかったり、読んで理解するのに大変苦労したりする症状です。俳優のトム・クルーズがディスレクシアだと自ら公表して有名になりました。Wikipedia によると、俳優ではキアヌ・リーブスもディスレクシアだと公表したそうです。また映画つながりで言うと、スティーヴン・スピルバーグ監督もディスレクシアであり、そのため小学校の卒業が2年も遅れ、今でも脚本を読むのに人の2倍の時間がかかるそうです。

ディスレクシアは遺伝性であることが知られています。またディスレクシアといっても重度のものからごく軽いものまでがあるようで、その軽いディスレクシアの子どもが周囲から気付かれることがなく「基礎的読解力がない」と判定されていることが考えられます。新井教授は RST が「読み障害」のある子を発見するツールとなってくれればと言っていますが、そういう子どもを早期に発見し、科学的なケアをすることが望まれると思いました。



もちろん基礎的読解力は遺伝だけで決まるのではなく、それ以外の本人の性格とか環境の影響もあるはずです。本書にも基礎的読解力が大人になっても向上した例が出てきます。では何が基礎的読解力を決めるのか。

それは個人的には「集中力」だと思います。数分でも数10分でも "あること" に集中し、没頭できる。休憩をとりながらであれば数時間でも没頭できる。そういった資質が大切なのではと思います。RSTの問題の一文を読解するのは数秒~10秒前後だと思いますが、集中して "深く" ものごとに当たれる能力が影響するのではと直感的に思います。

もう一つ付け加えると「努力を継続できる力」でしょうか。努力することの価値が直感的にわかる子ども、先生から(ないしは親から)言われれば、まずその実現を目指して素直に努力する子ども、そういった子の基礎的読解力が向上し、伸びていくと感じます。

とにかく新井教授が本書で書いているように、基礎的読解力に差がつく原因や、その改善策は今後の課題です。次の著書ではその処方箋の1つでも2つでも提示したいと、本書にありました。おそらく実証研究に基づく処方箋になるはずです。新井教授の次作に期待したいと思います。



nice!(0) 

No.233 - AI vs. 教科書が読めない子どもたち [技術]

今回は No.175「半沢直樹は機械化できる」No.196「東ロボにみるAIの可能性と限界」の続きです。

No.175 で、オックスフォード大学の研究者、カール・フレイとマイケル・オズボーンの両博士が2013年9月に発表した「雇用の未来:私たちの仕事はどこまでコンピュータに奪われるか?(The Future of Employment : How Susceptible are Jobs to Computerization ?)」という論文の内容を紹介しました。この論文は、「現存する職種の47%がAIに奪われる」として日本のメディアでもたびたび紹介されたものです。それに関連して、国立情報学研究所の新井紀子教授が「半沢直樹の仕事は人工知能(AI)で代替できる」と2013年に予想した話を書きました。半沢直樹は銀行のローン・オフィサー(貸付けの妥当性を判断する業務)であり、銀行に蓄積された過去の貸付けデータをもとにAI技術を使って機械的に行うことが可能だというものです。

No.196「東ロボにみるAIの可能性と限界」ではその新井教授が主導した「ロボットは東大に入れるか(略称:東ロボ)」プロジェクトの成果を紹介しました。これは大学入試(具体的にはセンター試験の模試)を題材にAIで何ができて何ができないのかを明らかにした貴重なプロジェクトです。

AI vs 教科書が読めない子どもたち.jpg
その新井教授が最近「AI vs. 教科書が読めない子どもたち」(東洋経済報社 2018.2)という本を出版されました(以下「本書」)。AIの強力さと弱点を「東ロボ」を例に実証的に説明し、AIが社会に浸透していく中で我々は何をすべきかを示した良い本だと思うので、その内容の一部を紹介したいと思います。

そもそも新井教授が「東ロボ」プロジェクトを始めるきっかけになったのは、人間の仕事がAIに奪われていくという危機感でした。実は、新井教授はオックスフォード大学の論文以前に、人間の仕事の半分がAIやコンピュータに奪われるという予測を発表していました。2010年に出版した「コンピュータが仕事を奪う」(日本経済新聞社。2010)です。ところが日本では誰もこの警告をに受けませんでした。


出版直後、私は東京駅前の大型書店に、この本がどこに置かれているかを見に行きました。ビジネス書の棚をいくら探しても見当たらない。結局どこに置かれていたかというと、SFのコーナーでした。その事実に私は慄然としました。日本人はこのシナリオをSFだと思うのか、と。

実はそれこそが、「ロボットは東大に入れるか」というプロジェクトをスタートさせようと考えた最初の動機でした。これが近い将来に間違いなく起こる事実であることを日本人に1日でも早く伝えたい。そのために一人ひとりに準備をしてほしい。その焦燥感が「ロボットは東大に入れるか」というフレーズに結晶したのだろうと思います。



偏差値 57.1 の成績をとった東ロボくん


ロボットは東大に入れるか.jpg
国立情報学研究所ニュース(NII Today)No.60(2013.6)。特集「ロボットは東大に入れるか」の表紙

東ロボの成果については、No.196「東ロボにみるAIの可能性と限界」に紹介したのですが、復習のために本書から引用します。


初めて "受験" した2013年の代々木ゼミナールの「第1回全国センター模試」では、5教科7科目900点満点の得点は387点。全国平均の459.5点を大きく下回り、偏差値は45でした。

ところが3年後の2016年に受験したセンター模試「2016年度進研模試 総合学力マーク模試・6月」では、5教科8科目950点満点で、平均得点の437.8点を上回る525点を獲得し、偏差値は57.1まで上昇しました。

偏差値57.1が何を意味するのか、合否判定でご説明します。全国には国公立大学が172あります(模試時点での大学コード発番数)が、東ロボくんはそのうち23大学の30学部53学科で合格可能性80%の判定をいただきました。思わず、ガッツポーズがでるレベルです。

私立大学は587校あります。短期大学は含みません。そのうち512大学の1343学部2993学科で合格可能性80%です。学部や学科は内緒ですけれど、中にはMARCH(明治大学、青山学院大学、立教大学、中央大学、法政大学)や関関同立(関西大学、関西学院大学、同志社大学、立命館大学)といった首都圏や関西の難関私立大学の一部の学科も含まれていました。両拳を突き上げたくなるレベルです。

さらに、将来の2次試験受験にそなえて、数学と世界史の2科目だけ記述式の模擬試験にも挑戦してみました。駿台予備学校の「東大入試実践模試」と代々木ゼミナールの「東大入試プレ」です。どちらも東大合格を目指す全国の優秀な受験生が受験する模試です。「2015/2016第1回東大入試実践模試」の世界史の問題の一つは、西欧とアジアの国家体制の変遷について600字以内の論文を書く難問でした。この問題で、東ロボくんは配点21点中9点を獲得し、受験生平均の4.3を大きく上回り偏差値61.8を獲得しました。東ロボくんに拍手。さらに「2016年度第1回東大入試プレ」の数学〈理系〉の問題では6問のうち4問に完答し、偏差値は76.2。全受験者のトップ1%に入る成績です。東ロボくんに拍手喝采。

「同上」

ちなみに偏差値57.1だった「2016年度進研模試 総合学力マーク模試・6月」において東ロボくんの得意・不得意を偏差値でみると、得意科目は世界史Bの66.3、数学IAの57.8、数学IIBの55.5などです。一方不得意科目は英語(筆記)の50.5、国語の49.7です。

大学入試センター模試(2016)の成績
ベネッセコーポレーション「進研模試」
(カッコ内は2015年の成績)
  得点 全国平均 偏差値
英語(筆記) 95(80) 92.9 50.5(48.4)
英語(リスニング) 14(16) 26.3 36.2(40.5)
国語(現代文+古文) 96(90) 96.8 49.7(45.1)
数学 I A 70(75) 54.4 57.8(64.0)
数学Ⅱ B 59(77) 46.5 55.5(65.8)
世界史 B 77(76) 44.8 66.3(66.5)
日本史 B 52(55) 47.3 52.9(54.8)
物理 62(42) 45.8 59.0(46.5)
合計(950点満点) 525(511) 437.8 57.1(57.8)
朝日新聞(2016.11.15)
No.196「東ロボにみるAIの可能性と限界」
に掲載した表を再掲。

偏差値 57.1が何を意味するかですが、これは全受験生の上位20%に東ロボくんが入ったということです。逆に言うと全受験生の80%は東ロボくんより成績が下だったわけです。

もちろんこの程度では東大には入学はできません。東大の偏差値は77以上であり、入学できるのは全受験生の0.4%以下です。新井教授は、このまま東ロボくんを成長させたとしても「偏差値60は運がよければ達成可能かもしれないが、偏差値65は不可能」と言っています。なぜ不可能なのか、その説明が本書の一つの目的だと言ってもいいでしょう。

とはいえ、東ロボくんがMARCHや関関同立の一部学科に入学可能というのは重大な事実です。AIの技術は急速に進歩していて、生活のあらゆる側面に入り込みつつあります。我々はそういう時代に生きているという認識がまず必要です。



以下、東ロボくんの得意科目(世界史、数学)と不得意科目(英語)について、どうやって問題を解いているのか、その一端を本書から紹介します。


東ロボくん:世界史の攻略法


世界史のセンター入試の7割程度は正誤判定問題、ないしは正誤判定に帰着できる問題です。たとえば次のような出題です。


カロリング朝フランク王国が建国された8世紀に起こった出来事について述べた文として正しいものを、次のうちから一つ選べ。

ピピンはランゴバルド王国を滅ぼした。
カール大帝は、マジャール人を撃退した。
唐の大宗の治世は、開元の治と呼ばれた。
ハールーン・アッラシードの治世が始まった。
「同上」

分析の結果、正誤判定問題においては多くの場合で問題文の条件は無視できることが分かりました。上の問題でいうと「(カロリング朝フランク王国が建国された)8世紀」の部分です。つまりこの問題の場合、選択肢の①②③は条件を無視して正誤判定が可能であり、④だけで「8世紀」という条件が必要になります。そこで東ロボくんはまず、条件を無視して正誤を判定します。どうやっているかが以下です。

たとえば「②カール大帝は、マジャール人を撃退した。」が正しいか誤っているかですが、まずこの文を回答とするような質問文を作り出します。たとえば「②カール大帝は、○○○を撃退した。この○○○は何か」という質問文です。

次にオントロジーを利用します。情報科学で言うオントロジーとは「概念体系」であり、さまざまな概念と概念の関係性を表したものです。たとえば「ハールーン・アッラシードは人名である」「ハールーン・アッラシードはカリフの一人である」「マジャール人は民族である」などです。「死んだ人はそれ以降の事項を起こせない」というのもオントロジーです。

世界史攻略のためのオントロジーが手作りで作成されました。そのオントロジーを用いると先ほどの質問文は「②カール大帝は、この民族を撃退した。この民族とは何か」と書き換えられます。この質問のように、単語で答える質問を "ファクトイド" と言います。実はファクトイド型の質問に答えて一躍有名になった人工知能があります。IBMのワトソンです。



ワトソンは2011年に、アメリカのテレビのクイズ番組「ジェパディ!」で人間のチャンピオンに勝って大きな話題になったコンピュータ・システムです。この「ジェパディ!」で出題される問題がファクトイドなのです。本書にその例があります。


Mozart's last & perhaps most powerful symphony shares its name with this planet.

モーツァルトの最後の、そして最も力強い交響曲には、ある惑星の名前が付けられています。

「同上」

この質問の "this" が何かを答えるのが「ジェパディ!」です。ワトソンでやっているのは基本的には人間がやるのと同じような「情報検索」です。人間ならこの質問に答えるにはどうするか。検索語を慎重に選んで「モーツァルト 最後 交響曲」で Google検索をすると、トップに出るのは Wikipedia の「交響曲第41番(モーツァルト)」の項です(2018.6.1 現在)。その「概要」のところは「本作はローマ神話の最高神ユーピテルにちなんで『ジュピター』(ドイツ語ではユーピター)のニックネームを持つが、・・・・・・」という文章で始まります。これで正解が「ジュピター」だ分かります。もちろん「ジュピター」が惑星の名前でもあることを知っているのが前提です。

もっと一般的には、検索でヒットしたテキストに、検索につかった単語がどのように現れるかを調べます。複数の単語がテキストにどのように現れるかを「共起」といい、共起関係を使って文にあたりをつけ、その文に含まれる「惑星」のカテゴリの単語を調べます。

ワトソンは問題文を単語に分解し、構文解析をし、検索にかけるべき重要な単語を判断します。また「ジュピターは惑星である」というようなオントロジーを備えているので質問に回答できるというわけです。



東ロボくんが「②カール大帝は、この民族を撃退した。この民族とは何か」という質問に答えるのも、基本的にワトソンと同じです。その結果、答として最も高いスコア、3.2 を獲得したのは「アヴァール人」でした。一方、もともとの問題文にあった「マジャール人」のスコアは 1.1 であり、その差は 2.1 です。この結果、東ロボくんは「②カール大帝は、マジャール人を撃退した。」を誤文と判定しました。

この差の 2.1 が正誤判定をするに十分に大きな数値なのかどうか、それは世界史の過去問を機械学習して決めました。つまり過去問のスコアを東ロボくんに計算させ、正解(正か誤のどちらか)と照らし合わせて、どの程度のスコア差が正誤判定になりうるかを学習したわけです。このようなやり方で、東ロボくんの世界史の偏差値は 66.5 までになりました。



以上の「世界史の攻略法」でポイントになっているのは、世界史の模試で出題できる歴史上の事実が限定されていること、つまり高校3年までに学習する範囲に限られることです。従ってオントロジーも手作りで作成できます。しかし、世界史の全知識が対象だったり、「ジェパディ!」のようにさまざまなジャンルの問題が出題される場合には、手作りでは難しい。従って、Wikipedia の全情報から文脈を解析してオントロジーを自動的に作るというような技術が必要になります。

ともかくセンター模試の世界史の結果から分かるのは、限定された情報の範囲の問題に対する回答は、データを蓄積した上での情報検索や統計処理で好成績をあげられることです。


東ロボくん:数学の攻略法


一方、世界史と並んで好成績あげた数学は、世界史とは全く対照的な方法がとられました。それは「数学の問題を自然言語処理で数式に "直訳" し、数式処理で問題を解く」という方法です。具体的な方法は専門的になるので本書には書いてありませんが、統計的・確率的にやるのではなく、論理だけで回答するということです。

数学では東大模試(理系)で6問中4問に完答し、偏差値77.2という驚異的な成績をあげました。大学入試の最難関は東大の理科3類ですが、ここを突破する鍵は数学の成績です。理3を受けるような受験生は、他の科目では大した差がつきません。数学で差がつきます。6問中4問に完答というのは、数学だけでいうと理3突破ラインです。これを数式処理でやったというのは東ロボくんの大きなブレークスルーであり、世界的に誇れる成果でしょう。

要するに、正確で限定的な語彙からなる問題文であれば、現在主流の統計的な自然言語処理ではなく、論理的な自然言語処理と数式処理で解けるということです。従って東ロボくんが「論理」を使って解くのは数学と物理の一部だけです。

ただし数学が理3突破ラインだといっても、東ロボくんが理3に合格できるわけではありません。それは不得意科目があるからです。その代表が英語です。


英語攻略法:150億文を暗記させても・・・・・・


英語の攻略法も、世界史と同じ統計的手法です。つまり大量の英語の例文を暗記させて、その情報検索と統計処理で回答するわけです。2016年の模試の際には、500億単語からなる16億文を暗記させたといいます。英語の文法(=論理)は一切使いません。この統計的やりかたで語順整序問題(問題に示されている数個の単語を正しい順に並べて文の穴を埋める問題)は100%の正解が出るまでになりました。

しかし東ロボくんがつまづいたのは、複文(会話文)の穴埋め問題、会話文完成問題でした。その例が本書にあります。


次の会話の空欄に入れるのに最も適当なものを、①~④の中から1つ選べ。

Nate : We're almost at the bookstore. We just have to walk for another few minutes.
Sunil : Wait.(    )
Nate : Oh, thank you. That always happens.
Sunil : Don't you tie your shoe just five minutes ago ?
Nate : Yes, I did. But I'll tie it more carefully this time.

① : We walked fo a long time.
② : We're almost there.
③ : Your shoes look expensive.
④ : Your shoelace is untied.

(訳)
ネイト:もうすぐ本屋だよ。あと2、3分かな。
スニール:ちょっと。(    )
ネイト:サンキュー。よくあるんだよね。
スニール:5分前に結んでなかったっけ?
ネイト:だね。今度はしっかり結んどくよ。

① : 随分歩いたね
② : もうすぐだね
③ : いい靴だね
④ : 靴の紐ほどけてるよ

「同上」

もちろん正解は④ですが、東ロボくんは②を選んでしまいました。2016年の会話文完成問題の正解率は4割を切ったそうです。

仮にこの問題が日本語の訳文で出題されたら、中学生や小学生(高学年)でも正解できるでしょう。子どもでもできる常識推論の問題だからです。これがセンター模試に出題されるのは "問題文が英語で書かれている" からであり、その英語が正しく理解できているかをテストしているわけです。英語さえ理解できれば、あとは子どもでも可能な推論になる。ところが東ロボくんにとってはその常識推論が難しいのです。

常識をコンピュータに教えればいいのではと思われるかもしれません。靴には紐がある、紐はほどける、紐は結ぶ、といった常識です。しかし中学生レベルの常識でも膨大にあります。新井教授は、


私たちにとっては「中学生が身につけている程度の常識」であっても、それは莫大な量の常識であり、それをAIやロボットに教えることは、とてつもなく難しいことなのです。

「同上」

と書いています。AIの研究でよくぶつかる「常識の壁」です。自然な会話の流れというのは、会話のバックにある常識を前提としています。また、発言によって引き起こされる "常識的な" 人の感情を前提としています。その常識や感情をコンピュータに教え込むのが難しい。だからこそ東ロボくんは、膨大な英語の例文を集めて情報検索と統計処理で問題を解く方針にしたのです。

東ロボくんに教えた例文は、最終的には150億文になったそうです。それでも会話文完成の4択問題の正答率を画期的には上げられなかったと本書にあります。では、もっとたくさんの例文を集めたらどうか。それは新井教授によると「ビッグデータ幻想」だと言います。


「150億なんてとるに足らない。今後、その百倍、万倍のデータが手に入るようになる」と予想した方がいました。けれども、それもまたビッグデータ幻想です。もちろん、ネット上には毎日大量の英文が書き込まれています。ツイッターだけでも物凄い量です。ですが、先にも触れたとおり、人間にとっては同じ英語でも、AIにとっては、特許の文書の英語と新聞の英語、センター試験の英語問題の英語はまったく別物です。

センター英語の正答率を高めるのに必要なのは「間違いのないお手本のような英語」です。ツイッター上のやりとりで、「お手本のような日本語」が使われている割合を考えれば、英語で書かれたツイッターでも、それがいかに少ないかは容易に想像できます。そんなものはいくら増えても何の役にも立ちません。

正しい文章を書ける人が限定的であり、文章を書くのに時間がかかり、そして、画像の教師データを「水増し」するように、手本となる文から自動的に意味を変えずに、一万倍に増やす方法が見つからない限り、150億文を万倍にすることなどできません。

「同上」



東ロボくんがセンター入試をどのように解いているのかの説明はこの程度にして、以下は社会に広まるAIの強力さと限界についてです。


社会に広まるAI


現代社会にはAI技術が広く使われ出しています。その例を本書から紹介しますと、まず顧客と企業の接点となるコールセンターです。上の "ファクトイド" のところで説明した IBM のワトソンもコールセンターに使われています。


コールセンターの役割は、問題を解決することではありません。用意されたFAQ(よく聞かれる質問とその回答集)に沿って応答し、複雑な問題の場合は担当部署に転送するのが業務です。ワトソンの役割は、顧客の問い合わせが、FAQのどれに該当するのかをオペレータに伝えることです。ここで、お得意の検索能力が力を発揮します。

ワトソンの画面には、音声認識機能でテキスト化された顧客とオペレータのやりとりがリアルタイムで表示されているはずです。それとほぼ同時に、FAQのランキングも表示されます。その仕組みはクイズに正解するのと同じです。現在の技術では、問い合わせに対する応答を一つに絞ることは困難ですが、時々刻々と進んでいくやりとりを入力して、適切な応答に近そうな順序にランキングすることはできるのです。

オペレータは表示されたランキングの中から、最も適切と思ったFAQを選んで顧客に説明します。間違っていれば別のFAQを選んで応対するということを繰り返します。そして、ワトソンが提案したFAQが正解だった場合は「正解」のボタンをクリックする。その情報が蓄積されることで、ワトソンが自律的に学習し、さらに賢くなっていくという仕組みになっているはずです。

私は、先ほどから「そうなっているはずです」を連発しました。私は実際にワトソンが導入された現場を見たことがないからです。けれど、現在のAIの実力を考えるとそれ以外のユーザーインタフェースは考えられません。ワトソンを導入した某銀行の方にそう申し上げたら、「まったくそのとおりですよ。寸分違いません」と教えてくださいました。

「同上」

ワトソンに限らす、コールセンターにAI技術を導入する場合は基本的に同じやりかたです。そこで使われている技術は、音声認識(声のテキスト化)、テキストの形態素分析(単語への分解)、構文解析、機械学習を使った情報検索などです。コールセンターは企業にとって顧客との接点となる重要な部門であり、的確な回答をしたり、問い合わせが終わるまでの時間を短縮することが企業にとっての大きな価値となります。

コールセンターにAI技術が有効な理由は、東ロボくんが世界史の模試を得意としているのと同じです。銀行のコールセンターで扱われる情報は「銀行が個人向けに提供している商品・サービスに関する情報」に限られます。それは多岐に渡っていて複雑でしょうが、とにかく枠組みが限定されていて、そこで使われる言葉や概念も限定できる。そこがポイントだと思います。

とは言え、クイズに答えていたワトソンが銀行のコールセンターで使われるということは、AI技術の汎用性を示しています。



AI技術が使われている別の例は、機械学習とディープラーニング(深層学習)を使った画像認識です。画像に写っている物体を検知し、それが何かを判別します。これは自動運転の "眼" に当たる部分や、CT画像からの病気の診断、監視カメラによる不審者検知、工場における不良品検出などに応用が広がっています。なぜ画像の認識がうまくいくのか。本書では2つの要因があげられています。

画像は、部分の単純な和が全体という、コンピュータが処理しやすい性質がある。

たとえば画像にイチゴが写っていたとすると、画像を拡大・縮小・回転・移動させてもイチゴである。この性質を利用して機械学習における教師データを「水増し」できる。

人間が外界から受け取る情報の大部分は眼からといいますが、画像認識は機械が(コンピュータが)眼を持ったことに相当します。No.175「半沢直樹は機械化できる」の「補記2」にアマゾンのレジなし店舗(Amazon GO)の話を書きましたが、レジ係りを不要にしたのは画像認識技術です。まさに "AIが仕事を奪う" そのものです。しかし本書には、画像認識が本質的に抱えている問題点も指摘されています。

ハードウェア(画像センサーとコンピュータなど)が向上し、より精密が画像が扱えるようになったとき、機械学習の教師データを全部作り直す(=全データについて精密な画像を用意する)必要がある。

画像認識の仕組みの細部を理解すると、画像認識ソフトを「だます」画像を作れる。つまり、どんな画像でも画像認識ソフトがイチゴだと判断するように細工できる。この細工は人間の目には分からない。このような悪意による改竄を防ぐのは本質的に難しい。

このような "落とし穴" は、よくあるAIの解説では指摘されないことだと思います。


AIの限界:AIとは数学のことである


社会に急速に浸透しつつあるAIですが、AIにはできないことや限界があります。この限界はコンピュータの性能が足りないからではありません。本書にその象徴的な話が出てきます。


プロジェクトを開始して間もなく、ある機関から「東ロボくんに是非うちのスパコンを使ってほしい」というオファーを頂きました。折角ですから、東ロボプロジェクトの研究者に希望者を募りました。すると、全員が大変困った顔をして、「使い道がない」というのです。中でも数学チームの指摘は興味深いものでした。

そこそこのサーバを使って5分で解けない問題は、スパコンを使っても、地球滅亡の日まで解けない」
「同上」

もの凄い速度のコンピュータが登場したら、あるいは量子コンピュータが登場したら、人間の知性と同等の(あるいはそれを上回る)AIができるということではないのです。AIの限界は計算機のスピードの問題ではありません。なぜ限界があるのか。人間の知性と同等のAIはなぜできないのか。本書の説明を簡潔に一言で言うと、その理由は、

AIとは数学のことだから、または、
AIは徹頭徹尾、数学でできているから

となるでしょう。数学に帰着できる問題はAIで解ける。数学の問題は最終的には計算問題になり、その計算をやるのがコンピュータ(=計算機)です。従って、数学の言葉で表現できない問題はAIでも解けない。

数学の言葉とは「論理」と「確率」と「統計」です。「論理」とは、たとえば「A=B で B=C なら A=C である」という三段論法に始まって、こうだからこうなるという体系のすべてです。方程式、関数、幾何学、行列、微積分など、高校3年までに習う数学の大部分は「論理」の範疇です。

「確率」は、必ずそうなるのではなくランダムに発生する事象、不確実性をもって発生する事象を表現する数学の言葉です。

一方、世の中にみられる事象は、確実に起こるのでもなくと、かといってランダムに起こるのでもないことが多数あります。こういった現実を観測して得られたデータを説明する数学の言葉が「統計」です。

数学の言葉は「論理」と「確率」と「統計」の3つであり、それしかありません。先ほどの東ロボくんのセンター入試でいうと、世界史の正誤問題と英会話の穴埋め問題は「統計」「確率」で解き、数学は「論理」でアプローチしていることになります。

「論理」「確率」「統計」の言葉で表現できないものは数学になじまず、従ってAI技術の適用ができなくなる。その例としてはまず、問題の枠組み(=フレーム)がはっきりしないものがあります。問題を考える範囲やスコープが曖昧なものや、解くときの条件が不明だったりするものです。それが曖昧だったり不明だと、解くために考慮すべきことが膨大に広がってしまい、現実には解けなくなります。いわゆる、AIにおける「フレーム問題」です。

  ちなみに、フレーム(問題の枠組み)が厳格に決まっているのがゲームです。厳格に決まっているという条件があれば、囲碁のような複雑極まりないゲームでもAI技術を使ったコンピュータ囲碁プログラムが人間を凌駕できるのです(No.180-181「アルファ碁の着手決定ロジック」参照)。

東ロボくんが世界史が得意という理由はここにあります。入試の世界史は、基本的には、学習指導要領、指導要領に沿って作られた教科書、教科書の理解を助けるための参考書という情報から作問できるものに限られます。これらの考えうるすべの情報をコンピュータに入れることも可能です。つまり「枠組み」がはっきりしている。従って上で例をあげた正誤判定だけでなく、たとえば次のような東大の2次試験の問題(模試)にも東ロボくんは回答できます。


(東大2次試験:世界史模試)

17世紀の東アジアと東南アジア地域での海上交易の繁栄と停滞の変遷とその要因について、東アジアと東南アジア諸国の交易の方針とヨーロッパ諸勢力のこの地域をめぐる動向に留意しならがら600字で論じなさい。

「同上」

大変に "難しそうな" 問題ですが、東ロボくんは大丈夫です。最初の引用にあったように、このような東大の2次の論述問題で東ロボくんは偏差値61.8を獲得しました。

これと真逆なのが「英語の会話文完成」問題です。会話文完成に必要なのは、自然な会話の流れを判定するために高校3年生であれば誰もがもっているであろう「常識」です。これは範囲が極めて曖昧であり、常識を書き出していくと膨大になります。「英語の会話文完成」がAIにとって難しい理由がここにあります。

数学でできないことはAIでもできないのですが、数学でできないことの一つに「意味」の記述があります。意味が重要になるものは言葉です。発話には意図があり、発話に応じることは意味の理解があるわけです。


言葉には明らかに記号の羅列以上の「意味」があります。ところが「意味」は観測不可能です。

そういうと一部のAI研究者は猛然と反論します。たとえば、「机の上にりんごと鉛筆がある」という文に対して、実際に机の上にりんごと鉛筆がのっている画像を合成できたら、それはAIが文の意味を理解したことになると主張します。

本当にそうでしょうか。では「太郎は花子が好きだ」はどんな画像にするのでしょう。「本当にそうでしょうか」は? さらに言えば、「『太郎は花子が好きだ』はどんな画像にするのだろう」という文は? 「そんなことは不可能だろう」という文は?

「同上」

意味を記述できる数学の言葉はありません。もちろん分野を限定すれば可能でしょう。東ロボくんは東大の2次試験・数学で偏差値 76.2 という驚異的な成績をあげましたが、それは問題文をその意味まで含めて「論理」という数学の言葉で記述できたからでしょう。しかしそのやりかたを一般の言葉にまで広げることはできない。言葉の意味を記述しているが辞書であるように、自然言語の意味は自然言語でしか記述できないのです。

本書にはIBMのワトソンがみずほ銀行のコールセンターに導入され、また東大の医科学研究所にも導入されて病気の診断に使われていることが紹介されています。まったく違った業種に同じコンピュータシステムが導入できるということは、ワトソンは「意味」を関知せずに「統計」と「確率」を駆使した情報検索で動いているからです。

自然言語処理は、自動翻訳システムや質問応答システムを作るときに必須です。しかし、AIに文法などの言葉のルールを教えて論理的な推論で言語を扱う研究は、ことごとく失敗に終わりました。だからこそ「統計」「確率」で自然言語処理を行うのが主流になったのです。

  余談ですが、このブログで以前にマイクロソフトやグーグルの機械翻訳チームの話を紹介しました(No.173「インフルエンザの流行はGoogleが予測する」参照)。

  グーグルの機械翻訳グループでは、メンバーの誰一人として話せない言語の翻訳に取り組んでいる。マイクロソフトの機械翻訳部門の統計専門家らは、「言語学の専門家がチームから去るたびに翻訳の質が上がる」と皮肉る始末だ。── 『ビッグデータの正体』(2013)からの引用

毎年バンクーバーで開催されるTED(Technology Entertainment Design)という会議があります。「広める価値のあるアイデア」を世界中から集めてプレゼンテーションが行われます。5日間ぶっ通しのチケットは150万円ですが、発売と同時に売り切れるそうです。新井教授は 2017年4月のTEDに招かれて講演したのですが、同じセッションに、代表的な質問応答システムである Siri の開発者であるトム・グルーバーがいました。


2017年4月にTEDに招かれて講演したとき、同じセッションにSiriのメインエンジニアであるトム・グルーバーがいました。当然、Siriがいかに言葉を理解するようになったかとういう内容の講演になるはずでした。意図したわけではありませんが、東ロボくんの講演で私が先にAIがどんな風に世界史の問題を解くかのネタバレをしてしまったので、トムはきっと話しづらかっただろうと思います。彼はそっと私に声をかけました。「紀子、君が言っていることは正しい。AIは意味を理解しない」 ───。

「同上」



以上のことからすると「人間の知性と同等ベルのAI = 真の意味でのAI」はまず無理なことがわかります。なぜかというと、まず人間の知能の原理が解明されていないからです。


(人間の知能の原理を数学的に解明して、それを工学的に再現するという方法は)原理的に無理だと、多くの研究者が内心思っています。なぜか。人間の知能を科学的に観測する方法がそもそもないからです。自分の脳がどう動いているか、何を感じていて、何を考えているかは、自分自身もモニターできません。文を読んで意味がわかるということがどういう活動なのかさえ、まったく解明できていないのです。

脳にセンサーを埋め込んでも残念ながらわかりません。センサーでモニタリングできるのは電気信号や血流などの物理的な動きだけです。しかも、それすら、動物実験でさえ厳しく制限されている現代に、健康な人の脳に直接センサーを埋め込むことなど到底許されません。「こういう原理で動いているのではないか?」という仮説を立てても、測定結果と比較して妥当性を検証しなければ話になりません。人間の知的活動をリアルに測定する方法がないのですから、人間の知能の科学的解明というスタートラインにすら立てないのです。

「同上」

AIはいくらそれが複雑になって、現状より遙かに優れたディープラーニングによるソフトウェアが搭載されても、所詮、コンピュータに過ぎません。コンピュータは計算機ですから、できることは計算だけです。計算するということは認識や事象を数式に置き換えるということです。

つまり「真の意味でのAI」が人間と同等の知能を得るには、私たちの脳が、意識無意識を問わず認識していることをすべて計算可能な数式に置き換えることができる、ということを意味します。しかし今のところ、数学で数式に置き換えることができるのは、論理的に言えること、統計的に言えること、確率的に言えることの3つだけです。そして、私たちの認識をすべて論理、統計、確率に還元することはできません。

脳科学が随分前に明らかにしたように、脳のシステムはある種の電気回路であることは間違いなさそうです。電気回路であるということは、on か off か、つまり 0 と 1 だけの世界に還元できることを意味します。基本的な原理は計算機と同じかもしれません。それが、「真の意味でのAI」や「シンギュラリティの到来」を期待させている一面はあると思います。けれども、原理は同じでも、脳がどのような方法で、私たちが認識していることを「0、1」の世界に還元しているのか。それを解明して数式に翻訳することができないかぎり、「真の意味でのAI」が登場したりシンギュラリティが到来したりすることはないのです。

「同上」

科学者は科学の限界に謙虚でなければなりません。それを新井教授は次のように言っています。


科学や技術とは「なんだかよくわからないけれども複雑なこと」を、数学の言葉を使って言語化し、説明していく営みです。それと同時に、言語化できなかったことを、痛みをもって記憶することでもあります。そして、前者以上に後者が大切です。

・・・・・・・・・・

言語化し数値化し測定し数理モデル化するということは、つまり「無理にかたづける」ことなのです。かたづかる腕力を持つのと同時に、そこで豊かさが失われることの痛みを知っている人だけが、一流の科学者や技術者たりうるのだと思います。

・・・・・・・・・・

私が科学者として肝に銘じていることがあります。それは、科学を過信せず、科学の限界に謙虚であることです。

「同上」


AI技術によって人間の仕事がなくなる


AIは以上のように限界があります。しかしその一方でAIは極めて強力な技術であり、東ロボくんはセンター模試で全受験生の80%より上にランクされるほどの実力を持ちました。オックスフォード大学「雇用の未来」では広範囲(約半分)の仕事がAI技術で置き換えられると想定しています(No.175「半沢直樹は機械化できる」参照)。

考えてみると「新しい発明や技術の登場で仕事がなくなる」のは今に始まったことではありません。むしろ人類の歴史はその繰り返しでした。新井教授も指摘しているのですが「便利になる」ということを突き詰めて考えると、それは「労働を置き換える」ということです。そして新技術は人類全体としては恩恵が多く、新技術の登場以前よりも社会がより豊かになってきました。そのことから「AI技術で無くなる仕事があったとしても、人類全体としてはそれを乗り越えてより豊かな世界を築いていけるに違いない」という楽観論があります。

しかし、そうとも言えないのです。その理由は2つあって、1つはAI技術で無くなると想定される仕事が極めて広範囲であることです。従来の新技術は特定の仕事が無くなるタイプでした。たとえば自動車が発明されて御者が無用になるといった ・・・・・・。それと比較してAI技術では全仕事の半数が無くなる(だろう)と予想されているのです。

2番目の理由ですが、AI技術でより豊かな世界になるためには「AIではできない仕事」や「AIで無くなる仕事に代わって新たに発生する仕事」に人が適応できることが必要ですが、そこに疑問があるからです。AIが不得意な仕事とは、コミュニケーション能力や読解力や常識が必要な仕事であり、加えて人間らしい柔軟な判断が必要な仕事です。


AIの弱点は、万個を教えられてようやく一を学ぶこと、応用がきかないこと、柔軟性がないこと、決められた(限定された)フレーム(枠組み)の中でしか計算処理ができないことなどです。繰り返し述べてきたとおり、AIには「意味がわからない」ということです。ですから、その反対の、一を聞いて十を知る能力や応用力、柔軟性、フレームに囚われない発想力などを備えていれば、AI恐るるに足らず、ということになります。

では、現代社会に生きる私たちの多くは、AIには肩代わりできない種類の仕事を不足なくうまくやっていけるだけの読解力や常識、あるいは柔軟性や発想力を十分に備えているでしょうか。常識の欠如した人が増えてきているのは嘆かわしいことですが、大半の人が持ち合わせていなければ、それはもはや常識とは言いませんから、常識や無意識の人間らしい合理的判断は大半の人が持ち合わせていることにしておきます。問題は読解力を基盤とする、コミュニケーション能力や理解力です。

「同上」

その大切な読解力が危機的な状況にあると、新井教授が明らかにしています。新井教授は東ロボくんのプロジェクトと並行して、中高生を対象にしたリーティング・スキル・テストを実施しました。その衝撃的な結果を次回に紹介します。



本書「AI vs.教科書が読めない子どもたち」の前半(AIについて)の感想ですが、No.196「東ロボにみるAIの可能性と限界」にも書いたように、

  大学入試(模試)という極めて具体的なチャレンジを通して判明したAIの強みと限界が実証的に書かれている

ことに好感しました。大学入試という限定した範囲だけれども、入試は人の知的な営みの成果を示す重要なシーンです。それをテーマにして実験をした結果をもとに論が展開されている。世の中には根拠も示さず「AIが人間の脳を越える」などと吹聴する論説がよくありますが、それらとは一線を画した本です。科学の基本的な方法論にのっとって書かれた本、そこに価値があると思いました。



 補記:藤井聡太棋聖 

2020年7月16日に行われた第91期棋聖戦5番勝負の第4局で、藤井聡太7段が渡辺明3冠を破り、史上最年少(17歳11ヶ月)のタイトル・ホルダーとなりました。藤井棋聖は7月21日にメディア各社のインタビューに応じましたが、将棋のAIソフトについて語った部分があったので、それを紹介します。


コロナ禍で4月中旬から約1ヶ月半、公式戦がなかった。その間、「じっくりと自分の将棋と向かい合えた。序盤の定跡を自分なりに整理した」という。

また、将棋ソフトを使い、研究を深めた。「ソフトの評価や読み筋を見て、自分で理由づけができるかどうかが大事。理由がわからないと応用ができない。ソフトと研究するだけでは強くならないので、改めて自分で考えるということは意識しています」と話す。

朝日新聞(2020.7.22)

本文中で新井教授は「AIの弱点は意味がわからないこと」と言っていましたが、藤井棋聖の言葉を借りると人間の強みは「理由づけができる」ことであり、これは「意味の理解」と同じことでしょう。藤井棋聖の将棋AIについての発言はシンプルで、あたりまえといえばその通りですが、史上最年少のタイトル・ホルダーとなった人の発言は、やはり重みがあると思いました。

(2020.7.27)



nice!(1)