知って得する 人工知能の基礎の基礎

人工知能(Artificial Intelligence:AI)はもはや、使っている側がそれと気づかないでいるほどに浸透している。また会社が「AIを導入した」「AIによる新サービス開発」と謳えば株価があがるご時世でもある。囲碁や将棋の世界で人間とAIとの勝負が話題になったのはもう昔の話。AIを活用した医療診断システムが稼働するなど、「ニュース・話題」の段階から、確実に日々の生活と社会の在り様を、AIが具体的に変え始めた時代を、私たちは生きている。

ところであなたはAIの基礎知識を持っていますか?AIについての基礎知識、本質的理解なしに仕事を続けることは、会社でのあなたの評価にもつながる切実なネガティブ・ポイントになりかねません

トレンディなキーワードを検索にかけ、情報を取得して、それでなんとなく会話についていければいいやと考えていませんか。それではあとから手痛いしっぺ返しを受けるでしょう。「AI関連ニュースに詳しい人レベル」を早く脱却すべきです。それには、きちんとした書籍を一通り読むことが近道ですが、ここではそういった書籍の書き手でも意外と見落としている、AIの「基礎の基礎」について2点説明します。

◎読解力とヒューリスティック:意味の理解とAI

◎数学と哲学:意味・認識論から始まったAI

1.AI並みでしかない(!?)、日本の中高生読解力

人工知能(Artificial Intelligence:AI)による音声解析・音声認識がコンピュータやスマホを経由して、私たちの生活の中に当たり前のように入り込んできている一番の事例は検索シーンだろうか。

スマホを取り出して、音声で質問をする。

「新宿にあるイタリアンレストラン」

すると画面には、新宿近辺のイタリアンレストランのリストずらりと並ぶ。

今度は質問を変えて再び音声検索を行う。

「新宿にあるイタリア料理以外のレストラン」
「新宿以外にあるイタリアンレストラン」

なんといずれも、画面にはさっきと同じようなイタリアンの店がずらりと並ぶ。(なんだかナ)という検索結果。

スマホの(音声入力に限らないが)検索への応答の裏ではAIが動いている。上述のような結果になるのはAIが『……以外の』の意味を分かっていないからだ。

そして、国立情報学研究所の新井紀子教授の読解力に関する調査で判明したことは、現代の中高生の「読解力」が(発展途上にある現在の)AI並みでしかない(!?)、ということだった。中高生は「AI読み」をしていたのだ。

新井紀子教授が調査したのは、文章などの意味をどの程度正確に読めているのかを見るリーディング・スキル・テスト(RST)。社会人も含め4万人のデータが解析された。

リーディング・スキル・テスト(RST)では、

・主語述語や修飾語被修飾語など、文を構成する要素の関係(=係り受け)の理解

・「それ」「これ」などの指示代名詞が何を示すか(=照応)の理解

・2つの文が同じ意味を表すかどうかを判断する力(=同義文判定)

・文の構造を理解したうえで、体験や常識、その他の様々な知識を動員して文章の意味を理解する力(=推論)

・文章と図形やグラフを比べて内容が一致するかどうかを認識する力(=イメージ同定)

・文章で書かれた定義を読んで、それと合致する具体例を認識する能力(=具体例同定)

についての力を調べる。

たとえばリーディング・スキル・テスト(RST)で下記のような問題がでる。


(大事なのは「読む」力だ!~4万人の読解力テストで判明した問題を新井紀子・国立情報学研究所教授に聞く(江川紹子) - 個人 - Yahoo!ニュース https://news.yahoo.co.jp/byline/egawashoko/20180211-00081509/

この問題文の中に登場する「28」「35」という数字を、キーワードとしてピックアップする、それが含まれるを回答として選択する、こういう思考経路をたどった回答者が四万人データの中でもっとも多かった。これは「28%がアメリカ合衆国以外の出身」という部分が「読めていない」、つまり思考経路から脱落していることを意味する。

そしてを回答したのは「AI読み」をしていたからだ、とも言い換えられる。

つまり、「AIにとって、Wikipediaを丸暗記するとか、医学論文を何百万件蓄積することは、実に簡単。そうして蓄積したデータに対し、いくつかのキーワードを使った検索をして、病名診断であれば『○○病の可能性がある』と」いった「解」を提示する。

医学論文を何百万件も読み通すこと、しかもそれを短時間に行うことは人間には不可能だ。人間にとっての不可能を可能にするAIの機能に対し期待が膨らみ、さまざまな応用が具体化されつつあるのが現状。しかし『……以外の』の意味を理解できないなど、AIにも弱点はある、ということ。

(人間が(あるいは人間も)行う知的処理をコンピュータ上で実現しようという研究としての人工知能について考える。 https://slidesplayer.net/slide/14226756/

 

2.問題は、教育現場だ

『……以外の』といったような要素を含む文章は教科書に多用され、多用することで「読解力」を向上させるべく準備されている。しかしその教科書程度の文章が実は読めていない、という衝撃の事実が新井教授のリーディング・スキル・テスト(RST)により判明したことになる。

しかし衝撃はこれに留まらなかった。戸田市(埼玉県)教育委員会が新井教授と共同で行った調査がそれ。RST結果と普段の学力テスト結果との間に相関関係が認められなったのだ。つまり、「学力テストはできているが、文章をしっかりとは読解できていない可能性があると考えられます。つまり、学力テストも、キーワードを拾って、AI的に解いていた、真に理解して解いていた訳ではなかったということです。(戸田市教育委員会のトライアプローチ~リーディングスキルテスト導入について~|School Platform|note https://note.mu/schoolplatform/n/nafe5bda447b2 )」

これは教育現場でAI読みを推奨するような、またはAI読みができた方がテストに合格しやすい教育手法が常態化していることを意味しているのかもしれない。そう気づいた戸田市(埼玉県)教育委員会はその後、「その授業での学習内容(当然ながら教科書の内容を含む)、文言の意味が正しく理解できるよう、リーディング・スキルの視点から授業改善」を行った。

 

3.AIの強みはヒューリスティック(heuristic)

読解力が中高生並み(?!)のAIだが、もちろん強みがある。上記「1.AI並みでしかない(!?)、日本の中高生読解力」で述べたように、「医学論文を何百万件も読み通すこと、しかもそれを短時間に行う」能力、これを使って試行錯誤を膨大な数でこなし、「解」に接近する能力がそれで、ヒューリスティック(heuristic)と呼ばれるもの。

ヒューリスティックとはもともと、人が意思決定をしたり判断を下すときに、厳密な論理で一歩一歩答えに迫るのではなく、直感で素早く解に到達する方法のことをいう。例えば、服装からその人の性格や職業を判断するなど。ここから近時、発見的な(方法)、経験則(の)、試行錯誤(的な)という意味でIT分野などで盛んに使われるようになっている。

つまり問題の「解」を得るための方法論の一つとして、常に正しいとは限らないが経験的にある程度正しい解を導ける推論や経験則などを利用して、近似的あるいは暫定的な「解」を得る手法のことをヒューリスティックという。高速のしかも日夜休まぬ試行錯誤をAIは行える。AIに対しビッグデータを渡してやることで、人間が行うのが事実上現実的でないほどの膨大な試行をこなすことで、人間にはできないほどの精度の高い結果を、AIは導くことができる。

注意したいのはこういう場面で与えられるビッグデータはある程度構造化されている点。構造化データであれば、人間を凌駕すると思えるほどの結果を出すことがAIにはできる。他方、音声認識の場面では、音声のテキスト化には成功しているものの構造化データにはなっていないため、読解力が中高生並み(?!)となってしまうのだ。

認識論でいうところの「意味」を理解する領域は、AIにとってまだ未踏峰といえる。

 

4.「続き」の文章が書けるAI

他方キーワードを拾って、パターンマッチングする作業領域については、かなりの程度、AIの能力は進化している。

この領域で最近面白い研究成果があった。膨大な過去記事や過去の文章を学習させたAIに、ある文章の「書きだし」部分を与えると、「それらしい」文章の「続き」が書けた。しかしあまりにも「それらしい」ので、悪用されることを恐れた研究陣がこの研究成果を非公開とすることに決めた、というのだ。(New AI fake text generator may be too dangerous to release、 say creators | Technology | The Guardian https://www.theguardian.com/technology/2019/feb/14/elon-musk-backed-ai-writes-convincing-news-fiction

対象は、イーロン・マスク氏らが出資する非営利のAI研究組織であOpenAIが開発した、テキスト生成用のAIモデル「GPT2」。

試しにブレグジット関連の文章を与えた。

「ブレグジットは既にEU離脱を問う国民投票以来、少なくともイギリス経済に800億ポンド(約11兆円)もの負担をかけています」

すると、

「さらに、多くの業界専門家たちはブレグジットによる経済的損失がさらに大きくなっていくと信じています」

と「GPT2」が「続き」の文章を記述し始め、そこから次々と「新聞記事(らしい)文章」を生成していったのだ。


https://www.theguardian.com/technology/2019/feb/14/elon-musk-backed-ai-writes-convincing-news-fiction

ただし、ここでも認識論、「意味」との関連では次のような現象が起きた。

スタンフォード大学の研究者であるHugh Zhang氏が「GPT2」に対し、次の文章を与えた。

科学者がアンデス山脈の人里離れたところにある、これまで人々が探検してこなかった谷で、科学者がユニコーンの群れを発見するという衝撃の事実が判明しました。科学者が発見したさらに驚くべき点は、ユニコーンたちが完璧な英語を話すという事実です。

この「続き」を「GPT2」が文章生成した。

科学者はその特徴的なツノにちなんで、その群れをオービッズ・ユニコーンと名付けました。4本のツノを持つ白銀のユニコーンは、これまで科学界に知られていませんでした。2世紀が経過した今では、話題となった奇妙な現象の謎も最終的に解決されました。

いかにもそれらしい文章だ。ところで「続き」に欠陥があるのを気づいただろうか。

・最初の文章では、ユニコーンのツノが1つ。これに対し「続き」では「4本のツノ」となっている。
・最初の文章では、「ユニコーンはそれまで存在が知られていなかった」とあるのに、AIは2世紀前からユニコーンが発見されていたと書いている、
(Dear OpenAI: Please Open Source Your Language Model https://thegradient.pub/openai-please-open-source-your-language-model/

すなわち、人工知能が活躍する領域をマッピングすると下記のようになるが、このうち右上が得意で、現状、左下は不得意なのだ。

(人間が(あるいは人間も)行う知的処理をコンピュータ上で実現しようという研究としての人工知能について考える。 https://slidesplayer.net/slide/14226756/

 

5.Googleの猫

ネットからAIについての情報を得ている人は、

「でもGoogleの研究でAIが猫を認識したって大騒ぎしたんじゃないの」
「『Googleの猫』から一気に、人工知能が将来人間の知能を凌駕するっていう議論が盛んになったんだよね」

と言うかもしれない。

新聞やネットからの情報だけからだとミスリーディングしやすい、この『Googleの猫』の話題。元の論文にあたると正確には、「Deep Learningという手法を使い、AIに1000万枚の画像を与え学習させたところ、猫の顔の写真に反応する仕組み(論文中では「ニューロン」の単語)ができた」というもの。

日本のマスコミ等で人工知能の権威としてよく登場する、東京大学松尾豊特任准教授も

「ディープラーニングは、データをもとに、コンピュータ自らが特徴量を作りだす。人間が特徴量を設計するのではなく、コンピュータが自ら高次の特徴量を獲得し、それをもとに画像を分類できるようになる。」「(ただし:筆者註)もちろん、画像特有の知識(事前知識)をいくつか用いているので、完全に自動的につくり出せる訳ではない。
(『人工知能は人間を超えるか』から)」

と解説している。

そもそも人間の幼児がどうやって言葉を獲得していくのか、言葉から意味をくみ取り、周囲の社会(まずは母親をはじめとする家庭という社会)を認識していくのか、その経路はまだよくわかっていない。つまり人間の知能がネコをどうやって「猫」の単語と結びつけてその意味を理解していくのかわかっていない。だから、それをAIができるようになるのはまだまだ先の話と考えていいのではないだろうか。

 

6.人工知能は哲学者が作った


(ゴットフリート・ライプニッツ - Wikipedia https://bit.ly/2zL7rXa )

ところでくだんの新井紀子教授、最近の著書で人工知能について次のように言っている。

「コンピュータはすべて数学でできています。AIは単なるソフトウェアですから、やはり数学だけで出来ています。
(『AI vs. 教科書が読めない子どもたち』から)」

たしかに人工知能はプログラミングによって作られている。AIが「数学でできている」という理解は間違いではない。が、100%正しいとも言えない。

こんにちのデジタル世界はどんな記号も1と0で表現することで成り立っている。そもそもコンピュータは、そしてコンピュータを構成しているICチップは「二進法」でできている。電気がつく/つかない、の「二進法」をベースに組み立てられ、ついにはAIに至るのだが、この「二進法」を考案したのは17世紀の哲学者だ。

人工知能の「父」はアラン・チューリング。第二次大戦中に、ドイツの暗号解読に功績をあげたことで知られている。彼はイギリスの数学者で1937年にコンピューターの数学的モデルと評されるチューリングマシンを考案。そして1948年から電子計算機の設計、数理論理学、人工知能、形態発生学等の研究に従事した。

そして人工知能の「祖父」にあたるのがゴットフリート・ライプニッツ(1646~1716)。ドイツ近世哲学の祖といわれる人物だ。

彼は二進法を考案すると同時に、『人間知性新論』を著わした。「新」の文字があるのは、この本がジョンロックの『人間知性論』に対抗した、意味・認識論にかかわる思索の結果だったからだ。

 

7.17世紀、平和構築のために人工知能は構想された

17世紀、西ヨーロッパ社会は脱宗教へ向けた活動が密かに(というのも同時代に正面切ってそれを唱えるのはまだ危険を伴ったから)、始まっていた。人間理性による社会構築、それも諸侯、諸国の相争わぬ世界、同時に病気の大流行も含む自然災害へ対処できる人間世界を構築しよう。そのためには世界共通(ここでの「世界」は西ヨーロッパだが)の普遍言語、普遍哲学が構築されなければならない。当時の知識人たちは「普遍言語構想」に邁進していた。

1617世紀の西ヨーロッパはそれくらい悲惨なことが起きていたのだ。

宗教は本来、人の生活に安寧をもたらし社会に安定を施すもののはずだ。しかしその宗教を理由に三十年戦争が戦われた。それは1618年~1648年、ドイツ国内の宗教的対立を契機とする紛争に諸外国が介入したもので、宗教を理由に人間がこれほどまで残虐な行為に出うるのかを人々に記憶させる戦争となった。
・戦闘後の死体を樹木にぶら下げる図

(三十年戦争 - Wikipedia https://bit.ly/2Cavf5y

主戦場となったドイツは戦災に加え各国傭兵軍の無規律な略奪で社会、経済、文化に大打撃を受けた。結果、人口は半減したとも伝えられている。ちなみにライプニッツはそのドイツに生まれた。

さらに当時は小氷河期(1560年〜1700年)にあたり、ボーデン湖やライン川が氷結するほどで、西ヨーロッパ全体に凶作をもたらし、体力の弱った人々の上にペスト、コレラ、チフスなどの疫病が蔓延したのだった。

こういった社会情勢を背景に、一方で解剖学、生病理学などの医学分野(輸血の実験も始まった)、顕微鏡と望遠鏡に象徴される様々な分野の、自然科学が急速に発達、自然観や世界認識のパラダイムチェンジ(たとえばガリレイの地動説)が生じていった。

そんな時、諸侯、国家の対立や戦争の原因は、お互いを認識する共通の言語、哲学がないからではないかとして、新しい言語・哲学を志向する多くの知識人、デカルト、パスカル、ホッブズ、ロック、そしてライプニッツらの活動が始まった。

 

8.「普遍記号論」化するAI社会に必要なのは哲学

「一切の思考は概念による計算である」、ホッブズがそう言い、『人間知性論』のジョンロックが「記号論」なる単語を造語し、すべての言語は0と1とからなる人工記号のシステムで書くのが最も合理的であるとライプニッツは言い、「普遍記号論」プロジェクトは提唱された。

1718世紀のバロック時代、コンピュータの、そしてAIの思想的設計図が「普遍記号論」で創案された。そこから三百五十年を経て、哲学的プジェクトは工学的プジェクトへ実を結び、人工知能、AIが出現したのだ。

いや出現したばかりでない。確実に日々の生活と社会の在り様を、AIが具体的に変え始めた時代、つまり「普遍記号論」化するAI社会を、いま私たちは生きている。

そうだとすると、「普遍記号論」化する世界の本質に迫り、時代のオリエンテーション(方向づけ)をしてくれる哲学の営為に、私たちはもっと目を向けるべきなのではないか。意味・認識論の進化・深化とともにAIは進んでいかなければらない。望ましい人間社会を手に入れるためには。

 

 


「もちろん知能的アプリケーションを作るまででしたら、そこまで必要ではありませんが、知能そのものを作り出そうという最大射程の時には、知能とは何か、存在するとはどういうことか、生きるということはどういうことか、という哲学が必要です。

なぜなら、「人工知能を作る」とは、生き物を作ろうとすることでもあるからです。」

人工知能の足場としての哲学 – iCardbook|知の旅人に https://society-zero.com/icard/240622


 

★iCardbook(アイカードブック)は、カード型ebookの形態で、書籍流通のデジタルトランスフォーメーションを企図した新しいホンの形です。ラインナップの中から人工知能(AI)に関連した書籍は以下の3点。


◎ゲームの中で動いているキャラクターAIに関する、AIの本質論の書。

「人工知能は工学(エンジニアリング)であり、科学(サイエンス)であり、哲学(フィロソフィー)なのである。(三宅 陽一郎)」

■『人工知能と人工知性』の参考文献リスト https://society-zero.com/reference/006.html

 

◎AIはコンピュータからの産物。電気信号で動いています。ところが人間の知能も実は、神経回路の「発火作用」で動いているのです。「神経回路」から「脳」を理解し、「知能」を解明し、AIとの違いにも迫ります。池谷裕二先生のもとで博士号を取得され、神経科学の第一線で活躍されている佐々木拓哉先生の著書。

■『脳と情報』の参考文献リスト https://society-zero.com/reference/007.html

 

◎境祐司氏の電子書籍。会社でAIを担当するよう命じられ途方に暮れている人のための入門書。はじめてAIを本格的に勉強しようとする人のためのガイダンス。デザインの要素知識から始まって、AIの本質論へ迫っていく、ミニ辞典。

■『人工知能と商業デザイン』の参考文献リスト https://society-zero.com/reference/005.html