ChatGPTがエルサレムのアイヒマンを大量生産しないために

◎子を持つ親、教員、出版人のためのChatGPT入門◎

まず次の「アミラーゼ問題」を考えてみてください。

●アミラーゼ問題

次の文を読みなさい。

アミラーゼという酵素はグルコースがつながってできたデンプンを分解するが、同じグルコースからできていても、形が違うセルロースは分解できない。

この文脈において、以下の文中の空欄にあてはまる最も適当なものを選択肢のうちから1つ選びなさい。

セルロースは(     )と形が違う。

(1)デンプン (2)アミラーゼ (3)グルコース (4)酵素

正解はこの記事の途中(2.問題文が読めないと問題は解けない)で紹介します。

 


目次:
1.ChatGPTは習わぬ経を読む門前の小僧
2.問題文が読めないと問題は解けない
3.書き言葉は学習によってしか習得できない
4.エルサレムのアイヒマンとChatGPTのリスク


 

さて、この記事のポイントは、次の内容となります。


ChatGPT(チャットジーピーティー)は「それらしいことを言うけれど実は何も考えていない人」です。もちろんこの表現はたとえであって、ChatGPTに人格はありません。つまり意思も知性も持ち合わせません。あくまで生成系AIのひとつで、文章生成ツールです。学習・教育のシーンで文章生成ツール・ChatGPTをどう活用するか。その検討の際、成長過程での脳の段階的発達との関係に十分配慮をすべきです。読み書きを通して脳は新しい神経回路を形成し、さまざまな認知機能を発達させます。なかでも書き言葉に励起される「思考」機能は、個人の人生と現代経済社会に不可欠な要素です。


会話(Chat)と文字列生成(GPT=Generative Pre-trained Transformer)とからの造語がChatGPT。ChatGPTは生成系AI(人工知能)のひとつで、文章生成に特化したツールです。どうやって文章生成ができるのか。子を持つ親ごさん、教員のみなさん、出版人の方々を念頭にざっくりベースで説明していきます。

 

1.ChatGPTは習わぬ経を読む門前の小僧

「痛いの痛いの」とくれば、その次には「飛んでいけー」とくるのが一般的ですね。

他方、「息を」ときた場合はどうでしょう。

その次には、「殺す(息をつめてじっとしている)」もあるし、「引き取る」と来れば本当に死んだことだし、「呑む美しさ」と続くかもしれません。いろいろです。いろいろですが、とは言え、全く関係のない単語が続くわけはありません。

ここらの、単語と単語の続き具合(パターン)を、文字列の巨大なデータから「確率」として学習することで、文章生成ツールとしての機能が発揮できるよう組み立てられ(自然言語処理エンジン)、双方向で文字列を投げ合う(Chat|会話する)のがChatGPTです。

またもうひとつ、学習モードを反転させた運用モードを作っているところが、「(ツール・機械の向こうに)まるで人間がいて書いたような文章だ」と驚嘆される秘密です。

・学習モードと運用モード

ChatGPTの原理と実際:自然言語処理を使った機械学習の仕組み

たとえば「日本の首都は東京です」という文章から「日本」「首都」「東京」の3つの単語の関連性を「確率」で把握しておきます。それに基づき、ユーザーから「日本の首都はどこ?」という質問をされると、「東京です」と応答する、といった具合です。

無料版のChatGPTには、GPTの中でも「GPT-3.5」が採用されています(2023年4月時点)。GPT-3.5は、3550億のパラメーターを有していて、1750億であった「GPT-3(2022年12月時点)」よりさらに文章の完成度・精度が良化しています。ちなみに有料版で採用されている「GPT-4」のパラメータ数は100兆とも言われ、なるほど出てくる文はもうほとんど機械が作成したことを感じさせません。

ここでパラメータとは、AIが動作し、結果を導き出す際に「どの選択肢が確率的に高いか」を推しはかるために参照する要素のことです。 同じ学習データを用いて学習(Pre-trained)を行ったとしても、パラメータが増加すれば結果を導き出す際の分岐点が増えることで、より多彩でなめらかな「らしい」応答文を作成することが可能になり、文章の完成度・精度が良化します。

既存のチャット(ボット)サービスにないChatGPT固有の特徴として、文脈を覚えていて文章を生成してくる点があります。つまりユーザーからの問いかけ文に対して、文体や語調、語彙まで整えて応答してくる点が際だっています。それは要するに、語彙選択や感情表現、その分野特有の言い回しにまつわるパラメータを持っているということです。100兆のパラメータ、恐るべし。文の自然さ、完成度、応答の「らしさ」程度がすさまじいのです。

ただし、ここでいう、「完成度・精度」は文章の出来具合や応答の「らしさ」のことをさしており、作成された文章の内容の「精度」、たとえば正しさなどのことではない点には留意すべきです。

応答の「らしさ」は、「司法試験でも合格圏に入る優秀さ」などと表現される事態を生んでいます。けれどもChatGPTは習わぬ経を読む門前の小僧に過ぎません。小僧が経をそらんじても、内容について、なんの理解もないのは当たり前です。文字列のいかに巨大なデータから「確率」を学習していても、単語と単語の続き具合(パターン)を応答文として返しているのに過ぎません。

パターンマッチングを原理としている以上、機械(AI)が内容を理解することはないのです。(マッチングというと二次元的な印象ですが、より実態に近い表現としては、大規模言語モデル(LLM|Large Language Models)のベクトル空間に座標データとして位置づける、その位置の近さを「マッチング」させています)

たしかにこれが人間であれば、門前の小僧であっても、何年もの人生経験と覚えた経との関連を反芻、思考することで内容の理解にたっすることがあるかもしれませんね。兼好法師も言っています。

「狂人の真似とて大路を走らば即ち狂人なり、悪人の真似とて人を殺さば悪人なり。驥を学ぶは驥のたぐひ、舜を学ぶは舜の徒(ともがら)なり。(徒然草85段)」

「学びは真似ぶから」、ですから、人間ならそういうことがあるでしょう。しかし意思や知性を持たない機械で、こうはいきません。まるで人格を感じさせるような応答文を返してきても、あくまで、「それらしいことを言うけれど実は何も考えていない人」、それがChatGPTです。ですから内容が間違っているとか、そのうち改良されることで内容が正しくなるだろうといったコメントや感想は、原理的には的外れということになります。

ただとにもかくにも、優秀な文章生成ツールが手に入るようになったことは間違いありません。

内容の正しさを問題にする必要のないシーンでの活用は大いに有益でしょう。

それでは次に、学習や教育シーンでのChatGPT活用について考えていきたいのですが、その前に、日本の生徒たちの文章読解力の現状をチェックしてみます。

 

2.問題文が読めないと問題は解けない

「生徒が問題を解けるようになるには、どういう授業設計をしたら良いか」、教育現場でこのような発想が当たり前であったところに、「いや実はそもそも問題文が読めていないのではないか」、という問題提起をしたのが、『AI vs.教科書が読めない子どもたち』の著者、新井紀子氏でした。全国2万5千人の中高生の「基礎的読解力」を調査した結果、3人に1人が、かんたんな問題文を読めていないと指摘したのです。このとき開発された「リーディングスキルテスト(RST)」は全国の市町村、教育機関で現在使われています。

RSTの一例が冒頭の「アミラーゼ問題」で、この本の中に紹介されていて、正解は(1)デンプンです。

他に、次のような問題もありました。こちらはいかがでしょう。

・パターンマッチング的な回答(④)で不正解が多い日本の生徒たち

人間が言葉の力を鍛えることでAIと共生する魅力的な社会がつくられる | 宣伝会議デジタル版

ここで、問題文の中に登場する「28%」「35%」という数字が、回答例の円グラフの中の数値と一致しているのを根拠に、④を回答した生徒が多かった、つまり数字のマッチングを理由に判断した生徒が多かった、ということです。これはAIがやっていることとおんなじです。つまりGoogleなどの検索エンジンは、検索サイトで入力されたキーワードとのパターンマッチングを梃子に、検索ユーザーの興味関心に関連したWeb記事を探し出すわけですから、まるで人工知能がやっているようなことを、生徒がやっていたことになります。したがってAI同様のパターンマッチングの結果、この問題に不正解の生徒は、問題中の文章を理解して読むことができていない可能性があります。

そして「文章の意味を理解して読むことができない」という現象は中高生の上の、大学生にも及んでいるというのですから、事態は深刻。

「意味を理解して読むことができない」という現象が想定外に広がっているのではないか、という疑念が確信に変わったのは、バイトに来ている東大生に頼んで、正答率が低かったRSTの問題を、東大のゼミ仲間に解いてもらった結果を聞いたときです。前著『AI vs.教科書が読めない子どもたち』に出てくる、悪名高き「アミラーゼ問題」に日本人大学院生は全員不正解。唯一正解したのが中国からの留学生だったというのです。
「教科書が読めない人」は実はこんなにいる

ところでこの本の出版が2018年。実はそれより先、2012年の国際的な調査でも、似た結果が出ていました。「PIAAC(国際成人力調査)」がそれで、16~65歳を対象に、仕事に必要な「読解力」「数的思考力」「ITスキル」を調べたもので、OECD加盟の先進国を中心に、24の国と地域で実施されました。

この中でたとえば、「図書館の蔵書検索システムを使って、指定された条件に合う本を選ぶ」という設問があります。

PIAAC_レベル4

これは、150文字程度の本の概要を複数、順次読み、その中から当てはまる本を選ぶ問題ですが、日本人の80%近くが不正解(正解率は14.68%|ちなみにフィンランド35.81%/ノルウェイ29.52%/オーストラリア30.01%/韓国32.87%)でした。16~65歳の集団でも、150文字程度の文章が読めていない可能性があるというわけです。

学生だけでなく、日本人全体で、文を読む力の低下現象が示唆されます。これはそのまま、思考の力の停滞をも暗示してはいないでしょうか。

かかる状況下の日本社会で、優秀な文章生成ツールChatGPTを活用するとどういう事が起きうるか。なかでも、学習や教育シーンでのChatGPT活用について考えてみましょう。

 

3.書き言葉は学習によってしか習得できない

私たちが人生で直面する課題は、答えがいくつもありえ、答えにいたる道もいくつも考えられる。そういう類いのものです。それまでの経緯や現状、そして自分の実態に合わせて正解を探っていく。そういうものですね。そのための柔軟な発想力や思考能力は、実は幼児期に基礎ができあがります。そしてそれは母語(日本人であれば日本語)、つまり言葉の習得と深い関係があることがわかってきています。発達心理学や脳神経学などの最近の成果です。

・デジタルで読む脳 X 紙の本で読む脳 :「深い読み」ができるバイリテラシー脳を育てる

・デジタルで変わる子どもたち ――学習・言語能力の現在と未来

・脳と情報: 神経回路と記憶のメカニズム

ここでその言葉のうち、話し言葉の習得は生得的に可能な部類に入りますが、書き言葉の習得はそうでありません。学習が必要です。適切な学習環境(教育制度だけでなく周囲の大人や子どもからの相互作用も含む)がなければ書き言葉を読んだり、書いたりできるようにならないのです。思考能力も育ちません。

しかも人間の認知的発達は段階を踏んで、ひとつひとつ階段を登るように、同時に複合的に重なり合いながら達成されていきます(ピアジェの「発生的認識論」)。

小学校や中学校の学習シーンで、調べ物は本を読む事に加え、Google検索する作業が含まれるようになっています。ここでGoogle検索作業がChatGPTの活用(生成された「らしい」文章のコピペ)で代替されるのは、認知的発達にネガティブな影響を及ぼしそうです。

Google検索をする際、検索する側、Googleを使う側は、自分の持った関心、疑問を一旦キーワードに落とします。するとGoogleの側はそのキーワードと関連の深そうなWeb記事のURLを返します。次に検索する側はやおらURLのスニペットを読んで、このURLの記事なら自分の持った関心、疑問に対応しているかなと判断して、クリックし、実際に読んで、あったあったと快哉をさけんだり、逆に期待を裏切られイライラしたりします。

この検索作業を通して脳には新しい神経回路が形成され、さまざまな認知機能が発達します。本を読む事と同様な発達が期待できます。生成された「らしい」文章のコピペ(ChatGPTの活用)とその修正作業に、同様のことが期待できるか、よく検討すべきでしょう。思考力など知能の段階的発達の過程に、ある制限的措置を設けることが望ましいのではないでしょうか。

大学での話ですが、最新脳科学の知見をわかりやすく伝える著書、『海馬』や『進化しすぎた脳』で有名な東京大学池谷裕二教授は、学生にChatGPTの使用をむしろ命じたのですが、その際の考えはこうです。

「ChatGPT、DeepL、グラマリー、三種の神器を必ず使うようにと伝えました。人間の生の脳で書いた文章なんて、下手くそですから」」
「そんなメールがきたのは初めて」 東大院生も驚いたChatGPTの“効果” 池谷裕二教授の活用法

日本語文の指導に費やす時間を、専門領域の指導・教育に使う方が生産的といった発想が池谷教授にはありそうです。

またこういう意見もあります。

「例えば、教員が使い、出力された結果をクラスで共有してディスカッションするなどの使い方はできるだろう。子供たちが個別にパーソナルな教材を作ってもらい、それに関する間違いがないかなど確認するワークも考えられる。その際、AIは間違えることがある、全てを信じてはいけない、といったAIリテラシーの涵養も必要になるだろう」
対話するAI「ChatGPT」  学校現場に芽生える期待と懸念

ですが、認知的発達が段階を踏んでいく(発生的認識論)ことを考慮したとき、どういう使い方がどういう時期に妥当か、よく吟味されるべきでしょう。とりわけ、「2.問題文が読めないと問題は解けない」でみた、文を読む力の低下現象や思考の力の停滞への懸念を前にすると、池谷教授などとは異なる対応も必要かと思います。

最後に、文を読む力の低下や思考の力の停滞が、現代経済社会の基底を崩しかねない要素をはらむことを説明します。

 

4.エルサレムのアイヒマンとChatGPTのリスク


「書記言語の発明が人類にもたらした最も重要な貢献は、推論にもとづく批判的論法と内省する能力のための民主的土台です。これは集団的良心の基礎です。二一世紀の私たちが、きわめて重要な集団的良心を維持するつもりなら、社会のメンバー全員が、深くかつ上手に読んで考えることができるようにしなくてはなりません。」
本をどう与えたら良いか、悩む親や先生に


官僚制は文明の黎明期からあったともされていますが、最近の社会学で官僚制は、近代社会の基盤と認識されています。早くにはマックス・ウエーバーが官僚組織の分析を進めていて、「鉄の檻」という比喩をつかった(『プロテスタンティズムの倫理と資本主義の精神』)ことが知られています。

国家行政ばかりか私企業や軍隊など、現代経済社会全般に官僚組織は広まっているわけですが、それは恣意性を排して運営されるという意味で高度に効率的であるから、です。しかし他方官僚制は、所属する個人の人間的な判断を否定し、彼ら彼女らを専門性の枠にとじ込める点で,自動機械のような冷徹な性格をも有しうる、それが「鉄の檻」の比喩に込められた意味でした。

人間を自動機械の部品に変えてしまう、官僚組織の暴力性の象徴的存在が「エルサレムのアイヒマン」です。

Eichmann

150万人とも600万人とも言われるユダヤ人の大虐殺(ホロコースト)、その行政的執行の中心人物こそアドルフ・アイヒマンでした。1960年、イスラエルの調査機関によりアルゼンチンで捕縛され、1961年からエルサレムで裁判が始まりました。政治哲学者ハンナ・アーレントはニューヨーカー誌からの依頼でアイヒマン裁判を傍聴し、それを『エルサレムのアイヒマン』にまとめました。ですから『エルサレムのアイヒマン』はドキュメンタリーです。アーレントは自身がまさにユダヤ人でしたが、その点は横に置いて、中立的な立場に徹して記述したのでしたが、それがかえって雑誌寄稿時点から批判を呼びました。

人々は、大虐殺(ホロコースト)という人類史上の汚点の中心人物に、極悪非道の巨悪的人物像を期待しました。しかしアーレントが描くアイヒマンはそのイメージから遠かったのです。しかも、ユダヤ人の中に協力者がいたことも、傍聴記録で明らかになったりさえしたので拒絶反応は激しさを増しました。

アーレントは寄稿を書物にまとめるにあたり自身の所見を、わずかに『エルサレムのアイヒマン』の副題に込めました。副題は「悪の陳腐さについての報告」とあり、著作物の最終章(第十五章 判決、上告、処刑)、最終ページは次の記述で締めくくられました。アイヒマンは驚くほど一貫して一言一句たがわず同じ決まり文句や自作の紋切り型の文句をくり返すのを好みました。同じパターンがもたらす「高揚感」に溺れるところがあったのです。

「死を眼前にして、彼は弔辞に用いられる紋切り型の文句を思い出したのだ。絞首台の下で、彼の記憶は彼を最後のぺてんにかけたのだ。彼は〈昂揚〉しており、これが自分自身の葬式であることを忘れたのである。

それはあたかも、この最後の数分間のあいだに、人間の邪悪さについてのこの長い講義がわれわれに与えてきた教訓——恐るべき、言葉に言いあらわすことも考えてみることもできない悪の陳腐さという教訓を要約しているかのようだった。」

その後、自身と著作への批判への対処として初版刊行から二年後の改訂増補版に「追記」を加え、裁判傍聴から得た自身の所見を、(それでも極めて控えめに)表明してみせました。

「彼は愚かではなかった。まったく思考していないこと——これは愚かさとは決して同じではない——、それが彼があの時代の最大の犯罪者の一人になる素因だったのだ。

(略)このような現実離れや思考していないことは、人間のうちにおそらくは潜んでいる悪の本能のすべてを挙げてかかったよりも猛威を逞しくすることがあるということ——これが事実エルサレムにおいて学び得た教訓であった。しかしこれは一つの教訓であって、この現象の解明でもそれに関する理論でもなかったのである。」

思考する脳を育てることと社会の持続可能性との間に橋がわたっているのです。文章を読み、文章を書くことを通じて形成される「思考」回路の形成なしに、現代の経済社会の仕組みの維持は困難です。

近代国家の建設過程は、教育制度の普及と共にありました。つまり「書き言葉」の一般大衆への浸透、そして書き言葉モデルの「思考」を、社会の成員が身につけていくこととパラレルに、一般大衆に、現在の国民国家存立の諸条件は浸透していったのです。近代国家を支える国民主権主義/法の支配/人権保障の理念/民主的政治制度といった概念への理解が備わっていることが、現代社会の持続可能性の前提なのです。

ChatGPTの社会への応用には、脳の段階的発達の視点をわすれてならないのではないでしょうか。飲酒や喫煙のように。また、映画やTV番組にレイティングシステムがあるように(「PG12」は12歳未満(小学生以下)の鑑賞に成人保護者の助言や指導が必要であるとし、「R15+」は15歳未満の入場・鑑賞を禁止しています)。

[追記2023年5月22日]
ビッグデータと人工知能の技術ベンチャー企業データセクション株式会社を創業し、現在は同社顧問、またデジタルハリウッド大学教授でもある橋本大也氏が、JEPA(日本電子出版協会)のセミナーに登壇、「ChatGPTと本の未来」のタイトルで多様な事例を交えてChatGPTについて解説しました。

その中で氏は、「義務教育課程のできるだけ早い段階で、ChatGPTまたAIの、原理的な仕組みを子どもたちに理解させることが大事になってくる」との見解を表明していました(橋本 大也 氏: ChatGPTと本の未来 - YouTube https://www.youtube.com/watch?v=Hqw_Zfj5LNA )。21世紀のリテラシーとしてかかる理解を素養とする時代がくるのかもしれません。

 

■関連URL

●本をどう与えたら良いか、悩む親や先生に https://society-zero.com/chienotane/archives/9999
「「深い読み(著者の知恵を超えて自分自身の知恵を発見する「読み」)」は共感する能力や他人の視点取得に大きく関わっており、民主主義社会の持続可能性に寄与している、といえる。」

●ChatGPT、2万人独自調査 「AIが7割の仕事奪う」有料ユーザー回答 https://xtrend.nikkei.com/atcl/contents/18/00820/00007/
調査対象ビジネスパーソン二万人中、
・ChatGPT認知者は64.2%、
・ChatGPT使用経験済みは13.5%、
・ChatGPTの仕事での使用経験済みは4.53%

●ChatGPTと検索エンジンのユーザー検索行動に関するアンケート調査|2023年5月実施 https://prtimes.jp/main/html/rd/p/000000344.000055900.html
・利用目的:ChatGPTと検索エンジンどちらも1位は「趣味に関すること」、次いで「仕事、勉強の情報収集」
・ChatGPTの回答に対し「検索エンジンで調べ直した」人は約8割