【ザ・テキトー】話題のChatGPTを理解するための雑学

２０２２年の終わり頃に出現して大評判となっている「ChatGPT」について、本質をどう理解して今後どうなっていくのかを考えるための、知識や教養をまとめます。
「手っ取り早く儲けよう！ベンリに使って楽しよう！」という記事が数多く出ていますが、今回は「ChatGPT」の使い方を取り上げません（笑）

「ChatGPT」の沸騰ぶり
結論：いま流行りのAIは「テキトー」
「適当さ」が絵で見てわかりやすい「Stable Diffusion」
- 比較対象としての「ジョジョ立ち」
ニューラル・ネットワーク
なぜいま急に始まったのか
「パラメータ」→計算の量と精度は、指数関数的
- 「パラメータ」の意味
ハードウェアの発展にぴったりマッチしたソフトウェアが起こすブレイクスルー
- CPU、２つの発展形態：CISCとRISC
  - 「CISC：Complex Instruction Set Computer」
  - 「RISC：Reduced Instruction Set Computer」
- 掛け算と足し算を大量にやる技術
予想される近未来：ホワイトカラー平社員全滅
まとめ

「ChatGPT」の沸騰ぶり

「ChatGPT」は、２０２２年１１月に出現して２０２３年初頭からネット上で話題沸騰しています。
どれぐらい話題かというと、NHKのニュースに取り上げられるぐらい（！）です。

まるで人間？対話式AI「ChatGPT」の光と影 | NHK

話題のAI対話ソフトChatGPT。人間が書いたような自然な文章で回答してくれる便利さの陰で使い方によってはリスクも。

公開されて２～３か月ほどの間に１００万人を超えるユーザーが集まるほど話題になったのは、だれでも無料で使える形になっていたことが大きく貢献しているでしょう。

Introducing ChatGPT

We’ve trained a model called ChatGPT which interacts in a conversational way. The dialogue format makes it possible for ChatGPT to answer followup questions, admit its mi...

「Try CHATGPT」ボタンを押すと、ユーザー登録などの画面に誘導されて体験することができました。
ちょうどこの記事を書いている間に、「ChatGPT Plus (USD $20/mo)」つまり有料プランが出現しました。ネット上のマーケティングではもはや伝統的手法となった「フリーミアムモデル」です。

結論：いま流行りのAIは「テキトー」

レポートが書ける、企画書が書ける、プログラムもできちゃう、などその回答を称賛する記事がたくさん出てきます。

ChatGPTがMBA・経営学修士課程の最終試験に合格したという報告

ペンシルベニア大学ウォートンスクールの研究チームが、OpenAIの対話型AI「ChatGPT」に同校の経営学修士課程(MBA)の最終試験を受けさせる実験を行い、ChatGPTが見事に合格点を取ったことを発表しました。

しかし、この記事ではあえてこう結論します：

えいちゃんのヒトコト

いま流行りのAIは、「テキトー」

「ChatGPT」は単に適当に答えているだけです、というと各方面からお叱りを受けそうですが、
むしろ０と１の二進数でできているコンピュータが「テキトー」な答えが出せること自体が革命的だったのです。

人間にもたまにいますよね、あまり考えずに「テキトー」に答えて会話を成立させています。ただ、今回のAIの場合、答えられる知識の範囲・量が普通の現代人に比較して非常に大きく、ものすごく大きなデータベースの中から「テキトー」に「いい感じの」答えを引っ張ってくるイメージです。これをみた人間は、そこに知性や論理性を感じます。

「適当さ」が絵で見てわかりやすい「Stable Diffusion」

「テキトー」の理由を説明する前に、どんな感じで適当なのか、イメージをつかむ方法を紹介します。

「ChatGPT」出現の半年ほど前、２０２２年８月に「Stable Diffusion」というシステムが発表されました。

「Stable Diffusion」は、言葉（テキスト）を入れると絵を描いてくれる人工知能・AIです。

AIに命令する言葉のことを、プロンプト、と言いますが、「呪文」と呼んで遊ぶ人が大量発生しました。

stable diffusion 呪文 - Google 検索

なぜかアニメ風の美少女が大量発生しています。

「Stable Diffusion」で生成されたこれらの画像を見て、違和感を感じませんか？

検索結果から各記事を少し眺めると、同じ「呪文」で何回も画像を生成し、試行錯誤をしていることがわかります。
画像を作るたびに違うものが出てくるのは、初期値が毎回違う仕組みのためですが、うまくいかない画像は体の一部が異様に大きかったり、指が三本だったり、腕が４本だったり、ヒトの形として普通は描かないものが含まれています。デッサンが狂っている、というレベルを超えています。

比較対象としての「ジョジョ立ち」

話しはものすごく飛ぶのですが、比較のために「ジョジョ立ち」を取り上げます。

ジョジョ立ち - Google 検索

「ジョジョの奇妙な冒険」という４０年ぐらい続いているマンガのキャラが、独特のポーズを作っているので名前が付いて「ジョジョ立ち」と呼ばれます。

実はこのポーズ、すべて実際に人間が実施可能なものだ、ということで実際にやってみた人がSNSなどで一時期話題になりました。
上述の画像検索結果には、人間が同じポーズをとっている写真も混ざっています。

「ジョジョの奇妙な冒険」を描いた荒木飛呂彦先生は、人間の骨格や筋肉を考慮して、構造上可能なはずの絵を描いたと思われるのです。

「Stable Diffusion」には、そういう論理性や配慮は無さそうです。
言われたことを「テキトー」に組み合わせて生成しているように見えます。

「ChatGPT」の答えは、この「Stable Diffusion」の「テキトー」な感じに、非常によく似ていると思うのです。

ニューラル・ネットワーク

昨今話題になっている「人工知能」「AI」はほぼすべて「ディープラーニング」という技術の応用です。

「ディープラーニング」は、「ニューラルネットワーク」という技術がもとになっています。

「ニューラルネットワーク」とは、「人間の脳や神経の構造を数式に置き換えてみよう！」という考え方です。

人間（生き物、と言ってもいいかもしれませんが）の脳や神経は、「ニューロン」という細胞が大量につながってできています。

「ニューロン」を模倣した数式をつくって計算させたら、いいこと起こるんじゃない！？！？　というノリで作られたのが「ニューラルネットワーク」という技術です。

「ノリ」というとまた専門家の方々から叱られるかもしれませんが、なぜうまくいくのか／なぜいい感じの答えが出るのか、について理由を説明することはできていないでしょう。
人間の脳がなぜ機能するのか、よくわかっていないのと似ています。

つまり、「ChatGPT」の答えが「テキトー」に見えるのは、その基盤となっている「ニューラルネットワーク」の「テキトー」さに通じています。

なぜいま急に始まったのか

「Stable Diffusion」や「ChatGPT」は、２０２２年に突如出現して一気に話題になりました。
他の組織や企業からも、類似の技術が数多く出てくるようです。

なぜいま、急に始まったのかについては、いくつかの理由がありそうです。

たとえば、「Transformer」という考え方・テクノロジーは、大きな前進となりました。

Transformer (機械学習モデル) - Wikipedia

30分で完全理解するTransformerの世界

しかし、ここでは、このようなソフトウェアの発展とは別のところに着目します。
それは、「ハードウェアの進化」です。

「パラメータ」→計算の量と精度は、指数関数的

「計算する量を一定以上増やすと、急激に精度が上がる」という現象が出ています。
上述の記事にも引用されているのが、たとえばこのグラフです。

「MetaFormer Is Actually What You Need for Vision」より引用

縦軸は精度、横軸は「パラメータ」となっていますが、「計算する量」と置き換えてよいでしょう。

「パラメータ」の意味

「ディープラーニング」あるいは、「ニューラルネットワーク」でいう「パラメータ」の意味は、ウェイトの数を言っているようです。

つまり、このような図でいうと、〇と〇の間にある線（矢印）１本が、パラメータ１個、と考えて

この矢印１個＝ウェイト値１個＝掛け算１回 → ニューロンに集まった分足し算、という構造になっています。

前述のグラフで言うと、この矢印を１３ビリオン＝１３０億個以上にすると精度が飛躍的に上がって、今回の「ChatGPT」「GPT-3」は１７５０億個を計算する、ということです。
次世代の「GPT-4」ではパラメータが１００兆個（！）になるという噂も出ています。

ハードウェアの発展にぴったりマッチしたソフトウェアが起こすブレイクスルー

IT系のテクノロジーは、「ハードウェア」の性能進化にぴったりマッチした「ソフトウェア」が出現して組み合わさることで、イノベーションが繰り返されてきた歴史があります。
この１年ぐらいで出てきたブレイクスルーも、「ハードウェア」の進化が背景にあるはず、という仮説のもと、その経緯を探ります。

CPU、２つの発展形態：CISCとRISC

コンピュータは、「CPU」⇔「メモリ」⇔「ディスク」という部分が連携して動きます。パソコンはもちろんのこと、スマホもまったく同じ構造です。

「CPU」は、計算するところで、パソコンの中でも一番高価な部品です。

この「CPU」の仕組みとして、大きく分けて二つの流れがあります。それが、「CISC」と「RISC」です。
（※３０年以上前に学んだ知識ですが、いまも通用しているようですので、おそるおそるこの言葉を使います（笑）

「CISC：Complex Instruction Set Computer」

「CISC」は、複雑な計算を一発でやって速くしよう！　という考え方です。

CISC - Wikipedia

「一発」というのは、現代のCPUでいうと2GHzぐらい、つまり、「２０億分の１秒」ぐらいで行います。

従来の大半のパソコンはこの「CISC」で作られています。王者は「Intel」です。
「インテルはいってる！」のアレです。

「RISC：Reduced Instruction Set Computer」

「RISC」は、単純な計算だけでいいから、ものすごく速くやろう、という考え方です。

RISC - Wikipedia

単純な計算とは、掛け算と足し算、と考えるとわかりやすいです。
実際、０と１の二進数の世界で行う計算は、すべて掛け算と足し算の組み合わせに変換できます。

CISCは１回で複雑な計算を目指しますが、RISCは掛け算と足し算だけに特化してめちゃめちゃ速くやる、と考えてよいと思います。

掛け算と足し算を大量にやる技術

掛け算と足し算を大量に行う技術が、いくつか出現して発展しました。

その一例が、CG、つまり、描画・表示する部品＝GPUです。

コンピュータの画面表示は、色の粒々でできています。一つの粒を何色にするかを、１画面分（たとえば１９２０個✖１０８０個）を３０秒に１回ぐらい計算すると人間の眼にはわからないぐらい滑らかに描画することができます。

「ゲーミング・パソコン」と称されて売られているパソコンは、この「GPU」の性能を押し出して競っています。ゲームは表示速度の違いがゲーマーの反応に直結しますから非常にシビアに追求されるわけです。

また、このGPUを大量に利用して、仮想通貨の「マイニング」に利用されるようになりました。
GPUが世界的に品不足に陥るほど、このニーズは一時高まりました。

そして、今回の「ディープラーニング」AIの計算でも、このGPUが活用されます。
「ディープラーニング」は、前述のとおり、掛け算と足し算、言い換えると、ベクトル演算、あるいは、行列演算（テンソル：Tensor）を大量に行います。

そのニーズの大きさから、AIに特化したハードウェアが開発されています。

たとえば、Googleはクラウドで「TPU」というディープラーニング計算に特化したサービスを提供したり、自社のスマホ「Pixel」のCPUとして「Google Tensor」を出しています。

Google、初オリジナルモバイルSoC「Google Tensor」発表　「Pixel 6」に搭載

Googleが次期フラグシップ「Pixel 6／6 Pro」を発表した。オリジナルのSoC「Google Tensor」を搭載する。Gogole Tensroは、4年を費やしてTPUのチップをモバイルに最適化したSoCだ。

Appleのパソコンに入っているIntel製ではない独自開発のCPUである「M1」「M2」には、AI特化の「Neural Engine」というハードウェアを搭載しています。

13インチMacBook Airと15インチMacBook Air

MacBook Airは13インチと15インチから選べるノートブックです。AIに最適な超高速のM3チップを新たに内蔵しました。軽いボディに、一日中使えるバッテリーやLiquid Retinaディスプレイも搭載しています。

「iPhone」のCPUである「A16」などのチップにも「Neural Engine」が入っています。

従来は、AIの計算はクラウド・ネットワーク側で行って、結果をスマホやパソコンに返してくる使い方が主流でした。しかし、これらのハードウェアがスマホやパソコンに搭載されている世界が普通となった場合、ネットワーク無しでAI機能を使うケースが増えそうです。

予想される近未来：ホワイトカラー平社員全滅

「ChatGPT」の答えを眺めていると、たとえば、大学の先生が困るだろうというのは多くの人が指摘しています。

対話AI「ChatGPT」が大学生レベルの試験の自由記述問題に合格してしまう

人間からの質問に対して非常に自然に受け答えできると話題になっている対話向け言語モデル「ChatGPT」に、面白半分にコンピューターサイエンスの自由記述問題を入力したところ、高得点で合格する回答が得られたことが報告されました。

しかし、このままAIが進化発展した場合、パソコンに向かって行う仕事の大半はAIが行うようになるのでは、という気がしてきます。

指示待ち族の仕事はなくなる、チャットGPTの衝撃は凄すぎる営業・総務・経理・人事・開発・広報・企画・・・大量解雇時代へ | JBpress (ジェイビープレス)

これは、下記の文章を「チャットGPT」に投げ込み、要約してもらった文章です。　世界で爆発的に利用者が増えている「チャットGPT」ですが、日本でも話題になり始めました。　音声をテキ(1/5)

つまり、いわゆる「ホワイトカラー」の仕事の大半を人工知能・AIがこなすようになるのでは、という予測が現実になった感じがします。

「ホワイトカラー」の仕事はなくなるか？！

しかし、前述のとおり、原理的・仕組み上、AIの回答は「テキトー」です。その回答をチェックする仕事は必須です。

チェック自体もAIにやらせることができるかもしれませんが、最終的には人間が責任を持つ必要があるでしょう。

つまり、「AIの仕事をチェックする仕事はなくならない（なぜならテキトーだから）」と言えそうです。

言い換えると、ホワイトカラー平社員の仕事はAIが行って、その仕事をチェックして監督するマネージャー・管理職の仕事はなくならないでしょう。

しかし、これは複数の事象が組み合わさって相当なインパクト、社会変革を起こすと予想します。

「大卒」の増加

もはやAIと関係なくなりますが、いわゆる「大卒」は増加傾向です。
少子化にも関わらず、１９８０年頃に年間４０万人だった大学進学者は、２０２０年までに２０万人以上増えています。（代わりに激減しているのが高卒就職者です。）

また、少子化で大学が余る、などと言われていますが、人気の大学ほど定員数は増加しています。

そして、これに拍車をかける政策が続きます。

東京２３区内の大学（東京大学や早稲田大学など人気校含む１０１大学が該当）の定員規制を緩和します。

東京２３区の大学における定員抑制について|国・自治体との連携|政策企画局

：東京23区の大学の定員増を抑制する規制に対する東京都の考え方やこれまでの活動についてお知らせするページです。

「デジタル人材」なるものを増やしたいそうで、文系学部を理系に転換させる政策もやるそうです。

文科省、大学の理系への学部転換を支援　10年で250学部 | 財経新聞

文部科学省は、成長分野の人材を育成する目的から、私立大と公立大を対象に約250学部の新設や理系への学部転換を支援する方針だという。

「社内失業」者の流出

この他、終身雇用の崩壊、年功序列で上がっていく給与制度の崩壊、同一労働一賃金の法制度、ジョブ型雇用の普及、産休制度の定着による女性の雇用継続など、ホワイトカラーに対する圧力は高まるばかりです。

この結果予想される現象は、社内失業者の流出です。
社内失業者は、４００万人を超えると予測されています。

｢仕事をしないのに高給取り｣テレワークで居場所を失った"妖精さん"はどこへ行くか | PRESIDENT WOMAN Online（プレジデントウーマンオンライン）

※本稿は、河合雅司『未来のドリルコロナが見せた日本の弱点』（講談社現代新書）の一部を再編集したものです。テレワークはコロナ禍で進んだことの代表例だ。これも「コロナ前」からのビジネス課題であったが、…

終身雇用・年功序列の世界では、大組織ほど多くの社内失業者を抱えることができました。
日本国内の大手企業でも、頻繁に希望退職者が募集されているのは、このような背景があります。
（省庁や自治体はどうするのでしょうか。）

まとめ

「ChatGPT」の本質は「テキトー」だ、という暴論の理由と、これら進化の結果起こることの一端を予想しました。

お役に立てば幸いです。