編集長が語る!講義の見どころ
AIの真実とは?AIの時代に何が起きるのか」/特集&岡野原大輔氏【テンミニッツTV】
2024/09/27
いつもありがとうございます。テンミニッツTV編集長の川上です。
最近、しみじみ実感するのは、AI時代が一気に到来したということです。インターネットの検索でも、AIで概要が示されたりすることが普通になってきました。仕事でも、AIを活用する場面が随所に増えています。もはや、AIが実装される社会への扉は完全に開かれつつあるといえるでしょう。
はたして、AI社会になったときに何が起きるのか。AIの本質とは何なのか?いまこそ、しっかりと考えておくべきでしょう。
たとえば、「AIはどのような仕組みで動いているのか」。AIに使われる人間にならないためにも、ここはぜひとも知っておきたいところです。また、「AIは本当に思考しているのか?」。ここは色々な議論がなされるところであり、興味が尽きません。
テンミニッツTVの珠玉の「AI講義」を集めました。AIは何ができて、何ができないのか。そして来たるべき未来とは?
■特集:AIの時代に何が起きるのか
https://10mtv.jp/pc/feature/detail.php?id=250&referer=push_mm_feat
・岡野原大輔:常識を初めて知った!?生成AIの大規模言語モデルとは
・西垣通:ChatGPTは考えてない?…「AIの回答」の本質とは
・中島隆博:20世紀型の全体主義とは違う現代の「デジタル全体主義」
・松尾豊×柳川範之:AIやディープラーニングによって社会分析の方法が変わる
■講座のみどころ:AIはどう動いているのか?開発者がわかりやすく解説(岡野原大輔氏)
本格的なAI時代の幕開けの大きな契機となったのが、ChatGPTの登場で名を馳せた「生成AI」の発展でしょう。
「AI」はいうまでもなく「人工知能」ですが、「生成AI」とは、人が創り出すような文章、画像、音楽、動画などのコンテンツを創り出すAIを意味します。どれほど精度が高いコンテンツを生み出せるようになっているかは、実際に例をご覧になった方も多いと思います。
しかし、「生成AI」が身の回りにどんどん進出してくるなかで、どのような仕組みで動いているのかもわからないのは問題です。「生成AI」がどのような学習をして能力を身につけて、どのように動いているのかは、ぜひ知っておくべきでしょう。
本日は、岡野原大輔氏に、とてもわかりやすく「生成AI」の仕組みをお話しいただいた講義を紹介します。
岡野原氏は、AI(人工知能)の独自開発により「日本最強のユニコーン企業」ともいわれる株式会社Preferred Networksの代表取締役最高研究責任者でいらっしゃいます。東京大学のクラスメートだった西川徹氏(現・同社代表取締役最高経営責任者)はじめ、大学院在学中の2006年にプログラミングコンテスト(ACM/ICPC)世界大会に出場した仲間など6人で創業されました。
まさにAIの最先端で開発を手掛ける第一人者による講義で、「生成AI」の仕組みが驚くほどよくわかります。
◆岡野原大輔:生成AI・大規模言語モデルのしくみ(全6話)
(1)生成AIとは何か
10年で劇的な進歩を遂げた生成AIと日本の開発事情
https://10mtv.jp/pc/content/detail.php?movie_id=5403&referer=push_mm_rcm1
まず岡野原氏は、日本の「生成AI」の現在地を教えてくださいます。曰く、「やはりアメリカのOpenAIやグーグル、さらにAnthropicなど、スタートアップもたくさん出ています。そのなかで、いまの日本の生成AI開発というのは、非常に早くスタートした彼らに追いつくことができるか、できないかというところが正直なところです」。
やはり、基幹技術は多数並行してあるべきですし、その一角を日本が占めるのは重要なことでしょう。
さらに岡野原氏は、この10年でどれほど「生成」する能力が進化したかも具体的にご教示くださいます。まさに百聞は一見に如かず。講義を見ればレベル違いの大進歩に驚かされます。岡野原氏がおっしゃるように、10年でこの進歩だとすれば、今後10年でどうなるかは想像もつきません。
さて、ではAIの仕組みの基礎の基礎はどういうものか。岡野原氏はこうおっしゃいます。
《AIといっても、結局はたくさんのパラメータがあるようなシステムになっています。例えば、大きいシンセサイザーがあって、シンセサイザーにいろいろなつまみがある。それぞれのつまみを少しずつ変えると、出てくる音が少し変わる。少しずつ変えると、入れた入力に対して出力が変わる。
機械学習がやっているのは、結局はこのパラメータの数がものすごくたくさんあるようなことで、何か入力を入れたら出力が出るような関数になっています。
例えば、犬猫分類の例でいいますと、最初に画像を入れたら、何に分類するのかがほぼランダムに決まるというようなモデルがあって、そのシステムに対して、「今『犬』と言ったけれど、本当は『猫』だよ」と、間違えたときに、次から間違えないように犬ではなく猫と出せるようにパラメータを変える。そのパラメータをどう変えたら次から同じデータに対して犬と間違えずに猫を出せるか、という技術が進んでいまして、機械学習にはそのパラメータの変え方がある(ということ)です。
たくさんデータを見せて、「この場合は犬です」「この場合は猫です」というのを見せていくと、どんどんパラメータの調整が進んでいって、究極的には、見たことがないいろいろなデータに対しても、犬とか猫とか、ちゃんとそういったものが正しく出せるようになるのです》
とにかく数多くの試行錯誤を行なわせて、「正しく出せる」ように機械学習させるのです。その場合、「数多く」という規模が勝負になります。
《実際に今、生成AI、例えば大規模言語モデルで使われているようなものですと、パラメータ数というのはだいたい数千億から1兆といった、ものすごい数、人の想像も及ばないような数になっています》
では、そのような機械学習を、いちいち人間が行なわせているのでしょうか。それは無理に決まっています。昨今の生成AIの秘密は、それを自動でやらせることに成功したことにあるのです。
まず前提となるのが、ある文字列を作成する場合、どの単語の次に、どの単語がくる確率が高いのかを計算して、それらしい文章を作成していくという方法論です。
《何か文字列を生成しよう、確率を与えようという場合に、まず1単語目がどういう確率で出るか。次に、1単語目に決めたものの次の2単語目に何が出やすいかということで決める。3単語目は、1単語目と2単語目の次に何が出やすいのかということを決める。こういう形で、単語列というものに対して、これがサイコロを振ったらどれくらいの確率で出るのかということを出せるようなモデルが、言語モデルになっています》
では、その前提に立ったうえで、どのようにコンピュータに学習させるのか。その方法論が「自己教師あり学習」というものです。
それは「予測:過去から未来を予測する」「欠損保管:一部を欠損させ残りから欠損を予測する」「対比:意味が同じものと違うものを対比させる」ということを、コンピュータに自動でどんどんやらせるものです。
インターネット上には「問題」となるべき文章などは、それこそ膨大にあります。1000億単語だとか、1兆単語などといったオーダーでたくさんの予測問題を解いて、間違っていたら当たるようにパラメータを調整するということを繰り返します。ものすごい量の練習をするなかで、少しでもうまく予測するために文章を理解していくようになってくるのだといいます。
《間違っていたときに正解が何かということは、他の本当の先生がいなくてもデータの中にもう入っているので、いくらでもすぐ分かるということです。そこがポイントです。普通、こういう学習をさせる場合は、いちばん大変なのは正解を教える部分です。人がつきっきりで「この場合はこうだよ」と教えなくても、ただ単にたくさんの文章があれば、そこからたくさんの練習問題が自動的にできる。しかも、それが病院の文章であれば病院のことも知るし、金融であればその金融の文章も理解できるようになるというようなことが、データさえ集まればできるというのが大きな特徴になっています》
では、「自己教師あり学習」の仕組みは、どのようなものか。それについては、第4話で詳しくご解説いただいています。また、問題を解くことを大規模化することによって、どのような性能の向上が起こったのかについては、第5話、第6話で詳しくご解説いただいています。
いずれも、図などを用いながらわかりやすく解説いただいていますので、ぜひ講義本編をご覧ください。
さらに、講義第6話の終盤では、「AIが嘘をつくこと=ハルシネーション(幻覚)」の問題も取り上げます。AIを使っていると、まことしやかに「嘘」をついてくるケースが散見されます。他の大部分が合っていたりするので、案外、うっかり見落としてしまいがちでもあります。
このようなハルシネーションを100パーセントなくすのは、まだ技術的にはかなり難しいと岡野原氏はおっしゃいます。では、どうすべきか――その問題意識も重要でしょう。
このようにAIの仕組みを学んできて、どうしても考えざるをえなくなるのは「AIは理解しているのかどうか」ということです。この点も、講義中(特に第2話)で問題意識として取り上げています。さて、どのように考えるべきか……。
これから来たるAI社会をどうするのかを深く考えるためにも、まさに必見の講義です。
(※アドレス再掲)
■特集:AIの時代に何が起きるのか
https://10mtv.jp/pc/feature/detail.php?id=250&referer=push_mm_feat
◆岡野原大輔:生成AI・大規模言語モデルのしくみ(1)
https://10mtv.jp/pc/content/detail.php?movie_id=5403&referer=push_mm_rcm2
----------------------------------------
編集部#tanka
----------------------------------------
ちはやふるオオクニヌシの恋文は修理固成のことばの力
大国主神をまつる出雲大社は、縁結びの神社としてもよく知られています。では、そのオオクニヌシが詠んだ恋文とは?縁を結ぶ智恵と言葉の力を、ぜひ鎌田東二先生の講義で。(達)
https://10mtv.jp/pc/content/detail.php?movie_id=5177&referer=push_mm_tanka
人気の講義ランキングTOP10
熟睡できる習慣や環境は?西野精治先生に学ぶ眠りの本質
テンミニッツ・アカデミー編集部
「ブッダに帰れ」――禅とは己事究明の道
藤田一照