生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
▶ 第1話を無料視聴する
閉じる
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
生成AIの推論術、鍵となる「宝くじ仮説」と注意機構とは
生成AI・大規模言語モデルのしくみ(4)「自己教師あり学習」のしくみ
岡野原大輔(株式会社Preferred Networks 代表取締役社長)
「自己教師あり学習」によって、出力の精度を高める生成AI。その学習の過程では、いったいどのようなプロセスが行われているのだろうか。そのことについて、わかりやすく解説していく。さらに、実はAIは、「宝くじ仮説」で大量のデータを元にした無数の仮説を削っていったり、「注意機構」と呼ばれるしくみによって必要な情報を取り出したりしているという。いったいどういうことなのか。生成AIの推論術を解説する。(全6話中第4話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:9分25秒
収録日:2024年4月16日
追加日:2024年7月30日
≪全文≫

●周辺情報を分析してふさわしい単語を推測する


―― そういうパターンが実際にどういうふうにできているのかというのは、また次のところですね。

岡野原 そうですね。ここに具体的に例文を挙げて、どれくらい理解していないと、ここは当てられないかという話をさせていただければと思います。

 ここに例文で挙げているのは、「こうしたことから、私は父と一緒に***へ行き相談した」です。この「***」の部分を当てるという話なのですけれど、この部分を当てようと思った場合に、ヒントはいっぱい周りにあるわけです。例えば、「私」と「父」という言葉が出ているので、私が何者か――たとえば私が先生だとか、父が実は病気がちだとか――、そういう情報がもし分かっていれば、「ここは病院ではないか」と当たりそうですよね。

 そういう形で、周りの文章の中でヒントになっている情報があって、それがあれば、少しでもここに入ってくる単語を当てられる可能性が上がります。

 ここで重要なのは「少しでも」ということで、間違えるたびに、大規模言語モデルはせっせと「何が悪かったのか」「どこでヒントを使えたのか」ということを、たくさんのパラメータの中で持っていて、そこのパラメータを次から使うように変えようということが起きてくるのです。

 しかも、今話した「私」とか「父」とか「こうしたことから」というのは、この場では書かれていなくて、それより前の部分に書かれています。「私」は前で登場して、その周辺の文章ではどう言っていたのかということも、情報を集めて持ってこなければいけないのです。

 例えば、こういう文章を読もうとしたときに、今のような、「どの単語がどの単語と関係していて、こういう係り受け関係だ、意味は何か」ということを、それこそ言語の専門家の方が設計してやっていたのが、今言った話を全部、人間が何も与えなくてもたくさんの単語を予測するという問題を解くだけで勝手に獲得していくというのが、大規模言語モデルが内部でやっている「自己教師あり学習」になります。

―― 岡野原さんの本を読んでいてもすごく印象深かったのですが、だから人間からすると、なぜそうなっているのかということが分からないのですよね。

岡野原 そうですね。今はもう少し技術が進んでいるので、実際に学習したモデルを解剖し...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
「科学と技術」でまず見るべき講義シリーズ
性はなぜあるのか~進化生物学から見たLGBT(1)有性生殖と無性生殖
なぜ雄と雌の2つの性別があるのか…「性」の謎とLGBT
長谷川眞理子
ブラックホールとは何か(1)私たちが住む銀河系
太陽系は銀河系の中で塵のように小さな存在でしかない
岡朋治
「宇宙の創生」の仕組みと宇宙物理学の歴史(1)宇宙の階層構造
「宇宙の階層構造」誕生の謎に迫るのが宇宙物理学のテーマ
岡朋治
生成AI・大規模言語モデルのしくみ(1)生成AIとは何か
10年で劇的な進歩を遂げた生成AIと日本の開発事情
岡野原大輔
ヒトの性差とジェンダー論(1)「性」とは何か
MLBのスーパースターも一代限り…生物学から迫る性の実態
長谷川眞理子
断熱から考える一年中快適で健康な住環境(1)日本の住宅の実態と問題点
なぜ日本は夏暑く、冬寒いのか…断熱から考える住宅の問題
前真之

人気の講義ランキングTOP10
エネルギーと医学から考える空海が拓く未来(1)サイバー・フィジカル融合と心身一如
なぜ空海が現代社会に重要か――新しい社会の創造のために
鎌田東二
熟睡できる環境・習慣とは(3)睡眠にいい環境とお風呂の入り方
布団に入る何分前がいい?入眠しやすいお風呂の入り方
西野精治
数学と音楽の不思議な関係(1)だれもがみんな数学者で音楽家
世界は音楽と数学であふれている…歴史が物語る密接な関係
中島さち子
学力喪失の危機~言語習得と理解の本質(1)数が理解できない子どもたち
なぜ算数が苦手な子どもが多いのか?学力喪失の真相に迫る
今井むつみ
葛飾北斎と応為~その生涯と作品(2)『富嶽三十六景』神奈川沖浪裏への道
『富嶽三十六景』神奈川沖浪裏のすごさ…波へのこだわり
堀口茉純
大谷翔平の育て方・育ち方(1)花巻東高校までの歩み
大谷翔平の育ち方…「自分を高めてゆく考え方」の秘密とは
桑原晃弥
内側から見たアメリカと日本(7)ジャパン・アズ・ナンバーワンの弊害
ジャパン・アズ・ナンバーワンで満足!?学ばない日本の弊害
島田晴雄
歴史の探り方、活かし方(1)歴史小説と史料探索の基本
日本は素晴らしい歴史史料の宝庫…よい史料の見つけ方とは
中村彰彦
何回説明しても伝わらない問題と認知科学(1)「スキーマ」問題と認知の仕組み
なぜ「何回説明しても伝わらない」のか?鍵は認知の仕組み
今井むつみ
生成AI「Round 2」への向き合い方(1)生成AI導入の現在地
生成AIの利活用に格差…世界の導入事情と日本の現状
渡辺宣彦