生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
第1話へ
▶ この講義を再生
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
(会員の方に広告は表示されません)
生成AIの推論術、鍵となる「宝くじ仮説」と注意機構とは
生成AI・大規模言語モデルのしくみ(4)「自己教師あり学習」のしくみ
岡野原大輔(株式会社Preferred Networks 共同創業者、代表取締役 最高研究責任者)
「自己教師あり学習」によって、出力の精度を高める生成AI。その学習の過程では、いったいどのようなプロセスが行われているのだろうか。そのことについて、わかりやすく解説していく。さらに、実はAIは、「宝くじ仮説」で大量のデータを元にした無数の仮説を削っていったり、「注意機構」と呼ばれるしくみによって必要な情報を取り出したりしているという。いったいどういうことなのか。生成AIの推論術を解説する。(全6話中第4話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:9分25秒
収録日:2024年4月16日
追加日:2024年7月30日
≪全文≫

●周辺情報を分析してふさわしい単語を推測する


―― そういうパターンが実際にどういうふうにできているのかというのは、また次のところですね。

岡野原 そうですね。ここに具体的に例文を挙げて、どれくらい理解していないと、ここは当てられないかという話をさせていただければと思います。

 ここに例文で挙げているのは、「こうしたことから、私は父と一緒に***へ行き相談した」です。この「***」の部分を当てるという話なのですけれど、この部分を当てようと思った場合に、ヒントはいっぱい周りにあるわけです。例えば、「私」と「父」という言葉が出ているので、私が何者か――たとえば私が先生だとか、父が実は病気がちだとか――、そういう情報がもし分かっていれば、「ここは病院ではないか」と当たりそうですよね。

 そういう形で、周りの文章の中でヒントになっている情報があって、それがあれば、少しでもここに入ってくる単語を当てられる可能性が上がります。

 ここで重要なのは「少しでも」ということで、間違えるたびに、大規模言語モデルはせっせと「何が悪かったのか」「どこでヒントを使えたのか」ということを、たくさんのパラメータの中で持っていて、そこのパラメータを次から使うように変えようということが起きてくるのです。

 しかも、今話した「私」とか「父」とか「こうしたことから」というのは、この場では書かれていなくて、それより前の部分に書かれています。「私」は前で登場して、その周辺の文章ではどう言っていたのかということも、情報を集めて持ってこなければいけないのです。

 例えば、こういう文章を読もうとしたときに、今のような、「どの単語がどの単語と関係していて、こういう係り受け関係だ、意味は何か」ということを、それこそ言語の専門家の方が設計してやっていたのが、今言った話を全部、人間が何も与えなくてもたくさんの単語を予測するという問題を解くだけで勝手に獲得していくというのが、大規模言語モデルが内部でやっている「自己教師あり学習」になります。

―― 岡野原さんの本を読んでいてもすごく印象深かったのですが、だから人間からすると、なぜそうなっているのかということが分からないのですよね。

岡野原 そうですね。今はもう少し技術が進んでいるので、実際に学習したモデルを解剖し...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
(会員の方に広告は表示されません)
「科学と技術」でまず見るべき講義シリーズ
社会はAIでいかに読み解けるのか(1)経済学理論の役割
AIやディープラーニングによって社会分析の方法が変わる
柳川範之
進化的人間考~ヒトの性質と異様な現代社会(1)進化のスパンと現在の人間生活
ヒトの進化史を文明の発展の時間軸から考える
長谷川眞理子
性はなぜあるのか~進化生物学から見たLGBT(1)有性生殖と無性生殖
なぜ雄と雌の2つの性別があるのか…「性」の謎とLGBT
長谷川眞理子
発酵はマジックだ!
色を消し、脂を溶かし、水を分解―スゴすぎる発酵の力!
小泉武夫
知能と進化(1)知性と身体性
AI、ディープラーニングとは…知能と身体性は不可分か?
長谷川眞理子
もっと知りたいイヌのこと(1)イヌの歴史を振り返る
オオカミはいつイヌになったか…犬の起源と家畜化の歴史
長谷川眞理子

人気の講義ランキングTOP10
日本人とメンタルヘルス…心のあり方(4)甘えない子が心の病気になる
二宮尊徳はヤングケアラー!?なぜ甘えない子が心を病むのか
與那覇潤
新撰組と幕末日本の「真実」(8)戊辰戦争~明治期の新撰組の魂
受け継がれる魂…戊辰戦争での奮戦と自由民権運動の情熱
堀口茉純
AI時代と人間の再定義(1)AIは思考するのか
AIでは「思考の三位一体」が成立しない…考えるとは?
中島隆博
『還暦からの底力』に学ぶ人生100年時代の生き方(1)定年制は要らない
仕事をするのに「年齢」は関係ない…不幸を招く定年型思考
出口治明
人生100年時代の「ライフシフト概論」(1)人生100年時代のインパクト
80歳まで現役でいるために大切なこと…人生100年時代の発想法
徳岡晃一郎
ラフカディオ・ハーン『神国日本』を読む(5)美の裏に潜む恐ろしい側面
恐ろしい日本…常に何者かに見られ、個性が抑圧される社会
賴住光子
性はなぜあるのか~進化生物学から見たLGBT(1)有性生殖と無性生殖
なぜ雄と雌の2つの性別があるのか…「性」の謎とLGBT
長谷川眞理子
これから必要な人材と人材教育とは?(1)人手の供給不足とマクロ経済への影響
ごく一部の人手不足が「致命的」になる…Oリング・セオリー
柳川範之
数学と音楽の不思議な関係(2)リズムと数の不思議と変拍子
童歌「あんたがたどこさ」は何拍子?変拍子の不思議な魅力
中島さち子
ドンロー・ドクトリンの台頭(1)トランプ系論と2025年度版NSS
ドンロー・ドクトリンとは?トランプ系論と西半球の重要性
東秀敏