生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
第1話へ
▶ この講義を再生
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
(会員の方に広告は表示されません)
正解がタダ!?大規模言語モデルの「自己教師あり学習」とは
生成AI・大規模言語モデルのしくみ(3)言語モデルと「自己教師あり学習」
岡野原大輔(株式会社Preferred Networks 共同創業者、代表取締役 最高研究責任者)
生成AIによる出力の精度を飛躍的に向上させた大規模言語モデル。はたしてこれまでの言語モデルとはどのような違いがあるのか。1940年代に出た言語モデルの原型を手始めにその仕組みを解説しながら、大規模言語モデルの画期性を解き明かす。キーワードは「自己教師あり学習」だ。(全6話中第3話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:10分14秒
収録日:2024年4月16日
追加日:2024年7月23日
≪全文≫

●単語の出現確率から文章を生成した初期の言語モデル


―― そういう話になってくると、ますます、どうやってそういう能力をいわゆるAIが身につけていくのかというところを、まず知った上でないと判断が難しいと思うのですが、早速その話に入っていきたいと思います。

 まず挙げていただいた言語モデルというところですね。これはどういうことになりますでしょうか。

岡野原 大規模言語モデルの「言語モデル」という部分に関して、まず説明させていただきます。

 言語モデル(ランゲージモデル)というのは、今の大規模言語モデルがこれだけブームになるよりずっと前からある分野です。それこそ、情報理論を発明して、今のコンピュータの礎をつくったシャノンという有名な研究者が1940年代に出したいちばん最初の情報理論の論文にも、その言語モデルの原型が出ています。

 この言語モデルでは、今のような文章を丸ごと生成するのは難しいので、1単語ずつ順番に生成していきます。まず最初に、いろいろあり得る単語の候補の中で「私」というのが出る確率を出すようなモデルを用意します。

 例えば、「私」というのはありとあらゆる単語の中で0.005の確率で出現する(とする)。いちばん出やすいのは、例えば「東京」とか、もっと別の単語かもしれないですけれど、たまたまサイコロを振ったら「私」が出る確率が0.005と設定します。次に、「私」の次に何の単語が出やすいかという確率を用意します。例えば「は」が0.02(の確率で)出る(とする)。

 こういうふうに、何か文字列を生成しよう、確率を与えようという場合に、まず1単語目がどういう確率で出るか。次に、1単語目に決めたものの次の2単語目に何が出やすいかということで決める。3単語目は、1単語目と2単語目の次に何が出やすいのかということを決める。こういう形で、単語列というものに対して、これがサイコロを振ったらどれくらいの確率で出るのかということを出せるようなモデルが、言語モデルになっています。

―― そうすると、その先ほどから意味の部分の話をしていますけれど、(むしろ)意味というよりは、確率でどれが確からしいかというところで並べ替えていくということですね。

岡野原 そうです。まさに今、非常に重要なところを話してもらいました。人間ですとどうしても、こういう...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
(会員の方に広告は表示されません)
「科学と技術」でまず見るべき講義シリーズ
ブラックホールとは何か(1)私たちが住む銀河系
太陽系は銀河系の中で塵のように小さな存在でしかない
岡朋治
ChatGPT~AIと人間の未来(1)ChatGPTは何ができて、何ができないか
ChatGPTは考えてない?…「AIの回答」の本質とは
西垣通
火山の仕組みを知る(1)火山の世界的分布と噴火の仕組み
火山噴火が起こるメカニズムと日本の火山の特徴
藤井敏嗣
知能と進化(1)知性と身体性
AI、ディープラーニングとは…知能と身体性は不可分か?
長谷川眞理子
レアメタルの光と影(1)イントロ
イノベーションがレアメタルをコモンメタルにする
岡部徹
もっと知りたいイヌのこと(1)イヌの歴史を振り返る
オオカミはいつイヌになったか…犬の起源と家畜化の歴史
長谷川眞理子

人気の講義ランキングTOP10
AI時代にリベラルアーツがなぜ必要か(1)AIに置き換わる仕事と人間がやる仕事
AI時代にリベラルアーツがなぜ必要か…人間がやるべきこととは?
橋爪大三郎
AI大格差~最新研究による仕事と給料の未来(7)AI時代にどう備えるか
認知症患者がAIと一緒に懐メロを歌う…AI活用の可能性ある分野
宮本弘曉
編集部ラジオ2026(17)「過剰な良かれ」の落とし穴
【10minで考える】巨人・阿部監督の辞任と「過剰な良かれ」
テンミニッツ・アカデミー編集部
地政学入門 歴史と理論編(1)地政学とは何か
地政学をわかりやすく解説…地政学の「3つの柱」とは?
小原雅博
小澤開作と満洲事変・日中戦争(1)少年時代の苦労と五族協和の夢
満洲で「五族協和」に命を懸けた小澤征爾の父・小澤開作
小澤俊夫
ビジョン講座「直観と論理をつなぐ思考法」(2)ビジョンにまつわる課題
世の中で一番知られていない「ビジョンの真実」とは何か
佐宗邦威
イラン戦争と終末論(1)イラン戦争の戦略的背景と米国の政策
なぜイラン戦争がこのタイミングなのか?戦略的背景に迫る
東秀敏
1分チャージ! 新・エクササイズ理論
たった1分で効果を上げる新運動理論と攻めのダイエット
堀江重郎
AI時代と人間の再定義(1)AIは思考するのか
AIでは「思考の三位一体」が成立しない…考えるとは?
中島隆博
認知症とは何か(1)疾患の種類と対応
多くの認知症の原因は「脳のゴミ」の蓄積
遠藤英俊