生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
▶ 第1話を無料視聴する
閉じる
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
正解がタダ!?大規模言語モデルの「自己教師あり学習」とは
生成AI・大規模言語モデルのしくみ(3)言語モデルと「自己教師あり学習」
岡野原大輔(株式会社Preferred Networks 共同創業者、代表取締役 最高研究責任者)
生成AIによる出力の精度を飛躍的に向上させた大規模言語モデル。はたしてこれまでの言語モデルとはどのような違いがあるのか。1940年代に出た言語モデルの原型を手始めにその仕組みを解説しながら、大規模言語モデルの画期性を解き明かす。キーワードは「自己教師あり学習」だ。(全6話中第3話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:10分14秒
収録日:2024年4月16日
追加日:2024年7月23日
≪全文≫

●単語の出現確率から文章を生成した初期の言語モデル


―― そういう話になってくると、ますます、どうやってそういう能力をいわゆるAIが身につけていくのかというところを、まず知った上でないと判断が難しいと思うのですが、早速その話に入っていきたいと思います。

 まず挙げていただいた言語モデルというところですね。これはどういうことになりますでしょうか。

岡野原 大規模言語モデルの「言語モデル」という部分に関して、まず説明させていただきます。

 言語モデル(ランゲージモデル)というのは、今の大規模言語モデルがこれだけブームになるよりずっと前からある分野です。それこそ、情報理論を発明して、今のコンピュータの礎をつくったシャノンという有名な研究者が1940年代に出したいちばん最初の情報理論の論文にも、その言語モデルの原型が出ています。

 この言語モデルでは、今のような文章を丸ごと生成するのは難しいので、1単語ずつ順番に生成していきます。まず最初に、いろいろあり得る単語の候補の中で「私」というのが出る確率を出すようなモデルを用意します。

 例えば、「私」というのはありとあらゆる単語の中で0.005の確率で出現する(とする)。いちばん出やすいのは、例えば「東京」とか、もっと別の単語かもしれないですけれど、たまたまサイコロを振ったら「私」が出る確率が0.005と設定します。次に、「私」の次に何の単語が出やすいかという確率を用意します。例えば「は」が0.02(の確率で)出る(とする)。

 こういうふうに、何か文字列を生成しよう、確率を与えようという場合に、まず1単語目がどういう確率で出るか。次に、1単語目に決めたものの次の2単語目に何が出やすいかということで決める。3単語目は、1単語目と2単語目の次に何が出やすいのかということを決める。こういう形で、単語列というものに対して、これがサイコロを振ったらどれくらいの確率で出るのかということを出せるようなモデルが、言語モデルになっています。

―― そうすると、その先ほどから意味の部分の話をしていますけれど、(むしろ)意味というよりは、確率でどれが確からしいかというところで並べ替えていくということですね。

岡野原 そうです。まさに今、非常に重要なところを話してもらいました。人間ですとどうしても、こういう...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
「科学と技術」でまず見るべき講義シリーズ
知能と進化(1)知性と身体性
AI、ディープラーニングとは…知能と身体性は不可分か?
長谷川眞理子
本当によくわかる「量子コンピュータ入門」(1)量子コンピュータとは何か
「量子コンピュータ」はどういうもので、何に使えるのか
武田俊太郎
性はなぜあるのか~進化生物学から見たLGBT(1)有性生殖と無性生殖
なぜ雄と雌の2つの性別があるのか…「性」の謎とLGBT
長谷川眞理子
「宇宙の創生」の仕組みと宇宙物理学の歴史(1)宇宙の階層構造
「宇宙の階層構造」誕生の謎に迫るのが宇宙物理学のテーマ
岡朋治
ヒトの性差とジェンダー論(1)「性」とは何か
MLBのスーパースターも一代限り…生物学から迫る性の実態
長谷川眞理子
社会はAIでいかに読み解けるのか(1)経済学理論の役割
AIやディープラーニングによって社会分析の方法が変わる
柳川範之

人気の講義ランキングTOP10
戦前、陸軍は歴史をどう動かしたか(1)総力戦時代の到来
日英同盟の廃棄、総力戦…世界秩序の激変に翻弄された日本
中西輝政
インフレの行方…歴史から将来を予測する(3)戦後の日本経済と海外のインフレ率
オイルショック、バブル…過去と現在の環境の共通点は?
養田功一郎
高市政権の進むべき道…可能性と課題(2)財政戦略3つの問題点
高市政権の財政政策の課題は…ポピュリズム政策をどうする?
島田晴雄
「Fukushima50」の真実…その素顔と誇り(2)吉田昌郎所長の機転と決断
なぜ部下たちは「吉田昌郎所長となら死ねる」と語ったのか
門田隆将
こどもと学ぶ戦争と平和(3)「小さな外交官」と少年兵の問題
外国が攻めてきたらどうすればいい?戦争と少年兵の問題
小原雅博
豊臣兄弟~秀吉と秀長の実像に迫る(序)時代考証が語る『豊臣兄弟!』の魅力
2026年大河ドラマ『豊臣兄弟!』秀吉と秀長の実像に迫る
黒田基樹
AI時代と人間の再定義(1)AIは思考するのか
AIでは「思考の三位一体」が成立しない…考えるとは?
中島隆博
これから必要な人材と人材教育とは?(3)無謬性とジョブローテーション
もうゼネラリストを育てる人事制度では時代に対応できない
柳川範之
これからの社会・経済の構造変化(3)新しいファミリーガバナンスの時代
なぜいまファミリー企業への注目が世界的に高まっているか
柳川範之
熟睡できる環境・習慣とは(4)起きているときを充実させるために
夜まとめて寝なくてもいい!?「分割睡眠」という方法とは
西野精治