生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
▶ 第1話を無料視聴する
閉じる
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
正解がタダ!?大規模言語モデルの「自己教師あり学習」とは
生成AI・大規模言語モデルのしくみ(3)言語モデルと「自己教師あり学習」
岡野原大輔(株式会社Preferred Networks 共同創業者、代表取締役 最高研究責任者)
生成AIによる出力の精度を飛躍的に向上させた大規模言語モデル。はたしてこれまでの言語モデルとはどのような違いがあるのか。1940年代に出た言語モデルの原型を手始めにその仕組みを解説しながら、大規模言語モデルの画期性を解き明かす。キーワードは「自己教師あり学習」だ。(全6話中第3話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:10分14秒
収録日:2024年4月16日
追加日:2024年7月23日
≪全文≫

●単語の出現確率から文章を生成した初期の言語モデル


―― そういう話になってくると、ますます、どうやってそういう能力をいわゆるAIが身につけていくのかというところを、まず知った上でないと判断が難しいと思うのですが、早速その話に入っていきたいと思います。

 まず挙げていただいた言語モデルというところですね。これはどういうことになりますでしょうか。

岡野原 大規模言語モデルの「言語モデル」という部分に関して、まず説明させていただきます。

 言語モデル(ランゲージモデル)というのは、今の大規模言語モデルがこれだけブームになるよりずっと前からある分野です。それこそ、情報理論を発明して、今のコンピュータの礎をつくったシャノンという有名な研究者が1940年代に出したいちばん最初の情報理論の論文にも、その言語モデルの原型が出ています。

 この言語モデルでは、今のような文章を丸ごと生成するのは難しいので、1単語ずつ順番に生成していきます。まず最初に、いろいろあり得る単語の候補の中で「私」というのが出る確率を出すようなモデルを用意します。

 例えば、「私」というのはありとあらゆる単語の中で0.005の確率で出現する(とする)。いちばん出やすいのは、例えば「東京」とか、もっと別の単語かもしれないですけれど、たまたまサイコロを振ったら「私」が出る確率が0.005と設定します。次に、「私」の次に何の単語が出やすいかという確率を用意します。例えば「は」が0.02(の確率で)出る(とする)。

 こういうふうに、何か文字列を生成しよう、確率を与えようという場合に、まず1単語目がどういう確率で出るか。次に、1単語目に決めたものの次の2単語目に何が出やすいかということで決める。3単語目は、1単語目と2単語目の次に何が出やすいのかということを決める。こういう形で、単語列というものに対して、これがサイコロを振ったらどれくらいの確率で出るのかということを出せるようなモデルが、言語モデルになっています。

―― そうすると、その先ほどから意味の部分の話をしていますけれど、(むしろ)意味というよりは、確率でどれが確からしいかというところで並べ替えていくということですね。

岡野原 そうです。まさに今、非常に重要なところを話してもらいました。人間ですとどうしても、こういう...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
「科学と技術」でまず見るべき講義シリーズ
海底の仕組みと地球のメカニズム(1)海底の生まれるところ
地球上の火山活動の8割を占める「中央海嶺」とは何か
沖野郷子
本当によくわかる「量子コンピュータ入門」(1)量子コンピュータとは何か
「量子コンピュータ」はどういうもので、何に使えるのか
武田俊太郎
五島列島沖合の海没処分潜水艦群調査(1)目的と潜水艦史
海底に突き刺さる旧日本海軍の潜水艦「伊58」を特定!
浦環
培養肉研究の現在地と未来図(1)フェイクミート市場とリアルミート研究
食肉3.0時代に突入、「培養肉」研究の今に迫る
竹内昌治
水から考える「持続可能」な未来(1)気候変動の現在地
最悪10メートル以上海面上昇…将来に禍根残す温暖化の影響
沖大幹
「宇宙の創生」の仕組みと宇宙物理学の歴史(1)宇宙の階層構造
「宇宙の階層構造」誕生の謎に迫るのが宇宙物理学のテーマ
岡朋治

人気の講義ランキングTOP10
エネルギーと医学から考える空海が拓く未来(1)サイバー・フィジカル融合と心身一如
なぜ空海が現代社会に重要か――新しい社会の創造のために
鎌田東二
熟睡できる環境・習慣とは(2)酒、コーヒー、ブルーライトは悪者か
ブルーライトは悪者か?近年分かった「第3の眼」との関係
西野精治
歴史の探り方、活かし方(6)江戸時代の藩校レベルを分析
史料読解法…江戸時代の「全国の藩校ランキング」を探る
中村彰彦
何回説明しても伝わらない問題と認知科学(1)「スキーマ」問題と認知の仕組み
なぜ「何回説明しても伝わらない」のか?鍵は認知の仕組み
今井むつみ
編集部ラジオ2025(29)歴史作家の舞台裏を学べる
歴史作家・中村彰彦先生に学ぶ歴史の探り方、活かし方
テンミニッツ・アカデミー編集部
内側から見たアメリカと日本(6)日本企業の敗因は二つのオウンゴール
日本企業が世界のビジネスに乗り遅れた要因はオウンゴール
島田晴雄
習近平―その政治の「核心」とは何か?(1)習近平政権の特徴
習近平への権力集中…習近平思想と中国の夢と強国強軍
小原雅博
習近平中国の真実…米中関係・台湾問題(1)習近平の歴史的特徴とは?
一強独裁=1人独裁の光と影…「強い中国」への動機と限界
垂秀夫
いま夏目漱石の前期三部作を読む(1)夏目漱石を読み直す意味
メンタルが苦しくなったら?…今、夏目漱石を読み直す意味
與那覇潤
戦争と暗殺~米国内戦の予兆と構造転換(3)未解決のユダヤ問題
「白人vsユダヤ人」という未解決問題とトランプ政権の行方
東秀敏