生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
第1話へ
▶ この講義を再生
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
(会員の方に広告は表示されません)
正解がタダ!?大規模言語モデルの「自己教師あり学習」とは
生成AI・大規模言語モデルのしくみ(3)言語モデルと「自己教師あり学習」
岡野原大輔(株式会社Preferred Networks 共同創業者、代表取締役 最高研究責任者)
生成AIによる出力の精度を飛躍的に向上させた大規模言語モデル。はたしてこれまでの言語モデルとはどのような違いがあるのか。1940年代に出た言語モデルの原型を手始めにその仕組みを解説しながら、大規模言語モデルの画期性を解き明かす。キーワードは「自己教師あり学習」だ。(全6話中第3話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:10分14秒
収録日:2024年4月16日
追加日:2024年7月23日
≪全文≫

●単語の出現確率から文章を生成した初期の言語モデル


―― そういう話になってくると、ますます、どうやってそういう能力をいわゆるAIが身につけていくのかというところを、まず知った上でないと判断が難しいと思うのですが、早速その話に入っていきたいと思います。

 まず挙げていただいた言語モデルというところですね。これはどういうことになりますでしょうか。

岡野原 大規模言語モデルの「言語モデル」という部分に関して、まず説明させていただきます。

 言語モデル(ランゲージモデル)というのは、今の大規模言語モデルがこれだけブームになるよりずっと前からある分野です。それこそ、情報理論を発明して、今のコンピュータの礎をつくったシャノンという有名な研究者が1940年代に出したいちばん最初の情報理論の論文にも、その言語モデルの原型が出ています。

 この言語モデルでは、今のような文章を丸ごと生成するのは難しいので、1単語ずつ順番に生成していきます。まず最初に、いろいろあり得る単語の候補の中で「私」というのが出る確率を出すようなモデルを用意します。

 例えば、「私」というのはありとあらゆる単語の中で0.005の確率で出現する(とする)。いちばん出やすいのは、例えば「東京」とか、もっと別の単語かもしれないですけれど、たまたまサイコロを振ったら「私」が出る確率が0.005と設定します。次に、「私」の次に何の単語が出やすいかという確率を用意します。例えば「は」が0.02(の確率で)出る(とする)。

 こういうふうに、何か文字列を生成しよう、確率を与えようという場合に、まず1単語目がどういう確率で出るか。次に、1単語目に決めたものの次の2単語目に何が出やすいかということで決める。3単語目は、1単語目と2単語目の次に何が出やすいのかということを決める。こういう形で、単語列というものに対して、これがサイコロを振ったらどれくらいの確率で出るのかということを出せるようなモデルが、言語モデルになっています。

―― そうすると、その先ほどから意味の部分の話をしていますけれど、(むしろ)意味というよりは、確率でどれが確からしいかというところで並べ替えていくということですね。

岡野原 そうです。まさに今、非常に重要なところを話してもらいました。人間ですとどうしても、こういう...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
(会員の方に広告は表示されません)
「科学と技術」でまず見るべき講義シリーズ
もっと知りたいイヌのこと(1)イヌの歴史を振り返る
オオカミはいつイヌになったか…犬の起源と家畜化の歴史
長谷川眞理子
発酵はマジックだ!
色を消し、脂を溶かし、水を分解―スゴすぎる発酵の力!
小泉武夫
「宇宙の創生」の仕組みと宇宙物理学の歴史(1)宇宙の階層構造
「宇宙の階層構造」誕生の謎に迫るのが宇宙物理学のテーマ
岡朋治
性はなぜあるのか~進化生物学から見たLGBT(1)有性生殖と無性生殖
なぜ雄と雌の2つの性別があるのか…「性」の謎とLGBT
長谷川眞理子
本当によくわかる「量子コンピュータ入門」(1)量子コンピュータとは何か
「量子コンピュータ」はどういうもので、何に使えるのか
武田俊太郎
水から考える「持続可能」な未来(1)気候変動の現在地
最悪10メートル以上海面上昇…将来に禍根残す温暖化の影響
沖大幹

人気の講義ランキングTOP10
編集部ラジオ2026(9)「トランプ大統領」の視点・論点
【テンミニッツで考える】「トランプ大統領」をどう見るか?
テンミニッツ・アカデミー編集部
日本人とメンタルヘルス…心のあり方(7)若者の引きこもりと日本の教育問題
日本の引きこもりの深い根源…「核家族」構造の問題とは?
與那覇潤
禅とは何か~禅と仏教の心(1)アメリカの禅と日本の禅
自発性を重んじる――藤田一照師が禅と仏教の心を説く
藤田一照
AI時代と人間の再定義(1)AIは思考するのか
AIでは「思考の三位一体」が成立しない…考えるとは?
中島隆博
「同盟の真髄」と日米関係の行方(7)トランプ氏の評価とその実像
こりごり?アイ・ラブ・トランプ?…トランプ陣営の実状は
杉山晋輔
プラトン『ポリテイア(国家)』を読む(14)ポリスと魂の堕落過程〈下〉僭主の末路
僭主制は欲望の奴隷…過度の自由が過度の隷属に転換する
納富信留
『貞観政要』を読む(2)著作に登場する人物たち
房玄齢・杜如晦・魏徴・王珪―太宗の四人の優れた側近
田口佳史
ソニー流「人的資本経営と新規事業」成功論(2)“変わり者”の生かし方と後継者選び
「人材の組み合わせ」こそ「尖った才能」を輝かせる必勝法
水野道訓
民主主義の本質(1)近代民主主義とキリスト教
なぜ民主主義が「最善」か…法の支配とキリスト教的背景
橋爪大三郎
『太平記』に学ぶ激動期の生き方(1)なぜ今『太平記』を読むべきなのか
『太平記』は乱世における人間の処し方が学べる古典文学
兵藤裕己