生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
▶ 第1話を無料視聴する
閉じる
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
(会員の方に広告は表示されません)
正解がタダ!?大規模言語モデルの「自己教師あり学習」とは
生成AI・大規模言語モデルのしくみ(3)言語モデルと「自己教師あり学習」
岡野原大輔(株式会社Preferred Networks 共同創業者、代表取締役 最高研究責任者)
生成AIによる出力の精度を飛躍的に向上させた大規模言語モデル。はたしてこれまでの言語モデルとはどのような違いがあるのか。1940年代に出た言語モデルの原型を手始めにその仕組みを解説しながら、大規模言語モデルの画期性を解き明かす。キーワードは「自己教師あり学習」だ。(全6話中第3話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:10分14秒
収録日:2024年4月16日
追加日:2024年7月23日
≪全文≫

●単語の出現確率から文章を生成した初期の言語モデル


―― そういう話になってくると、ますます、どうやってそういう能力をいわゆるAIが身につけていくのかというところを、まず知った上でないと判断が難しいと思うのですが、早速その話に入っていきたいと思います。

 まず挙げていただいた言語モデルというところですね。これはどういうことになりますでしょうか。

岡野原 大規模言語モデルの「言語モデル」という部分に関して、まず説明させていただきます。

 言語モデル(ランゲージモデル)というのは、今の大規模言語モデルがこれだけブームになるよりずっと前からある分野です。それこそ、情報理論を発明して、今のコンピュータの礎をつくったシャノンという有名な研究者が1940年代に出したいちばん最初の情報理論の論文にも、その言語モデルの原型が出ています。

 この言語モデルでは、今のような文章を丸ごと生成するのは難しいので、1単語ずつ順番に生成していきます。まず最初に、いろいろあり得る単語の候補の中で「私」というのが出る確率を出すようなモデルを用意します。

 例えば、「私」というのはありとあらゆる単語の中で0.005の確率で出現する(とする)。いちばん出やすいのは、例えば「東京」とか、もっと別の単語かもしれないですけれど、たまたまサイコロを振ったら「私」が出る確率が0.005と設定します。次に、「私」の次に何の単語が出やすいかという確率を用意します。例えば「は」が0.02(の確率で)出る(とする)。

 こういうふうに、何か文字列を生成しよう、確率を与えようという場合に、まず1単語目がどういう確率で出るか。次に、1単語目に決めたものの次の2単語目に何が出やすいかということで決める。3単語目は、1単語目と2単語目の次に何が出やすいのかということを決める。こういう形で、単語列というものに対して、これがサイコロを振ったらどれくらいの確率で出るのかということを出せるようなモデルが、言語モデルになっています。

―― そうすると、その先ほどから意味の部分の話をしていますけれど、(むしろ)意味というよりは、確率でどれが確からしいかというところで並べ替えていくということですね。

岡野原 そうです。まさに今、非常に重要なところを話してもらいました。人間ですとどうしても、こういう...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
(会員の方に広告は表示されません)
「科学と技術」でまず見るべき講義シリーズ
生成AI・大規模言語モデルのしくみ(1)生成AIとは何か
10年で劇的な進歩を遂げた生成AIと日本の開発事情
岡野原大輔
進化生物学から見た「宗教の起源」(1)宗教の起源とトランス状態
私たちにはなぜ宗教が必要だったのか…脳の働きから考える
長谷川眞理子
ブラックホールとは何か(1)私たちが住む銀河系
太陽系は銀河系の中で塵のように小さな存在でしかない
岡朋治
「宇宙の創生」の仕組みと宇宙物理学の歴史(1)宇宙の階層構造
「宇宙の階層構造」誕生の謎に迫るのが宇宙物理学のテーマ
岡朋治
水から考える「持続可能」な未来(1)気候変動の現在地
最悪10メートル以上海面上昇…将来に禍根残す温暖化の影響
沖大幹
もっと知りたいイヌのこと(1)イヌの歴史を振り返る
オオカミはいつイヌになったか…犬の起源と家畜化の歴史
長谷川眞理子

人気の講義ランキングTOP10
編集部ラジオ2026(3)高市政権の行方と「明治維新」
高市政権の今後は「明治維新」の歴史から見えてくる!?
テンミニッツ・アカデミー編集部
高市政権の進むべき道…可能性と課題(4)外交力と防衛力の強化へ
求められる「能動的サイバー防御」、問われる本物の外交力
島田晴雄
明治維新から学ぶもの~改革への道(1)五つの歴史観を踏まえて
明治維新…官軍史観、占領軍史観、司馬史観、過誤論の超克
島田晴雄
「Fukushima50」の真実…その素顔と誇り(1)なぜ日本人は突入できたのか?
福島第一原発事故…日本の危機と闘った吉田昌郎と現場の人々
門田隆将
インフレの行方…歴史から将来を予測する(4)10年後の物価…5つのシナリオ
5つのシナリオ分析…10年後の日本の物価水準はどうなる?
養田功一郎
経験学習を促すリーダーシップ(1)経験学習の基本
成長を促す「3つの経験」とは?経験学習の基本を学ぶ
松尾睦
戦前、陸軍は歴史をどう動かしたか(1)総力戦時代の到来
日英同盟の廃棄、総力戦…世界秩序の激変に翻弄された日本
中西輝政
内側から見たアメリカと日本(6)日本企業の敗因は二つのオウンゴール
日本企業が世界のビジネスに乗り遅れた要因はオウンゴール
島田晴雄
平和の追求~哲学者たちの構想(6)EU批判とアメリカの現状
理想を具現化した国連やEUへの批判がなぜ高まっているのか
川出良枝
何回説明しても伝わらない問題と認知科学(1)「スキーマ」問題と認知の仕組み
なぜ「何回説明しても伝わらない」のか?鍵は認知の仕組み
今井むつみ