生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
▶ 第1話を無料視聴する
閉じる
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
正解がタダ!?大規模言語モデルの「自己教師あり学習」とは
生成AI・大規模言語モデルのしくみ(3)言語モデルと「自己教師あり学習」
岡野原大輔(株式会社Preferred Networks 代表取締役社長)
生成AIによる出力の精度を飛躍的に向上させた大規模言語モデル。はたしてこれまでの言語モデルとはどのような違いがあるのか。1940年代に出た言語モデルの原型を手始めにその仕組みを解説しながら、大規模言語モデルの画期性を解き明かす。キーワードは「自己教師あり学習」だ。(全6話中第3話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:10分14秒
収録日:2024年4月16日
追加日:2024年7月23日
≪全文≫

●単語の出現確率から文章を生成した初期の言語モデル


―― そういう話になってくると、ますます、どうやってそういう能力をいわゆるAIが身につけていくのかというところを、まず知った上でないと判断が難しいと思うのですが、早速その話に入っていきたいと思います。

 まず挙げていただいた言語モデルというところですね。これはどういうことになりますでしょうか。

岡野原 大規模言語モデルの「言語モデル」という部分に関して、まず説明させていただきます。

 言語モデル(ランゲージモデル)というのは、今の大規模言語モデルがこれだけブームになるよりずっと前からある分野です。それこそ、情報理論を発明して、今のコンピュータの礎をつくったシャノンという有名な研究者が1940年代に出したいちばん最初の情報理論の論文にも、その言語モデルの原型が出ています。

 この言語モデルでは、今のような文章を丸ごと生成するのは難しいので、1単語ずつ順番に生成していきます。まず最初に、いろいろあり得る単語の候補の中で「私」というのが出る確率を出すようなモデルを用意します。

 例えば、「私」というのはありとあらゆる単語の中で0.005の確率で出現する(とする)。いちばん出やすいのは、例えば「東京」とか、もっと別の単語かもしれないですけれど、たまたまサイコロを振ったら「私」が出る確率が0.005と設定します。次に、「私」の次に何の単語が出やすいかという確率を用意します。例えば「は」が0.02(の確率で)出る(とする)。

 こういうふうに、何か文字列を生成しよう、確率を与えようという場合に、まず1単語目がどういう確率で出るか。次に、1単語目に決めたものの次の2単語目に何が出やすいかということで決める。3単語目は、1単語目と2単語目の次に何が出やすいのかということを決める。こういう形で、単語列というものに対して、これがサイコロを振ったらどれくらいの確率で出るのかということを出せるようなモデルが、言語モデルになっています。

―― そうすると、その先ほどから意味の部分の話をしていますけれど、(むしろ)意味というよりは、確率でどれが確からしいかというところで並べ替えていくということですね。

岡野原 そうです。まさに今、非常に重要なところを話してもらいました。人間ですとどうしても、こういう...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
「科学と技術」でまず見るべき講義シリーズ
培養肉研究の現在地と未来図(1)フェイクミート市場とリアルミート研究
食肉3.0時代に突入、「培養肉」研究の今に迫る
竹内昌治
ブラックホールとは何か(1)私たちが住む銀河系
太陽系は銀河系の中で塵のように小さな存在でしかない
岡朋治
五島列島沖合の海没処分潜水艦群調査(1)目的と潜水艦史
海底に突き刺さる旧日本海軍の潜水艦「伊58」を特定!
浦環
本当によくわかる「量子コンピュータ入門」(1)量子コンピュータとは何か
「量子コンピュータ」はどういうもので、何に使えるのか
武田俊太郎
社会はAIでいかに読み解けるのか(1)経済学理論の役割
AIやディープラーニングによって社会分析の方法が変わる
柳川範之
「宇宙の創生」の仕組みと宇宙物理学の歴史(1)宇宙の階層構造
「宇宙の階層構造」誕生の謎に迫るのが宇宙物理学のテーマ
岡朋治

人気の講義ランキングTOP10
葛飾北斎と応為~その生涯と作品(1)北斎の画狂人生と名作への進化
葛飾北斎と応為…画狂の親娘はいかに傑作へと進化したか
堀口茉純
熟睡できる環境・習慣とは(4)起きているときを充実させるために
夜まとめて寝なくてもいい!?「分割睡眠」という方法とは
西野精治
平和の追求~哲学者たちの構想(1)強力な世界政府?ホッブズの思想
平和の実現を哲学的に追求する…どんな平和でもいいのか?
川出良枝
何回説明しても伝わらない問題と認知科学(2)バイアスの正体と情報の抑制
『100万回死んだねこ』って…!?記憶の限界とバイアスの役割
今井むつみ
禅とは何か~禅と仏教の心(1)アメリカの禅と日本の禅
自発性を重んじる――藤田一照師が禅と仏教の心を説く
藤田一照
編集部ラジオ2025(30)西野精治先生に学ぶ「熟睡の習慣」
熟睡できる習慣や環境は?西野精治先生に学ぶ眠りの本質
テンミニッツ・アカデミー編集部
エネルギーと医学から考える空海が拓く未来(1)サイバー・フィジカル融合と心身一如
なぜ空海が現代社会に重要か――新しい社会の創造のために
鎌田東二
中国共産党と人権問題(2)中国共産党は超法規的存在?
国家の上に存在する中国共産党はどのような組織なのか
橋爪大三郎
健診結果から考える健康管理・新5カ条(1)血管をより長く守ることが重要な時代
健康診断の結果が悪い人が絶対にやってはいけないこと
野口緑
『孫子』を読む:行軍篇(5)敵の動向と窮寇の見極め
窮寇の見極め―慎重に、真摯に、冷静に敵を観察せよ
田口佳史