生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
▶ 第1話を無料視聴する
閉じる
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
(会員の方に広告は表示されません)
正解がタダ!?大規模言語モデルの「自己教師あり学習」とは
生成AI・大規模言語モデルのしくみ(3)言語モデルと「自己教師あり学習」
岡野原大輔(株式会社Preferred Networks 共同創業者、代表取締役 最高研究責任者)
生成AIによる出力の精度を飛躍的に向上させた大規模言語モデル。はたしてこれまでの言語モデルとはどのような違いがあるのか。1940年代に出た言語モデルの原型を手始めにその仕組みを解説しながら、大規模言語モデルの画期性を解き明かす。キーワードは「自己教師あり学習」だ。(全6話中第3話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:10分14秒
収録日:2024年4月16日
追加日:2024年7月23日
≪全文≫

●単語の出現確率から文章を生成した初期の言語モデル


―― そういう話になってくると、ますます、どうやってそういう能力をいわゆるAIが身につけていくのかというところを、まず知った上でないと判断が難しいと思うのですが、早速その話に入っていきたいと思います。

 まず挙げていただいた言語モデルというところですね。これはどういうことになりますでしょうか。

岡野原 大規模言語モデルの「言語モデル」という部分に関して、まず説明させていただきます。

 言語モデル(ランゲージモデル)というのは、今の大規模言語モデルがこれだけブームになるよりずっと前からある分野です。それこそ、情報理論を発明して、今のコンピュータの礎をつくったシャノンという有名な研究者が1940年代に出したいちばん最初の情報理論の論文にも、その言語モデルの原型が出ています。

 この言語モデルでは、今のような文章を丸ごと生成するのは難しいので、1単語ずつ順番に生成していきます。まず最初に、いろいろあり得る単語の候補の中で「私」というのが出る確率を出すようなモデルを用意します。

 例えば、「私」というのはありとあらゆる単語の中で0.005の確率で出現する(とする)。いちばん出やすいのは、例えば「東京」とか、もっと別の単語かもしれないですけれど、たまたまサイコロを振ったら「私」が出る確率が0.005と設定します。次に、「私」の次に何の単語が出やすいかという確率を用意します。例えば「は」が0.02(の確率で)出る(とする)。

 こういうふうに、何か文字列を生成しよう、確率を与えようという場合に、まず1単語目がどういう確率で出るか。次に、1単語目に決めたものの次の2単語目に何が出やすいかということで決める。3単語目は、1単語目と2単語目の次に何が出やすいのかということを決める。こういう形で、単語列というものに対して、これがサイコロを振ったらどれくらいの確率で出るのかということを出せるようなモデルが、言語モデルになっています。

―― そうすると、その先ほどから意味の部分の話をしていますけれど、(むしろ)意味というよりは、確率でどれが確からしいかというところで並べ替えていくということですね。

岡野原 そうです。まさに今、非常に重要なところを話してもらいました。人間ですとどうしても、こういう...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
(会員の方に広告は表示されません)
「科学と技術」でまず見るべき講義シリーズ
新しい循環文明への道(1)採掘文明から循環文明へ
2026年頭所感~循環文明の「三つの柱」…いよいよ実現へ
小宮山宏
ブラックホールとは何か(1)私たちが住む銀河系
太陽系は銀河系の中で塵のように小さな存在でしかない
岡朋治
本当によくわかる「量子コンピュータ入門」(1)量子コンピュータとは何か
「量子コンピュータ」はどういうもので、何に使えるのか
武田俊太郎
生成AI・大規模言語モデルのしくみ(1)生成AIとは何か
10年で劇的な進歩を遂げた生成AIと日本の開発事情
岡野原大輔
進化生物学から見た「宗教の起源」(1)宗教の起源とトランス状態
私たちにはなぜ宗教が必要だったのか…脳の働きから考える
長谷川眞理子
社会はAIでいかに読み解けるのか(1)経済学理論の役割
AIやディープラーニングによって社会分析の方法が変わる
柳川範之

人気の講義ランキングTOP10
こどもと学ぶ戦争と平和(1)私たちに必要な想像力と戦争体験
なぜ戦争が起こるのだろう…大切なのは想像力と生の声
小原雅博
新撰組と幕末日本の「真実」(序)『ちるらん』の魅力と史実の絶妙さ
新撰組と『ちるらん』…群像劇としての魅力の源泉に迫る!
堀口茉純
「Fukushima50」の真実…その素顔と誇り(6)日本人の現場力のすごさ
日本は助かる運命にあった…わが国は現場力で保っている国
門田隆将
インフレの行方…歴史から将来を予測する(6)高市政権誕生の影響
ポイントは財政悪化よりインフレ?…高市政権でどうなるか
養田功一郎
進化生物学から見た「宗教の起源」(2)宗教の機能とメンタライジングの次元
毛繕いを代行!?脳の大型化が可能にしたメンタライジング
長谷川眞理子
ドンロー・ドクトリンの台頭(3)脱地政学論と日本への影響
ドンロー・ドクトリンの正体は脱地政学論…日本の進む道は
東秀敏
これから必要な人材と人材教育とは?(1)人手の供給不足とマクロ経済への影響
ごく一部の人手不足が「致命的」になる…Oリング・セオリー
柳川範之
編集部ラジオ2026(4)門田隆将先生「Fukushima50」の真実
【10分解説】福島第一原発事故…吉田昌郎氏と現場の底力
テンミニッツ・アカデミー編集部
大谷翔平の育て方・育ち方(1)花巻東高校までの歩み
大谷翔平の育ち方…「自分を高めてゆく考え方」の秘密とは
桑原晃弥
なぜ働いていると本が読めなくなるのか問答(1)読書と教養からみた日本の近現代史
『なぜ働いていると本が読めなくなるのか』で追う近現代史
三宅香帆