生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
▶ 第1話を無料視聴する
閉じる
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
(会員の方に広告は表示されません)
正解がタダ!?大規模言語モデルの「自己教師あり学習」とは
生成AI・大規模言語モデルのしくみ(3)言語モデルと「自己教師あり学習」
岡野原大輔(株式会社Preferred Networks 共同創業者、代表取締役 最高研究責任者)
生成AIによる出力の精度を飛躍的に向上させた大規模言語モデル。はたしてこれまでの言語モデルとはどのような違いがあるのか。1940年代に出た言語モデルの原型を手始めにその仕組みを解説しながら、大規模言語モデルの画期性を解き明かす。キーワードは「自己教師あり学習」だ。(全6話中第3話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:10分14秒
収録日:2024年4月16日
追加日:2024年7月23日
≪全文≫

●単語の出現確率から文章を生成した初期の言語モデル


―― そういう話になってくると、ますます、どうやってそういう能力をいわゆるAIが身につけていくのかというところを、まず知った上でないと判断が難しいと思うのですが、早速その話に入っていきたいと思います。

 まず挙げていただいた言語モデルというところですね。これはどういうことになりますでしょうか。

岡野原 大規模言語モデルの「言語モデル」という部分に関して、まず説明させていただきます。

 言語モデル(ランゲージモデル)というのは、今の大規模言語モデルがこれだけブームになるよりずっと前からある分野です。それこそ、情報理論を発明して、今のコンピュータの礎をつくったシャノンという有名な研究者が1940年代に出したいちばん最初の情報理論の論文にも、その言語モデルの原型が出ています。

 この言語モデルでは、今のような文章を丸ごと生成するのは難しいので、1単語ずつ順番に生成していきます。まず最初に、いろいろあり得る単語の候補の中で「私」というのが出る確率を出すようなモデルを用意します。

 例えば、「私」というのはありとあらゆる単語の中で0.005の確率で出現する(とする)。いちばん出やすいのは、例えば「東京」とか、もっと別の単語かもしれないですけれど、たまたまサイコロを振ったら「私」が出る確率が0.005と設定します。次に、「私」の次に何の単語が出やすいかという確率を用意します。例えば「は」が0.02(の確率で)出る(とする)。

 こういうふうに、何か文字列を生成しよう、確率を与えようという場合に、まず1単語目がどういう確率で出るか。次に、1単語目に決めたものの次の2単語目に何が出やすいかということで決める。3単語目は、1単語目と2単語目の次に何が出やすいのかということを決める。こういう形で、単語列というものに対して、これがサイコロを振ったらどれくらいの確率で出るのかということを出せるようなモデルが、言語モデルになっています。

―― そうすると、その先ほどから意味の部分の話をしていますけれど、(むしろ)意味というよりは、確率でどれが確からしいかというところで並べ替えていくということですね。

岡野原 そうです。まさに今、非常に重要なところを話してもらいました。人間ですとどうしても、こういう...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
(会員の方に広告は表示されません)
「科学と技術」でまず見るべき講義シリーズ
ブラックホールとは何か(1)私たちが住む銀河系
太陽系は銀河系の中で塵のように小さな存在でしかない
岡朋治
進化生物学から見た「宗教の起源」(1)宗教の起源とトランス状態
私たちにはなぜ宗教が必要だったのか…脳の働きから考える
長谷川眞理子
レアメタルの光と影(1)イントロ
イノベーションがレアメタルをコモンメタルにする
岡部徹
本当によくわかる「量子コンピュータ入門」(1)量子コンピュータとは何か
「量子コンピュータ」はどういうもので、何に使えるのか
武田俊太郎
新しい循環文明への道(1)採掘文明から循環文明へ
2026年頭所感~循環文明の「三つの柱」…いよいよ実現へ
小宮山宏
「宇宙の創生」の仕組みと宇宙物理学の歴史(1)宇宙の階層構造
「宇宙の階層構造」誕生の謎に迫るのが宇宙物理学のテーマ
岡朋治

人気の講義ランキングTOP10
こどもと学ぶ戦争と平和(5)防衛力の強化という問題と歴史の教訓
賢者は歴史に学び、愚者は経験に学ぶ…本当に大切なことは?
小原雅博
「Fukushima50」の真実…その素顔と誇り(5)プラントエンジニアの覚悟と死装束
俺たちが死んだら、次はお前だ。被害を俺たちで止めるんだ
門田隆将
大谷翔平の育て方・育ち方(1)花巻東高校までの歩み
大谷翔平の育ち方…「自分を高めてゆく考え方」の秘密とは
桑原晃弥
ドンロー・ドクトリンの台頭(3)脱地政学論と日本への影響
ドンロー・ドクトリンの正体は脱地政学論…日本の進む道は
東秀敏
編集部ラジオ2026(4)門田隆将先生「Fukushima50」の真実
【10分解説】福島第一原発事故…吉田昌郎氏と現場の底力
テンミニッツ・アカデミー編集部
インフレの行方…歴史から将来を予測する(6)高市政権誕生の影響
ポイントは財政悪化よりインフレ?…高市政権でどうなるか
養田功一郎
これから必要な人材と人材教育とは?(2)AI時代に必要とされる能力
AI時代に必要なのは「問いを立てる能力」…いかに育成するか
柳川範之
プロジェクトマネジメントの基本(1)国際標準とプロジェクトの定義
プロジェクトマネジメントとは?国際標準から考える特性
大塚有希子
深掘りシェイクスピア~謎の生涯と名作秘話(6)現代への影響と文化的財産
志賀直哉、太宰治、小林秀雄…対立する『ハムレット』批評
河合祥一郎
高市政権の進むべき道…可能性と課題(3)外交への懸念と経済復活への提言
「強い経済」へ――実現への壁は古い日本と同調圧力!?
島田晴雄