生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
▶ 第1話を無料視聴する
閉じる
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
正解がタダ!?大規模言語モデルの「自己教師あり学習」とは
生成AI・大規模言語モデルのしくみ(3)言語モデルと「自己教師あり学習」
岡野原大輔(株式会社Preferred Networks 共同創業者、代表取締役 最高研究責任者)
生成AIによる出力の精度を飛躍的に向上させた大規模言語モデル。はたしてこれまでの言語モデルとはどのような違いがあるのか。1940年代に出た言語モデルの原型を手始めにその仕組みを解説しながら、大規模言語モデルの画期性を解き明かす。キーワードは「自己教師あり学習」だ。(全6話中第3話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:10分14秒
収録日:2024年4月16日
追加日:2024年7月23日
≪全文≫

●単語の出現確率から文章を生成した初期の言語モデル


―― そういう話になってくると、ますます、どうやってそういう能力をいわゆるAIが身につけていくのかというところを、まず知った上でないと判断が難しいと思うのですが、早速その話に入っていきたいと思います。

 まず挙げていただいた言語モデルというところですね。これはどういうことになりますでしょうか。

岡野原 大規模言語モデルの「言語モデル」という部分に関して、まず説明させていただきます。

 言語モデル(ランゲージモデル)というのは、今の大規模言語モデルがこれだけブームになるよりずっと前からある分野です。それこそ、情報理論を発明して、今のコンピュータの礎をつくったシャノンという有名な研究者が1940年代に出したいちばん最初の情報理論の論文にも、その言語モデルの原型が出ています。

 この言語モデルでは、今のような文章を丸ごと生成するのは難しいので、1単語ずつ順番に生成していきます。まず最初に、いろいろあり得る単語の候補の中で「私」というのが出る確率を出すようなモデルを用意します。

 例えば、「私」というのはありとあらゆる単語の中で0.005の確率で出現する(とする)。いちばん出やすいのは、例えば「東京」とか、もっと別の単語かもしれないですけれど、たまたまサイコロを振ったら「私」が出る確率が0.005と設定します。次に、「私」の次に何の単語が出やすいかという確率を用意します。例えば「は」が0.02(の確率で)出る(とする)。

 こういうふうに、何か文字列を生成しよう、確率を与えようという場合に、まず1単語目がどういう確率で出るか。次に、1単語目に決めたものの次の2単語目に何が出やすいかということで決める。3単語目は、1単語目と2単語目の次に何が出やすいのかということを決める。こういう形で、単語列というものに対して、これがサイコロを振ったらどれくらいの確率で出るのかということを出せるようなモデルが、言語モデルになっています。

―― そうすると、その先ほどから意味の部分の話をしていますけれど、(むしろ)意味というよりは、確率でどれが確からしいかというところで並べ替えていくということですね。

岡野原 そうです。まさに今、非常に重要なところを話してもらいました。人間ですとどうしても、こういう...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
「科学と技術」でまず見るべき講義シリーズ
レアメタルの光と影(1)イントロ
イノベーションがレアメタルをコモンメタルにする
岡部徹
ChatGPT~AIと人間の未来(1)ChatGPTは何ができて、何ができないか
ChatGPTは考えてない?…「AIの回答」の本質とは
西垣通
社会はAIでいかに読み解けるのか(1)経済学理論の役割
AIやディープラーニングによって社会分析の方法が変わる
柳川範之
性はなぜあるのか~進化生物学から見たLGBT(1)有性生殖と無性生殖
なぜ雄と雌の2つの性別があるのか…「性」の謎とLGBT
長谷川眞理子
断熱から考える一年中快適で健康な住環境(1)日本の住宅の実態と問題点
なぜ日本は夏暑く、冬寒いのか…断熱から考える住宅の問題
前真之
培養肉研究の現在地と未来図(1)フェイクミート市場とリアルミート研究
食肉3.0時代に突入、「培養肉」研究の今に迫る
竹内昌治

人気の講義ランキングTOP10
和歌のレトリック~技法と鑑賞(1)枕詞:その1
ぬばたまの、あしひきの……不思議な「枕詞」の意味は?
渡部泰明
これからの社会・経済の構造変化(1)民主主義と意思決定スピード
フラット化…日本のヒエラルキーや無謬性の原則は遅すぎる
柳川範之
「進化」への誤解…本当は何か?(9)AI時代の人間と科学の関係
科学は嫌われる!? なぜ「物語」のほうが重要視されるのか
長谷川眞理子
独裁の世界史~未来への提言編(1)国家の三つの要素
未来を洞察するために「独裁・共和政・民主政」の循環を学べ
本村凌二
AI時代と人間の再定義(1)AIは思考するのか
AIは間違いが分からない…思考で大事なのは訂正可能性
中島隆博
歌舞伎はスゴイ(1)市川團十郎の何がスゴイか(前編)
市川團十郎の歴史…圧倒的才能の初代から六代目までの奮闘
堀口茉純
豊臣兄弟~秀吉と秀長の実像に迫る(8)秀長の死の影響と秀吉政権の瓦解
「家康対奉行」の構図は真っ赤な嘘!? 秀吉政権瓦解の真相
黒田基樹
逆境に対峙する哲学(1)日常性が「破れ」て思考が始まる
逆境にどう対峙するか…西洋哲学×東洋哲学で問う知的ライブ
津崎良典
エネルギーと医学から考える空海が拓く未来(5)『秘蔵宝鑰』が示す非二元論的世界
雄大で雄渾な生命の全体像…その中で点滅する個々の生命
鎌田東二
生成AI「Round 2」への向き合い方(1)生成AI導入の現在地
生成AIの利活用に格差…世界の導入事情と日本の現状
渡辺宣彦