生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
▶ 第1話を無料視聴する
閉じる
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
大規模言語モデルを成功させた要因「Transformer」とは
生成AI・大規模言語モデルのしくみ(5)言語モデルの大規模化とTransformer
科学と技術
岡野原大輔(株式会社Preferred Networks 共同創業者、代表取締役 最高研究責任者)
大規模言語モデルを成功させた要因の1つに“Transformer”と呼ばれる言語モデルの登場がある。Transformerは、必要な情報を取り出す「注意機構」と、長期的な記憶から情報を探索する「MLPブロック」によって構成されるのだが、この“Transformer”の場合は、大規模化することで、どこまで性能が上がるかがクリアにわかるようになった。それが「べき乗則」と呼ばれるものである。そして、さらに予想外のことも起こっているという。いったいどういうことなのか。Transformerモデルの画期性とともにその詳細を解説する。(全6話中第5話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:8分39秒
収録日:2024年4月16日
追加日:2024年8月6日
≪全文≫

●自己注意機構とMLPブロックで構成される“Transformer”モデル


―― 次にTransformerというところですね。

岡野原 そうですね。このTransformerが、今(第5話で)説明した「注意機構」と、もう1つ、記憶の主翼を担っている「MLPブロック」と呼ばれるモデルで構成されています。ちなみにこのTransformerがある種、今の大規模言語モデルを成功させた主要因の1つだといわれています。

 このTransformerも、「注意」のしくみを元にすると簡単な話で、中身は2つからなっています。

 1つは説明した「注意」、どこから情報を持ってくるのかという部分です。では「注意」でどこから情報を持ってきますかというと、前のときの、どこかの自分の処理の途中結果を取ってくるのです。これがたくさんあって、自分の処理の途中結果を集めてくる。例えば、「彼」というところにあるブロックの周りから、この「彼」というところに情報を集めてくる。(つまり)「彼」に関する情報を集めてくるのです。

 次に、「彼」に溜まっている情報と別の場所の単語を「この情報、自分がほしいから取ってください」というように、「自己注意機構」でどんどん情報を行き来させる。これが1つです。

 もう1つ、この(スライドの)右側の「MLPブロック」というのは何を実現しているかというと、長期記憶です。今見ている文章ではない、過去に読んだ文章でも、たくさん役に立つ情報はもちろんあるわけです。例えば、「病院というのはこういう機能を持っていますよ」だとか、「こういう人が行きやすいですね」だとか、そういう情報がものすごく大量に詰まっているのです。

 Transformerは、この2つが、たくさん組み合わさってできているモデルになっている。次の単語を予測するために、「自己注意機構」で周りからどんどん必要な情報を集めてくる。さらには、今の文章ではない、昔読んだ文章からもどんどん情報を持ってこなければいけないということで、「MLPブロック」からも情報を集める。これが100層とか、何回も処理されて、ここまでやってようやく1つの単語を予測するというモデルになっています。

―― なるほど。今のお話を聞いていると、たしかに「理解」というものにだいぶ近くなっている気がしますね。

岡野原 そうですね。なので、1個1個がやっていること自体は、ものすごく単純な...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
「科学と技術」でまず見るべき講義シリーズ
断熱から考える一年中快適で健康な住環境(1)日本の住宅の実態と問題点
なぜ日本は夏暑く、冬寒いのか…断熱から考える住宅の問題
前真之
航空機事故ゼロをめざして(1)フラッター現象とは何か
零戦の開発段階で起きたフラッター現象…事故の教訓とは
鈴木真二
本当によくわかる「量子コンピュータ入門」(1)量子コンピュータとは何か
「量子コンピュータ」はどういうもので、何に使えるのか
武田俊太郎
「宇宙の創生」の仕組みと宇宙物理学の歴史(1)宇宙の階層構造
「宇宙の階層構造」誕生の謎に迫るのが宇宙物理学のテーマ
岡朋治
現在の宇宙の姿(1)星はなぜ自ら輝くのか
宇宙に関するニュースを理解するために宇宙の姿を学ぶ
岡村定矩
進化生物学から見た「宗教の起源」(1)宗教の起源とトランス状態
私たちにはなぜ宗教が必要だったのか…脳の働きから考える
長谷川眞理子

人気の講義ランキングTOP10
『孫子』を読む:虚実篇(1)いかに主導権を握るか
「虚実篇」から学ぶ優秀なリーダーの役割と戦略の重要性
田口佳史
外交とは何か~不戦不敗の要諦を問う(5)日本外交の進むべき道
中国の「国進民退」に危機感…これからの日中関係を読む
小原雅博
習近平中国の真実…米中関係・台湾問題(2)国家戦略目標の転換
経済発展から「国家の安全」へ…転換された国家戦略目標
垂秀夫
クーデターの条件~台湾を事例に考える(1)クーデターとは何か
台湾でクーデターは起きるのか?想定シナリオとその可能性
上杉勇司
定年後の人生を設計する(1)定年後の不安と「黄金の15年」
不安な定年後を人生の「黄金の15年」に変えるポイント
楠木新
ルネサンス美術の見方(1)ルネサンス美術とは何か
ルネサンスはどうやって始まった?…美術の時代背景
池上英洋
経験学習を促すリーダーシップ(1)経験学習の基本
成長を促す「3つの経験」とは?経験学習の基本を学ぶ
松尾睦
死と宗教~教養としての「死の講義」(1)「自分が死ぬ」ということ
世界の宗教は死をどう考えるか…科学では死はわからない
橋爪大三郎
編集部ラジオ2025(22)長谷川眞理子先生の「子育て」講義
生物学からわかる「ヒトの配偶や子育て」で大切なこと
テンミニッツ・アカデミー編集部
チームパフォーマンスを高める心理的安全性(1)心理的安全性が注目される理由
なぜ今「心理的安全性」なのか、注目を集める背景に迫る
青島未佳