生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
第1話へ
▶ この講義を再生
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
(会員の方に広告は表示されません)
大規模言語モデルを成功させた要因「Transformer」とは
生成AI・大規模言語モデルのしくみ(5)言語モデルの大規模化とTransformer
岡野原大輔(株式会社Preferred Networks 共同創業者、代表取締役 最高研究責任者)
大規模言語モデルを成功させた要因の1つに“Transformer”と呼ばれる言語モデルの登場がある。Transformerは、必要な情報を取り出す「注意機構」と、長期的な記憶から情報を探索する「MLPブロック」によって構成されるのだが、この“Transformer”の場合は、大規模化することで、どこまで性能が上がるかがクリアにわかるようになった。それが「べき乗則」と呼ばれるものである。そして、さらに予想外のことも起こっているという。いったいどういうことなのか。Transformerモデルの画期性とともにその詳細を解説する。(全6話中第5話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:8分39秒
収録日:2024年4月16日
追加日:2024年8月6日
≪全文≫

●自己注意機構とMLPブロックで構成される“Transformer”モデル


―― 次にTransformerというところですね。

岡野原 そうですね。このTransformerが、今(第5話で)説明した「注意機構」と、もう1つ、記憶の主翼を担っている「MLPブロック」と呼ばれるモデルで構成されています。ちなみにこのTransformerがある種、今の大規模言語モデルを成功させた主要因の1つだといわれています。

 このTransformerも、「注意」のしくみを元にすると簡単な話で、中身は2つからなっています。

 1つは説明した「注意」、どこから情報を持ってくるのかという部分です。では「注意」でどこから情報を持ってきますかというと、前のときの、どこかの自分の処理の途中結果を取ってくるのです。これがたくさんあって、自分の処理の途中結果を集めてくる。例えば、「彼」というところにあるブロックの周りから、この「彼」というところに情報を集めてくる。(つまり)「彼」に関する情報を集めてくるのです。

 次に、「彼」に溜まっている情報と別の場所の単語を「この情報、自分がほしいから取ってください」というように、「自己注意機構」でどんどん情報を行き来させる。これが1つです。

 もう1つ、この(スライドの)右側の「MLPブロック」というのは何を実現しているかというと、長期記憶です。今見ている文章ではない、過去に読んだ文章でも、たくさん役に立つ情報はもちろんあるわけです。例えば、「病院というのはこういう機能を持っていますよ」だとか、「こういう人が行きやすいですね」だとか、そういう情報がものすごく大量に詰まっているのです。

 Transformerは、この2つが、たくさん組み合わさってできているモデルになっている。次の単語を予測するために、「自己注意機構」で周りからどんどん必要な情報を集めてくる。さらには、今の文章ではない、昔読んだ文章からもどんどん情報を持ってこなければいけないということで、「MLPブロック」からも情報を集める。これが100層とか、何回も処理されて、ここまでやってようやく1つの単語を予測するというモデルになっています。

―― なるほど。今のお話を聞いていると、たしかに「理解」というものにだいぶ近くなっている気がしますね。

岡野原 そうですね。なので、1個1個がやっていること自体は、ものすごく単純な...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
(会員の方に広告は表示されません)
「科学と技術」でまず見るべき講義シリーズ
もっと知りたいイヌのこと(1)イヌの歴史を振り返る
オオカミはいつイヌになったか…犬の起源と家畜化の歴史
長谷川眞理子
水から考える「持続可能」な未来(1)気候変動の現在地
最悪10メートル以上海面上昇…将来に禍根残す温暖化の影響
沖大幹
知能と進化(1)知性と身体性
AI、ディープラーニングとは…知能と身体性は不可分か?
長谷川眞理子
進化的人間考~ヒトの性質と異様な現代社会(1)進化のスパンと現在の人間生活
ヒトの進化史を文明の発展の時間軸から考える
長谷川眞理子
発酵はマジックだ!
色を消し、脂を溶かし、水を分解―スゴすぎる発酵の力!
小泉武夫
ChatGPT~AIと人間の未来(1)ChatGPTは何ができて、何ができないか
ChatGPTは考えてない?…「AIの回答」の本質とは
西垣通

人気の講義ランキングTOP10
編集部ラジオ2026(8)10分解説!第二の人生の仕事革命
年金の「働き損」解消時代!第二の人生を充実させる方法とは
テンミニッツ・アカデミー編集部
日本人とメンタルヘルス…心のあり方(5)SNS社会と「二宮尊徳的」時代の終り
「既読」への不安…SNS社会にみる日本社会の混乱の要因
與那覇潤
人生100年時代の「ライフシフト概論」(1)人生100年時代のインパクト
80歳まで現役でいるために大切なこと…人生100年時代の発想法
徳岡晃一郎
『還暦からの底力』に学ぶ人生100年時代の生き方(1)定年制は要らない
仕事をするのに「年齢」は関係ない…不幸を招く定年型思考
出口治明
『孫子』を読む:地形篇(3)逆命利君の教えと絶対的勝利の条件
逆命利君か従命病君か――漢の時代から伝わる重要な戦略論
田口佳史
これからの社会・経済の構造変化(2)経済的利益と社会課題解決の両立へ
利益か社会課題解決か…かつての日本企業の美点を取り戻せ
柳川範之
新撰組と幕末日本の「真実」(8)戊辰戦争~明治期の新撰組の魂
受け継がれる魂…戊辰戦争での奮戦と自由民権運動の情熱
堀口茉純
大統領に告ぐ…硫黄島からの手紙の真実(2)翻訳に込めた日米の架け橋への夢
アメリカ人の心を震わせた20歳の日系二世・三上弘文の翻訳
門田隆将
定年後の人生を設計する(1)定年後の不安と「黄金の15年」
不安な定年後を人生の「黄金の15年」に変えるポイント
楠木新
高市政権の進むべき道…可能性と課題(1)高市首相の特長と政治リスク
歴史的圧勝で仕事人・高市首相にのしかかるリスク要因
島田晴雄