生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
第1話へ
▶ この講義を再生
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
(会員の方に広告は表示されません)
大規模言語モデルを成功させた要因「Transformer」とは
生成AI・大規模言語モデルのしくみ(5)言語モデルの大規模化とTransformer
岡野原大輔(株式会社Preferred Networks 共同創業者、代表取締役 最高研究責任者)
大規模言語モデルを成功させた要因の1つに“Transformer”と呼ばれる言語モデルの登場がある。Transformerは、必要な情報を取り出す「注意機構」と、長期的な記憶から情報を探索する「MLPブロック」によって構成されるのだが、この“Transformer”の場合は、大規模化することで、どこまで性能が上がるかがクリアにわかるようになった。それが「べき乗則」と呼ばれるものである。そして、さらに予想外のことも起こっているという。いったいどういうことなのか。Transformerモデルの画期性とともにその詳細を解説する。(全6話中第5話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:8分39秒
収録日:2024年4月16日
追加日:2024年8月6日
≪全文≫

●自己注意機構とMLPブロックで構成される“Transformer”モデル


―― 次にTransformerというところですね。

岡野原 そうですね。このTransformerが、今(第5話で)説明した「注意機構」と、もう1つ、記憶の主翼を担っている「MLPブロック」と呼ばれるモデルで構成されています。ちなみにこのTransformerがある種、今の大規模言語モデルを成功させた主要因の1つだといわれています。

 このTransformerも、「注意」のしくみを元にすると簡単な話で、中身は2つからなっています。

 1つは説明した「注意」、どこから情報を持ってくるのかという部分です。では「注意」でどこから情報を持ってきますかというと、前のときの、どこかの自分の処理の途中結果を取ってくるのです。これがたくさんあって、自分の処理の途中結果を集めてくる。例えば、「彼」というところにあるブロックの周りから、この「彼」というところに情報を集めてくる。(つまり)「彼」に関する情報を集めてくるのです。

 次に、「彼」に溜まっている情報と別の場所の単語を「この情報、自分がほしいから取ってください」というように、「自己注意機構」でどんどん情報を行き来させる。これが1つです。

 もう1つ、この(スライドの)右側の「MLPブロック」というのは何を実現しているかというと、長期記憶です。今見ている文章ではない、過去に読んだ文章でも、たくさん役に立つ情報はもちろんあるわけです。例えば、「病院というのはこういう機能を持っていますよ」だとか、「こういう人が行きやすいですね」だとか、そういう情報がものすごく大量に詰まっているのです。

 Transformerは、この2つが、たくさん組み合わさってできているモデルになっている。次の単語を予測するために、「自己注意機構」で周りからどんどん必要な情報を集めてくる。さらには、今の文章ではない、昔読んだ文章からもどんどん情報を持ってこなければいけないということで、「MLPブロック」からも情報を集める。これが100層とか、何回も処理されて、ここまでやってようやく1つの単語を予測するというモデルになっています。

―― なるほど。今のお話を聞いていると、たしかに「理解」というものにだいぶ近くなっている気がしますね。

岡野原 そうですね。なので、1個1個がやっていること自体は、ものすごく単純な...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
(会員の方に広告は表示されません)
「科学と技術」でまず見るべき講義シリーズ
本当によくわかる「量子コンピュータ入門」(1)量子コンピュータとは何か
「量子コンピュータ」はどういうもので、何に使えるのか
武田俊太郎
レアメタルの光と影(1)イントロ
イノベーションがレアメタルをコモンメタルにする
岡部徹
進化的人間考~ヒトの性質と異様な現代社会(1)進化のスパンと現在の人間生活
ヒトの進化史を文明の発展の時間軸から考える
長谷川眞理子
Beyond5G・6Gで進む情報通信の民主化(1)情報通信の民主化と「協創」
6Gの研究開発を推進する情報通信の民主化
中尾彰宏
発酵はマジックだ!
色を消し、脂を溶かし、水を分解―スゴすぎる発酵の力!
小泉武夫
社会はAIでいかに読み解けるのか(1)経済学理論の役割
AIやディープラーニングによって社会分析の方法が変わる
柳川範之

人気の講義ランキングTOP10
編集部ラジオ2026(10)ユダヤ人特集~鶴見太郎先生
【10min解説】鶴見太郎先生《教養としてのユダヤ人の歴史》
テンミニッツ・アカデミー編集部
教養としての「ユダヤ人の歴史とユダヤ教」(1)ユダヤ人とは誰のことか
ユダヤ人とは?なぜ差別?お金持ち?…『ユダヤ人の歴史』に学ぶ
鶴見太郎
イラン戦争とトランプ大統領の戦争指導(3)戦争終結シナリオと大統領選挙の行方
MAGA連合に亀裂!?イラン戦争が及ぼす大統領選への影響
東秀敏
ユダヤ神話の基本を知る
ユダヤ教の神話…天地創造、モーセの十戒、死後の世界
鎌田東二
大統領に告ぐ…硫黄島からの手紙の真実(2)翻訳に込めた日米の架け橋への夢
アメリカ人の心を震わせた20歳の日系二世・三上弘文の翻訳
門田隆将
日本人とメンタルヘルス…心のあり方(7)若者の引きこもりと日本の教育問題
日本の引きこもりの深い根源…「核家族」構造の問題とは?
與那覇潤
これから必要な人材と人材教育とは?(3)無謬性とジョブローテーション
もうゼネラリストを育てる人事制度では時代に対応できない
柳川範之
イスラエルの歴史、民族の離散と迫害(1)前編
古代イスラエルの歴史…メサイア信仰とユダヤ人の離散
島田晴雄
経験学習を促すリーダーシップ(1)経験学習の基本
成長を促す「3つの経験」とは?経験学習の基本を学ぶ
松尾睦
ラフカディオ・ハーン『神国日本』を読む(1)なぜ『神国日本』なのか?
ラフカディオ・ハーンが解明した「美しい日本」の秘密と未来
賴住光子