生成AI・大規模言語モデルのしくみ
この講義シリーズは第2話まで
登録不要無料視聴できます!
第1話へ
▶ この講義を再生
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
(会員の方に広告は表示されません)
大規模言語モデルを成功させた要因「Transformer」とは
生成AI・大規模言語モデルのしくみ(5)言語モデルの大規模化とTransformer
岡野原大輔(株式会社Preferred Networks 共同創業者、代表取締役 最高研究責任者)
大規模言語モデルを成功させた要因の1つに“Transformer”と呼ばれる言語モデルの登場がある。Transformerは、必要な情報を取り出す「注意機構」と、長期的な記憶から情報を探索する「MLPブロック」によって構成されるのだが、この“Transformer”の場合は、大規模化することで、どこまで性能が上がるかがクリアにわかるようになった。それが「べき乗則」と呼ばれるものである。そして、さらに予想外のことも起こっているという。いったいどういうことなのか。Transformerモデルの画期性とともにその詳細を解説する。(全6話中第5話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:8分39秒
収録日:2024年4月16日
追加日:2024年8月6日
≪全文≫

●自己注意機構とMLPブロックで構成される“Transformer”モデル


―― 次にTransformerというところですね。

岡野原 そうですね。このTransformerが、今(第5話で)説明した「注意機構」と、もう1つ、記憶の主翼を担っている「MLPブロック」と呼ばれるモデルで構成されています。ちなみにこのTransformerがある種、今の大規模言語モデルを成功させた主要因の1つだといわれています。

 このTransformerも、「注意」のしくみを元にすると簡単な話で、中身は2つからなっています。

 1つは説明した「注意」、どこから情報を持ってくるのかという部分です。では「注意」でどこから情報を持ってきますかというと、前のときの、どこかの自分の処理の途中結果を取ってくるのです。これがたくさんあって、自分の処理の途中結果を集めてくる。例えば、「彼」というところにあるブロックの周りから、この「彼」というところに情報を集めてくる。(つまり)「彼」に関する情報を集めてくるのです。

 次に、「彼」に溜まっている情報と別の場所の単語を「この情報、自分がほしいから取ってください」というように、「自己注意機構」でどんどん情報を行き来させる。これが1つです。

 もう1つ、この(スライドの)右側の「MLPブロック」というのは何を実現しているかというと、長期記憶です。今見ている文章ではない、過去に読んだ文章でも、たくさん役に立つ情報はもちろんあるわけです。例えば、「病院というのはこういう機能を持っていますよ」だとか、「こういう人が行きやすいですね」だとか、そういう情報がものすごく大量に詰まっているのです。

 Transformerは、この2つが、たくさん組み合わさってできているモデルになっている。次の単語を予測するために、「自己注意機構」で周りからどんどん必要な情報を集めてくる。さらには、今の文章ではない、昔読んだ文章からもどんどん情報を持ってこなければいけないということで、「MLPブロック」からも情報を集める。これが100層とか、何回も処理されて、ここまでやってようやく1つの単語を予測するというモデルになっています。

―― なるほど。今のお話を聞いていると、たしかに「理解」というものにだいぶ近くなっている気がしますね。

岡野原 そうですね。なので、1個1個がやっていること自体は、ものすごく単純な...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
(会員の方に広告は表示されません)
「科学と技術」でまず見るべき講義シリーズ
進化生物学から見た「宗教の起源」(1)宗教の起源とトランス状態
私たちにはなぜ宗教が必要だったのか…脳の働きから考える
長谷川眞理子
ブラックホールとは何か(1)私たちが住む銀河系
太陽系は銀河系の中で塵のように小さな存在でしかない
岡朋治
発酵はマジックだ!
色を消し、脂を溶かし、水を分解―スゴすぎる発酵の力!
小泉武夫
もっと知りたいイヌのこと(1)イヌの歴史を振り返る
オオカミはいつイヌになったか…犬の起源と家畜化の歴史
長谷川眞理子
「宇宙の創生」の仕組みと宇宙物理学の歴史(1)宇宙の階層構造
「宇宙の階層構造」誕生の謎に迫るのが宇宙物理学のテーマ
岡朋治
知能と進化(1)知性と身体性
AI、ディープラーニングとは…知能と身体性は不可分か?
長谷川眞理子

人気の講義ランキングTOP10
ウェルビーイングを高めるDE&I(2)人と組織を取り巻く環境変化:後編
なぜ日本の幸福度は低すぎるのか?会社任せで失われる自律性
青島未佳
AI大格差~最新研究による仕事と給料の未来(1)最新研究から見えてくる未来像
AI大格差…なぜ日本の雇用環境では「ショックが大きい」のか?
宮本弘曉
百姓からみた戦国大名~国家の本質(1)戦国時代の過酷な生存環境
戦国大名と民衆の過酷な課題…飢饉の常態化をどう生き延びるか
黒田基樹
教養としての「ユダヤ人の歴史とユダヤ教」(1)ユダヤ人とは誰のことか
ユダヤ人とは?なぜ差別?お金持ち?…『ユダヤ人の歴史』に学ぶ
鶴見太郎
インフレの行方…歴史から将来を予測する(1)インフレの具体像を探る
270年の物価の歴史に学べ…急激な物価上昇期の特徴と教訓
養田功一郎
豊臣兄弟~秀吉と秀長の実像に迫る(序)時代考証が語る『豊臣兄弟!』の魅力
織田家中一の武略者…『豊臣兄弟!』秀吉と秀長の知られざる実像
黒田基樹
天下人・織田信長の実像に迫る(1)戦国時代の日本のすがた
織田信長の「天下」とは…最新研究で激変する人物像・時代像
柴裕之
人の行動の「なぜ」を読み解く行動分析学(1)随伴性
三日坊主、部屋が片付かない…なぜできないか行動分析学で考える
島宗理
昭和の名将・樋口季一郎…ユダヤ人救出編(5)陸軍悪玉論の中の名将たち
武力を持ったエリート官僚たち…陸軍悪玉論と個々人の決断
門田隆将
イラン戦争と終末論(2)終末論とトランプ政権への影響
イラン戦争で反ユダヤ主義が加速!?トランプ政権へのリスク
東秀敏