生成AI「Round 2」への向き合い方
この講義シリーズは第2話まで
登録不要無料視聴できます!
第1話へ
▶ この講義を再生
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
(会員の方に広告は表示されません)
「マルチモーダル」とは?最新の生成AI技術を疑似体験
生成AI「Round 2」への向き合い方(3)「マルチモーダル」な生成AI
渡辺宣彦(コグニザントジャパン株式会社 代表取締役社長CEO)
生成AIモデルにおいて先頭を走るのがChatGPTだが、そのChatGPTを提供しているOpenAIは、歩みを止めずに生成AIのさまざまな最新モデルを開発している。テキストの他に画像や音声も同時に処理する「マルチモーダル」な最新の生成AI技術を、実演動画をまじえて紹介する。(全10話中第3話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:10分35秒
収録日:2024年11月5日
追加日:2025年1月7日
≪全文≫

●テキスト以外も処理する「マルチモーダル」な生成AI


渡辺 そういえば(生成AIに関する動きが)どこから始まったかというと、ChatGPTというのがけっこう大きな存在だったのではないかと思います。そのChatGPTを提供しているのはOpenAIという組織、企業です。そこに対してはマイクロソフトがかなり大きな投資を行っており、パートナーとして行動しています。ここ(スライド)では「Best Friends」と書いていますが、OpenAIは、ただ独立している企業、組織ですので、独自の日本法人も日本で作られましたし、その果たすべき使命のためにどんどん行動しています。

 2023年からの大きな変化という意味では、こちらにGPT-4、3.5-Turboとたくさん並んでいますけれど、最近、OpenAIが提供しているモデルと呼ばれます。2023年のお話の段階では「LLM(Large Language Model:大規模言語モデル)ですよ」という言い方をしたかと思うのですが、最近は「マルチモーダル」ということが非常に重要なものになっています。

―― それはどういう意味なのですか。

渡辺 マルチモーダルの意味は、間違いのないように、念のためCopilotに訊いてみました。例えばテキストベースの言葉だけではなくて、話し言葉であったり、それから画像であったりといったような、異なる要素を同時に取り扱うようなことができるようなAIだということが、マルチモーダルの持っている意味だそうです。

―― なるほど。そうすると、テキストベースだけではないということになるわけですか。

渡辺 ないのです。それが非常に高速に提供されるというのがマルチモーダルの意味合いになってきます。

―― はい。

渡辺 実際どんなことなのか、体感していただきたいので次に進みます。

 例えばこういうことなのです。これは「Azure AI Speech」ということで、人工的に合成している声だと思っていただければいいと思います。「Custom Neural Voice」といいますけれど、当社のCEOサティアがスピーチをしているので、それを聞いてみようと思います。

<サティア・ナデラのスピーチ(英語)>

渡辺 インドにおけるスキリングの話をしています。日本だけではなくて、インドでもやっているということなのだと思うのです。

―― これは本人の声ですよね...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
(会員の方に広告は表示されません)
「経営ビジネス」でまず見るべき講義シリーズ
野獣の経営、家畜の経営(1)経営センスが育つ土壌
ファーストリテイリングで経営者が育つ理由
楠木建
「重要思考」で考え、伝え、聴き、議論する(1)「重要思考」のエッセンス
重要思考とは?「一瞬で大切なことを伝える技術」を学ぶ
三谷宏治
重職心得箇条~管理職は何をなすべきか(1)時代に請われ、時代に応えた佐藤一斎
リーダーの心得…幕末の偉人たちを育てた佐藤一斎に学べ!
田口佳史
経験学習を促すリーダーシップ(1)経験学習の基本
成長を促す「3つの経験」とは?経験学習の基本を学ぶ
松尾睦
プロティアン~最先端の自律的キャリア形成(1)変幻自在のキャリア論
なぜ第二の人生のためにキャリアの棚卸しが必要か~組織から自律へ
田中研之輔
ソニー流「人的資本経営と新規事業」成功論(1)人を真に活かす人事評価とは
ソニー流の「人材論」「新規ビジネス論」を具体的に語ろう
水野道訓

人気の講義ランキングTOP10
編集部ラジオ2026(17)「過剰な良かれ」の落とし穴
【10minで考える】巨人・阿部監督の辞任と「過剰な良かれ」
テンミニッツ・アカデミー編集部
AI時代にリベラルアーツがなぜ必要か(2)大規模言語モデルが孕む問題
AIは頭のないオウム?…AIがAIを引用する世界に創造性はあるか?
橋爪大三郎
地政学入門 歴史と理論編(1)地政学とは何か
地政学をわかりやすく解説…地政学の「3つの柱」とは?
小原雅博
AI大格差~最新研究による仕事と給料の未来(1)最新研究から見えてくる未来像
AI大格差…なぜ日本の雇用環境では「ショックが大きい」のか?
宮本弘曉
ウェルビーイングを高めるDE&I(5)心理的安全性の高い組織づくり
無知、無能、邪魔!?…心理的安全性を阻害する5つの要因
青島未佳
チームパフォーマンスを高める心理的安全性(1)心理的安全性が注目される理由
なぜ今「心理的安全性」なのか、注目を集める背景に迫る
青島未佳
老荘思想に学ぶ(3)「過度」を戒める「道」の思想
実力、実質を伴わずにやり過ぎるのは愚の骨頂である
田口佳史
小澤開作と満洲事変・日中戦争(1)少年時代の苦労と五族協和の夢
満洲で「五族協和」に命を懸けた小澤征爾の父・小澤開作
小澤俊夫
学力喪失の危機~言語習得と理解の本質(4)足場かけと遊びの活用
気づきを与えるカードゲームの魔法、大事なのは足場かけ
今井むつみ
数学と音楽の不思議な関係(1)だれもがみんな数学者で音楽家
世界は音楽と数学であふれている…歴史が物語る密接な関係
中島さち子