生成AI「Round 2」への向き合い方
この講義シリーズは第2話まで
登録不要無料視聴できます!
▶ 第1話を無料視聴する
閉じる
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
「マルチモーダル」とは?最新の生成AI技術を疑似体験
生成AI「Round 2」への向き合い方(3)「マルチモーダル」な生成AI
渡辺宣彦(コグニザントジャパン株式会社 代表取締役社長CEO)
生成AIモデルにおいて先頭を走るのがChatGPTだが、そのChatGPTを提供しているOpenAIは、歩みを止めずに生成AIのさまざまな最新モデルを開発している。テキストの他に画像や音声も同時に処理する「マルチモーダル」な最新の生成AI技術を、実演動画をまじえて紹介する。(全10話中第3話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:10分35秒
収録日:2024年11月5日
追加日:2025年1月7日
≪全文≫

●テキスト以外も処理する「マルチモーダル」な生成AI


渡辺 そういえば(生成AIに関する動きが)どこから始まったかというと、ChatGPTというのがけっこう大きな存在だったのではないかと思います。そのChatGPTを提供しているのはOpenAIという組織、企業です。そこに対してはマイクロソフトがかなり大きな投資を行っており、パートナーとして行動しています。ここ(スライド)では「Best Friends」と書いていますが、OpenAIは、ただ独立している企業、組織ですので、独自の日本法人も日本で作られましたし、その果たすべき使命のためにどんどん行動しています。

 2023年からの大きな変化という意味では、こちらにGPT-4、3.5-Turboとたくさん並んでいますけれど、最近、OpenAIが提供しているモデルと呼ばれます。2023年のお話の段階では「LLM(Large Language Model:大規模言語モデル)ですよ」という言い方をしたかと思うのですが、最近は「マルチモーダル」ということが非常に重要なものになっています。

―― それはどういう意味なのですか。

渡辺 マルチモーダルの意味は、間違いのないように、念のためCopilotに訊いてみました。例えばテキストベースの言葉だけではなくて、話し言葉であったり、それから画像であったりといったような、異なる要素を同時に取り扱うようなことができるようなAIだということが、マルチモーダルの持っている意味だそうです。

―― なるほど。そうすると、テキストベースだけではないということになるわけですか。

渡辺 ないのです。それが非常に高速に提供されるというのがマルチモーダルの意味合いになってきます。

―― はい。

渡辺 実際どんなことなのか、体感していただきたいので次に進みます。

 例えばこういうことなのです。これは「Azure AI Speech」ということで、人工的に合成している声だと思っていただければいいと思います。「Custom Neural Voice」といいますけれど、当社のCEOサティアがスピーチをしているので、それを聞いてみようと思います。

<サティア・ナデラのスピーチ(英語)>

渡辺 インドにおけるスキリングの話をしています。日本だけではなくて、インドでもやっているということなのだと思うのです。

―― これは本人の声ですよね...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
「経営ビジネス」でまず見るべき講義シリーズ
ソニー流「人的資本経営と新規事業」成功論(1)人を真に活かす人事評価とは
ソニー流の「人材論」「新規ビジネス論」を具体的に語ろう
水野道訓
プロティアン~最先端の自律的キャリア形成(1)変幻自在のキャリア論
なぜ第二の人生のためにキャリアの棚卸しが必要か~組織から自律へ
田中研之輔
ハラスメント防止に向けた風土づくり(1)ハラスメントの概要
増え続けるハラスメント…その背景としての職場の特徴
青島未佳
メンタルヘルスの現在地とこれから(1)「心を病む」とはどういうことか
なぜ「心の病」が増えている?メンタルヘルスの実態に迫る
斎藤環
そこまでやるか
当たり前のことを徹底してやった時、初めて人の心は動く
上甲晃
ストーリーとしての競争戦略(1)当たり前の重要さ
柳井正氏の年度方針「儲ける」は商売の本筋
楠木建

人気の講義ランキングTOP10
こどもと学ぶ戦争と平和(2)「本当の平和」とは何か
「平和」には2つある…今の日本は本当に平和なのか?
小原雅博
AI時代と人間の再定義(1)AIは思考するのか
AIでは「思考の三位一体」が成立しない…考えるとは?
中島隆博
プロジェクトマネジメントの基本(10)大脳生理学によるモチベーション理論
論理的?計画的?社交的?冒険的?利き脳による4タイプ
大塚有希子
ソニー流「人的資本経営と新規事業」成功論(4)新規事業成功のポイント
新規ビジネスの立ち上げ方、伸ばし方、見切り方の具体例
水野道訓
これから必要な人材と人材教育とは?(2)AI時代に必要とされる能力
AI時代に必要なのは「問いを立てる能力」…いかに育成するか
柳川範之
エネルギーと医学から考える空海が拓く未来(4)全てをつなぐ密教の世界観
密教の世界観は全宇宙を分割せずに「つないでいく」
鎌田東二
これからの社会・経済の構造変化(2)経済的利益と社会課題解決の両立へ
利益か社会課題解決か…かつての日本企業の美点を取り戻せ
柳川範之
危機のデモクラシー…公共哲学から考える(5)共存・共生のための理性
共生への道…ジョン・ロールズが説く「合理性と道理性」
齋藤純一
印象派とは~画家たちの関係性から技法まで(4)マネとモネの《草上の昼食》
マネの《草上の昼食》が問題に…スキャンダルの真相とは
安井裕雄
「三国志」の世界とその魅力(1)二つの三国志
三国志の舞台、三国時代はいつの・どんな時代だったのか?
渡邉義浩