生成AI「Round 2」への向き合い方
この講義シリーズは第2話まで
登録不要無料視聴できます!
第1話へ
▶ この講義を再生
この講義の続きはもちろん、
5,000本以上の動画を好きなだけ見られる。
スキマ時間に“一流の教養”が身につく
まずは72時間¥0で体験
(会員の方に広告は表示されません)
「マルチモーダル」とは?最新の生成AI技術を疑似体験
生成AI「Round 2」への向き合い方(3)「マルチモーダル」な生成AI
渡辺宣彦(コグニザントジャパン株式会社 代表取締役社長CEO)
生成AIモデルにおいて先頭を走るのがChatGPTだが、そのChatGPTを提供しているOpenAIは、歩みを止めずに生成AIのさまざまな最新モデルを開発している。テキストの他に画像や音声も同時に処理する「マルチモーダル」な最新の生成AI技術を、実演動画をまじえて紹介する。(全10話中第3話)
※インタビュアー:川上達史(テンミニッツTV編集長)
時間:10分35秒
収録日:2024年11月5日
追加日:2025年1月7日
≪全文≫

●テキスト以外も処理する「マルチモーダル」な生成AI


渡辺 そういえば(生成AIに関する動きが)どこから始まったかというと、ChatGPTというのがけっこう大きな存在だったのではないかと思います。そのChatGPTを提供しているのはOpenAIという組織、企業です。そこに対してはマイクロソフトがかなり大きな投資を行っており、パートナーとして行動しています。ここ(スライド)では「Best Friends」と書いていますが、OpenAIは、ただ独立している企業、組織ですので、独自の日本法人も日本で作られましたし、その果たすべき使命のためにどんどん行動しています。

 2023年からの大きな変化という意味では、こちらにGPT-4、3.5-Turboとたくさん並んでいますけれど、最近、OpenAIが提供しているモデルと呼ばれます。2023年のお話の段階では「LLM(Large Language Model:大規模言語モデル)ですよ」という言い方をしたかと思うのですが、最近は「マルチモーダル」ということが非常に重要なものになっています。

―― それはどういう意味なのですか。

渡辺 マルチモーダルの意味は、間違いのないように、念のためCopilotに訊いてみました。例えばテキストベースの言葉だけではなくて、話し言葉であったり、それから画像であったりといったような、異なる要素を同時に取り扱うようなことができるようなAIだということが、マルチモーダルの持っている意味だそうです。

―― なるほど。そうすると、テキストベースだけではないということになるわけですか。

渡辺 ないのです。それが非常に高速に提供されるというのがマルチモーダルの意味合いになってきます。

―― はい。

渡辺 実際どんなことなのか、体感していただきたいので次に進みます。

 例えばこういうことなのです。これは「Azure AI Speech」ということで、人工的に合成している声だと思っていただければいいと思います。「Custom Neural Voice」といいますけれど、当社のCEOサティアがスピーチをしているので、それを聞いてみようと思います。

<サティア・ナデラのスピーチ(英語)>

渡辺 インドにおけるスキリングの話をしています。日本だけではなくて、インドでもやっているということなのだと思うのです。

―― これは本人の声ですよね...

スキマ時間でも、ながら学びでも
第一人者による講義を1話10分でお届け
さっそく始めてみる
(会員の方に広告は表示されません)
「経営ビジネス」でまず見るべき講義シリーズ
真理は平凡の中にある
感動した言葉は野球部監督の「あいさつは野球より難しい」
上甲晃
ハラスメント防止に向けた風土づくり(1)ハラスメントの概要
増え続けるハラスメント…その背景としての職場の特徴
青島未佳
これから必要な人材と人材教育とは?(1)人手の供給不足とマクロ経済への影響
ごく一部の人手不足が「致命的」になる…Oリング・セオリー
柳川範之
組織心理学~若者とのコミュニケーション(1)「Z世代」の特徴と接し方
Z世代は傷つきやすい!?…昔の世代との相違点、共通点とは
山浦一保
「重要思考」で考え、伝え、聴き、議論する(1)「重要思考」のエッセンス
重要思考とは?「一瞬で大切なことを伝える技術」を学ぶ
三谷宏治
ソニー流「人的資本経営と新規事業」成功論(1)人を真に活かす人事評価とは
ソニー流の「人材論」「新規ビジネス論」を具体的に語ろう
水野道訓

人気の講義ランキングTOP10
編集部ラジオ2026(9)「トランプ大統領」の視点・論点
【テンミニッツで考える】「トランプ大統領」をどう見るか?
テンミニッツ・アカデミー編集部
日本人とメンタルヘルス…心のあり方(7)若者の引きこもりと日本の教育問題
日本の引きこもりの深い根源…「核家族」構造の問題とは?
與那覇潤
禅とは何か~禅と仏教の心(1)アメリカの禅と日本の禅
自発性を重んじる――藤田一照師が禅と仏教の心を説く
藤田一照
AI時代と人間の再定義(1)AIは思考するのか
AIでは「思考の三位一体」が成立しない…考えるとは?
中島隆博
「同盟の真髄」と日米関係の行方(7)トランプ氏の評価とその実像
こりごり?アイ・ラブ・トランプ?…トランプ陣営の実状は
杉山晋輔
プラトン『ポリテイア(国家)』を読む(14)ポリスと魂の堕落過程〈下〉僭主の末路
僭主制は欲望の奴隷…過度の自由が過度の隷属に転換する
納富信留
『貞観政要』を読む(2)著作に登場する人物たち
房玄齢・杜如晦・魏徴・王珪―太宗の四人の優れた側近
田口佳史
ソニー流「人的資本経営と新規事業」成功論(2)“変わり者”の生かし方と後継者選び
「人材の組み合わせ」こそ「尖った才能」を輝かせる必勝法
水野道訓
民主主義の本質(1)近代民主主義とキリスト教
なぜ民主主義が「最善」か…法の支配とキリスト教的背景
橋爪大三郎
『太平記』に学ぶ激動期の生き方(1)なぜ今『太平記』を読むべきなのか
『太平記』は乱世における人間の処し方が学べる古典文学
兵藤裕己