【AIクイズ】これ知らないと「AI分かってる風」がバレます
更新日:
イチオシスト
ライター / 編集
イチオシ編集部 旬ニュース担当
注目の旬ニュースを編集部員が発信!「イチオシ」は株式会社オールアバウトが株式会社NTTドコモと共同で開設したレコメンドサイト。毎日トレンド情報をお届けしています。

【問題】
最近のAIは文章だけじゃなく、画像も音声も動画も理解できるって知っていましたか?この進化を表すキーワード、説明できますか?
★ ヒント
「マルチ」は「複数」、もう一つの単語は「様式・形式」を意味する英語です。GPT-4oやGeminiがまさにこの技術を搭載しています。
【解説】

マルチモーダルAIとは、テキスト・画像・音声・動画など複数の種類(モダリティ)のデータを同時に理解・生成できるAIのことです。従来のAIはテキストならテキストだけ、画像なら画像だけと単一のデータ形式しか扱えませんでした。しかしGPT-4oやGoogleのGeminiなどは、写真を見せて「これは何?」と聞いたり、音声で指示を出して画像を生成させたりできます。たとえばレシートの写真を撮って「これを家計簿にまとめて」と頼む、といった使い方が可能です。人間が日常的に「見て・聞いて・読んで」情報を総合判断しているのと同じことを、AIにもさせようという技術の方向性です。今後のAI活用では、このマルチモーダル対応かどうかがツール選びの重要なポイントになります。
「マルチモーダル」が分かれば、最新AIのニュースがグッと読みやすくなりますよ!次回もAIの必須ワードを出題するのでお楽しみに!
さらにもう一問!
▶ 【AIクイズ】知ったかぶりしてない?AI用語の基本中の基本!
記事提供元:脳トレ日和
※記事内容は執筆時点のものです。最新の内容をご確認ください。



