他社AIとは美しさが違う!Google新モデル『Omni』の圧倒的な文字生成力と、不自然な音声の回避術
AI動画生成の最新動向や活用法を知りたい方におすすめです!AI情報を発信するKEITOさんが、Googleの新モデル「Gemini Omni」の驚くべき文字生成機能や注意点を徹底解説してくれます。
イチオシスト
※記事内で紹介した商品を購入すると、売上の一部が当サイトに還元されることがあります。
Geminiの動画生成AI「Omni」をAIディレクターが解説!

画像出典:KEITOさん (https://www.youtube.com/watch?v=7Ok6EbI32fk)
AIがどんどん普及する中、生成AIの精度について気になっている方も多いのではないでしょうか? 今回は、Googleの最新動画生成AIの「Omni」について解説します。紹介してくれたKEITOさんいわく、「Omni」は動画内のテキストが綺麗に収まるのが最大の特徴なんだとか。SNSやビジネスで使える新しい動画表現について知りたい方はぜひチェックしてみてください。
詳細はKEITO【AI&WEB ch】さんのYouTubeチャンネルからチェック!:
Gemini『Omni』が凄い!文字も綺麗に生成される唯一のAI動画生成モデル
1.旧バージョンに比べ、テキストの生成精度が大幅に向上

画像出典:KEITOさん (https://www.youtube.com/watch?v=7Ok6EbI32fk)
Gemini Omniの最も分かりやすい進化は、動画内にテキストを綺麗に配置できるようになった点です。これまでのモデルでは難しかった日本語の文字も、かなり高い精度で表示されます。
ただ、実際に使ってみたところ、タイプライターのようにリアルタイムで文字を作っていく表現や、画面いっぱいに文字を詰め込むような複雑な指示はまだ苦手なようです。うまく活用するには、固定のテキストを配置するようなプロンプトを意識すると良い結果が得られます。
2.解説動画やインフォグラフィック作成に便利

画像出典:KEITOさん (https://www.youtube.com/watch?v=7Ok6EbI32fk)
テキスト生成が綺麗になったことで、解説動画やインフォグラフィック動画を簡単に作れるようになりました。例えば「コーヒーの効果」といったテーマを指示すると、字幕付きのわかりやすいアニメーションが生成されます。
生成された音声は少し不自然な部分があるため、映像だけを使って音声は別のツールや自分の声で後から被せるといった工夫をすれば、ビジネスシーンでも十分に使える実用性の高いコンテンツが完成します。
3.動画をインプットしてスタイルを変換することも可能

画像出典:KEITOさん (https://www.youtube.com/watch?v=7Ok6EbI32fk)
もう一つの目玉機能が、手持ちの動画をインプット素材として使えることです。
短い動画を読み込ませて「アニメ風」や「3Dグラフィック風」にスタイルを変換する指示を出すと、元の動きを維持したまま全く違う雰囲気の動画を作ってくれます。ショート動画の演出を工夫したい時などに、アイデア次第で非常に面白い使い方ができる機能です。
4.利用時の注意点:生成コンテンツの懸念点は?

画像出典:KEITOさん (https://www.youtube.com/watch?v=7Ok6EbI32fk)
便利な機能が満載ですが、利用する際には注意すべき点もあります。有名なキャラクターの特徴をプロンプトに入れると、そのままのアウトな動画が生成されてしまう可能性があります。また、過激な表現を指示した際にもモザイクが必要なレベルの動画が出てしまうことがあるようです。
生成AIを使用する際は、著作権や倫理的な問題に触れないよう、プロンプトの入力に十分に気をつけながら、ツールを安全に活用していく必要があります。
【まとめ】今後の進化に期待大!
今回は、Gemini Omniの驚きの機能についてご紹介しました! テキスト生成の美しさと動画のスタイル変換機能を活用することで、AI動画の表現の幅が大きく広がります。
もっと詳しく知りたい方は、ぜひ、KEITOさんの動画と合わせてチェックしてみてください。
KEITOさんのYouTubeチャンネル:Gemini『Omni』が凄い!文字も綺麗に生成される唯一のAI動画生成モデル
※記事内における情報は原稿執筆時のものになります。あらかじめご了承ください。
※記事内容は執筆時点のものです。最新の内容をご確認ください。

)
