Gemini Omni Flashワークフローでプロンプトまたは参照画像からAI動画を作成。4、6、または8秒を選択し、16:9または9:16を設定し、クリップに音声が必要な場合はオプションのオーディオを追加できます。
Gemini Omni Flash ワークフローで生成されたサンプル出力。
テキストと画像の混合入力から生成された動画。
Gemini Omni Flashは、PoYo VEO 3.1公式APIを搭載したサイトの高速Gemini Omni動画ワークフローです。テキストから動画、画像から動画、最初/最後のフレーム生成、最大3枚の画像参照、オプションのオーディオ、4/6/8秒の長さ、16:9または9:16の出力に対応しています。
オリジナルのシーン、カメラの動き、製品クリップ、またはソーシャル動画のドラフトが必要な場合は、テキストプロンプトから始めます。
参照画像をアップロードしてクリップをガイドします。1枚の画像は画像から動画として機能し、2枚の画像は最初と最後のフレームをガイドでき、3枚の画像はサポートされている参照モードで使用できます。
最終クリップに音声が必要な場合はオーディオを有効にします。反復作業中はドラフトを無音のままにしてクレジット使用量を削減できます。
高コストの最終レンダリングにコミットする前に、迅速なテキストから動画または画像から動画のドラフトが必要な場合にGemini Omni Flashを使用します。
プロンプトだけに頼るのではなく、画像で出力をガイドします。これは製品、キャラクター、スタイルフレーム、開始/終了フレーミングに役立ちます。
音声はオプションなので、初期テストは無音のままにし、プレゼンテーションの準備ができたクリップでオーディオをオンにできます。
ワークフローは実用的なコントロールを公開します:長さ、アスペクト比、解像度、オーディオ、参照画像。
シーンプロンプトを書いて、4、6、または8秒の動画クリップを生成します。
画像ガイド付き動画、最初/最後のフレームコントロール、またはサポートされている参照モードに最大3枚の画像参照を使用します。
完全なクリップのためにオーディオをオンにするか、低コストのドラフトのために出力を無音のままにします。
選択したVEO 3.1公式モードでサポートされている場合、720p、1080p、または4Kを選択します。
16:9の横向きクリップまたはソーシャルプラットフォーム用の9:16の縦向きクリップを生成します。
生成前に推定クレジットコストを確認して、長さ、解像度、オーディオを調整できます。
短いプロンプトまたは参照画像からReels、Shorts、TikTok用の9:16縦向きクリップを生成します。
製品写真を制御されたフレーミングとオプションのオーディオで短い動画広告に変換します。
より長いまたはより高解像度の出力により多くのクレジットを費やす前に、4秒でシーンの方向性をテストします。
すべての実行前にコストを可視化しながら、複数のプロンプトまたは参照画像のバリエーションを作成します。
プロンプトまたは画像参照からオプションのオーディオ、可視化されたクレジットコスト、4/6/8秒の出力設定でAI動画を作成します。