テキストプロンプトまたは参照画像からAI動画を生成。720p、1080p、または4K出力でオプションの音声生成。16:9または9:16で1クリップあたり最大8秒。
Veo 3.1 で生成されたサンプル出力。
カメラワークとドラマチックな照明のAI生成シネマティックシーン。
Veo 3.1は、テキストプロンプトまたは参照画像から4〜8秒のクリップを作成する動画生成モデルです。720p、1080p、4K解像度をサポートし、オプションでAI生成音声を追加できます。プロンプト主導のシーンにはテキストから動画を、視覚的な参照で出力をガイドする必要がある場合は画像から動画を使用します。
被写体、アクション、カメラ、スタイルを説明する最大1000文字のプロンプトを書きます。720p、1080p、または4Kで出力。
最大3枚の参照画像をアップロード。フレームモードは2枚の画像を開始/終了フレームとして使用。参照モードは3枚の画像をスタイルガイダンスに使用。
任意の動画出力にAI生成音声を追加。すべての解像度で利用可能。無音動画より$0.025/秒の追加コスト。
4K解像度で直接生成 — アップスケーリング不要。最終レンダリングとクライアント納品に使用。
1回のパスで同期音声付き動画を生成。別の音声ツールや手動同期は不要。
フレームモードで開始と終了フレームを設定するか、参照モードで3枚の画像からスタイルガイド生成を行います。
低コストで720pでプロンプトと参照をテスト。方向性が固定されたら1080pまたは4Kにスケールアップ。
用途に基づいて出力解像度を選択。ドラフトには720p、プロダクションには1080p、最大ディテールには4K。
クリップの長さを4、6、または8秒に設定。デフォルトは8秒。
シネマティックおよびデスクトップコンテンツには横長(16:9)。ソーシャルおよびモバイルには縦長(9:16)。
任意の解像度でAI生成音声を追加。無音動画は低コストで利用可能。
フレームモード:2枚の画像(開始+終了フレーム)。参照モード:スタイルガイダンス用の3枚の画像。
被写体、アクション、カメラの動き、照明、スタイル、ムードを最大1000文字で説明。
画像から動画モードで製品画像を動画広告にアニメーション化。
TikTok、Reels、Shorts用の9:16縦長動画を生成。
カメラの動きとシネマティックな演出で16:9横長動画を作成。
フレームモードでコンセプトアートをアニメーションプレビューに変換。