生成前先比较当前 Gemini Omni 工作流:Veo 3.1 用于文本/图像生成视频,Gemini Omni Flash 用于快速视频草稿,GPT Image 2 用于图像生成和编辑。
打开各模型页查看支持输入、设置、价格逻辑和工作流建议。
文本生成视频和图像生成视频,支持可选音频、4/6/8 秒片段,以及支持时的 720p/1080p/4K 输出。
基于当前 VEO 3.1 official 接入的快速 Gemini Omni 视频工作流,适合提示词和图像引导草稿。
以 1K、2K 或 4K 档位生成和编辑 AI 图像,用于参考帧、产品视觉、缩略图和概念图。
当前 Gemini Omni 模型页的并排规格。实际积分成本取决于时长、分辨率、质量和音频。
把要完成的工作匹配到支持该输入和输出的模型。
从提示词创建视频
需要文本驱动视频、可选音频、4/6/8 秒和横竖屏输出时使用 Veo 3.1。
快速创建 Gemini Omni 视频草稿
在投入更多积分做最终输出前,用 Gemini Omni Flash 快速测试提示词或图像引导的视频方向。
让参考图动起来
视频需要跟随产品、角色、风格帧或首尾帧方向时,上传最多 3 张参考图。
生成或编辑静态图像
用 GPT Image 2 创建缩略图、产品概念、风格帧和视频前参考图。
关于 Gemini Omni 模型选择的常见问题。