通过 Gemini Omni Flash 工作流,用提示词或参考图创建 AI 视频。可选择 4、6 或 8 秒,设置 16:9 或 9:16,并在需要声音时启用可选音频。
使用 Gemini Omni Flash 工作流生成的示例输出。
通过混合文本和图像输入生成的视频,展示多模态能力。
Gemini Omni Flash 是本站基于 PoYo VEO 3.1 official API 的快速视频工作流。它支持文本生成视频、图像生成视频、首尾帧生成、最多 3 张图像参考、可选音频、4/6/8 秒时长,以及 16:9 或 9:16 输出。
需要原创场景、镜头运动、产品短片或社交视频草稿时,从文本提示词开始。
上传参考图来引导视频。一张图可用于图像生成视频,两张图可引导首尾帧,三张图可用于支持的参考模式。
最终片段需要声音时启用音频。草稿阶段保持静音可以减少积分消耗。
当你需要快速创建文本生成视频或图像生成视频草稿,再决定是否投入更高成本做最终渲染时使用。
用图像引导输出,而不是只依赖提示词。适合产品、角色、风格帧和首尾帧控制。
音频是可选项,早期测试可以保持静音,确认可展示后再打开音频。
工作流提供实用控制:时长、宽高比、分辨率、音频和参考图。
写下场景提示词,生成 4、6 或 8 秒视频片段。
使用最多 3 张图像参考,进行图像引导视频、首尾帧控制或支持的参考模式。
为完整片段开启音频,或保持静音以降低草稿成本。
在所选 VEO 3.1 official 模式支持时,可选择 720p、1080p 或 4K。
生成 16:9 横向视频或 9:16 竖向社交平台视频。
生成前查看预计积分成本,方便调整时长、分辨率和音频。
从短提示词或参考图生成适合 Reels、Shorts 和 TikTok 的 9:16 竖屏片段。
将产品照片变成短视频广告,并控制画面构图,可按需加入音频。
先用 4 秒测试场景方向,再把更多积分投入到更长或更高分辨率输出。
创建多组提示词或参考图变体,并在每次运行前看到成本。