Question 1

어떤 Gemini Omni 모델을 사용해야 합니까?

Accepted Answer

일반적인 텍스트-비디오 및 이미지-비디오에는 Veo 3.1을 사용하세요. 빠른 Gemini Omni 비디오 작업 흐름을 원할 경우 Gemini Omni Flash를 사용하세요. 정지 이미지나 이미지 편집이 필요한 경우 GPT Image 2을(를) 사용하세요.

Question 2

Gemini Omni Flash는 오디오 또는 비디오 파일을 입력으로 허용합니까?

Accepted Answer

아니요. 현재 워크플로에서는 필수 텍스트 프롬프트와 선택적인 이미지 URL을 허용합니다. 오디오 생성은 직접 오디오 파일 입력이 아닌 선택적 출력입니다.

Question 3

어떤 모델이 오디오 생성을 지원하나요?

Accepted Answer

현재 비디오 워크플로는 VEO 3.1 official 통합을 통해 선택적 오디오 생성을 제공합니다. GPT Image 2는 오디오를 생성하지 않습니다.

Question 4

가장 적은 크레딧을 쓰는 모델은?

Accepted Answer

GPT Image 2은 정지 이미지의 경우 더 낮게 시작됩니다. 비디오는 지속 시간, 해상도, 오디오에 따라 다르므로 비용이 더 많이 듭니다. 제출하기 전에 생성기에서 정확한 크레딧 비용을 미리 확인하세요.

Model	Input	Output	Max Resolution	Duration	Audio	Credits	최고의 대상
Veo 3.1	텍스트 / 이미지	비디오	지원 시 4K	4 / 6 / 8초	예	60+	프롬프트 기반 비디오, image-to-video, 선택 음성, 더 높은 해상도의 최종 클립
Gemini Omni Flash	텍스트 / 이미지	비디오	지원 시 4K	4 / 6 / 8초	예	60+	프롬프트 또는 최대 3개의 이미지 참조를 통한 빠른 Gemini Omni 비디오 초안
GPT Image 2	텍스트 / 이미지	이미지	최대 4K	—	—	3+	AI 이미지, 참조 프레임, 제품 시각 자료 및 프롬프트 안내 이미지 편집

어떤 Gemini Omni 모델을 사용해야 하나요?

Gemini Omni 모델 보기