Google Veo 3 ahora genera videos verticales: todo lo que debes saber
Google Veo 3 acaba de añadir soporte para la generación nativa de videos verticales en formato 9:16, una actualización técnica clave para creadores de contenido móvil y plataformas sociales. Este avance permite crear videos verticales sin necesidad de recorte o post-procesamiento, manteniendo calidad y coherencia desde el inicio.
Implementación técnica del formato vertical 9:16
Veo 3 emplea un parámetro API aspectRatio
que ahora acepta el valor «9:16» para videos verticales, además del tradicional «16:9» horizontal. La resolución máxima para este formato es 720p, mientras que el modo horizontal llega a 1080p. Esto se debe a limitaciones computacionales y optimizaciones para dispositivos móviles.
- Uso de modelos de difusión multi-escala con procesamiento espacial y temporal adaptado al formato vertical.
- Modificaciones en las capas convolucionales y mecanismos de atención para mantener proporciones y coherencia visual.
- Condicionamiento multi-frame para garantizar consistencia a lo largo de los 192 frames (8 segundos de video).
Configuración API para videos verticales
Los desarrolladores pueden configurar la generación así:
config = types.GenerateVideosConfig(aspectRatio="9:16", resolution="720p")
Además, se puede ajustar un parámetro seed
para mejorar la reproducibilidad, aunque sin determinismo absoluto.
Arquitectura y procesamiento temporal
La arquitectura de Veo 3 combina modelos de difusión con transformers especializados que ajustan su atención espacial y temporal para el formato vertical. Técnicas avanzadas garantizan coherencia de objetos y movimientos a lo largo de toda la secuencia, evitando distorsiones y manteniendo proporciones exactas.
Resolución y calidad
- Formatos soportados: 9:16 a 720p, 16:9 hasta 1080p.
- Videos generan 192 cuadros a 24 fps con 8 segundos de duración.
- Modelos Veo 3 y Veo 3 Fast: el segundo prioritiza rapidez con una leve pérdida de calidad.
- Optimización para pantalla móvil: ajuste de compresión, nitidez adaptativa y perfil de color para OLED/LCD.
Estructura de precios y sistema de créditos
La generación de videos verticales tiene el mismo costo que la horizontal. Precios destacados:
- Veo 3 estándar: $0.40 por segundo con audio.
- Veo 3 Fast: $0.15 por segundo con audio.
- Usuarios sin suscripción reciben 100 créditos mensuales gratuitos.
- Suscriptores Pro y Ultra tienen créditos incrementales y capacidades ampliadas.
Los créditos descuentan el consumo basado en segundos de video generados, permitiendo escalabilidad y control granular de costos.
Integración y herramientas para desarrolladores
- Disponible a través de Google AI Studio y Gemini API.
- SDK «google-genai» con clases para configurar aspectos técnicos y manejo asíncrono.
- Soporte para debugging, monitoreo y workflows de batch generation.
- Compatibilidad con herramientas de edición profesional para post-procesamiento.
Watermarking con SynthID
Todos los videos generados incluyen marcas de agua invisibles con la tecnología SynthID, que garantizan autenticidad y detección posterior incluso tras modificaciones. Marcas visibles «Veo» aparecen en muchos videos excepto para usuarios Ultra con la herramienta Flow, que usan solo watermarking invisible.
Limitaciones y rendimiento
- Duración máxima actual: 8 segundos por generación.
- Resolución máxima vertical limitada a 720p.
- Tiempos de procesamiento entre 1 y 5 minutos, según modelo seleccionado.
- No hay generación en tiempo real; todas las llamadas son asíncronas.
- Límites en generación simultánea y restricciones geográficas aplican.
Casos de uso y aplicaciones
- Creación de contenido marketing y redes sociales altamente optimizado.
- Integración en apps móviles para creación rápida de videos verticales.
- Producción masiva de contenido con workflows automatizados y escalables.
Futuras mejoras técnicas
Google planea ampliar duración máxima, soportar resoluciones más altas en vertical y mejorar velocidad. También se trabaja en edición en tiempo real y mejor integración con AR/VR. Se espera mejoras en marca de agua SynthID y detección para aumentar seguridad y autenticidad del contenido generado.
Resumen
Google Veo 3 da un paso importante al integrar soporte nativo para videos verticales 9:16. El sistema, basado en modelos avanzados de difusión, ofrece calidad optimizada para pantallas móviles, precios competitivos y herramientas para desarrolladores que facilitan su integración en productos y servicios. Aunque tiene ciertas limitaciones en duración y resolución, representa un avance clave para la creación automatizada de contenido pensado para el consumo móvil actual.