Google Veo 3 ahora genera videos verticales: todo lo que debes saber

Google Veo 3 acaba de añadir soporte para la generación nativa de videos verticales en formato 9:16, una actualización técnica clave para creadores de contenido móvil y plataformas sociales. Este avance permite crear videos verticales sin necesidad de recorte o post-procesamiento, manteniendo calidad y coherencia desde el inicio.

Implementación técnica del formato vertical 9:16

Veo 3 emplea un parámetro API aspectRatio que ahora acepta el valor «9:16» para videos verticales, además del tradicional «16:9» horizontal. La resolución máxima para este formato es 720p, mientras que el modo horizontal llega a 1080p. Esto se debe a limitaciones computacionales y optimizaciones para dispositivos móviles.

  • Uso de modelos de difusión multi-escala con procesamiento espacial y temporal adaptado al formato vertical.
  • Modificaciones en las capas convolucionales y mecanismos de atención para mantener proporciones y coherencia visual.
  • Condicionamiento multi-frame para garantizar consistencia a lo largo de los 192 frames (8 segundos de video).

Configuración API para videos verticales

Los desarrolladores pueden configurar la generación así:

config = types.GenerateVideosConfig(aspectRatio="9:16", resolution="720p")

Además, se puede ajustar un parámetro seed para mejorar la reproducibilidad, aunque sin determinismo absoluto.

Arquitectura y procesamiento temporal

La arquitectura de Veo 3 combina modelos de difusión con transformers especializados que ajustan su atención espacial y temporal para el formato vertical. Técnicas avanzadas garantizan coherencia de objetos y movimientos a lo largo de toda la secuencia, evitando distorsiones y manteniendo proporciones exactas.

Resolución y calidad

  • Formatos soportados: 9:16 a 720p, 16:9 hasta 1080p.
  • Videos generan 192 cuadros a 24 fps con 8 segundos de duración.
  • Modelos Veo 3 y Veo 3 Fast: el segundo prioritiza rapidez con una leve pérdida de calidad.
  • Optimización para pantalla móvil: ajuste de compresión, nitidez adaptativa y perfil de color para OLED/LCD.

Estructura de precios y sistema de créditos

La generación de videos verticales tiene el mismo costo que la horizontal. Precios destacados:

  • Veo 3 estándar: $0.40 por segundo con audio.
  • Veo 3 Fast: $0.15 por segundo con audio.
  • Usuarios sin suscripción reciben 100 créditos mensuales gratuitos.
  • Suscriptores Pro y Ultra tienen créditos incrementales y capacidades ampliadas.

Los créditos descuentan el consumo basado en segundos de video generados, permitiendo escalabilidad y control granular de costos.

Integración y herramientas para desarrolladores

  • Disponible a través de Google AI Studio y Gemini API.
  • SDK «google-genai» con clases para configurar aspectos técnicos y manejo asíncrono.
  • Soporte para debugging, monitoreo y workflows de batch generation.
  • Compatibilidad con herramientas de edición profesional para post-procesamiento.

Watermarking con SynthID

Todos los videos generados incluyen marcas de agua invisibles con la tecnología SynthID, que garantizan autenticidad y detección posterior incluso tras modificaciones. Marcas visibles «Veo» aparecen en muchos videos excepto para usuarios Ultra con la herramienta Flow, que usan solo watermarking invisible.

Limitaciones y rendimiento

  • Duración máxima actual: 8 segundos por generación.
  • Resolución máxima vertical limitada a 720p.
  • Tiempos de procesamiento entre 1 y 5 minutos, según modelo seleccionado.
  • No hay generación en tiempo real; todas las llamadas son asíncronas.
  • Límites en generación simultánea y restricciones geográficas aplican.

Casos de uso y aplicaciones

  • Creación de contenido marketing y redes sociales altamente optimizado.
  • Integración en apps móviles para creación rápida de videos verticales.
  • Producción masiva de contenido con workflows automatizados y escalables.

Futuras mejoras técnicas

Google planea ampliar duración máxima, soportar resoluciones más altas en vertical y mejorar velocidad. También se trabaja en edición en tiempo real y mejor integración con AR/VR. Se espera mejoras en marca de agua SynthID y detección para aumentar seguridad y autenticidad del contenido generado.

Resumen

Google Veo 3 da un paso importante al integrar soporte nativo para videos verticales 9:16. El sistema, basado en modelos avanzados de difusión, ofrece calidad optimizada para pantallas móviles, precios competitivos y herramientas para desarrolladores que facilitan su integración en productos y servicios. Aunque tiene ciertas limitaciones en duración y resolución, representa un avance clave para la creación automatizada de contenido pensado para el consumo móvil actual.

Fuentes de información

Salir de la versión móvil