
Nuevos Modelos de Generación de Medios con IA de Google
Google presentó recientemente sus últimos avances en generación de medios con IA en su conferencia I/O. La revelación más significativa es Veo 3, un modelo innovador capaz de generar videos con audio acompañante. Esta tecnología permite la creación de clips altamente realistas, como cantos de pájaros sincronizados con imágenes de aves o calles de ciudad completas con sonidos de tráfico realistas. Google destaca la excelencia de Veo 3 en la simulación de física del mundo real y en la sincronización labial precisa.
Expandiendo las Capacidades de IA
Actualmente, Veo 3 está disponible exclusivamente para suscriptores de Gemini Ultra en EE. UU. a través de la aplicación Gemini y para usuarios empresariales en Vertex AI. También se integra con Flow, una nueva herramienta de creación de películas con IA diseñada para simplificar la creación de videos. Flow combina Veo, Imagen y Gemini para permitir a los usuarios describir su salida de video deseada en lenguaje natural, dejando los aspectos técnicos a la IA.
Al presentar Veo 3, Google no ha descartado a su predecesor. Veo 2 permanece accesible, ofreciendo a los usuarios un control mejorado dentro de Flow. Los usuarios pueden utilizar imágenes como referencias, manipular ángulos de cámara, ajustar proporciones e incluso agregar o eliminar objetos de sus videos.
Imagen 4 y SynthID Detector
Junto con Veo 3, Google también presentó Imagen 4, su último modelo de generación de imágenes. Imagen 4 cuenta con detalles excepcionales, representando con precisión texturas intrincadas como telas y pieles de animales. Sus capacidades mejoradas de tipografía y su capacidad para generar imágenes de alta resolución (hasta 2K) en varias proporciones lo convierten en una herramienta poderosa. Imagen 4 está disponible a través de la aplicación Gemini, Vertex AI y aplicaciones de Workspace, como Docs y Slides.
Abordando la creciente dificultad para identificar contenido generado por IA, Google lanzó el SynthID Detector. Este portal permite a los usuarios cargar medios para su análisis, determinando la presencia de SynthID, la tecnología de marca de agua de IA de Google. Si bien no es infalible, ya que no todos los generadores de IA emplean SynthID, es un paso significativo hacia el uso responsable de la IA.
1 Imagen del Generación de Medios IA:

Fuente: Engadget