Google Avanza Modelos de IA para Soluciones Empresariales

09/04/2025 Inteligencia Artificial

Google ha anunciado actualizaciones significativas en su conjunto de modelos de IA, con el objetivo de consolidar su posición en el mercado empresarial. Estas mejoras abarcan varios formatos de medios, incluyendo la generación de **música**, **video**, **voz** e **imagen**, todos accesibles a través de su plataforma en la nube Vertex AI.

Lyria: Modelo de Texto a Música

Lyria, el modelo de texto a música de Google, ahora está disponible en vista previa para clientes selectos. Este modelo ofrece una alternativa a las bibliotecas de música libres de derechos, permitiendo a los usuarios crear canciones en diversos estilos y géneros, desde **solos de piano jazzísticos** hasta **pistas lo-fi**.

Veo 2: Creación de Video Mejorada

Veo 2, el modelo de creación de video de Google, ha recibido actualizaciones centradas en la edición y personalización de efectos visuales. Las nuevas características incluyen la capacidad de eliminar imágenes de fondo, logotipos y objetos de videos existentes. Además, Veo 2 puede extender los fotogramas de video (por ejemplo, convertir paisaje a retrato), ajustar los ángulos de cámara y crear timelapses y clips estilo dron. También puede interpolar entre fotogramas de inicio y fin especificados. Estas características están actualmente disponibles en vista previa.

Chirp 3: Tecnología de Clonación de Voz

Chirp 3, el modelo de comprensión de audio de Google, ahora alimenta una función de clonación de voz llamada Instant Custom Voice. Esta función, ahora generalmente disponible, puede clonar una voz utilizando solo 10 segundos de audio. Chirp 3 también sustenta una nueva herramienta llamada Transcription with Diarization, disponible en vista previa, que separa e identifica a los oradores en grabaciones con múltiples participantes. Google enfatiza un proceso de "diligencia" para verificar los permisos de uso de voz adecuados para Instant Custom Voice, evitando abusos.

Imagen 3: Generación de Imágenes Mejorada

Imagen 3, el generador de imágenes de Google, ahora ofrece un rendimiento significativamente mejor, particularmente en la eliminación de objetos y en la reconstrucción de partes de imágenes dañadas o faltantes. Esta mejora aumenta la utilidad del modelo en tareas de edición y restauración de imágenes.

Medidas de Seguridad y Marca de Agua

Todos los medios generados por Imagen, Veo y Lyria (excluyendo Chirp) están marcados con la tecnología SynthID de Google. Google enfatiza que todos sus modelos de IA generativos tienen salvaguardias integradas para proteger contra la creación de contenido perjudicial. La empresa también ofrece mecanismos de exclusión para el entrenamiento de modelos y una política de indemnización para proteger a los clientes de Google Cloud y Vertex AI de disputas de derechos de autor relacionadas con la IA.

Estas actualizaciones demuestran el compromiso de Google de proporcionar herramientas de IA integrales y potentes para el mercado empresarial, compitiendo directamente con plataformas como Bedrock de Amazon.

Fuente: TechCrunch