
ChatGPT Obtiene Generación de Imágenes GPT-4o: Una Gran Actualización
El CEO de OpenAI, Sam Altman, anunció recientemente una actualización significativa para las capacidades de generación de imágenes de ChatGPT. Esto marca la primera mejora importante en más de un año, trayendo la creación y modificación de imágenes nativas a la plataforma.
ChatGPT ahora puede aprovechar el poder del modelo GPT-4o de OpenAI para generar y modificar imágenes y fotos directamente dentro de la interfaz del chatbot. Anteriormente, aunque GPT-4o impulsaba la plataforma, sus capacidades se limitaban a la generación y edición de texto.
Altman declaró que la generación de imágenes nativas de GPT-4o está disponible de inmediato en ChatGPT y Sora, el producto de generación de video con IA de OpenAI, para los usuarios con la suscripción Pro de $200 al mes. La función pronto se implementará para los usuarios Plus y gratuitos de ChatGPT, así como para los desarrolladores que utilizan el servicio API de la empresa.
Calidad de Imagen y Edición Mejoradas
OpenAI afirma que GPT-4o "piensa" más que su predecesor, DALL-E 3, lo que resulta en imágenes más precisas y detalladas. Además, GPT-4o puede editar imágenes existentes, incluidas aquellas con personas, lo que permite a los usuarios transformarlas o "rellenar" detalles como objetos de primer y segundo plano.
Datos de Entrenamiento y Consideraciones Éticas
Para impulsar esta nueva función de imagen, OpenAI entrenó GPT-4o en "datos disponibles públicamente" junto con datos propietarios obtenidos a través de asociaciones con empresas como Shutterstock, según informó el Wall Street Journal. OpenAI enfatiza su compromiso de respetar los derechos de los artistas y ha implementado políticas para evitar la generación de imágenes que imiten directamente el trabajo de artistas vivos.
OpenAI también ofrece un formulario de exclusión para los creadores que deseen que su trabajo se elimine de los conjuntos de datos de entrenamiento. La empresa respeta las solicitudes para impedir que los bots de web-scraping recopilen datos de entrenamiento, incluidas imágenes, de sitios web.
Competencia en el Panorama de la Generación de Imágenes con IA
Esta actualización de las capacidades de generación de imágenes de ChatGPT sigue a la reciente salida experimental de imágenes nativas de Google para Gemini 2.0 Flash. Sin embargo, Gemini 2.0 Flash enfrentó desafíos con protecciones insuficientes, lo que llevó a la eliminación de marcas de agua y la creación de imágenes que representan personajes protegidos por derechos de autor.
Fuente: TechCrunch