1,2K
Seguro que alguna vez te has preguntado si es posible generar imágenes a partir de textos o incluso editarlos. Con Visual ChatGPT de Microsoft, esto podría ser pronto una realidad
Visual ChatGPT – la información más importante
Visual ChatGPT es una nueva implementación del modelo ChatGPT de Microsoft que permite generar y modificar imágenes a partir de peticiones de texto. Para ello, el equipo de investigación ha integrado varios generadores de imágenes como Stable Diffusion, Blip y Pix2Pix y utiliza diálogos entre los usuarios y la IA para realizar cambios dinámicos en las imágenes.
- Visual ChatGPT es una herramienta de imagen planificada por Microsoft que genera y cambia imágenes a partir de peticiones de texto. Se basa en el conocido chatbot ChatGPT, así como en varias IAs de imagen.
- La particularidad con respecto a las IAs generadoras de imágenes convencionales, como Midjourney y Dall-E, es que sólo pueden generar imágenes nuevas y, como mucho, utilizar trabajos anteriores como referencia.
- Visual ChatGPT, por otro lado, se supone que es capaz de cambiar dinámicamente las imágenes existentes mediante el diálogo entre los usuarios y la IA. Por ejemplo, debería ser posible sustituir o adaptar elementos individuales de la imagen de forma selectiva.
- Visual ChatGPT también puede emitir parámetros de imágenes como respuesta textual y así, por ejemplo, interpretar el color de la pared en una imagen o dar descripciones de imágenes más complejas.
- Por ahora, Visual ChatGPT está disponible como vista previa pública en Github, pero requiere mucha memoria de vídeo y una GPU dedicada. Aún no está claro para qué utilizará Microsoft la herramienta, pero podría, por ejemplo, integrarse en la búsqueda de imágenes de Bing u otros programas.