820
Vous vous êtes certainement déjà demandé s’il était possible de générer des images à partir de textes ou même de les éditer. Avec Visual ChatGPT de Microsoft, cela pourrait bientôt devenir une réalité.
Visual ChatGPT – les informations les plus importantes
Visual ChatGPT est une nouvelle implémentation du modèle ChatGPT de Microsoft, qui permet de générer et de modifier des images à partir de requêtes textuelles. Pour ce faire, l’équipe de recherche a intégré plusieurs générateurs d’images tels que Stable Diffusion, Blip et Pix2Pix et utilise des dialogues entre les utilisateurs et l’IA pour apporter des modifications dynamiques aux images.
- Visual ChatGPT est un outil d’imagerie prévu par Microsoft, qui génère et modifie des images à partir de demandes textuelles. Le chatbot ChatGPT bien connu ainsi que diverses IA d’images servent de base.
- La particularité par rapport aux IA génératrices d’images traditionnelles comme Midjourney et Dall-E est que celles-ci ne peuvent générer que de nouvelles images et utilisent les œuvres précédentes tout au plus comme référence.
- En revanche, Visual ChatGPT devrait être en mesure de modifier dynamiquement les images existantes par le biais de dialogues entre les utilisateurs et l’IA. Il serait ainsi possible de remplacer ou d’adapter de manière ciblée certains éléments de l’image.
- Visual ChatGPT peut également fournir des paramètres d’images sous forme de réponse textuelle et ainsi interpréter par exemple la couleur du mur dans une image ou donner des descriptions d’images plus complexes.
- Pour l’instant, Visual ChatGPT est disponible en aperçu public sur Github, mais nécessite beaucoup de mémoire vidéo et un GPU dédié. On ne sait pas encore à quoi Microsoft utilisera cet outil, mais il pourrait par exemple être intégré dans le moteur de recherche d’images de Bing ou dans d’autres programmes.