611
Vi sarete probabilmente chiesti se sia possibile generare immagini da testi o addirittura modificarli. Con Visual ChatGPT di Microsoft, questo potrebbe presto diventare realtà
Visual ChatGPT – le informazioni più importanti
Visual ChatGPT è una nuova implementazione del modello ChatGPT di Microsoft che consente di generare e modificare immagini a partire da richieste di testo. A tal fine, il team di ricerca ha integrato diversi generatori di immagini come Stable Diffusion, Blip e Pix2Pix e utilizza i dialoghi tra gli utenti e l’IA per apportare modifiche dinamiche alle immagini.
- Visual ChatGPT è uno strumento per immagini progettato da Microsoft che genera e modifica immagini a partire da richieste di testo. Si basa sul noto chatbot ChatGPT e su varie AI per le immagini.
- La particolarità rispetto alle AI che generano immagini convenzionali come Midjourney e Dall-E è che possono generare sempre e solo nuove immagini e utilizzare al massimo i lavori precedenti come riferimento.
- La ChatGPT, invece, dovrebbe essere in grado di modificare dinamicamente le immagini esistenti attraverso il dialogo tra gli utenti e l’intelligenza artificiale. Ad esempio, dovrebbe essere possibile sostituire o adattare singoli elementi dell’immagine in modo mirato.
- Visual ChatIl GPT può anche fornire parametri delle immagini come risposta testuale e quindi, ad esempio, interpretare il colore della parete in un’immagine o fornire descrizioni di immagini più complesse.
- Per ora, Visual ChatGPT è disponibile come anteprima pubblica su Github, ma richiede molta memoria video e una GPU dedicata. Non è ancora chiaro per cosa Microsoft utilizzerà lo strumento, ma potrebbe, ad esempio, essere integrato nella ricerca di immagini di Bing o in altri programmi.