717
Pewnie zastanawialiście się, czy możliwe jest generowanie obrazów z tekstów, a nawet ich edycja. Dzięki Visual ChatGPT od Microsoftu może to wkrótce stać się rzeczywistością
Visual ChatGPT – najważniejsze informacje
Visual ChatGPT to nowa implementacja modelu ChatGPT Microsoftu, która pozwala na generowanie i modyfikowanie obrazów na podstawie zapytań tekstowych. Aby to zrobić, zespół badawczy zintegrował kilka generatorów obrazów, takich jak Stable Diffusion, Blip i Pix2Pix, i wykorzystuje dialogi między użytkownikami a SI do dynamicznych zmian obrazów.
- Visual ChatGPT to planowane narzędzie obrazkowe od Microsoftu, które generuje i zmienia obrazy na podstawie zapytań tekstowych. Jest ono oparte na znanym chatbocie ChatGPT, a także na różnych obrazowych AI.
- Specjalną cechą w porównaniu z konwencjonalnymi AI generującymi obrazy, takimi jak Midjourney i Dall-E, jest to, że mogą one tylko zawsze generować nowe obrazy i używać poprzednich prac co najwyżej jako odniesienia.
- Visual ChatGPT natomiast ma być w stanie dynamicznie zmieniać istniejące obrazy poprzez dialog pomiędzy użytkownikami a SI. Przykładowo, powinno być możliwe celowe zastępowanie lub dostosowywanie poszczególnych elementów obrazu.
- Wizualny czatGPT może również wyprowadzać parametry obrazów jako odpowiedź tekstową i w ten sposób np. interpretować kolor ściany na obrazie lub podawać bardziej złożone opisy obrazów.
- Na razie Visual ChatGPT jest dostępny jako ogólnodostępny podgląd na Githubie, ale wymaga sporo pamięci wideo i dedykowanego GPU. Nie wiadomo jeszcze, do czego Microsoft wykorzysta to narzędzie, ale może ono zostać na przykład zintegrowane z wyszukiwaniem obrazów w Bingu lub innych programach.