276
Вероятно сте се чудили дали е възможно да генерирате изображения от текстове или дори да ги редактирате. С Visual ChatGPT от Microsoft това скоро може да стане реалност
Visual ChatGPT – най-важната информация
Visual ChatGPT е нова имплементация на модела ChatGPT на Microsoft, която позволява генерирането и модифицирането на изображения от текстови заявки. За тази цел изследователският екип е интегрирал няколко генератора на изображения, като Stable Diffusion, Blip и Pix2Pix, и използва диалози между потребителите и изкуствения интелект, за да прави динамични промени в изображенията.
- Визуален чатGPT е планиран инструмент за изображения от Microsoft, който генерира и променя изображения от текстови заявки. Той е базиран на добре познатия чатбот ChatGPT, както и на различни изкуствени интелекти за изображения.
- Особената характеристика в сравнение с конвенционалните изкуствени интелекти за генериране на изображения, като Midjourney и Dall-E, е, че те могат да генерират винаги само нови изображения и да използват предишни произведения най-много като референция.
- Визуален чатGPT, от друга страна, се предполага, че може динамично да променя съществуващите изображения чрез диалог между потребителите и ИИ. Например трябва да е възможно да се заменят или адаптират отделни елементи на изображението по целенасочен начин.
- Visual ChatGPT може също така да извежда параметрите на изображенията като текстов отговор и по този начин например да интерпретира цвета на стената в дадено изображение или да дава по-сложни описания на изображенията.
- Засега Visual ChatGPT е на разположение като публично достъпна предварителна версия в Github, но изисква много видеопамет и специален графичен процесор. Все още не е ясно за какво Microsoft ще използва инструмента, но той може например да бъде интегриран в търсенето на изображения в Bing или в други програми.