780
Jistě vás někdy napadlo, zda je možné generovat obrázky z textů nebo je dokonce upravovat. S aplikací Visual ChatGPT od společnosti Microsoft by se to mohlo brzy stát skutečností
Vizuální ChatGPT – nejdůležitější informace
Vizuální ChatGPT je nová implementace modelu ChatGPT společnosti Microsoft, která umožňuje generovat a upravovat obrázky z textových požadavků. Za tímto účelem výzkumný tým integroval několik generátorů obrázků, jako jsou Stable Diffusion, Blip a Pix2Pix, a k dynamickým změnám obrázků využívá dialogy mezi uživateli a umělou inteligencí.
- Vizuální chatGPT je plánovaný nástroj společnosti Microsoft pro generování a změnu obrázků na základě textových požadavků. Je založen na známém chatbotu ChatGPT a také na různých obrázkových UI.
- Speciální vlastností oproti běžným AI generujícím obrázky, jako jsou Midjourney a Dall-E, je to, že mohou generovat vždy jen nové obrázky a předchozí díla používají nanejvýš jako referenční.
- Vizuální chatGPT má být naproti tomu schopen dynamicky měnit existující obrázky prostřednictvím dialogu mezi uživateli a umělou inteligencí. Například by mělo být možné cíleně nahrazovat nebo upravovat jednotlivé prvky obrazu.
- Vizuální chatGPT může také vypisovat parametry obrázků jako textovou odpověď, a tak například interpretovat barvu zdi na obrázku nebo podávat složitější popisy obrázků.
- Prozatím je Visual ChatGPT k dispozici jako veřejně dostupný náhled na Githubu, vyžaduje však hodně videopaměti a dedikovaný grafický procesor. Zatím není jasné, k čemu Microsoft nástroj využije, ale mohl by být například integrován do vyhledávání obrázků v Bingu nebo do jiných programů.