Меня больше заинтересовало, каким образом сгенерированные Вирт-Кандинским картинки могут «использоваться для умышленного обхода технических средств модерации неприемлемых запросов»…
Итак, спустя год после релиза нашей первой диффузионной модели мы представляем новую версию модели генерации изображений по тексту — Kandinsky 3.0!
Это результат длительной работы нашей команды, которую мы вели параллельно с разработками версий Kandinsky 2.1 и 2.2. Мы провели много экспериментов по выбору архитектуры и проделали большую работу с данными, чтобы сделать понимание текста и качество генераций лучше, а саму архитектуру — проще и лаконичнее.
Также мы сделали нашу модель более «отечественной»: теперь она значительно лучше ориентируется в российском и советском культурном поле.
Во всяком случае, результат уже лучше предыдущего, озвученного в названии темы: «получите крокодила с тремя сиськами».