Британський ШІ-стартап Stability AI представив останнє сімейство моделей генерації зображень Stable Diffusion 3.5. У своєму блозі компанія пише, що вони більш кастомізовані та універсальні ніж моделі попереднього покоління. А також більш продуктивні.
Всього Stability презентувала три моделі:
- Stable Diffusion 3.5 Large — найбільша та найпотужніша, має 8 мільярдів параметрів і здатна генерувати зображення з роздільною здатністю до 1 мегапікселя.
- Stable Diffusion 3.5 Large Turbo — менша та швидша за попередню, проте генерує зображення деякими втратами в якості.
- Stable Diffusion 3.5 Medium — має 2,5 млрд параметрів, оптимізована для роботи на смартфонах і ноутбуках, здатна генерувати зображення з роздільною здатністю від 0,25 до 2 мегапікселів. На відміну від двох попередніх, вийде пізніше — 29 жовтня.
Stability каже, що їхні моделі створюють «різноманітних» людей із різними відтінками шкіри та рисами обличчя. Цікаво подивитися, як це буде на практиці, враховуючи факап ШІ-моделі Google.
Нагадаємо, техногіганту довелося прибирати функцію генерації людей в Gemini, бо вона генерувала історично неправдоподібних персонажів (наприклад, чорношкірих вікінгів або Папу Римського).
Окрім цього, моделі Stability можуть генерувати різні стилі та естетики, як 3D, фотографія, живопис, штрихове мистецтво тощо.
Stable Diffusion 3.5 можна вільно використовувати для досліджень і комерційних цілей, але тільки компаніям із річним доходом меншим за $1 млн. Організації з більшим доходом повинні укласти зі стартапом контракт на отримання корпоративної ліцензії.
Версії Large і Large Turbo можна використовувати через API та сторонні платформи, включаючи Hugging Face, Fireworks, Replicate і ComfyUI.
Нагадаємо, у червні новим очільником Stability став колишній керівник Weta Digital Прем Аккараджу. Також стартап залучив нові інвестиції $80 млн.