Midjourney V4 — нейромережа, яка генерує деталізовані зображення

Генератор зображень штучного інтелекту Midjourney представляє нову кодову базу та архітектуру штучного інтелекту з V4. Тепер згенеровані ним зображення більш детальні, реалістичні та конкретні, пише видання The Decoder.


Генеральний директор Midjourney Девід Хольца каже, що V4 — це перша модель, навчена на суперкластері Midjourney AI, який розробляли протягом останніх дев’яти місяців. Хольц описав які покращення отримала версія V4:

  • більше нових знань, наприклад, про істот або місцевість;
  • ШІ краще вміє правильно розпізнавати дрібні деталі;
  • ШІ може обробляти складніші запити;
  • ШІ краще обробляє сцени з кількома об’єктами та персонажами.
Зображення: The Decoder

Чому це цікаво

Midjourney V4 може створювати набагато реалістичніші зображення, але це також створює ризики. Відтепер правила спільноти будуть виконуватися набагато суворіше, каже Хольц. Користувач, який спробує обійти список заборонених слів, отримає бан. V4 також вимагає іншого формулювання запитів. Наприклад, є нова функція реміксування, тобто можливість подальшого редагування згенерованих зображень за допомогою штучного інтелекту.

Незважаючи на те, що версія 4 є кроком вперед і, на думку деяких користувачів, забезпечує набагато привабливіші результати, в альфа-версії все ще існують обмеження. Наприклад, є обмеження на квадратне співвідношення сторін.

Також розробники обіцяють підвищити роздільну здатність та якості зображення, контроль масштабування та чіткість зображення. Крім того, потрібно усунути проблеми з текстовими артефактами та помилками кадрування.

Залишити коментар

Коментарі | 0

Пошук