Компанія Google без гучного анонсу зробила останню версію свого генератора зображень на основі штучного інтелекту Imagen 3 доступною для всіх користувачів у США, помітив американський технологічний сайт VentureBeat. Новий інструмент доступний на платформі AI Test Kitchen.

Він створює зображення з більшою деталізацією, кращим освітленням і меншою кількістю артефактів порівняно з попередніми моделями, стверджують у Google. 

Хоча компанія анонсувала Imagen 3 ще в травні на конференції I/O, обмежений доступ до інструменту через платформу Vertex AI з’явився лише у червні. Деякі користувачі Reddit почали експериментувати з Imagen 3 ще минулого тижня, а Google опублікував дослідницьку роботу про інструмент лише поточного тижня.

Як і інші генератори зображень на основі ШІ, Imagen 3 може створювати деталізовані зображення на основі текстового опису. Крім того, користувачі можуть редагувати зображення, виділяючи певну частину та описуючи бажані зміни.

Однак інструмент має певні обмеження, до прикладу, він відмовляється генерувати зображення публічних осіб, таких як Тейлор Свіфт, а також зображення зброї. Хоча генератор не створює персонажів з авторськими правами, користувачі можуть легко обійти це обмеження, описуючи бажаного персонажа.

Журналістам The Verge вдалося отримати зображення, дуже схожі на Соніка та Маріо, а також персонажів, що нагадують Міккі Мауса. Крім того, інструмент може генерувати логотипи компаній, таких як Apple, Macy’s, Hershey’s і навіть Google.

Згенеровані  Imagen 3 зображення, схожі на Sonic, скрін The Verge

Згенеровані Imagen 3 зображення, схожі на Sonic, скрін The Verge

Цього тижня також відбувся запуск Grok-2 від компанії Ілона Маска xAI — конкурентної системи штучного інтелекту з помітно меншими обмеженнями на генерацію зображень, що підкреслює різні підходи до етики та модерації контенту в технологічній індустрії.

Grok використовували для створення різноманітного контенту, включаючи зображення з наркотиками, насильством і публічними особами в сумнівних ситуаціях.