Генеративний ШІ має потенціал до кардинальної зміни індустрії продуктової фотографії у сфері e-commerce, сприяючи зростанню продажів. Сергій Зінченко, який має понад 8 років досвіду роботи зі стартапами, зокрема Claid.AI та Let’s Enhance, ділиться з AIN.UA історією свого шляху створення продукту на основі ШІ.


Я хочу поділитися досвідом у створенні продуктів на прикладі Claid: як ми відкрили нові можливості та використовували генеративний ШІ, щоб підкорити галузь продуктової фотографії.

Місія Claid – це повне автоматизування процесу створення та редагування зображень від початку до кінця за допомогою нашого набору ШІ-інструментів.

Одним з останніх досягнень нашої компанії в цій сфері став AI Photoshoot – інструмент, який використовує поєднання ШІ-технологій для простого створення лайфстайл-сцен зі звичайних фотографій продуктів. Але як нам це вдалося? Що спонукало нас створити цей інструмент?

Зображення тут і далі надані Сергієм Зінченком

Початок Let’s Enhance та Claid.AI

Все почалось 2018 року, коли ми запустили ШІ-інструмент Let’s Enhance, який покращував якість зображень з низькою роздільною здатністю. Він базується на штучних нейронних мережах GAN, які можуть відновлювати деталі на зображенні та покращувати їхню якість. Тобто ми почали працювати з генеративним ШІ ще до того, як це стало популярним.

Хоча клієнти полюбили Let’s Enhance і продукт органічно виріс до понад 5 мільйонів користувачів, після ретельного аналізу ринку електронної комерції ми виявили реальну потребу у покращенні саме продуктової фотографії та побачили в цьому можливість допомогти бізнесам. Саме тоді ми вирішили створити Claid.ai — платформу для автоматизації редагування зображень, які розміщують на маркетплейсах.

До 2022 року Claid.AI набирав обертів: ми почали підписувати контракти з компаніями, що найшвидше зростали на онлайн-ринку. Водночас уважно слідкували за ринковими тенденціями та новими технологіями, шукаючи можливості для швидкого експоненційного зростання.

Стрибок у невизначеність

Прорив у генеративному ШІ з технологіями на кшталт DALL-E 2 та Stable Diffusion нарешті відкрив нові можливості для компаній для розвʼязання проблем, які раніше здавалися неможливими. Ці системи здатні створювати фотореалістичні зображення з текстових запитів, і це збігалось з нашою основною компетенцією у поліпшенні якості зображень. Але перед нами постав новий виклик: як інтегрувати їх у наші продукти?

Ми почали з брейншторму. Ідеї варіювалися від генерації слайдів до створення персоналізованих фотокниг. Ми ранжували ідеї на основі ринкового потенціалу, можливості їх реалізації та сумісності з нашою продуктовою стратегією. Після багатьох обговорень ми вибрали генерацію сцен фотознімків продуктів як напрямок для дослідження.

Оцінка можливостей

Побачивши шанс створити лайфстайл-фото продуктів на базі ШІ, ми взяли паузу, аби оцінити ринок і нашу експертизу перед заглибленням в тему. Ось що вплинуло на рішення продовжувати роботу в цьому напрямку:

Оцінка ринку

  • Обсяг: розмір ринку є великим завдяки розширенню нашої ціннісної пропозиції, яку ще не використали конкуренти.
  • Темпи росту: ринок швидко зростає, що означає більше можливостей для успіху.
  • Конкуренція: ніша, яку ми обрали, залишилась незайнятою, що дає нам можливості розгорнутись.

Ці фактори склали чітку картину: привабливість ринку була високою. Це не лише про цифри, це був про вибуховий потенціал, який ми бачили у цій сфері.

Аналіз наших сильних сторін

  • Інтеграція з наявними продуктами: з нашим корінням у e-commerce та наявними клієнтами, новий продукт виглядав як природне розширення Claid.AI.
  • Конкуренція: на той час ніхто інший не використовував генеративний ШІ для фотографії в e-commerce. Це була прогалина, яку ми прагнули заповнити.
  • Спроможності: наш досвід у технологіях і знання галузі означали, що ми не починаємо з нуля, а наш бренд тільки підсилював позиції на ринку.

Поєднуючи висновки з макрорівневого аналізу ринку з мікрорівневим розумінням наших власних можливостей, ми побачили більше, ніж просто нову ідею продукту. Ми побачили шлях, який ідеально відповідав тому, де ми перебуваємо та куди хочемо рухатись.

Загальний обсяг ринку становить понад $10 мільярдів (маркетинговий бюджет у електронній комерції, який призначений для створення візуального контенту), його потенціал зростання та конкурентне середовище – все вказувало, що ми рухаємось у правильному напрямку. Наші навички та бренд могли втілити ідею в реальність.

Збір перших інсайтів

Ми визначили короткий список ідей, від створення сцен фотознімків продуктів до фотографії їжі та віртуальних автосалонів. Це рішення було засноване на наших стратегічних цілях у сфері генеративного ШІ.

Ось як ми це робили. Основна мета полягала у валідації інтересу та визначенні наших цільових сегментів клієнтів:

  • Вибір кількох ідей: після мозкового штурму та оцінки стратегії ми вирішили дослідити 3 площини застосування: сцени фотознімків продуктів, фотографії їжі та віртуальні автосалони.
  • Запуск посадової сторінки та збір даних: ми одночасно запустили посадкову сторінку з цими ідеями та інтегрували опитування Typeform.
  • Приведення трафіку: ми спрямовували трафік на нашу нову посадкову сторінку, використовуючи популярність наших наявних брендів. Після цього збирали запити користувачів, використовуючи такі питання: «Чи можете ви навести приклади, як генерація зображень може бути корисною для вашого бізнесу?».
  • Інтерв’ю з клієнтами: ми відсортували відповіді у Typeform, щоб вибрати людей для проведення детальніших інтерв’ю, аби краще зрозуміти їхні потреби. Наприклад, під час інтерв’ю лунали запитання: «Як виглядає ваш процес створення візуального контенту?», «Які виклики ви зустрічаєте при створенні візуального контенту?».
  • Виявлення спільних потреб: після близько 30 інтерв’ю ми побачили патерн: труднощі у створенні консистентного та привабливого контенту для соціальних мереж.
  • Уточнення фокусу: ми внесли корективи у нашу посадкову сторінку, зосередившись на допомозі брендам у створенні лайфстайл-фото продуктів.

Після завершення дослідження ми внесли зміни у наше позиціювання, які відобразилися у новому меседжі на посадковій сторінці.

Технологічні виклики

Поки ми займалися бізнес-дослідженням, технічна команда повинна була створити концепт і перевірити можливість його реалізації. На початку нам довелося взяти на себе великі ризики. Ми знали, що людям потрібні якісні фотографії продуктів і що технологія мала величезний потенціал, але ми не знали, наскільки добре вони працюватимуть разом. Основні проблеми, з якими ми стикалися:

  • Збереження вигляду продукту: готові ШІ-моделі спотворювали продукти, змінюючи етикетки, текстури, форми тощо.
  • Спотворення форм: краї об’єктів іноді неконтрольовано збільшувалися або змінювалися.
  • Неправильне розміщення об’єктів: предмети не завжди виглядали природно розміщеними або «плавали у повітрі».
  • Регулювання освітлення: крім розміщення, освітлення потрібно було калібрувати так, щоб продукти не виглядали штучно вставленими.
  • Неестетичний фон: ШІ не завжди генерував хороші результати, час від часу замість бажаного фону ми отримували дивні візерунки, створені мережею.

«Проблема, яку ми розглядаємо, має унікальні виклики, які роблять її наукомісткою. Це можна розглядати як бар’єр для конкурентів, які не мають досвіду в таких фундаментальних технологіях», – Карлос Санчес Мендоза, керівник відділу ШІ.

Нам потрібно було розвʼязати ці проблеми, щоб зберегти автентичний вигляд продукту на фото та високу роздільну здатність деталей, що критично важливо для електронної комерції. Ми знали, що їх подолання буде ключем до публічного релізу продукту на ринку.

Ми пробували різні підходи, і коли виходили нові версії використовуваних нами ШІ-технології, це дуже допомагало. Ми продовжували допрацьовувати і налагоджувати продукт, і нарешті отримали фотографії, які, на нашу думку, були достатньо хорошими.

Це була ризикована подорож, але ми вірили в технологію та потребу, яку закриваємо, навіть коли було важко. До січня ми мали недосконалу, але функціональну альфа-версію AI Photoshoot.

Бути першими

Поява генеративного ШІ започаткувала конкурентну гонку серед компаній. Кожен намагався закріпити за собою право на ідею, навіть до того, як у них було повністю готове рішення.

Наша CEO Софія Швець і я відвідали хакатон зі ШІ від HF0, і це стало для мене моментом важливого усвідомлення. Оточені хакерами та інноваторами, ми зіткнулись з командою, яка працювала над схожим на наш проєктом, а також зустріли продуктового менеджера великої компанії, який теж зосереджувався на розв’язанні подібної проблеми.

Цей досвід став для нас дзвіночком. Як розподілена команда, ми зосередили нашу увагу на розробці продукту і не зіштовхувалися з такою інтенсивною конкуренцією. Але у Сан-Франциско ми виявили, що не одні: кілька команд працювали над схожими ідеями. Хакатон навчив нас, що робити один лише чудовий продукт недостатньо: розробка та ранній маркетинг повинні йти рука об руку для швидкої та ефективної конкуренції на ринку.

Взаємодія з раннім ком’юніті 

Лише через два місяці після запуску ми представили AI Photoshoot у закритому бета-тестуванні. З новою посадковою сторінкою ми продовжували залучати цільову аудиторію. Продукт був на ранній стадії, але вже містив основний функціонал (перетворення простих знімків продуктів на лайфстайл-сцени за допомогою комбінації технологій ШІ), що дозволило ітерувати розвиток продукту на основі відгуків клієнтів.

Щоб прискорити процес, ми перейшли на тижневі спринти. Було важливо побудувати продукт на основі коротких циклів зворотного зв’язку з клієнтами. Це дозволяло нам перевіряти наявність будь-яких прогалин або викликів у користувацькому досвіді. Ми вивчили важливість цього на прикладі Let’s Enhance, коли технологія ШІ була новою і користувачі не знали, як її використовувати.

Ми проводили другий раунд інтерв’ю разом із демонстрацією продукту, де ставили більш конкретні запитання, пов’язані з проблемою, яку ми розвʼязували, наприклад: «Як ви залучаєте клієнтів?»

Що ми змінили на основі відгуків користувачів

Одне з найважливіших усвідомлень: ми показували темплейти зображень в чорно-білому варіанті, щоб допомогти нашим клієнтам зрозуміти, що ШІ буде керуватися композицією, але кожного разу вони отримуватимуть нові згенеровані результати. Однак під час тестування з користувачами клієнти повідомили, що їм не потрібні чорно-білі фони. 

Врешті наша продуктова дизайнерка пояснила, що люди не мислять етапами; вони очікують побачити тільки кінцевий результат. Коли ми відмовились від ідеї чорно-білих фонів, то побачили набагато більше клієнтського залучення.

«Я прийшла до усвідомлення, що UX-дизайн у інструментах ШІ не повинен дотримуватися логіки імплементації, оскільки це може бути занадто складно для користувачів, які не знайомі з процесом розробки. Натомість дизайн має відповідати ментальній моделі клієнтів так, як вони очікують взаємодіяти з продуктом», – Анна Продвойська, Principal Product Designer.

Ми також внесли невеликі зміни, але вони були необхідними для бездоганного впровадження продукту.

  • Покращення input для введення запитів: користувачі часто плутали наше поле для введення запитів з тими, що використовуються в ChatGPT. Наприклад, вони вводили команди на кшталт «розмістіть продукт на столі» замість опису сцени. Для підвищення ясності ми покращили опис до поля введення тексту.
  • Зміна бічної панелі: Спочатку в нашому інтерфейсі була чорна бічна панель, але під час тестування з користувачами ми виявили, що люди повністю ігнорують простір для шаблонів.

На основі відгуків користувачів ми тонко налаштували наш продукт, зробивши його готовим до публічного запуску.

Публічний запуск

Ми запланували запустити продукт в один день з конференцією Shoptalk, важливій події у сфері електронної комерції, 30 березня 2023 року, а також дебют першої публічної версії AI Photoshoot на Product Hunt у той же час.

Наш стенд привертав постійну увагу протягом усього Shoptalk. Сотні захоплених учасників не давали нам спокою, охоче вивчаючи, як ШІ може поліпшити їхні фотографії продуктів. 

Цей новий продукт змінив фокус нашої компанії. Ми оновили нашу посадкову сторінку, щоб краще донести, що ми можемо запропонувати клієнтам. AI Photoshoot показує стрімке зростання щомісяця, роблячи його нашим продуктом з найшвидшим зростанням. 

Які висновки ми зробили

Ми взяли на себе прораховані ризики і зробили ставку на генеративний ШІ, і для нас це спрацювало. Це було непросто, але ми пройшли через технологічні виклики та невизначеність ринку та створили щось значуще.

Конкуренція буде завжди. Сьогодні чи завтра, хтось інший спробує зробити те, що ви робите зараз. Тому вам слід зосередитись на тому, що дійсно має значення — на ваших клієнтах. 

Ви повинні швидко рухатися, почати продавати продукт якнайшвидше і не соромитися повідомляти людей про те, над чим ви працюєте, навіть на ранніх етапах розробки.

Автор: Сергій Зінченко, колишній Founding Head of Product в Claid.ai та LetsEnhance.io