Как создать новый data science продукт в Украине? Опыт Captain Growth

4616
8

Год назад Дмитрий Билаш и Дмитрий Плешаков управляли собственным digital-агентством, имея на борту глобальных клиентов и офисы в 3 странах, но в один момент они решили все резко изменить и уйти в data science. Свой новый продукт - Captain Growth - они выпустили на Product Hunt 26 февраля: это искусственный интеллект для маркетинговой аналитики. О том, как перейти из рекламы в продуктовую разработку и как на самом деле создаются data science продукты рассказывает сооснователь Captain Growth Дмитрий Билаш.

Идея продукта появилась у моего партнера и сооснователя Captain Growth Дмитрия Плешакова. Во время поездки к партнерам в Европу он в очередной раз убедился, как туго маркетологам приходится с данными. Все хотят быть data driven, но нанять высококлассных аналитиков могут лишь крупные компании, а средний и малый бизнес лишь сублимирует, открывая пару отчетов в месяц. Заблудиться в тысячах визуализаций легко, а извлечь из них реальную пользу — нетривиальная задача. Аналитика – это как раз одна из тех задач, где искусственный интеллект может эффективно заменить человека. И мы решили приложить к этому свою руку.

На тот момент наше digital-агентство обслуживало более 50 клиентов и бизнес шел весьма хорошо, несмотря на стагнацию рекламного рынка. Но идея «пора валить» в голове крутилась уже давно. Дело в том, что реклама в Украине — сложно масштабируема. Вспомните, как много украинских рекламных агентств имеют полноценные офисы в США или Европе и управляют глобальными аккаунтами? Откровенно говоря, я знаю всего несколько. На то есть ряд причин.

Первая – украинскому агентству трудно накопить капитал для международной экспансии, так как косты на проекты в Украине в десятки раз меньше, чем в США или Европе. Европейскому агентству легко открыть офис у нас, но не наоборот. Вторая – рекламу не принято «аутсорсить», как IT-разработку. Как считают иностранные маркетологи, нужно понимать контекст потребителей, чтобы что-то им продать. И я с ними согласен.

Приняв такие вводные, мы решили слезть с вполне себе бодрой лошади и двигаться дальше.

Разработка

Создание Captain Growth – комплексный процесс с большим количеством особенностей. В этом же материале хочу поделиться 3 самыми интересными фактами, которые мы подметили.

Сделали модель, которая точно считает? Рано радоваться

Когда ты уютно пишешь модель и запускаешь ее на своем ноутбуке – это одно дело, но когда нужно создать массовый продукт – это совсем другая история. У нас очень скоро появилась проблема оптимизации количества вычислений.

Первая версия продукта давала очень точные результаты. Мы сделали ее буквально за 2 месяца и думали, что дело в шляпе, и мы скоро запустимся. Но когда мы взяли реальный дата сет и запустили модель на облаке, вычисления по 1 клиенту занимали в среднем 2-3 часа в день. При таких расходах обслуживание клиента на AWS стоило $40-50 в месяц, что при ценах на SaaS-рынке абсолютно нерентабельно. В результате мы 3 раза переписывали все с нуля и в конце концов ускорились в 10 раз. Теперь обслуживание стоит $4-5, а все вычисления происходят за пару минут.

Чтобы просто написать модель, годы опыта не нужны – как правило, задачи бизнеса весьма тривиальны и уже решены. А вот чтобы сделать из «лабораторного» кода работающий продукт, нужно иметь опыт и умение находить неочевидные решения.

Работать с разными типами данных – это большой вызов

Часто модель хорошо работает на одном дата-сете, но как только даешь на вход чуть другие данные, она теряет в точности. В нашем случае это абсолютно недопустимо. Captain Growth должен работать с разными данными. Данные каждого клиента Facebook Ads — уникальны, а реклама в Facebook и Adwords отличаются на 100%. Но создавать новую модель на каждого пользователя и даже новый сервис (в маркетинге их сотни) – не стратегично.

В итоге нам таки удалось найти подход, как быстро обучать машину новому типу данных. Сегодня Captain может найти инсайты практически в чем угодно. Например, пару дней назад в Киев приезжал Майк Бутчер, главный редактор TechCrunch. Хотелось обратить его внимание на продукт. Мы решили спарсить информацию про 10 000 статей с TechCrunch (длинна текстов, лайки, темы, спецсимволы и прочее) и запустили «Капитана» на этих данных.

Через 3 минуты он выдал 57 весьма интересных инсайтов. 15 самых интересных из них мы оформили в эту книжку и подарили ее Майку.

Крупные вендоры данных – еще те ребята

Наш продукт был бы невозможен без крупных вендоров данных, которые собирают информацию и потом отдают нам для анализа. Первый крупный вендор, которого мы подключили – это Facebook, но работать с ним непросто.

Во-первых, каждый вендор имеет свою структуру данных. Эта структура зачастую весьма запутана. Чтобы полноценно в ней разобраться, нужно досконально знать их API, которое к тому же постоянно меняется. Мы не смогли найти специалиста по Facebook API и в результате разбирались с ним сами.

Во-вторых, есть вопрос лимитов. На старте Facebook или любой другой вендор не дает вам полный доступ к API. Вы находитесь в «песочнице» и можете делать минимальное количество тестовые запросы. Чтобы получить полный доступ нужно доказать платформе, что вы умеете работать с API, а ваш продукт представляет ценность для пользователей и не нарушает их приватности.

Нам удалось получить расширенные права только с третьей попытки. С этой заявкой у нас была целая история. Мы подали очередной запрос на расширение прав, ответ задержали на 2 недели. В конце концов мы получили долгожданное «да», но ничего не произошло – мы как были с правами тестеров, так с ними и остались. Мы написали кучу писем в поддержку, но так и не получили ответа. А через еще несколько недель все-таки получили полноценный доступ. Без какого-либо уведомления.

И еще. API регулярно меняется. Поэтому нужно внимательно следить за обновлениями. Так может случится, что в один день ваш сервис просто упадет из-за того, что вы не учли обновление стороннего API.

Команда и результаты

Последние 2 месяца продукт находится в открытой бете. За это время к Captain Growth подключилось 112 клиентов. Нашим первым платящим клиентом стало небольшой рекламной агентство из США, которое занимается Facebook-рекламой. Их клиенты – это также малый и средний бизнес в Штатах. Интересно, что бюджеты, которые они тратят от имени своих клиентов на тот же Facebook, в десятки раз превышают годовые бюджеты крупных украинских компаний. Например, один из их клиентов расходует $10 000-20 000 в месяц на Facebook-рекламу и продает весьма странные товары hand-made. Конечно, на таких объемах есть что анализировать и оптимизировать. Только за первый месяц использования Captain Growth они сократили расходы на $6000, при этом увеличили продажи на 15%.

Сейчас над продуктом работает 10 человек. Бекенд-разработкой и общим техническим виденьем проекта управляет CTO. Data science частью занимается lead data scientist и junior data science специалист. За фронтенд самого сервиса отвечает 1 middle разработчик, а 2 веб-разработчика занимаются сайтом. Дизайнер отвечает за внешний вид продукта и промоматериалов.

Я и мой партнер выполняем роль Chief Marketing Officer и Head of Product. Также у нас есть специалист new business в Германии, который работает с крупными европейскими клиентами. Сейчас мы расширяемся и в поисках frontend и backend-девелоперов – хотим к осени найти еще 2-3 человека в команду.

Сколько все это стоило и какие планы?

В общей сложности мы потратили на проект уже около $50 000. Стартовый капитал удалось получиться благодаря агентскому бизнесу и уже к весне мы планируем выйти на операционную прибыль при том, что расходы на развитие компании постоянно растут.

Продукт уже продается и для нас применима bootstrapping-модель. Однако AI-продукт – это не только бизнес, но и наука. А чтобы вкладываться в исследования, разумеется, нужны свободные ресурсы. Поэтому мы открыты к сотрудничеству с инвесторами, которые имеют экспертизу в Artificial Intelligence.

На данном этапе наша задача – рост до 1000 платящих клиентов и развитие продукта. Сегодня мы делаем релиз на Product Hunt с интеграцией с Facebook, а уже на март запланирована интеграция с Adwords и Google Analytics.

Автор: Дмитрий Билаш, сооснователь Captain Growth

Оставить комментарий

Комментарии | 8

  • чисто под fb или adwords тоже поддерживаете?

  • «15 самых интересных из них мы оформили в эту книжку и подарили ее Майку»
    Яку книжку? Є лінк?

      • и что вам Майк на это ответил?

        кстати, на первый взгляд в алгоритме ничего фантастического нет. у каждой стать есть набор параметров: название, автор, дата публикации и т.д. а также лайки и шеры. дальше для каждой статьи делаем всевозможные комбинации из этих параметров. и дальше ищем похожие комбмнации у других материалов (например комбинация: автор вася пупкин, время суббота 23:45, тематика техника) и вычисляем для каждой такой комбинации среднее кол-во шеров. дальше выявляем аномалии.
        возможно еще нужно для каждого параметра добавить степень его влияния. это нужно тестировать …

        самое сложно еместо здесь, как по мне, вычислительные мощностя, так как на генерацию и подсчет этого всегь дофига ресурсов нужно…

        кстати я уже понял, что вы пилите под адвордс… у самого давно есть похожие штуки, только работают на базе excel таблиц

        • Майк заценил, будем общаться с ним и их отделом аналитики детальнее. Кстати, такой сервис неожиданно оказался весьма популярным – к нам уже обратилось несколько крупных изданий.

          В любой технологии нет ничего фантастического. Ракеты Маска тоже взлетают и садятся по законам физики, которые мы в школе/универе учили.
          То, о чем вы пишите и есть поиск аномалий – и это только одна из задач, которую мы решаем рядом методов.
          Реально крутых находок в случае, что вы описали, 3:
          — Скорость. Попробуйте посчитать аномалии в 50-100-мерном пространстве (50-100 парамеров всмысле).
          — Подход, как нужно выявлять аномалии бывает очень разным. В зависимости от характера данных, нужно адаптироваться – наша машина умеет понимать природу ваших данных и подстраиваться под них
          — Самое интересное: уровень аномалии. Представьте, что у вас таблица с 10 параметрами и 100к строк. Вы просто в экселе нашли аномалии. Например, их 7% от общего числа точек. Каждая аномалия находится на пересечении всех 10 параметров. Но работать с такими выводами невозможно – глазами ничего не найдешь. К тому же в этом и смысла нет, так как все и сразу параметры не играют роли и аномальности привнесли, скажем, 3 из 10.
          В случае с маркетингом это супер важно, так как каждый инсайт – это руководство к действию. Если инсайт будет на слишком низком уровне, юзер будет действовать слишком точечно и потратит время на кучу действий, а если слишком высоко, то заденет то, что и так работает хорошо.
          Благодаря нам клиент знает самый оптимальный уровень, где стоит действовать.

Поиск