First things first

Клиент — международная IT-компания (SaaS), которая продает свои решения в секторе b2b. Цель ее знакомства с Big Data — найти больше контактов за границей и, как следствие — масштабирование на зарубежные рынки. Клиенты компании — это интернет-магазины (e-commerce), которые работают с использованием модели подписки и определенных технологий.

Итак, дано: перечень «движков», которые использует e-commerce — более чем 360 наименований известных в мире платформ с активными интернет-магазинами.

Задание:

  • найти по всему миру сайты, которые используют технологии из списка;
  • фильтровать по географическому региону, в котором работает интернет-магазин;
  • фильтровать сайты по тематике продуктов;
  • ранжировать сайты по размеру бизнеса;
  • найти в компании, которая владеет сайтом, контакты принимающих решения лиц.

Гипотезы — не аксиомы

Попробуйте назвать самый крупный e-commerce в Украине? Вы можете предположить его годовой оборот и трафик сайта? Типичный пользователь вспомнит 3–5 магазинов на слуху — узнаваемые бренды, названия которых жителю другой страны скорее всего неизвестны.

Всегда ли узнаваемость бренда гарантирует, что на сайт ежедневно заходит много пользователей? Сколько посетителей в месяц — это нормально?

Серьезный вопрос, ведь для каждой категории продаваемых товаров определен объем спроса в интернете. Магазин может быть лидером, практически монополистом в нише (например, продавать лампы для освещения взлетно-посадочных полос частных аэродромов), но при этом по трафику теряться среди магазинов товаров ежедневного потребления или электроники.

Стоит также учитывать регион, который охватывает бизнес. В Украине, например, практически нет интернет-рынка оборудования для сверхлегкой и малой авиации, в то время как в США или Германии это не диковинка. Соответственно, трафик в одной и той же тематике в разных регионах существенно отличается. Посещаемость сайта — это лишь один из показателей, по которым можно судить о масштабах бизнеса. Нужно оценивать долю трафика каждого магазина в совокупном объеме спроса по определенной группе товаров или услуг в определенном регионе. Также вас ждет оценка маркетинговых затрат на онлайн-рекламу, ведь чем больше бизнес тратит, тем он крупнее. Как вы помните, одна из поставленных задач — именно ранжирование сайта по размеру бизнеса.

Сколько вы знаете интернет-магазинов в Бразилии? Сколько сайтов в Индии продает кастрюли? На каких платформах работает большинство ecommerce-сайтов в Канаде? Используют ли там систему управления содержимым Magento в принципе?

Можно, конечно, погуглить. Но каждый из этих вопросов требует время на исследование. Если вы планируете покорить мир (и желательно сегодня), то поспешите! Пока это не сделал конкурент, немедля подойдите к делу основательно, с умом и применением новейших технологий. Да, мы все еще о Big Data, ведь важно не только уметь собирать массивы данных, но и грамотно использовать их в целях бизнеса.

Решение

Первым делом — чекап сайтов с помощью Builtwith и SimilarTech. Эти сервисы сканируют площадки и анализируют узнаваемые технологии, которые там используются. Например, системы рекламы и аналитики, сервисы оплаты, системы управления содержимым, сервисные технологии и прочие. Первичная таблица с результатами состояла из около 10 млн строк.

Далее — анализ посещаемости сайтов. Для этих 10 млн с помощью сервисов Alexa.com и SimilarWeb мы получили результаты и сразу же отсекли сайты с трафиком менее 40 000 в месяц.

Упомянутые сервисы с помощью внутренних алгоритмов присваивают каждому сайту категорию. Например, Интернет-магазин/Электроника, Интернет-магазин/Мультимаркет и т. д. Названия категорий сайтов на каждом сервисе разные. Человеку нетрудно это понять, но для автоматической обработки данных необходимо было привести все названия к единому образцу. Анализировать по географическому критерию также помогли ресурсы Alexa.com и SimilarWeb.

Для ранжирования потенциальных клиентов было сделано допущение, что средняя конверсия в нише составляет 1%, а средний чек — $100. Это позволило массово отобрать самые потенциальные компании. Хотя было понятно, что в разных нишах средний чек сильно отличается. Для этой же цели были учтены стоимость технологий, используемых на сайте, и затраты домена на интернет-рекламу (объем платного трафика умножить на предполагаемую стоимость клика в нише). Интересно, что топ-100 сайтов при разном подходе к ранжированию не сдвинулся.

Остался последний и самый емкий этап — поиск контактов для собранного списка сайтов, по которым можно было бы связаться с компанией для сотрудничества.

Частично контакты удалось извлечь из служб регистрации доменов. В процессе были и открытия: например, L’Oreal имеет дочерние бренды Urban Decay и Kiehl’s на разных сайтах, но с одним техническим центром. Еще один инсайт: у крупных компаний есть региональные представительства с отдельным сайтом, но единым центром принятия решений. Всю эту информацию необходимо было учесть.

Далее были собраны электронные адреса и телефоны сотрудников, которые упоминали сайт или название компании в соцсетях (LinkedIn, Facebook, Twitter). Если такой информации не было, на помощь приходили контактные данные, указанные на самих сайтах. Что самое интересное, информация о пользователях в соцсетях была корректной. Мы тоже удивились.

Результат

После проведение очистки собранных данных и сведения к единому формату, клиент получил внушительную базу лидов с контактами на 132 000 строк.

Для сравнения: своими силами в полуручном режиме клиенту удалось собрать около 6 000 лидов (под лидом мы подразумеваем базу с контактами целевой аудитории клиента). Использование  Big Data подхода оказалось эффективнее для бизнеса на 1914%. Как тебе такое, Илон Маск?

Авторы: Дмитрий Литавский, Любовь Солодкая,  Promo Performance marketing agency.