Вчера в Одессе прошла конференция Яндекса «Горизонты цифрового маркетинга». Среди трех секций самой популярной стала секция, посвященная аналитике и роли данных в цифровом маркетинге: среди топ-5 лучших докладов по результатам голосования четыре прозвучало именно в этой секции. В ней приняли участие Игорь Ашманов (Ашманов и партнеры),  Алексей Бакун (Gemius Украина), Федор Вирин (Data Insight), Дмитрий Сатин (UsabilityLab) и Владислав Флакс (OWOX).

Игорь Ашманов – о новых типах данных для новых измерений

Big Data, по словам эксперта, отличает то, что их нельзя анализировать вручную, а также – что по фрагменту таких данных нельзя получить целую картину. Первое, что приходит в голову, когда говорят о больших данных: это сведения о посещаемости,  о поисковых запросов, вообще о пользовательском поведении в сети. связанные либо со счетчиком (Liveinternet, Google Analytics, Яндекс.Метрика), либо с рекламными системами. Такие данные позволяют на первом этапе прогнозировать, на какие сайты будет ходить пользователь, на втором – из активности в сети вычислить его социально-демографические характеристики. На следующем этапе может появиться классификация пользователей по психотипам, хоть Ашманов и отнесся к психологии скептически.

Мракобесие не работает  (Ашманов о психологии и психотипах)

«Что можно увидеть снаружи, когда смотришь не на поведение пользователей, а на то, что они пишут, то есть как на авторов – в блогах, социальных сетях. У нас есть специальная компания, которая анализирует блоги, мнения пользователей, соотношение позитива/негатива», – рассказал эксперт. В этом случае можно анализировать:

  • Соотношение позитива/негатива. По словам Ашманова, именно картина с высоты птичьего полета дает понять, что оно как правило равно 1 к 4. «Люди любят ругаться в сети, и если ты видишь конкретную рекламную кампанию, где это соотношение другое, это уже что-то значит», – сказал он.
  • Информационные вбросы. Если наблюдать график распространения какого-то информповода по сети, также можно делать выводы о том, естественная ли это вещь или вброс. Этого нельзя сделать, анализируя отдельный блог, для этого нужны Big Data.
  • Сообщества ботов. Как рассказал Ашманов, есть сообщества из тысяч ботов («где-то зачерпнули ковшом чужих твитов, к примеру, двухгодичной давности, и обмениваются ими, чтобы создать впечатление реальной жизни»). Такие сообщества часто используются в политических целях: к примеру, в декабре, когда в РФ после выборов демонстрация собиралась громить Лубянку, и договаривалась в каком-то интернет-канале, боты забили этот канал цитатами из русской классики. Если не смотреть с «высоты птичьего полета», то есть, не анализировать Big Data, понять, определить, что это «те же самые твиты», невозможно.
  • Медийный вес, проплачиваемость блогера. Можно посчитать количество перепостов, составить рейтинг проплачиваемости блогера. «Если мы уже определили что это вброс, то дальше, поскольку мы видим вбросы, можем каждому блогеру приписать степень его приверженности к участию во них. Можем посчитать и тематический рейтинг блогера», – рассказал эксперт.
  •  География и предсказания. «В блогах видна география, если ты анализируешь задним числом какое-то событие типа терракта, конфликта в регионе, то оказывается, что горные пласты в этом регионе начали потрескивать задолго до того, как произошло землетрясение. Условно говоря, в регионе появляется какая-то сила, которая хочет захватить ГЭС и взорвать. Заранее в этом регионе начинается столкновение кого-то с патрулем, бои и так далее. Как будто бы потрескивают пласты. В принципе, если научиться отличать такое потрескивание от фона – можно предсказывать события», – говорит Ашманов.

Но такие данные, по его словам – «стремные», часто связанные с политической деятельностью, что может повлечь преследования, попытки их перекупить и т.д.

Алексей Бакун – об отчетности

Около 15% баннеров, за которые платит рекламодатель, фактически, не показывается пользователю, рассказал Алексей Бакун. «Абсолютно никто не гарантирует, что если вы заплатите свои деньги, вы не заплатите за воздух. К примеру, пошел запрос на рекламу, а пользователь закрыл браузер, подвисла или не загрузилась флешка и т.д. Фактически, некоторые рекламные системы на рынке Украины досчитывают эти 15% клиенту, некоторые — не досчитывают. В связи с этим нужно иметь в виду, что рекламодатель хочет видеть те же параметры эффективности, что и в других медиа: к примеру, сколько процентов людей из вашей аудитории видели рекламу, а не столько-то кукиз, CTR такой-то». То есть, пояснил эксперт, нужно представлять рекламодателю данные в понятной форме.

Бакун привел в пример недавнюю рекламную кампанию Aukro.ua, эффективность которой мерялась инструментами Gemius. В начале кампании, по словам эксперта,  в среднем ее видело примерно 7 из 14 млн украинских пользователей. Gemius пару месяцев назад запустил веб-интерфейс, где социально-демографические параметры рекламной кампании можно видеть онлайн, а не в виде больших отчетов.

Федор Вирин – об «искореженности» онлайн-отчетов

Федор Вирин из Data Insight рассказал о тех основных подводных камнях, которые угрожают составителям и аналитикам данных и, как следствие, «корежат» выводы. Онлайн-отчеты дешевле офлайновых в 6-8 раз, но имеют свою специфику.

Рекламный щит “Вы это видите – значит, это работает”. Нет, это не работает, – Федор Вирин о «простоте» онлайн-опросников

  • Самый простой способ проведения отчета: повесить анкету на сайте. Но это, по словам эксперта, редко работает. Потому что анкету заполнят только те пользователи, которые почему-то не поленились это сделать;
  • Опросы нужно проводить на различных сайтах. Аудитория одного, даже очень хорошего сайта, может существенно отличаться по характеристикам от аудитории других проектов;
  • Некоторые группы пользователей в онлайне (как и в офлайне) почти недостижимы: очень богатые, очень бедные пользователи, новички (те, которые пользуются интернетом менее трех лет). «Любой репрезентативный опрос нужно перевзвешивать. Раз у нас мало новичков, нужно дать их анкетам больший вес», – советует эксперт. Нужно, к примеру, учитывать, что если в Киеве интернетом пользуются давно, то в небольших городах (особенно в промышленных) – недавно;
  • Выборку нужно чистить. На ответы пользователей часто влияет социальная желательность. «Когда задаем вопрос “А вы перевели бы старушку через дорогу?” – ответ всегда будет “Да, конечно”. В интернете этот эффект меньше, но он есть. Он может касаться, к примеру, преувеличения или преуменьшения семейного дохода, всего, что показало бы пользователя в лучшем свете. «В интернете очень легко задать провокационный вопрос, так чтобы пользователь ответил, как того хочет интервьюер. Такого нужно избегать», – советует Вирин.
  • Первый ответ из списка всегда выбирают чаще, эта погрешность заметна и в интернете. В онлайн-опросе варианты ответа нужно ротировать или вообще использовать шкалу. Длительность заполнения опроса не должна превышать 10-15 минут.

Дмитрий Сатин – о том, зачем искать аномалии

Данные ничего не стоят, если мы не можем сделать из них вывод, – так начал свой доклад Дмитрий Сатин. Развитие знаний происходит через наблюдение аномалий, именно такой способ предлагает эксперт попробовать при анализе данных.

Один из способов – сравнение демографии своего проекта с общей демографией интернета. Эксперт привел в пример два проекта: первый с основной аудиторией 18-24, второй – с ядром аудитории 25-34 года. Первый проект был сайтом поиска работы, второй – сайтом по продаже отопительного оборудования.

Еще один источник аномалий – внутренняя трансформация клиента, например, во время прохождения воронки продаж. Эксперт предлагает тщательно проанализировать характеристики аудитории проекта на входе и выходе из «воронки». И приводит три примера:

Я всегда боюсь неудовлетворенного клиента, который потом в интернете начнет нас хулить, – Дмитрий Сатин

  • На сайте магазина Sokol.ua на входе в воронку киевлян чуть менее половины. А на странице подтверждения заказа – их уже почти три четверти. Объясняется это просто: у магазина плохо работает доставка в регионы. «А ведь реклама – то, что привело людей в начало воронки, захватила и регионалов, они отсеялись и ушли недовольными», – замечает Сатин.
  • Загадочный пример  сайта по продаже котлов (МК Термо) по распределению параметров монитора на входе и выходе из воронки. На входе широкоугольников и 3х4 – примерно равное количество, на выходе – широкоугольников больше. На основании этого, говорит эксперт, можно делать различные выводы. К примеру, на работе, где человек ищет данные о продукте, стоят стандартные мониторы, а дома – большие. Или эти параметры могут объясняться через уровень дохода тех, кто ищет данные и тех, кто покупает.
  • Пример с сайта заказа цветов Обрадовал.ру. «На входе в воронку женщин видимо больше, чем мужчин. А покупают цветы, в основном мужчины. Почему женщины больше смотрят и меньше покупают, – задался вопросом эксперт. – Оказывается, по русской традиции невеста не должна видеть свой букет до свадьбы. По факту же, ни одна невеста не позволит жениху выбрать цветы (а вдруг не подойдут к платью), так что она сама выбирает букет, а потом пересылает ему ссылки».

«Посмотрите на данные воронки продаж у себя на проекте, возможно, вы увидите подобные аномалии, и они наведут вас на идею изменения маркетинговой кампании», – советует эксперт.

Владислав Флакс – о том, с чего начинать анализ Big Data

В начале своего выступления эксперт заметил, что обработка больших массивов данных и прибыль компании связаны напрямую.

«Представьте, что вы зашли онлайн в один из магазинов большой сети в США,  вы увидите две абсоютно одинаковые витрины. Но если мы с вами в зайдем в какой-то интернет-магазин с выручкой в $50 млрд в год, мы увидим две разные витрины, каждая из которых будет персонализирована для нас. Amazon решает, какие товары вам показать, на основании обработки данных. Можно спорить о том, удобен он или нет, но продает он в шесть раз больше, чем Best Buy и Walmart, вместе взятые, продают онлайн», – говорит эксперт.

Что делать, если вы – владелец бизнеса и хотите быть ближе к Big Data? Флакс рекомендует для начала два инструмента – облачный сервис Google Prediction (сервис машинного обучения, который позволяет загрузить матрицу с данными, выявить общие тенденции и понять, что выделяет вашу аудиторию) и Amazon Elastic MapReduce (облачный сервис для распределенных вычислений).