Британская компания Cambridge Analitica была основана в 2013 году, но массово заговорили о ней в декабре 2016 года, когда швейцарский журнал Das Magazin опубликовал резонансный материал про роль Big Data в мировых политических процессах. В статье утверждалось, что залогом победы Дональда Трампа на президентских выборах в США, а также причиной успеха кампании по выходу Великобритании из ЕС – Brexit – стал масштабный сбор и анализ информации о жителях обеих стран.
В обоих случаях, согласно заявлению авторов материала, использовались наработки и технологии компании Cambridge Analytica. Британцы оптом скупали всю доступную информацию о гражданах нужной страны – от медицинских карт до телефонных справочников, проводили анализ полученной Big Data, используя 5-факторную психологическую модель OCEAN, затем сопоставляли результаты с электоральными списками и на выходе получали готовую мишень для таргетированной рекламной кампании в Facebook и на других площадках. Психометрия, умноженная на социальную Big Data.
Нашумевший материал последовательно пережил массовое тиражирование, серию разоблачений и критики, но в то же время ткнул пальцем в ряд очевидных фактов.
- Big Data – новая нефть. Соцсети – крупнейший ее источник.
- Стоимость и ценность личных данных постоянно растет по мере того, как развивается инструментарий по их анализу и монетизации.
- Несмотря на то, что практически каждая соцсеть заявляет о защите пользовательских данных de jure, de facto безопасность этой информации сугубо номинальна.
- Чем больше становится объем Big Data, тем больше крупных игроков заинтересованы в том, чтобы купить, спарсить или любым другим образом получить интересы, увлечения и предпочтения многомиллиардной сетевой аудитории.
- Все, что будет вами сказано, налайкано, расшарено и добавлено в сохраненные записи вместе с количеством друзей и подписчиков будет использовано для задач маркетинга, предвыборных гонок, потребительских исследований, банковского скоринга и т.д.
Cambridge Analitica – не единственная компания, которая в данный момент занимается психометрией. На рынке есть еще минимум несколько крупных игроков, решающих те же или смежные вопросы: IBM с проектом Watson Personality Insights, Relation Rate, Visual DNA, EFL и другие. Тем не менее, Cambridge Analitica стала первой с настолько резонансным и успешным кейсом, как Дональд Трамп в качестве президента США. Станет ли приезд ее СЕО открытием ниши Big Data в социальных сетях для украинских игроков?
“Українська національна Big Data”
В начале материала мы не зря подчеркнули, что будем искать именно публичных конкурентов Cambridge Analitica украинских компаний. Непубличных компаний в избытке и значительная часть из них работает именно в политической нише психометрии. По мнению эксперта в управлении репутацией Бориса Тизенгаузена, уже на ближайших парламентских выборах точку зрения пользователей украинского сегмента интернета будут формировать не только привычные выпускники ботоферм, но и уже более серьезные алгоритмы, использующие современные инструменты для анализа данных. Для этого уже происходит массированная скупка пользовательских баз данных – почтовых рассылок, кредитных карт, мобильных операторов и т.д.
Но оставим кесарю кесарево, а кулуары – политикам, и вместо этого рассмотрим несколько публичных украинских компаний, специализирующихся на работе с соцмедиа и сравним их функциональность с Cambridge Analitica. Для этого используем упрощенный чеклист – наличие Big Data, поведенческий и контентный анализ пользователя, а также гибкий модуль таргетированной рекламы.
ZMIYA
Zmiya.com.ua – совместный продукт медиабренда “Типичный Киев” и того самого киевского программиста – Макса Фрая. Был запущен в 2015 как анализатор украинских блогов в социальных сетях, после чего быстро оброс дополнительными функциями. Например, на сайте можно отыскать актуальный рейтинг украинской блогосферы, СМИ, а также наглядно изучить актуальные тренды и инфоповоды. Данные для анализа Zmiya собирает из аккаунтов в Facebook, Twitter, ранжируя их не только по количеству просмотров/подписчиков, но и по живой активности – комментариям, лайкам и шерам.
Информационная выборка у Zmiya ограничена. База данных СМИ, к примеру, составлена вручную, а рейтинг пользователей украинского Facebook ограничивается первыми 240 пользователями после чего сервис выдает ошибку. Сервис также собирает данные по хештегам для формирования пула горячих тем, но не проводит лексико-морфологический анализ пользовательских тестов. Система таргетирования информации под определенные пользовательские сегменты отсутствует.
Итого – удобно для мониторинга, но не Cambridge Analitica.
Publicfast
Стартап основан в 2013 году и представляет собой инструмент по монетизации лидеров мнений или же, как их называют в англоязычном интернете – influencers. При регистрации пользователь добавляет свои аккаунты в соцсетях, после чего Publicfast оценивает его охват и влияние и на основании этих данных формирует рыночную стоимость аккаунта, как рекламной площадки. Дальше все происходит, как в обычной партнерке – рекламодатель выставляет офферы по определенной модели оплаты, а новоиспеченный лидер мнений решает – хочет ли он зарабатывать на ретрансляции данного типа контента.
Для работы сервис парсит данные связанные с аккаунтом зарегистрированного пользователя, что ограничивает общую базу данных. В Publicfast также отсутствует текстовый анализ, а рекламный таргетинг ограничен аудиторией конкретного пользователя без четкого сегментирования под нужный месседж или продукт.
Итого – удобно для монетизации личного или бизнес-аккаунта, но не Cambridge Analitica.
SemanticForce
Самый долгоживущий проект из списка, которому в этом году исполняется 12 лет. Специализируется на мониторинге и анализе онлайн-медиа, соцсетей, форумов, блогов, интернет-магазинов, сайтов-отзовиков, видеоплатформ и даже презентаций SlideShare. Помимо глобального сбора данных сервис умеет точечно изучать автора конкретных высказываний – отслеживать поведение, находить другие учетные записи, собирать гео- и другую информацию.
Компания обладает большим пулом данных для мониторинга и анализа, а также предлагает текстовый анализ с оценкой эмоционального отношения автора контента к предмету. Инструменты для рекламного таргетинга отсутствуют.
Итого – горячо, но до полного соответствия Cambridge Analitica еще далеко.
TheRespo
Компания специализируется на изучении интересов пользователей из различных соцсетей, сегментации и персонализации информации под каждый выделенный сегмент. Помимо e-commerce theRespo работает с репутационным бизнесом и аналитикой общественного мнения. Среди известных кейсов – оптимизация воронки вовлеченности для сервиса госзакупок Prozorro.
Также недавно компания совместно с VoxUkraine провела исследование активности пользователей на FB-странице президента Украины Петра Порошенка. В результате выяснилось, что каждый шестой комментарий на странице президента оставляется ботом, а под некоторыми постами их концентрация достигает 50%.
Сервис работает с Big Data, умеет делать поведенческий и контентный анализ пользователя, и на основе всего вышеперечисленного формулирует инсайты по таргетированию нужного сегмента аудитории. В целом, по набору функций TheRespo пока что ближе к сравнению с Cambridge Analitica.
UpMyRating
Темная лошадка, которая спустя 2 года разработки готовится выйти на украинский рынок Big Data. Сейчас находится в стадии закрытого тестирования, но уже в ноябре 2017 представители компании обещают показать рынку свой первый рабочий модуль.
В качестве готового продукта, UpMyRating собирается конкурировать с внутренними рекламными сервисами соцсетей. Идея заключается в том, что пользователю гораздо выгоднее наращивать и монетизировать собственный социальный капитал, чем достигать целей через спонсорские посты Facebook. При естественном развитии аккаунта в соцсети самая сложная часть – найти или сформировать свою аудиторию и вот эту нишу сегментирования и таргетирования UpMyRating и собирается перекрыть.
Заявленная функциональность сервиса включает комплексный парсинг данных о Facebook-аккаунтах, расчет веса аккаунта, его поведенческую модель и анализатор текстов, а также построение прогнозной модели поведения пользователя Facebook. Потом сервис планирует перейти от аналитики и прогнозирования к непосредственному формированию и корректировке инфополя аудитории. Если у разработчиков получится достичь заявленных целей – на рынке появится довольно интересный комплексный продукт по работе с социальной Big Data, который во многом повторит СА.
Стоит отметить, что самым интересным нюансом работы компаний, занимающихся Big Data из соцсетей, является их противостояние с постоянно меняющимися алгоритмами Facebook, ботофермами и прочими помехами, которые ставят под вопрос качество сегментирования и в целом правдивость полученных данных. Тем не менее, спрос на пользовательскую информацию не стихает, благодаря чему можно наблюдать увлекательную гонку вооружений всех заинтересованных в ней сторон, а также прогнозировать появление на рынке социальной Big Data новых игроков.
В том числе и украинских.