По мнению аналитиков Forbes, одним из 5-ти ключевых трендов 2013 года будут новые решения в области визуализации и анализа больших объемов информации.

Эпоха Big Data уверенно наступает, и теперь на первый план встает уже не проблема сбора, а проблема анализа и визуализации нарастающей информационной волны. Скорость, наглядность и функциональность становятся ключевыми показателями работы аналитических систем.

В ногу со временем

Большие объемы информации требуют новых методов визуализации. Таких, в которых будут видны более глубокие и подробные взаимосвязи, элементы иерархии, соотношения между разными объектами и т.д. Как было точно подмечено одним из экспертов (David McCandless), визуализация является одной из форм сжатия данных. Таким образом, грамотная визуализация может существенно упростить процесс анализа и обработки больших массивов данных.

Однако, на сегодняшний день большинство решений по мониторингу и анализу СМИ и соц-медиа предлагают весьма скудный и устаревший арсенал – например, по отображению тональности.

sfor1

В итоге мы видим лишь первичный анализ данных, общую статистику, которая не решит и даже не приблизит нас к решению бизнес-задач или оценке ситуации на рынке. Другими словами, несмотря на проделанный нами анализ сообщений (определение позитива и негатива по каждому сообщению), мы получаем в итоге лишь общую картину, которая вызывает больше вопросов чем дает ответов.

Вернемся к диаграмме. Взглянув на нее, у вас, как представителя компании, могут возникнуть по крайней мере следующие вопросы:

  • Какие компании или персоны упоминались в контексте позитива и негатива?
  • Кто говорил плохо обо мне и хорошо о конкурентах?
  • Кто говорит хорошо обо мне и хорошо о конкурентах?
  • Были ли биполярные сообщения (случаи, когда обо мне говорили одновременно и позитивно, и негативно)?
  • За что именно хвалили, а за что ругали?

Можно ли узнать ответы на эти вопросы, просто взглянув на определенный график? Да. Более того, все ответы вы можете получить, взглянув всего на одну-единственную диаграмму. И мы рады представить вам такую возможность.

Наглядность формы, ценность содержания

В своей работе мы стараемся придерживаться принципа, что любая визуализация, любой график или диаграмма должны отвечать на значимые для бизнеса вопросы, а не присутствовать ради красивой картинки – формы без содержания. Это касается и более сложных вариантов отображения данных.

В платформе SemanticForce используется объектный подход к определению тональности: тональность определяется для каждого объекта в сообщении, а не всего сообщения в целом. Например, могут присутствовать сравнения с конкурентами – и здесь важно детектировать тональность не только к вашему бренду, но и к чужому. Часто люди неоднозначны в высказываниях по отношению к продукту – их устраивают одни показатели, но вызывают недовольство другие. Подобные сообщения невозможно трактовать однополярной тональностью, поэтому объектный подход и биполярная тональность – необходимый инструмент современного анализа информации.

Когда подобный объектный анализ сообщений закончен, вы можете увидеть общую статистику – сколько было отзывов о вас, какие упоминались конкуренты, в какой тональности о них говорили. Однако нашей целью было сделать подобную статистику максимально наглядной и доступной для оценки одним взглядом.

sfor2

Мы перебрали много вариантов визуализации этих данных (выше – один из них, где видна общая статистика по упоминаемости конкурентов), пока не нашли механизм для эффективного и интерактивного отображения объектной тональности.

Представляем вашему вниманию нашу очередную инновацию в методах визуализации данных – интерактивную диаграмму объектной тональности. По ней вы сразу можете определить: как часто вас сравнивали с конкурентами, о каких компаниях говорили в контексте с вами и в какой тональности, а также, что именно говорили.

sfor3

Перед вами привычная круговая диаграмма, где зеленым цветом выделен сектор с объемом позитивных отзывов, а красным – негативных. Дополнительные круги на секторах соответствуют другим объектам, которые упоминались вместе с исследуемым брендом. При этом сразу понятен и характер, и объем упоминаний по конкурентам. Советуем обратить внимание на круги зеленого цвета на красном секторе – это позитивные отзывы о конкурентах в контексте негатива о вас. Вы также можете легко понять объем биполярных упоминаний (содержащих позитив и негатив одновременно) – соответствующий круг заштрихован и относится к вашему бренду. Ниже приводим еще несколько примеров диаграмм по брендам из разных индустрий.

sfor4

sfor5

По клику на интересующий объект, вы получите более подробную статистику по упоминаниям, их тематике и объему, а также сможете перейти непосредственно на перечень этих сообщений. Таким образом, всего в несколько кликов вы можете получить ответ на практически любой бизнес-вопрос о ваших конкурентах. Диаграмма реализована на HTML5, что позволяет работать с ней на iOS, Android и прочих платформах и устройствах.

Диаграмма обновляется в режиме реального времени, поэтому когда анализ сообщений проводится автоматическим инструментом (платформа анализа текстов Blueberry, о которой мы совсем скоро расскажем в отдельной статье), вы можете наблюдать увлекательную картину изменения показателей «на лету».

Полагаем, что подобная визуализация будет особенно полезна для “Центров управления социальными медиа”, о которых мы уже писали в нашем блоге – она поможет быстро ориентироваться в большом потоке входящей информации и делать детальный анализ.

Мы планируем активно развивать данный вид визуализации – в частности, добавить другие типы диаграмм (например, эмоции в сообщениях, факторный анализ и т.п.). Надеемся, что этот инструмент будет ценным помощником для анализа ситуации на рынке и поведения потребителей, станет важным ориентиром для принятия решений. И отметим, что мы видим семантический навигатор как цельную платформу по визуализации Big Data и открыты для сотрудничества со СМИ, коллегами по цеху, поставщиками аналитических систем и т.п.

Будем рады ответить на вопросы в комментариях!