Если выделить одну технологическую парадигму, которую мы запомним в 2016 году, то это будет голос. От чат-ботов до Amazon Echo и разговорных интерфейсов, наши голоса становятся одним из основных способов взаимодействия с компьютерами. На этой неделе партнер венчурного фонда KPCB Мэри Микер представила ежегодный отчет об интернет-трендах 2016 года. Заметную часть из более 200 слайдов презентации Микер уделила данным о голосовых интерфейсах. Издание FastCoDesign проанализировало данные ее презентации и написало о том, как люди используют голосовые интерфейсы и как быстро они станут нормой. Редакция AIN.UA приводит полный перевод заметки.
Как мы используем голос
Существует ряд случаев, когда «разговоры» с компьютером имеют смысл: пользователь за рулем, альтернативный графический интерфейс сложен и неудобен, а иногда людям просто лень печатать. Согласно данным Микер, 61% использования голосовых интерфейсов приходится на случаи, когда руки и глаза пользователей заняты. Обычно такое происходит дома (43%) или в машине (36%).
В то же время, в более четверти случаев люди выбирают голосовые интерфейсы, потому что им неудобно печатать на некоторых устройствах. Среди таких пользователей основной процент людей с ограниченными возможностями, которым гораздо проще «разговаривать» с компьютерами, чем вводить информацию на клавиатуре. Именно для людей с проблемами моторного-двигательного аппарата и были изначально разработаны многие дополнения к привычным интерфейсам.
А еще говорить со смартфоном или другим устройство «весело и круто», что является мотивацией для 22% пользователей голосовых интерфейсов.
Не забудьте «позвонить маме»
Что в действительности пользователи говорят своим устройствам? Когда Google представил новые голосовые команды в начале 2014 года, самой используемой среди них быстро стала «позвони маме». Согласно графику из отчета Микер, с тех пор разговоры с мамой не теряют своей популярности. Соперничают с ними только просьбы «проложить дорогу домой», где наверняка ждет мама. А отцы тем временем обречены на одиночество.
Триумф Amazon Echo
Существенное количество слайдов презентации венчурного инвестора посвящены одному устройство с голосовым управлением — Amazon Echo. У 5% клиентов Amazon оно стоит дома, а 61% знает, что это за устройство.
Почему эти цифры важны для компании? У Amazon есть 44 млн подписчиков сервиса для постоянных клиентов Prime, а одна из наиболее сильных сторон Echo — легкость заказа товаров с сайта онлайн-ритейлера. Стоит небрежно пробормотать в пустоту «купить больше бумажных полотенец», стоя на кухне, и вы уже сделали заказ. Пользовательский опыт прост настолько, насколько это возможно. Сравните это с вбиванием «amazon.com» в адресную строку браузера, поиском бумажных полотенец, отправкой их в корзину и оплатой.
Это делает из Алексы, компьютерной личности, живущей в устройствах Echo, суперпродавца, который только начал свою работу. Чтобы подчеркнуть растущую популярность этого устройства, Микер приводит сравнение продаж Echo с iPhone. Глобальные поставки смартфона беспрерывно росли почти десять лет и впервые упали в начале 2016 года. Устройство Amazon с голосовым интерфейсом напротив показывает рост в десятки процентов с момента запуска — в первом квартале текущего года поставки достигли миллиона единиц.
Эти показатели говорят о том, что мы понемногу выходим из эры бесконечного роста рынка смартфонов и вступаем в мир устройств, органично встроенных в наше окружение.
Последние 4%
За ворохом историй о голосовом интерфейсе легко упустить из виду, как много времени потребовалось технологии, чтобы она стала реальностью. В 1970 году машины могли распознавать речь с точностью 10%. В 2010 эта цифра составила уже 70%, а сегодня колеблется около 90%.
Но последние шаги наиболее сложные и важные. «Когда точность распознавания речи шагнет с 95% до 99%, мы перейдем от “едва пользуюсь” голосовым интерфейсом к “использую его постоянно”. Большинство людей недооценивают разницу между 95% и 99% точностью, а ведь последняя меняет правила игры… Никто не хочет ждать ответа 10 секунд. Точность вместе с задержкой — две ключевые метрики для готовой к массовому производству голосовой системы», — отмечает в своем исследовании Эндрю Энджи, главный ученый китайского поискового гиганта Baidu.
Он также прогнозирует, что в ближайшие четыре года скорость перехода на голосовой интерфейс начнет экспоненциальный рост. К 2020 году более половины поисковых запросов, делаемых онлайн, будут не текстовыми. Пользователи будут искать с помощью изображений или голоса.