Как понять, что вашему стартапу нужен Data Scientist?
Если вы делаете IT-стартап без использования Data Science – скорее всего он устарел уже на уровне идеи. По сути, то же самое касается финтеха, медицины, ритейла, логистики, развлекательного веб- или мобильного сервиса. Негоже начинать статьи со спойлера, но проблема в том, что в какой бы сфере вы не затеяли новый проект сегодня, ему совершенно точно нужен Data Scientist. И вот почему.
Материал подготовлен при поддержке «Майкрософт Украина»
Почему сейчас?
О том, что такое искусственный интеллект и причем тут Data Science, мы уже рассказывали в отдельном материале. Обязательно почитайте его, если вы плохо знакомы с темой.

Долгое время искусственный интеллект и все связанное с ним было предметом фантазий писателей, надежд ученых и разработчиков и страхов обывателей. Теоретическая основа для всего, что воплощается сейчас, была заложена примерно в 50-х годах прошлого века, интерес к вопросу то поднимался, то угасал. Каждая волна интереса сопровождалась появлением произведений искусства на эту тему: фантастический бум в литературе в 60-х, в фильмах – в 80-90-х и вот сейчас. Можно с уверенностью сказать, что, если о чем-то говорят в кино, значит, этим же занимаются и в сфере науки и разработок.


Регулярный возврат к теориям 70-летней давности происходил не случайно – на каждом этапе мелькала надежда, что теперь вычислительных мощностей достаточно для того, чтобы научить искусственный интеллект уму-разуму и отправить его служить человечеству. По факту, к этому мы пришли только сейчас – в частности, благодаря неусыпной гонке технологий за воплощением в жизнь закона Мура. И то – еще не в полной мере.

Прорыв в работе с большими данными и создании искусственного интеллекта – инновация, которая влечет за собой настолько масштабные перемены во всех сферах жизни человека, что сейчас мы даже не можем себе их представить. «Сейчас мы стоим на пороге настолько масштабных перемен, насколько в свое время было одомашнивание животных и изобретение парового двигателя. ИИ позволит компаниям делать те же вещи, только дешевле и эффективнее. Маржинальность вырастает на 50% и более. С одной стороны – это шок для экономики, но он ликвидирует старый вид производства, который не был эффективен», – рассказывает Максим Орловский.

Максим – ментор инкубатора Cloud Business City (это место, где стартапы могут получить техническую помощь и знания в области Data Science и работы с облаком Azure, где, собственно, есть инструменты для работы с искусственным интеллектом), его первая область специализации и тематика PhD – нейронаука. Максим занимается проектами в области Data Science и искусственного интеллекта, руководит компанией Кодрум и является учредителем лаборатории BICA Labs.

По мнению Максима Орловского, IT-стартап не имеет права называться инновационным, если он не использует возможности искусственного интеллекта в том или ином виде. Потому что это такая же естественная часть инноваций ближайшего будущего, как электричество около века назад. Или компьютер для хардверного стартапа на заре формирования Кремниевой долины. Если открыть список топ-100 лучших стартапов из любой области и в любой передовой стране мира, значительная часть из них будет использовать Data Science и скорее всего она будет предлагать выполнять уже известные задачи, просто быстрее, качественнее или дешевле.

Где пригодился искусственный интеллект?
Со стороны может показаться, что искусственный интеллект – игрушка, годная только для развлекательных проектов. Отчасти такое ощущение формируется из-за того, что в медиа больше пишут о развлекательной или игровой стороне успехов ИИ – это легче воспринимается пользователями и находит больший отклик. Нейросети научились рисовать как Рембрандт, играть как Bealtes и писать стихи как Егор Летов. Когда они спят, то видят во сне реальность, как будто под ЛСД. Когда они творят, они могут превратить вашу фотографию в подобие картины художника, украсят ваш обыденный снимок невероятными фильтрами и дополнениями, сделают вашу жизнь забавнее и веселее. Их купят дороже большие компании.

Три восточноевропейских стартапа, которые были куплены крупными компаниями за последние три года, отлично подходят для развлекательных целей. Украинский Viewdle, разрабатывающий технологию распознавания лиц, был куплен Google в 2013 году. Looksery — сервис (тоже основан украинцами), который умеет корректировать потоковое видео в реальном времени, в 2015 году был куплен Snapchat. Наконец, белорусский Masquerade, разработчик приложения MSQRD, позволяющего накладывать фильтры на лицо пользователя и делать такие фотографии, был приобретен Facebook в нынешнем году. Все три технологии интересны прежде всего как часть больших сервисов, чем как самостоятельные решения, и если они будут свежи и хороши, то обязательно найдут своего покупателя.


На днях появилась новость о том, что стартап ebo обучил нейросети подбирать подарки людям, на основании их предпочтений. Чтобы получить помощь в выборе, нужно ответить на несколько вопросов на сайте проекта, указать возраст, пол и место жительства – остальные задачи возьмет на себя нейросеть, у которой уже есть приличная база знаний о вкусах людей и возможных подарках. Недавно нейросети научились предсказывать следующие кадры в видео и следующее действие пользователя по фотографии. Возможно, скоро мы увидим фильмы, созданные сетями, а не человеком. Написать повесть она уже в состоянии.

Тем не менее, развлечение – уже сегодня не главная и не единственная роль, которая отводится искусственному интеллекту. Да, нейросети часто обучают на играх и развлекательных вещах, потому что это самый простой и безболезненный способ, и в нем цена ошибки не так высока, как если бы речь шла о жизни и свободе человека. Вместе с тем, искусственный интеллект применим практически в любой сфере человеческой деятельности.

Сервисы по переводу показывают ошеломительные успехи благодаря внедрению искусственного интеллекта. Это значит, что другие способы машинного перевода отойдут как неэффективные.

Все, что связано с транспортом и логистикой, будет автоматизировано. Самоуправляемые автомобили, беспилотный общественный транспорт, который уже есть в Нидерландах и Сингапуре, беспилотные фуры, которые без пяти минут реальность для американских дорог – это все не только позволяет компаниям сокращать расходы на оплату труда, но и более эффективно прогнозировать сроки доставки товара. Автопилоту не нужно спать в дороге, он реже попадает в аварии и не заболеет в высокий сезон.



Помощь в ритейле от больших данных и ИИ сложно переоценить. Уже можно распознавать лица посетителей и анализировать, были ли они тут раньше и чем интересовались, отправлять потенциальным клиентам push-уведомления на телефон, когда те проходят по улице мимо, понимать, как человек перемещался по магазину, искал ли он что-то параллельно в телефоне на сайте компании – это ключи к повышению продаж, поэтому ритейл-стартапу было бы странно их не использовать. Анализ спроса на те или иные товары позволяет лучше организовать логистику. В идеальном для ритейла мире вся цепочка процессов – с момента, когда человек попадает в магазин или заведение и делает заказ до момента, когда самоуправляемый автомобиль отправляется пополнять запасы популярного товара – будет автоматизирована.

Большие данные и технологии распознавания лиц с таким же успехом применимы в сфере безопасности или, например, в индустрии красоты – возможности ограничены только фантазией основателей проектов. Так в аэропорту острова Аруба повсюду установлены системы распознавания лиц, поэтому при прохождении контроля достаточно показать паспорт лишь однажды – в первый раз. На всех остальных этапах камеры распознают людей автоматически.

Умное зеркало HiMirror, которое дает подсказки, как ухаживать за кожей на основании ее внешнего вида и данных о косметике владельца, сегодня можно купить за 189 долларов. Вполне подъемная сумма для среднестатистической семьи в развитой стране. «Умная» составляющая зеркала анализирует состояние разных участков кожи лица и понимает, что им нужно прямо сейчас.
HiMirror

ИИ развивается в медицине. Какие-то проекты живут пока только в лабораториях, какие-то превратились в стартапы. Вы наверняка читали о том, что нейросети уже научили находить раковые клетки. Британский стартап Babylon работает над внедрением искусственного интеллекта, который бы ставил через приложение диагноз пользователю на основании описанных симптомов. Возможности нейросети шире возможностей человека – она может за короткое время сравнить разные симптомы и другие данные (например, МРТ, УЗИ и так далее) с теми, что есть у нее в базе, и выявить проблемы и патологии. Одной из ключевых проблем нейросетей сейчас является то, что человек часто не понимает, как они принимают решения. Ученым MIT удалось научить нейросеть обосновывать ответы – и это полезное подспорье в диагностике.

На базе облачных технологий Microsoft и решений в сфере искусственного интеллекта был создан проект ImagineCare. Он позволяет медикам создавать для пациентов индивидуальный план по уходу за здоровьем, основанный на их личных особенностях, месте, где те живут, данных от «умных» устройств по уходу за здоровьем. У таких пациентов есть медсестры, которые постоянно следят за их здоровьем удаленно – через сервисы мониторинга – и быстро реагируют на проблемы или корректируют рекомендации.

Стартап из Кэмбриджа, Darktrace, научился предугадывать возможные кибератаки в сети. В области юриспруденции есть стартапы на основании ИИ, которые позволяют разобраться в сложных для понимания законах (LegalRobot), находить прецеденты или анализировать юридические документы (LegalSifter).
Dartmouth-Hitchcock Health System
Что же Украина?
Максим Орловский, говорит о том, что в Украине проекты на базе ИИ набирают популярность в разных сферах деятельности – наша страна входит в 15 государств, в которых подобные стартапы получили финансирование в 2016 году. «В Qoderoom мы делали систему лояльности для VISA, проект системы документооборота, логистические проекты. В том числе в этих решениях мы применяем ИИ. Кроме того, на украинском рынке скоро появятся продукты украинских брендов, которые в своих мобильных приложениях будут использовать ИИ, мы работаем сейчас над такими. В BanQ Systems мы внедряем компоненты ИИ, связанные со скорингом и определением рисков в кредитовании», – рассказывает Максим.

Украинская BICA Labs изучает возможности построения новых когнитивных архитектур и создания более эффективных технологий в области ИИ. Один из прошлых проектов – предсказание развития патологии на основании анализа генотипа человека. Еще один – это computer vision: распознавание микроскопических фотографий срезов тканей.

Проекты в области Data Science создаются и на базе украинского инкубатора Cloud Business City, реализованного Microsoft. Проект Nexticy позволяет создавать любые формы отчетов на компьютере, делиться ими с коллегами посредством привычных инструментов и анализировать содержимое отчетов благодаря системе фильтров и инструментами для визуализации данных. Elaborate Cloud – это SaaS-платформа, основанная на технологиях машинного интеллекта, предназначенная для сбора данных о поведении клиентов и умном заимствовании контента, а также системы рекомендации контента.

Иван Шестаков, маркетинг-директор Megogo, рассказал, что после внедрения персонализированной выдачи пользователи стали отмечать, что библиотека сервиса пополнилась интересными видео, хотя глобально поменялось только то, что они видят в первую очередь.

С чего начать?
В 2016 году Google, Facebook, Amazon, IBM и Microsoft, объединились для работы над развитием искусственного интеллекта в некоммерческий проект. Кроме того, каждая из компаний открыла собственные инструменты для разработок в области интеллекта.

Так, например, облако Microsoft Azure позволяет подключать через открытый API когнитивные сервисы – такие как компьютерное зрение, распознавание текста, лиц, эмоций и видео, основанные на искусственном интеллекте. В числе встроенных возможностей – распознавание голоса (и кто владелец этого голоса), обучение языку (позволяет учить программы новым командам от пользователя), переводы между языками, изучение языковых особенностей, рекомендательные сервисы, сервисы поиска по изображениям и видео, создание ботов, распознавание биометрических данных.


Благодаря тому, что инструменты стали общедоступны, мы пришли сейчас к буму стартапов в области ИИ и больших данных. И этот бум подтверждает тот факт, что отказ от использования этих технологий отбрасывает компанию далеко назад и делает ее уязвимой перед конкурентами.

Простота в подключении искусственного интеллекта к проектам снижает требования к знаниям разработчика в области программирования и открывает перед ними новые вызовы. Тут важно умение анализировать результаты, получаемые от искусственного интеллекта, и постоянно улучшать точность его работы. Герой нового времени – человек, который владеет базовыми навыками программирования и в совершенстве знает математику и методы анализа.

Максим Орловский так оценивает требования к кандидату на должность специалиста по машинному обучению и Data Scientist в проекте: «В первую очередь они должны разбираться в математике: мат. статистике, матричной алгебре, дифференциальных уравнениях. Хорошо владеть технологиями Big Data и Cloud Computing. Должны уметь программировать на таких языках, как Python, Java, или С++, а еще лучше владеть — специальными языками, которые набирают популярность в области Machine Learning, например, Julia.

Но самое важное для специалистов в области машинного обучения — быть хорошо знакомыми со специализированными фреймворками и инструментами, которые существуют на текущий момент (TensorFlow, Torch, Theano, CNTK). Задача – не написать код, а подобрать корректную архитектуру обработки данных и оптимальные методы обучения из числа существующих. Для специалиста Data Scientist важно найти правильный метод, который позволит обработать те данные, которые есть. И обучить нейросеть. Вы никогда не найдете сразу правильное решение. Нужно двигаться итеративно, создавать архитектуру, пробовать, видеть низкий результат, уметь понять, почему результат низкий и корректировать метод
».

К сожалению, этим профессиям пока практически не учат в университетах. На весь мир найдется несколько мест, где ее можно получить. В Стэнфорде и Массачусетсе, в частности. Но входной барьер в профессию для людей с аналитическим складом ума и хорошей математической школой невысок – достаточно получить дополнительные прикладные знания и дальше учиться на своем опыте и ошибках. Кроме того, важно разобраться в бизнес-процессах компании.

Сейчас, чтобы освоить ценную профессию, специалистам с навыками программирования стоит углубить свои знания в математике и статистике, математикам – наоборот, приобщиться к программированию – так советует поступать профессор бизнес-аналитики в IE Business School Джозеп Курто. В больших проектах Data Science может заниматься целая команда, в которой есть свои математики, программисты и люди, которые хорошо ориентируются в бизнес-процессах.

Как и любая новая профессия, Data Scientist еще приобретет популярность в мире. Но к тому моменту как это произойдет, конкуренция в области проектов с использованием искусственного интеллекта достигнет небывалых высот, поэтому начинать работу в этом направлении стоит уже сейчас, не игнорируя те возможности, которые открыли технологии.

Узнать больше о работе с данными можно на серии мероприятий Data Science, машинное обучение и нейросети, которые пройдут в Киеве, Одессе и Львове 9, 11 и 12 декабря соответственно. Участие в мероприятиях бесплатное при условии предварительной регистрации.

© 1999—2016 AIN.UA
adv@ain.ua
Made on
Tilda