Data Science, то есть наука о работе с данными, это не просто новое модное слово в мире IT. Это то, что изменит мир программирования, бизнеса и даже потребителей не менее, чем в свое время его изменило изобретение парового двигателя и персонального компьютера. На самом деле, Data Science уже его меняет, свидетельство тому – множество стартапов в области больших данных и искусственного интеллекта.

Редакция AIN.UA объясняет на картинках, что же это такое и каким образом меняет наш мир. Помогает нам разобраться в этой теме Максим Орловский, ментор Cloud Business City (первый виртуальный бизнес-центр в облаке, который развивает Data Science проекты), PhD, MD, руководитель BICA Labs, CEO Кодрум, сооснователь BanQ Systems и спикер на грядущей конференции «Data Science, машинное обучение и нейросети». Максим изучает вопросы искусственного интеллекта и сопутствующих ему технологий с 1998 года.

Материал подготовлен при поддержке «Майкрософт Украина»
Что такое Data Science?
1
Data Science — это наука о методах анализа данных и извлечения из них ценной информации, знаний. Она тесно пересекается с такими областями как машинное обучение (Machine Learning) и науку о мышлении (Cognitive Science и, конечно же, технологиями для работы с большими данными (Big Data).
2
За время массового распространения технологий человек нагенерировал огромное количество данных. Такое, которое он не способен обработать и визуализировать. Данные о наших звонках и перемещениях, поведении в интернете, предпочтениях в магазинах, антропогенных изменениях в ландшафте, климатических процессах и многих других вещах. Это все — большие данные, Big Data. И из них при правильной обработке можно извлечь большую пользу.
3
Во все времена ранее компьютеры получали новые возможности посредством программирования – человек создавал для машины понятные алгоритмы работы, которые приводили к ожидаемому результату. Этот подход устарел.
4
Для эффективной работы с большими данными нужен другой, им стало машинное обучение. В этом случае человек только дает компьютеру какие-то вводные, но результаты работы такого алгоритма не детерменированы человеком. Человек определяет способ обучения машины, но машина учится сама; сама приходит к тем или иным ответам и анализирует информацию. Это похоже на то, как учимся мы с вами. Машинное обучение — это не только искусственный интеллект. К этой сфере относятся генетические и эволюционные алгоритмы, и более простые задачи, связанные с кластерным анализом, например.

Наконец, Cognitive Science. Это междисциплинарная наука, изучающая, механизмы познания и мышления. Результаты таких исследований в первую очередь ложатся в основу разработки различных подходов к созданию искусственного интеллекта.

5
Шутка. Конечно, мозг человека и ИИ работают примерно так.
Причем тут нейросети?
1
Нейросети — это самообучающиеся сети (то есть технология Machine Learning), устроенные по образу и подобию человеческого мозга, которые используют Big Data как материал, на котором они учатся. То есть – это продукт Data Science. Самый перспективный для человечества сейчас.
2
Нейросети пытаются воспроизвести отдельные аспекты устройства нейросетей в мозге человека. Поэтому так и называются. Но полностью его повторить пока не могут — мощности еще не те. По оценкам Максима Орловского, до момента, когда силы сравняются, уйдет 30-50 лет.
3
Искусственный интеллект разделяют на специализированные формы и общий интеллект, сравнимый с интеллектом человека или превосходящий его. Нейросети могут быть общего типа и специализированного.

Специализированные формы способны не только решать определенную задачу, но и делать это зачастую гораздо лучше человека. Вот они-то сейчас и набирают популярность и только в них есть толк при существующем уровне развития технологий.
4
Нейросети – это не что-то принципиально новое. Сама технология, подходы к проектированию и ключевые алгоритмы их обучения были разработаны еще в 50-60 годах прошлого века. Тем не менее, лишь в последние годы произошло сочетание ключевых факторов, позволивших ИИ сделать качественный скачек вперед: вычислительных мощностей, доступных наборов больших данных и хорошо проработанных фреймворков.
5
Нейросети уже можно применять практически везде. В области права – для поиска прецедентов (что особенно популярно в американской судебной системе). В финтехе — для анализа сделок, программы лояльности, надежности клиента и так далее. В логистике — для прогнозирования потребности в тех или иных продуктах. В медицине нейросети, обрабатывая огромные массивы данных, могут находить неожиданные факторы, влияющие на здоровье пациента, и точно диагностировать даже самые сложные заболевания.
6
Нейросети могут проявлять себя и в творческих задачах. Но знаменитые фильтры на изображениях – это побочный продукт, который появился в результате того, что разработчики пытались разобраться, как же работает алгоритм обучения нейросети. Он стал широкоизвестным среди массовой аудитории. Незаслуженно меньше говорится о том, что нейросети успели хорошо себя зарекомендовать в вопросах перевода, распознавания или анализа данных. Между тем, эти технологии уже можно использовать в проектах, подключая соответствующие функции через API – эту возможность предоставляют гиганты технологической индустрии.
7
Нейросети уже умеют рисовать картины в стиле известных художников — например проект «Новый Рембрандт», реализованный при поддержке Microsoft. Но вопрос о том, когда нейросети смогут создавать самостоятельные произведения искусства, остается открытым. Наверное, когда мощность искусственного интеллекта превысит человеческий.
Новые и старые профессии
1
Любая новая область деятельности порождает новые профессии. Специалист по работе с данными, Data Scientist, и специалист по машинному обучению – это новые самые завидные специалисты будущего. Они – не программисты. Это великолепные математики с большими кросс-дисциплинарными знаниями и суперспособностью к анализу, подкрепленной упорством – потому что шансы с первого раза найти идеальную формулу для обучения искусственного интеллекта близки к нулю. Они должны отыскивать среди всех существующих алгоритмов тот, который лучше подходит для решения задач проекта и понимать, когда что-то идет не так, что именно идет не так.
2
Data scientist понимает, в каком виде данные нужны компьютеру, и в его задачи входить обеспечить их (да, и такой нужен). Незаменимый помощник Data Scientist – специалист по машинному обучению, который выбирает архитектуру и обучающие алгоритмы, для работы с этими данными.
3
Гиганты IT-индустрии открыли свои фреймворки, которые позволяют абстрагироваться от написания десятков тысяч строк кода и дают возможность создавать нейросети с базовыми знаниями языка программирования. Так, например, в облаке Microsoft Azure есть все инструменты для работы с искусственным интеллектом. При этом чтобы начать использовать его в своем стартапе, не нужно покупать мощное железо и дорогостоящее ПО – инструменты доступны в формате «продукт как услуга». Их просто нужно подключить в облаке.
Почему Data Science – это важно?
1
Data Science и технологии искусственного интеллекта позволяет больше узнать о том, что предпочитает человек (собирая и анализируя данные), стать ближе к нему, создавая более персонализированные интерфейсы (например, отбирая предложения в соответствии с тем, что ранее было интересно пользователю, отправляя персонализированные рассылки) и т.д.
2
Для IT-отрасли возможность работы с данными представляет собой такой большой качественный скачок, что новые стартапы нельзя представить себе без применения этой технологии – это все равно что продолжать использовать лошадей для перевозки в эпоху расцвета автомобилей. А ведь сам термин IT-стартап подразумевает инновационность.
3
Автоматизация, внедрение новых возможностей персонализации позволяет повысить маржинальность бизнеса. И если не сделать это самостоятельно, более технологичные конкуренты просто выдавят вас с рынка.
Так когда искусственный интеллект нас убьет?
Пока что можно говорить о том, что не скоро. В теории таким разрушительным мог бы быть общий искусственный интеллект, который бы стал сильнее человеческого. Но такой пока не создан.
Узнать больше о работе с данными, машинном обучении и нейросетях можно на серии мероприятий Data Science, машинное обучение и нейросети, которые пройдут в Киеве, Одессе и Львове 9, 11 и 12 декабря соответственно. Участие в мероприятиях бесплатное при условии предварительной регистрации.
© 1999—2016 AIN.UA
[email protected]
Made on
Tilda