У видавництві BookChef виходить український переклад книги Кай-Фу Лі «AI. Наддержави штучного інтелекту».
Автор наголошує, що з огляду на безпрецедентний розвиток штучного інтелекту помітні зміни відбудуться набагато раніше, ніж очікувало людство. Поки конкуренція між США і Китаєм набирає обертів, Кай-Фу Лі закликає обидві країни взяти на себе зобов’язання, передбачені технологічним розвитком.
AIN.UA публікує уривок з п’ятого розділу під назвою «Чотири хвилі штучного інтелекту».
Чотири хвилі штучного інтелекту
У 2017 році я вперше почув, як Дональд Трамп розмовляє китайською. Під час першої поїздки президента США до Китаю його виступ з привітанням, адресованим учасникам великої технічної конференції, транслювався на великий екран. Він почав свою промову англійською, а потім різко перейшов на китайську.
«Штучний інтелект змінює світ, — сказав він бездоганною китайською, але з типовим для Трампа норовом. — А розробки iFlyTek є справді фантастичними».
Президент Трамп, звісно, не розмовляє китайською. Але штучний інтелект дійсно змінює світ, і такі передові китайські компанії, як iFlyTek, прокладають шлях для цих змін. Навчивши свої алгоритми на основі вибірок із виступів президента Трампа, iFlyTek створила майже ідеальну цифрову модель його голосу: збігалося все — його інтонація, тональність та манери.
Потім цю вокальну модель переналаштували на китайську мову і продемонстрували всьому світу, як могла б звучати мова Дональда Трампа, якби він виріс в селі неподалік від Пекіна. Рух губ був не зовсім точно синхронізовано з китайськими словами, але досить правдоподібно для того, щоб обдурити випадкового глядача.
Президент Обама теж отримав сувенір від iFlyTek: це був відеозапис реальної прес-конференції, лише він говорив ідеальною мандаринською, зберігши при цьому свій професорський стиль вимови.
«За допомогою iFlyTek я вивчив китайську, — сказав Обама
кореспондентському корпусу Білого дому. — Мені здається, що я розмовляю китайською краще ніж Трамп. А ви як вважаєте?»
FlyTek може сказати своїм конкурентам те саме: ця китайська компанія здобула перемоги у низці престижних міжнародних конкурсів штучного інтелекту з розпізнавання та синтезу мовлення, розпізнавання зображень і машинного перекладу. В обробці природної мови (тобто здатності штучного інтелекту розуміти загальний зміст висловлювання) «другою мовою» компанії, тобто англійською, iFlyTek часто залишає позаду команди Google, DeepMind, Facebook і IBM.
Цей успіх прийшов не відразу. Ще 1999 року, коли я починав роботу
над проектом Microsoft Asia, деякий час, моїм найкращим помічником був обдарований юнак із докторським ступенем. Його звали Лю Цінфен. Він був із тих студентів, які після моєї лекції в Хефеї йшли з гуртожитку, щоб продовжити читати підручники при світлі вуличних ліхтарів.
Властиві йому працьовитість і творчий підхід до наукових досліджень робили його одним із найбільш перспективних молодих дослідників Китаю. Та коли ми запропонували йому ґрант і стажування в Microsoft із подальшим працевлаштуванням, Лю не погодився. Він хотів почати свою діяльність у компанії, яка здійснює розробки у сфері штучного інтелекту.
Я сказав, що визнаю його видатні дослідницькі здібності, але Китай занадто сильно відстав від таких американських гігантів в області розпізнавання мовлення, як компанія Nuance, і що в Китаї не так багато користувачів, яких могла б зацікавити ця технологія. Лю не повірив моїм словам і став засновником iFlyTek.
Минуло майже 20 років, він здобув десятки перемог на конкурсах в області штучного інтелекту, і зрештою iFlyTek значно перевершила Nuance і за технічними можливостями, і за ринковою капіталізацією, ставши найдорожчою в світі компанією, яка займається розпізнаванням мови.
Поєднання передових досягнень iFlyTek в розпізнаванні, перекладі й синтезі мови призведе до створення новаторських продуктів на основі штучного інтелекту, таких як навушники з синхронним перекладом, які миттєво перетворюють ваші слова і голос в вимову будь-якою мовою. Подібні продукти невдовзі зроблять революцію у міжнародних поїздках, бізнесі та культурі й забезпечать величезні запаси часу для творчості й креативних процесів.
Хвилі штучного інтелекту
Однак, це станеться не відразу. Повна революція потребує певного часу і складатиметься з чотирьох хвиль, тобто етапів впровадження штучного інтелекту. Першим світ підкорить штучний інтелект інтернету, потім штучний інтелект для бізнесу, потім настане черга для штучного інтелекту сприйняття і автономного штучного інтелекту. На кожному з цих етапів штучний інтелект буде захоплювати нові сфери повсякденного життя людей.
Перші дві хвилі — штучний інтелект інтернету і штучний інтелект для бізнесу вже охопили нас, майже невідчутно змінюючи цифровий і фінансовий світ.
Вони наполегливо привертають нашу увагу до інтернет-компаній, замінюють юристів середньої ланки алгоритмами, торгують акціями і діагностують захворювання.
Штучний інтелект сприйняття сьогодні діджиталізує наш фізичний світ, навчається розпізнавати обличчя, розуміти прохання і «бачити» все, що нас оточує. Ця хвиля обіцяє змінити наше сприйняття реальності й взаємодію з нею, розмиваючи межі між цифровим і фізичним світом.
Автономний штучний інтелект прийде останнім, але сильно вплине на наше життя. Як тільки самокеровані автомобілі заповнять вулиці, автономні дрони піднімуться в небо, а інтелектуальні роботи почнуть працювати на фабриках, вони змінять до невпізнання всі сторони нашого життя — від вирощування органічних овочів і фруктів до керування автомобілем і фастфуду.
Для кожної з цих хвиль потрібні різні види даних, і кожна з них дає Сполученим Штатам і Китаю шанс на лідерство. Китай може зайняти лідерські позиції в області штучного інтелекту в інтернеті й штучного інтелекту сприйняття, і, швидше за все, швидко наздожене Сполучені Штати в області автономного штучного інтелекту. Сьогодні штучний інтелект для бізнесу залишається єдиною ареною, де Сполучені Штати
безперечно зберігають своє лідерство.
Утім конкуренція з’являтиметься не лише в цих двох країнах. Послуги на основі штучного інтелекту вперше з’явилися на ринку в Сполучених Штатах і Китаї, але вони будуть поширюватися по всьому світу, причому цей процес вже широко розвернувся в країнах, що розвиваються. Такі компанії, як Uber, DiDi, Alibaba і Amazon, запекло конкурують за ринки, що формуються, але застосовують при цьому різні стратегії.
У той час як гіганти Кремнієвої долини приходять в нові країни зі своїми продуктами, інтернет-компанії Китаю, навпаки, інвестують у місцеві стартапи, які намагаються чинити опір тиску з боку США. Конкурентна боротьба, яка лише починається, помітно вплине на глобальний економічний ландшафт двадцять першого століття. Для того, аби зрозуміти, як вона розвиватиметься як всередині самих конкуруючих країн, так і за їх межами, ми повинні спочатку зануритися в кожну з чотирьох хвиль штучного інтелекту, які омивають їхні економіки.
Перша хвиля: штучний інтелект в інтернеті
Штучний інтелект в інтернеті вже, ймовірно, заліз в вашу голову, а якщо ні, то у ваш гаманець точно. Ви колись ловили себе на думці, що дуже довго дивитеся відео на YouTube, хоча не збиралися цього робити? Сайт із надприродною здогадливістю пропонує вам ролик за роликом, які ви просто не можете не побачити до того, як повернетеся до роботи? А Amazon, схоже, знає, що ви хочете купити, раніше, ніж ви встигнете про це подумати?
Якщо так, то ви вже користуєтеся перевагами штучного інтелекту в інтернеті (або вже стали його жертвою, залежно від того, як оцінюєте свій час і гроші). Перша хвиля штучного інтелекту почала підійматися майже 15 років тому і зміцніла приблизно 2012 року.
Штучний інтелект в інтернеті — це в основному рекомендаційні алгоритми: вони вивчають наші особисті уподобання, а потім пропонують контент, який нам підійде.
Ефективність цих механізмів залежить від даних, до яких вони мають доступ, і зараз у великих інтернет-компаніях в розпорядженні найбільші обсяги цифрових даних в світі. Але ці дані стають дійсно корисними для алгоритмів лише після того, як їх «маркують». Втім, як користувачам, вам не потрібно активно «маркувати» щось — оцінювати контент або прив’язувати до нього ключові слова.
Ярлики з’являються під час зіставлення частини даних із конкретним результатом: «купив» проти «не купив», «натиснув» проти «не натиснув», «подивився до кінця» проти «перейшов на інше відео». Ці маркування, тобто наші покупки, «лайки», перегляди або час перебування на конкретних сторінках, далі використовуються для навчання алгоритмів, щоб ті в свою чергу могли пропонувати нам відповідний контент.
У звичайного користувача з’являється відчуття, що інтернет «стає
кращим» — тобто дає йому те, чого він хоче, а його інтернет-залежність посилюється. Це ще один доказ сили штучного інтелекту: він використовує дані, щоб дізнатися про нас якомога більше, а потім оптимізує свої дії, пристосовуючись до наших бажань. Така оптимізація призводить до значного збільшення прибутку для інтернет-компаній, які заробляють гроші на наших натисканнях на клавіші: Google, Baidu, Alibaba, YouTube і їхніх аналогів з усього світу.
Використовуючи штучний інтелект в інтернеті, Alibaba рекомендує вам продукти, які ви швидше за все придбаєте, Google показує цільову рекламу, на яку ви обов’язково натиснете, а YouTube пропонує відеоролики, які вам захочеться переглянути.
Застосувавши ті самі методи в іншому контексті, компанія Cambridge Analytica використовувала дані Facebook, щоб краще вплинути на американських виборців під час президентської кампанії 2016 року. До речі, вважають, що саме Роберт Мерсер, засновник Cambridge Analytica, першим сказав: «Хороші дані — це коли ти маєш дуже багато даних».