Apple вперше показала, як працює над власною моделлю штучного інтелекту. Інженери компанії опублікували дослідницьку статтю, у якій детально описується розробка нової генеративної моделі ШІ під назвою MM1, здатної працювати з текстом і зображеннями.
Що таке MM1 та що він може
MM1 — це мультимодальна велика мовна модель (MLLM), яка навчається на зображеннях та тексті. Її назва не пояснюється, але може означати MultiModal 1 – пишуть журналісти Wired, які проаналізували статтю Apple.
- Це сімейство моделей ШІ, найбільша з яких досягає 30 мільярдів параметрів. Вважається, чим більша кількість, тим складніша модель – тобто може обробляти більше завдань та видавати точніші результати.
- У статі йдеться, що ШІ відповідає на запитання про фотографії та демонструє ті навички, які показує ChatGPT та інші схожі чатботи. Коли MM1 дали фото ресторанного столу з парою пляшок пива та зображення меню і спитали, скільки хтось має заплатити за все пиво – вона правильно підрахувала вартість.
- MM1 схожий на останні моделі ШІ від інших техногігантів, таких як Llama 2 від Meta з відкритим кодом і Gemini від Google.
- Моделі цього типу можна використовувати для чатботів або створення «агентів» для вирішення завдань, використовуючи комп’ютерні інтерфейси або сайти. Це значить, що MM1 потенційно може використовуватися у продуктах Apple, наприклад Siri.
Як Apple може застосувати MM1
Професорка Бостонського університету Кейт Саєнко вважає, що MM1 – відносно невелика модель за кількістю «параметрів». Така модель може полегшити інженерам Apple експериментувати з різними методами навчання та удосконаленнями, перш ніж розширювати масштаб.
За її словами, з дослідницької роботи важко зробити якісь висновки про плани компанії. Але вона припускає, що MM1 може стати кроком до створення «якогось типу мультимодального помічника, який може описувати фотографії, документи чи діаграми та відповідати на запитання про них».
Чому це важливо
У розробці генеративного ШІ Apple значно відстає від своїх конкурентів: у Google є свій Gemini, в OpenAI – ChatGPT, Microsoft має Copilot, Meta працює над Llama тощо. Щоб наздогнати техногігантів, Apple змінила вектор розвитку та навіть відмовилась від довготривалого проєкту зі створення власного автономного електромобіля.
Генеральний директор Apple Тім Кук заявляв, що Apple інвестує в штучний інтелект «величезну» кількість часу і зусиль, а подробиці розкриють пізніше. Прийдешня iOS 18 може стати найбільшим оновленням програмного забезпечення в історії Apple з кількома функціями штучного інтелекту.
Проте чий саме ШІ використають – поки не ясно. Раніше ми писали, що Apple та Google ведуть перемовини про інтегрування генеративного ШІ Gemini у нові функції iPhone, про це так само вони вели переговори з OpenAI. Прояснитися ситуація може після щорічної Всесвітньої конференції розробників.