Google випустила нову версію свого сімейства моделей штучного інтелекту Gemini 2.0, здатну виконувати різноманітні завдання, повідомляється в блозі компанії.
Gemini 2.0 стала потужнішою за попередню версію. забезпечуючи однакову ефективність і швидкість за менших витрат. Крім поліпшення старих функцій, модель отримала нові мультимодальні можливості. Тепер вона здатна нативно генерувати аудіо та зображення, а також працювати з декількома типами даних одночасно.
Як і слід було очікувати, Flash пропонує значно кращу продуктивність, ніж його попередник. Наприклад, він отримав 63% балів у тесті HiddenMath, який перевіряє здатність моделей штучного інтелекту розв'язувати математичні задачі змагального рівня. Для порівняння, Gemini 1.5 Flash отримав 47,2% у цьому ж тесті.
Одним із ключових нововведень є інтеграція у Gemini 2.0 ШІ-агентів. Цей тип ШІ зможе самостійно виконувати завдання від імені користувача, наприклад, допомагати в навігації, пошуку інформації та навіть грати у відеоігри.
Наприклад, Project Astra — це візуальна система, яка може розпізнавати об'єкти, допомагати орієнтуватися в просторі та навіть знаходити загублені речі. Astra може спілкуватися кількома мовами та навіть перемикатися між ними на льоту.
Іншим новим інструментом є Project Mariner — розширення для Chrome, яке самостійно працює з веббраузером. Для розробників створили агента Jules, який допомагає шукати та виправляти помилки в коді, агент для геймерів здатний аналізувати екран і покращувати продуктивність.
Google акцентує на заходах безпеки, зокрема на тестуванні агентів у захищених середовищах. Наприклад, агент для браузера може працювати тільки в активній вкладці і вимагає підтвердження для важливих дій на кшталт покупок.
Хоча Gemini 2.0 все ще перебуває на етапі експериментального використання, користувачі вже можуть спробувати її через вебверсію Gemini. Компанія планує розширити доступність моделі на інші платформи та послуги, включаючи пошукову систему Google Search, робочий простір Workspace та інші, вже наступного року.
Компанія також прагне зробити цю модель доступною для розробників, щоб вони могли створювати на її основі застосунки та інструменти.