Google додає ШІ до пошуку та покращує чат-бот Gemini. Що презентувала компанія на I/O 2024

Alphabet, материнська компанія Google, на своєму щорічному заході для розробників I/O розповіла про низку нових продуктів та оновлень. Зокрема, було представлено покращену версію чат-бота Gemini та оновлення для пошукової системи Google, що є частиною боротьби з конкурентами в галузі ШІ.

Головні оновлення Google

Google презентувала оновлену пошукову систему, яка надаватиме перевагу відповідям, створеним штучним інтелектом, над посиланнями на сайти. Анонсоване оновлення вже цього тижня запрацює спочатку для США, перш ніж запроваджувати цю функцію в інших частинах світу. Сотні мільйонів користувачів періодично бачитимуть на першій сторінці результатів пошуку розмовні резюме, створені штучним інтелектом компанії.

Meet the next era of Google Search. With our latest AI advancements, you’ll be able to ask whatever’s on your mind, and Search will be there to help in ways you never imagined. #GoogleIO

Learn more → https://t.co/xyHY5BQZ4j pic.twitter.com/wY1Ww1RvAs
— Google (@Google) May 14, 2024

З’явилася «полегшена» версія до родини моделей штучного інтелекту Gemini 1.5 під назвою Flash, який працює швидше та дешевше.

Google представила Gemma 2.0, відкриті моделі наступного покоління. Gemma 2.0 розроблена для виняткової продуктивності та ефективності й буде доступна в різних розмірах. Родина Gemma також включатиме PaliGemma, першу візуально-мовну модель Google, натхненну PaLI-3.

Google також анонсувала Gemini Live, яка незабаром стане доступна передплатникам Gemini Advanced. Користувачі зможуть під час розмові з Gemini вибрати голос для відповіді, переривати відповідь уточнювальними питаннями, а сам помічник адаптується до манери спілкування.

Проєкт Astra — прототип, який може вести розмову з користувачами про все, що вони бачать на камері смартфона в режимі реального часу. Під час демонстраційного відео, показаного на Google I/O, користувач використовував його для ідентифікації динаміка та пошуку окулярів, які він залишив в іншій кімнаті.

We watched #GoogleIO with Project Astra. 👀 pic.twitter.com/bGgSRGNwvu
— Google DeepMind (@GoogleDeepMind) May 14, 2024

Компанія Google прагне скласти конкуренцію Sora від OpenAI за допомогою Veo, моделі штучного інтелекту, здатної генерувати відеоролики в роздільній здатності 1080p тривалістю понад хвилину на основі текстового опису. Veo може відтворити різні візуальні стилі, зокрема пейзажі та таймлапси, а також редагувати вже створений матеріал.

🎥Introducing Veo, our new generative video model from @GoogleDeepMind.

With just a text, image or video prompt, you can create and edit HQ videos over 60 seconds in different visual styles. Join the waitlist in Labs to try it out in our new experimental tool, VideoFX #GoogleIO pic.twitter.com/RnMsWu9s1q
— Google (@Google) May 14, 2024

Захист авторських прав на ШІ-зображення за допомогою SynthID. Це інструмент для нанесення водяних знаків на зображення, створені штучним інтелектом. Google планує розширити його застосування на текстові та відео формати в майбутньому.

Google анонсувала Imagen 3 — генеративну ШІ-модель для створення зображень: вона краще розуміє текстові запити, менше помиляється і дозволяє створювати чіткіший текст на зображеннях.

SynthID will now expand to 2️⃣ new modalities: text and video.

While this tool isn’t a silver bullet for identifying AI-generated content, it’s an important building block for helping millions of people understand the provenance of synthetic content. → https://t.co/CS0s9NaAfX pic.twitter.com/BHVhMsa1cO
— Google DeepMind (@GoogleDeepMind) May 14, 2024

Нова модель штучного інтелекту LearnLM призначена для того, щоб допомагати студентам у навчанні. Вона може вести бесіди та пропонувати навчальні матеріали.

Google представила функцію, яка попереджатиме користувачів про потенційні шахрайства під час телефонної розмови, наприклад, якщо вас попросять ввести номер платіжної картки. Ця функція, яка буде вбудована в майбутню версію Android, використовує Gemini Nano, найменшу версію генеративного ШІ від Google.

Thanks to Gemini Nano, @Android will warn you in the middle of a call as soon as it detects suspicious activity, like being asked for your social security number and bank info. Stay tuned for more news in the coming months. #GoogleIO pic.twitter.com/wtc3rrk0Gc
— Google (@Google) May 14, 2024

У Google Фото влітку з’явиться новий помічник Ask Photos, який може переглянути ваш архів в галереї, щоб знайти відповідь на запитання, наприклад, «який у мене номерний знак?».

Компанія представила шосте покоління тензорного процесорного блоку (TPU), який має надати їй та її клієнтам Google Cloud альтернативу потужним процесорам лідера галузі Nvidia. Новий чип буде доступний для хмарних клієнтів компанії наприкінці 2024 року.

Конкуренція з OpenAI

Презентація продуктів відбулася наступного дня після того, як OpenAI представила свою нову модель штучного інтелекту GPT-4o. Компанія показала, як ChatGPT може озвучувати відповіді з людською інтонацією на будь-який письмовий чи візуальний запит.

Деякі з функцій, представлених Google, схожі на можливості ChatGPT, що підкреслює жорстку конкуренцію між двома розробниками ШІ.

OpenAI запустила оновлену ШІ-модель GPT-4o: працює з аудіо, відео та текстами в реальному часі

Google

Google додає ШІ до пошуку та покращує чат-бот Gemini. Що презентувала компанія на I/O 2024

Головні оновлення Google

Конкуренція з OpenAI

Читати більше