ChatGPT зможе працювати з відео вже цього року

ChatGPT навчиться працювати з відео. Про це повідомив генеральний директор OpenAI Сем Альтман у нещодавньому подкасті Unconfuse Me, спілкуючись зі співзасновником Microsoft Біллом Гейтсом. Основне з нього зібрав Mashable.

Альтман та Гейтс обговорили майбутнє чат-боту та його оновлення – GPT-5. Альтман заявив, що нове покоління мовної моделі, яка лежить в основі ChatGPT, стане «повністю мультимодальною» та підтримуватиме мову, зображення, код і відео.

Поточна версія ChatGPT вже працює із зображеннями та звуком, але з відео спектр того, що може робити генеративний штучний інтелект, значно розшириться.

Системи штучного інтелекту, зокрема ChatGPT, здатні аналізувати відео, зможуть підвищити надійність роботи і створити чат-бота, який усвідомлює контекст. Проте новою версією легко зловживати, особливо в контексті конфіденційності, де OpenAI раніше вже мала проблеми. У червні був поданий позов, в якому стверджувалося, що моделі OpenAI були навчені на крадених даних.

The New York Times також позивається до суду проти OpenAI та Microsoft за порушення авторських прав. На думку представників видання, статті використовують для тренування штучного інтелекту.

Компанія також веде перемовини з представниками ЗМІ, пропонуючи виплати в обмін на використання їхніх новин для використання у навчанні моделей.

Коли вийде GPT-5?

За словами Альтмана, користувачі можуть очікувати на GPT-5 вже цього року.

Альтман чітко дав зрозуміти, що сподівається розширити можливості ChatGPT. Така стрімка швидкість розвитку, за чутками, стала однією з причин його короткочасного звільнення з посади генерального директора некомерційною радою директорів OpenAI через побоювання щодо етичних дилем і потенційних далекосяжних наслідків цих технологій.

Microsoft, компанія, яка стала джерелом величезного капіталу Гейтса, вклала мільярди в OpenAI, інтегрувавши її моделі у свій продукт Copilot.

Під час розмови з Гейтсом Альтман зазначив, що нинішні взаємодії ChatGPT «є найдурнішою з тих моделей, які коли-небудь будуть». Тож, за його словами, головною метою GPT-5 є покращення логіки й надійності – особливо на тлі відомих «галюцинацій» програми, коли чат-бот впевнено стверджує неправдиву інформацію.