OpenAI, компанія-розробник ChatGPT, провела серію передріздвяних заходів протягом наступних 12 днів, під час яких щодня презентуватимуть нові функції та продукти штучного інтелекту. Подія стартувала 5 грудня о 10 ранку за тихоокеанським часом.
Компанія обіцяла як масштабні запуски, так і менш значні, але цікаві оновлення. У своєму дописі на платформі X (колишньому Twitter) генеральний директор OpenAI Сем Альтман зазначив:
«Щодня у прямому ефірі ми будемо презентувати нові продукти чи демо — серед них як масштабні запуски, так і приємні дрібниці. У нас є що показати, сподіваємося, вам сподобається! Щасливого Різдва».
Хоча OpenAI не розкриває деталей, спільнота очікує, що серед новинок будуть представлені довгоочікуваний інструмент перетворення тексту у відео Sora та нова модель для покращеного логічного мислення серії o1. Серед менших анонсів можна очікувати новий голос ChatGPT у стилі Санти та значок у вигляді сніжинки.
AIN.UA розповідає, які новинки презентували.
День перший
OpenAI відкрила свій так званий адвент календар із масштабного оновлення моделі логічного мислення o1 і запуску нового тарифного плану ChatGPT Pro.
Модель o1, відома під кодовою назвою Strawberry, вийшла з попереднього доступу і стала доступною для користувачів тарифів ChatGPT Plus і Team, а з наступного тижня її зможуть використовувати клієнти Enterprise та Edu. Порівняно з o1-preview, нова версія швидша, потужніша та точніша, краще справляється з кодуванням, математикою та обробкою зображень.
Також OpenAI представила тариф ChatGPT Pro за $200 на місяць. Він містить необмежений доступ до o1, GPT-4o, Advanced Voice mode, а також ексклюзивну версію o1 (pro mode), яка використовує більше обчислювальних ресурсів для розв'язання складних задач.
Попередній тариф Plus залишається доступним за $20 на місяць (для українців ціна на нього у 2025 році зросте до $24), пропонуючи ранній доступ до нових функцій і всі моделі, крім потужнішої версії o1.
Компанія також анонсувала грантову програму ChatGPT Pro Grant Program для підтримки медичних досліджень, з подальшим розширенням на інші галузі.
Це лише початок різдвяної серії OpenAI, що обіцяє ще більше новинок найближчими днями.
День другий
На другий день святкового заходу компанія анонсувала розширення своєї дослідницької програми reinforcement fine-tuning. Ця ініціатива дозволяє розробникам і дослідникам налаштовувати моделі штучного інтелекту для вирішення складних завдань у вузьких галузях із підвищеною точністю.
Що таке reinforcement fine-tuning?
Це метод, який дає змогу розробникам впливати на поведінку ШІ-моделі, задаючи конкретні завдання та оцінюючи результати. Завдяки цьому зворотному зв’язку модель покращує свої міркування та стає точнішою у вирішенні подібних викликів у майбутньому.
Наприклад, для навчання моделі аналізу юридичних документів можна надати приклади текстів, оцінюючи відповіді штучного інтелекту. Так модель ефективніше засвоїть навички узагальнення та інтерпретації юридичної мови. Цей підхід відкриває широкі можливості для використання ШІ у спеціалізованих галузях, таких як медицина, фінанси чи наукові дослідження.
Хто може долучитися
OpenAI відкрила програму для науково-дослідних інститутів, університетів і підприємств, які працюють над вузькими, чітко визначеними завданнями, що можуть отримати користь від допомоги ШІ.
День третій
Найочікуваніший з анонсів під час 12-денного марафону релізів компанії. OpenAI нарешті представила свою нову модель штучного інтелекту Sora, яка перетворює текст у відео.
Our holiday gift to you: Sora is here. https://t.co/UhdmYuGHtT pic.twitter.com/ljoruQsfO0
— OpenAI (@OpenAI) December 9, 2024
OpenAI вперше продемонструвала Sora в лютому цього року, але зараз модель стала доступною для ширшого кола користувачів.
Що нового у цьому релізі
Основна функція Sora — створення відео за простими запитами — залишилася незмінною, але OpenAI значно покращила швидкість і зменшила вартість використання моделі. Додали також кілька нових функцій, серед яких виділяються дві:
- Storyboard: Ця функція дозволяє створювати декілька відео та об’єднувати їх у єдиний ролик за допомогою інтерактивної шкали часу, як у професійних редакторах відео (наприклад, Adobe Premiere Pro).
- Стрічка творчості: Користувачі можуть публікувати у свого роду творчій галереї свої відео, створені у Sora, переглядати приклади інших, бачити запити, за якими створені відео, і модифікувати їх для власних потреб.
Користувачі можуть створювати відео за текстовими запитами, змінювати стиль роликів за допомогою інструмента Remix і об’єднувати кліпи з функцією Storyboard. Sora також пропонує готові стилі. Відео можна обрізати, повторювати створені відео та обирати з трьох форматів: вертикальний, горизонтальний і квадратний.
Доступ до генерації відео через Sora мають користувачі платних підписок OpenAI:
- ChatGPT Plus ($20/місяць): Дозволяє створювати до 50 відео на місяць тривалістю до 5 секунд із роздільною здатністю до 720p.
- ChatGPT Pro ($200/місяць): Дає змогу створювати довші відеоролики тривалістю до 20 секунд із роздільною здатністю до 1080p, а також генерувати до п’яти варіацій одного запиту. Ліміт становить 500 відео на місяць.
Без підписки користувачі можуть лише переглядати стрічку творчості, не створюючи власних відео.
Sora працює як окремий продукт. Для доступу необхідно перейти на Sora.com і увійти у свій обліковий запис ChatGPT Plus або Pro.
День четвертий
На четвертий день святкових анонсів OpenAI представила оновлену функцію під назвою Canvas, яку запустила ще в жовтні. Її розробили переважно для завдань із програмування та написання текстів. Ця функція інтегрована безпосередньо в ChatGPT та відкривається в окремому вікні.
Інтерфейс Canvas працює як спільний документ, але замість співпраці з іншими людьми користувачі взаємодіють із ChatGPT. У цьому середовищі ChatGPT виступає в ролі редактора текстів або рецензента коду, надаючи рекомендації та зауваження безпосередньо у контексті всього проєкту.
Користувачі можуть знайти Canvas у нижньому меню в текстовому полі ChatGPT. Крім того, Canvas автоматично відкривається, якщо ChatGPT виявляє ситуацію, коли ця функція може бути корисною. Також можна вручну активувати Canvas через запит у чаті.
Окрім того, Canvas тепер доступний для всіх користувачів, включаючи безкоштовний рівень, через вебверсію та застосунок ChatGPT для Windows. Очікується, що скоро функція стане доступною і для macOS.
День п'ятий
На п'ятий день Сем Альтман і ще двоє представників команди OpenAI Мікдад Джаффер і Дейв Каммінгс у святкових светрах продемонстрували інтеграцію ChatGPT з Apple Intelligence для iOS та macOS, яку компанія Apple почала впроваджувати у свої пристрої.
Під час демонстрації Siri надавала відповіді, згенеровані ChatGPT, додаючи посилання для перегляду повних відповідей у застосунку ChatGPT.
Система працює за трьома основними напрямами: голосові команди Siri, Writing Tools для редагування тексту та візуальний інтелект через нову кнопку управління камерою на iPhone 16, яка відкриває візуальні функції ChatGPT.
Користувачі можуть отримати доступ до базових функцій ChatGPT без створення облікового запису, але вони можуть оплачувати розширені версії ChatGPT через Apple.
День шостий
На екваторі святкового марафону від OpenAI презентували те, що вперше показали ще у травні — розширений голосовий режим із відео.
Тепер ChatGPT може спостерігати за вами в реальному часі протягом розмови, створюючи відчуття, ніби ви спілкуєтеся з людиною через відеозв'язок. Як бонус, у грудні з'явився голос Санти, який, вочевидь, спілкується з британським акцентом.
Під час демонстрації OpenAI показала покращені можливості пам'яті ChatGPT для роботи з відео, мовленням і текстом. Наприклад, модель запам'ятала імена людей, яких бачила на камері.
Розширений голосовий режим є нативно мультимодальним, що дозволяє створювати природніші за тоном розмови, ніж у попередніх моделей. Крім відео, цей режим підтримує функцію демонстрації екрана, яка дає змогу показувати ваші застосунки для отримання допомоги.
Це дозволяє показувати будь-яку програму на телефоні, вибравши «поділитися екраном». Наприклад, ви можете відкрити повідомлення та попросити ChatGPT допомогти відповісти на нього. Модель навіть визначає, який саме застосунок відкритий.
Під час іншої демонстрації один з інженерів OpenAI показав набір для заварювання дрипів кави. ChatGPT визначив, що на співрозмовнику одягнений капелюх Санти, а також розпізнав кавовий дрипер і крок за кроком пояснив, як приготувати каву.
Функції відео та демонстрації екрана вже починають впроваджувати для платних підписників ChatGPT Plus і Pro. Корпоративні та освітні клієнти OpenAI отримають доступ до функції на початку наступного року. Голос Санти доступний всюди, де працює розширений голосовий режим.
День сьомий
На сьомий день анонсів OpenAI представила Projects – для впорядкування та керування чатами. Команда OpenAI назвала це оновлення дуже корисним, воно об’єднуватиме різні можливості ChatGPT в одному місці, зокрема Canvas.
Під час презентації демоверсії показали, як Projects можна використовувати для створення проєкту «Таємний Санта». Створили групу Secret Santa з учасниками та їхніми вішлістами, а потім попросили ChatGPT випадковим чином призначити їх одне одному. Потім попросили ChatGPT написати електронний лист для учасників.
В іншому прикладіли завантажили нотатки про різноманітну побутову техніку та використали ChatGPT, щоб запитати, коли варто змінити фільтр для води у своєму холодильнику. Це корисно, якщо ви дуже організовані. Доступ до Projects був відкритий користувачам ChatGPT Plus, Pro і Teams.
День восьмий
OpenAI зробила свою пошукову систему ChatGPT search доступною для всіх користувачів у всіх регіонах, де доступний ШІ-чат компанії. Цю систему вперше представили два місяці тому, але раніше нею могли користуватися лише передплатники ChatGPT Plus і Team, та корпоративні й освітні клієнти.
«Шукайте в інтернеті швидше і якісніше — тепер це доступно по всьому світу на сайті http://chatgpt.com, а також у наших мобільних і десктопних додатках для всіх зареєстрованих користувачів», — пише OpenAI.
ChatGPT search дає можливість знайти відповіді в інтернеті, але не покидаючи сам чат. Розробники дослухались до відгуків і покращили систему новими функціями. Тепер користуватись пошуком можна й під час голосової розмови.
Пошук можна почати з головної панелі. Наприклад, запитавши, що цікавого відбувається у якомусь місті. Далі штучний інтелект аналізує, чи треба для цього підключати інтернет. Однак можна увімкнути спеціальну кнопку, щоб він шукав інформацію в мережі за замовчуванням.
Далі він видає результати пошуку, трохи схожі на такі, як в Google. Вони дозволяють перейти на іншу вебсторінку та отримати більше інформації.
День дев’ятий
Дев’ятий день передріздвяних заходів OpenAI може сподобатися розробникам, адже сьогодні компанія «вручає подарунки» саме їм. Ось про що йдеться.
- OpenAI розгортає свою модель для міркування та розв’язання складних задач o1, тепер вона доступна для розробників на рівні використання 5 в API. Це наступниця моделі o1-preview, яку розробники вже використовували для різних завдань.
- o1 готова для різних сценаріїв, пропонуючи ключові функції: підтримку викликів функцій для підключення до API і зовнішніх даних, створення структурованих відповідей за власними JSON-схемами, налаштування тону та стилю через повідомлення для розробників, обробку зображень для наукових, виробничих і кодових задач, знижену затримку завдяки ефективнішому використанню токенів (на 60% менше).
- Окрім цього, вдосконалили Realtime API, який розробники використовують для голосових помічників, віртуальних репетиторів, ботів-перекладачів тощо. Нова підтримка WebRTC допоможе голосовим сервісам у режимі реального часу, використовуючи JavaScript для створення кращої якості звуку та корисних відповідей. OpenAI також оголосила про зниження цін на деякі послуги.
- Також представили два нових офіційних SDK для Go і Java в бета-версії, на додаток до вже наявних бібліотек для Python, Node.js і .NET. Мета: зробити OpenAI API простими у використанні незалежно від того, яка мова програмування обирається, кажуть у компанії.
День десятий
OpenAI хоче зробити свій штучний інтелект доступнішим для більшого кола людей. Вони розширили його на комп’ютери та телефони з різними операційними системами. А тепер зробили так, що ChatGPT можна подзвонити. Навіть зі стаціонарного телефону.
Його номер 1-800-242-8478, і на місяць дають 15 безплатних хвилин розмови. Проте поговорити по телефону зі штучним інтелектом OpenAI можна буде, тільки якщо ви живете у США.
Люди в інших країнах можуть зберегти цей номер і спілкуватися із ChatGPT через WhatsApp. Але поки що в ньому недоступні голосові розмови та аналіз фото, як в інших застосунках. Також ChatGPT не можна буде додати до групових чатів.
День одинадцятий
Минулого місяця OpenAI оновила ChatGPT для macOS, чат отримав можливість читати екранний вміст у деяких програмах. На 11 день заходів компанія розширила підтримку й на низку інших програм сторонніх розробників.
Відсьогодні на MacBook уже можна спробувати попрацювати разом із ChatGPT на таких програмах для кодування: BBEdit, MatLab, Nova, Script Editor, TextMate, Android Studio, AppCode, CLion, DataGrip, GoLand, IntelliJ IDEA, PHPStorm, PyCharm, RubyMine, RustRover, WebStorm, Prompt і Warp.
Також він тепер сумісний із Apple Notes, Quip та Notion. Чат «бачитиме», що ви вже зробили у цих програмах і зможе допомогти, наприклад, заповнити прогалини.
Можливо, пізніше відповіді ChatGPT не доведеться навіть копіювати зі спеціального вікна та вставляти у текст чи код, він робитиме це сам — таке покращення розробники запропонували прямо під час трансляції.
Серед цікавого — десктопна програма для MacOS підтримує й голосовий режим. Тобто працюючи у підтримуваних програмах можна не тільки спитати текстом, я поспілкуватися з ШІ стосовно своєї роботи.
Незабаром команда обіцяє зробити такі ж функції й для користувачів Windows. А ще OpenAI каже, що на 12 день слід чекати щось «суперспеціальне».
День дванадцятий
В останній день «святкових» анонсів OpenAI презентувала нові моделі логічного мислення o3 та o3-mini — наступників o1 і o1-mini, випущених раніше цього місяця. Цікаво, що компанія пропустила назву o2 через можливий конфлікт із британським телекомунікаційним провайдером O2.
OpenAI стверджує, що o3 показала надзвичайні результати в тестах продуктивності. Наприклад, вона перевершила попередника o1 на 22,8 процентних пунктів у кодуванні. Крім того, o3 набирає 96,7% на математичному тесті AIME 2024, не впоравшись лише з одним завданням. У тесті GPQA Diamond, що містить завдання з біології, фізики та хімії рівня PhD, модель набрала 87,7%, що значно перевищує результати людей.
o3 досягла 25,2% успішних рішень у тестах Frontier Math, де інші моделі не перевищували 2%. У тесті ARC-AGI вона утричі покращила показники o1, досягнувши 85%.
Cпочатку дві нові моделі будуть надані у користування стороннім дослідникам для тестування безпеки. Як очікується, o3-mini з’явиться до кінця січня 2025 року, а o3 незабаром після цього. Дослідників також закликають розробляти сценарії, що виходять за межі можливостей наявних моделей.
Як подати заявку на доступ до тестування o3 та o3-mini
Реєстрація вже відкрита на сайті OpenAI та триватиме до 10 січня 2025 року. Кандидати мають заповнити форму, вказавши зокрема фокус дослідження, минулий досвід, посилання на репозиторії у Github, а також вибрати, яку з моделей — o3 або o3-mini — вони хочуть протестувати, та для чого вони планують їх використовувати.
Анонс OpenAI відбувся наступного дня після запуску конкурентної моделі Gemini 2.0 Flash Thinking від Google. Обидві компанії змагаються за лідерство у створенні нових ШІ-рішень для науки, технологій і програмування, що вказує на нову фазу конкуренції в галузі штучного інтелекту.