Французький ШІ-стартап Mistral запускає нову відкриту мультимодальну модель Pixtral Large, яка має 124 мільярди параметрів. Вона створена на базі флагманської Mistral Large 2 та може розуміти документи, діаграми та звичайні зображення.
Pixtral Large можна спробувати через API або в le Chat. Для наукових цілей модель доступна за ліцензією Mistral Research License, а для комерційних — Mistral Commercial License.
Як показала себе Pixtral Large
Mistral стверджує, що у тесті MathVista, який оцінює складні математичні міркування над візуальними даними, модель випередила інші та досягла 69,4 %.
За допомогою ChartQA та DocVQA оцінили можливості міркування над складними діаграмами та документами, і Pixtral Large перевершила GPT-4o та Gemini-1.5 Pro.
Також модель продемонструвала конкурентні можливості на MM-MT-Bench, перевершуючи Claude-3.5 Sonnet (новий), Gemini-1.5 Pro і GPT-4o (останній).
Модернізація Mistral Large 2
Найкраща текстова модель компанії Mistral Large 2 також отримала покращення. Йдеться, що вона краще розуміє довгий контекст, має нову систему підказок та точніший виклик функцій.
«Модель підходить для використання в робочих процесах із пошуком та отриманням інформації (RAG), автоматизації завдань і взаємодії зі складними документами. Це робить її корисною для корпоративних цілей, як-от дослідження та обмін знаннями, автоматизація роботи, семантичний аналіз документів і покращення обслуговування клієнтів», — кажуть у Mistral.
Нагадаємо, нещодавно французький стартап запустив API модерації контенту для користувачів. Компанія також використовує його для модерування в своєму Le Chat. А у вересні Mistral знизив ціни на всі продукти, презентував оновлену модель Mistral Small корпоративного класу та додав у le Chat функцію обробки зображень.