Microsoft представила Phi-3.5 — мала мовна ШІ модель перевершує Gemini та GPT-4o

Microsoft викотила останню версію своєї невеликої мовної моделі Phi-3.5. Вони розроблені, щоб бути високопродуктивними та економічними, перевершуючи моделі подібних і більших розмірів за різними бенчмарками в мові, міркуванні, кодуванні та математиці.

Як пише Tom's guide, ця нова версія є значним оновленням попереднього покоління, перевершуючи менші моделі від провідних гравців, таких як Google, OpenAI, Mistral і Meta, за кількома важливими показниками.

Phi-3.5 доступна у версіях з 3,8 млрд, 4,15 млрд та 41,9 млрд параметрів, кожна з яких призначена для базового/швидкого міркування, більш потужного міркування та завдань з аналізу зображень і відео відповідно.

Усі три моделі можна безкоштовно завантажити та використовувати за допомогою локального інструменту.

Модель особливо добре показала себе в міркуваннях, поступаючись лише GPT-4o-mini серед провідних малих моделей. Вона також добре впоралася з математичними тестами, значно перевершивши Llama та Gemini.

Congrats to @Microsoft for achieving such an incredible result with the just released phi 3.5: mini+MoE+vision 🤯

Phi-3.5-MoE beats Llama 3.1 8B across the benchmarks

Of course, Phi-3.5-MoE a 42B parameter MoE with 6.6B activated during generation

And Phi-3.5 MoE outperforms… pic.twitter.com/9d4h5Q5p7Z
— Rohan Paul (@rohanpaul_ai) August 20, 2024

Наскільки добре працює Phi-3.5?

Автор тексту встановив і запустив меншу версію Phi-3.5 з 3,8 млрд параметрів на своєму ноутбуці і виявив, що вона не така вражаюча, як показали бенчмарки. Хоча вона була докладна у своїх відповідях, але часто формулювання залишало бажати кращого, і вона мала проблеми з деякими простими тестами.

Наприклад, вона не змогла виконати базове завдання із написання короткої історії з одного речення, де кожне наступне слово починається з останньої літери попереднього.

Автор зазначає, що не випробував більшу версію Phi-3.5, але за чутками, вона вирішує деякі проблеми меншої версії. За результатами бенчмарків, її продуктивність може бути на рівні з OpenAI GPT-4o-mini, який доступний у безкоштовній версії ChatGPT.

Одна з сильних сторін Phi-3.5 полягає в її ефективності при виконанні складних завдань у різних мовах, особливо в галузі STEM і соціальних наук.

Microsoft випустила нові ШІ-моделі Phi-3.5, які перевершують аналоги від Google та OpenAI

Наскільки добре працює Phi-3.5?

Читати більше