Microsoft викотила останню версію своєї невеликої мовної моделі Phi-3.5. Вони розроблені, щоб бути високопродуктивними та економічними, перевершуючи моделі подібних і більших розмірів за різними бенчмарками в мові, міркуванні, кодуванні та математиці.
Як пише Tom's guide, ця нова версія є значним оновленням попереднього покоління, перевершуючи менші моделі від провідних гравців, таких як Google, OpenAI, Mistral і Meta, за кількома важливими показниками.
Phi-3.5 доступна у версіях з 3,8 млрд, 4,15 млрд та 41,9 млрд параметрів, кожна з яких призначена для базового/швидкого міркування, більш потужного міркування та завдань з аналізу зображень і відео відповідно.
Усі три моделі можна безкоштовно завантажити та використовувати за допомогою локального інструменту.
Модель особливо добре показала себе в міркуваннях, поступаючись лише GPT-4o-mini серед провідних малих моделей. Вона також добре впоралася з математичними тестами, значно перевершивши Llama та Gemini.
Congrats to @Microsoft for achieving such an incredible result with the just released phi 3.5: mini+MoE+vision 🤯
— Rohan Paul (@rohanpaul_ai) August 20, 2024
Phi-3.5-MoE beats Llama 3.1 8B across the benchmarks
Of course, Phi-3.5-MoE a 42B parameter MoE with 6.6B activated during generation
And Phi-3.5 MoE outperforms… pic.twitter.com/9d4h5Q5p7Z
Наскільки добре працює Phi-3.5?
Автор тексту встановив і запустив меншу версію Phi-3.5 з 3,8 млрд параметрів на своєму ноутбуці і виявив, що вона не така вражаюча, як показали бенчмарки. Хоча вона була докладна у своїх відповідях, але часто формулювання залишало бажати кращого, і вона мала проблеми з деякими простими тестами.
Наприклад, вона не змогла виконати базове завдання із написання короткої історії з одного речення, де кожне наступне слово починається з останньої літери попереднього.
Автор зазначає, що не випробував більшу версію Phi-3.5, але за чутками, вона вирішує деякі проблеми меншої версії. За результатами бенчмарків, її продуктивність може бути на рівні з OpenAI GPT-4o-mini, який доступний у безкоштовній версії ChatGPT.
Одна з сильних сторін Phi-3.5 полягає в її ефективності при виконанні складних завдань у різних мовах, особливо в галузі STEM і соціальних наук.