Microsoft викотила останню версію своєї невеликої мовної моделі Phi-3.5. Вони розроблені, щоб бути високопродуктивними та економічними, перевершуючи моделі подібних і більших розмірів за різними бенчмарками в мові, міркуванні, кодуванні та математиці.

Як пише Tom's guide, ця нова версія є значним оновленням попереднього покоління, перевершуючи менші моделі від провідних гравців, таких як Google, OpenAI, Mistral і Meta, за кількома важливими показниками.

Phi-3.5 доступна у версіях з 3,8 млрд, 4,15 млрд та 41,9 млрд параметрів, кожна з яких призначена для базового/швидкого міркування, більш потужного міркування та завдань з аналізу зображень і відео відповідно.

Усі три моделі можна безкоштовно завантажити та використовувати за допомогою локального інструменту.

Модель особливо добре показала себе в міркуваннях, поступаючись лише GPT-4o-mini серед провідних малих моделей. Вона також добре впоралася з математичними тестами, значно перевершивши Llama та Gemini.

Наскільки добре працює Phi-3.5?

Автор тексту встановив і запустив меншу версію Phi-3.5 з 3,8 млрд параметрів на своєму ноутбуці і виявив, що вона не така вражаюча, як показали бенчмарки. Хоча вона була докладна у своїх відповідях, але часто формулювання залишало бажати кращого, і вона мала проблеми з деякими простими тестами.

Наприклад, вона не змогла виконати базове завдання із написання короткої історії з одного речення, де кожне наступне слово починається з останньої літери попереднього.

Автор зазначає, що не випробував більшу версію Phi-3.5, але за чутками, вона вирішує деякі проблеми меншої версії. За результатами бенчмарків, її продуктивність може бути на рівні з OpenAI GPT-4o-mini, який доступний у безкоштовній версії ChatGPT.

Одна з сильних сторін Phi-3.5 полягає в її ефективності при виконанні складних завдань у різних мовах, особливо в галузі STEM і соціальних наук.