Французький стартап Mistral випустив свою першу модель штучного інтелекту Codestral для кодування, про це йдеться на їхньому сайті.

  • Розробники кажуть, що модель навчається на різноманітному наборі даних з понад 80 мов програмування. Туди входять як найпопулярніші: Python, Java, C, C++, JavaScript та Bash, так і специфічні: Swift та Fortran. 
  • Широка мовна база гарантує, що Codestral може допомогти розробникам у різних середовищах кодування та проєктах, йдеться на сайті.
  • Mistral стверджують, що їхня нова модель може виконувати функції кодування, писати тести та завершувати будь-який частковий код за допомогою механізму fill-in-the-middle.

Проблеми Codestral

Mistral позиціонує свою модель як відкриту, але це спірне питання, пише TechCrunch. Ліцензія стартапу забороняє використовувати Codestral і його результати для будь-якої комерції. 

Причиною може бути те, що Codestral частково навчався на захищеному авторським правом контенті — докази цього оприлюднив CNBC. Mistral не підтвердив і не спростував це у своєму блозі.

Також TechCrunch пише, що, попри перевагу над конкурентами у деяких показниках, Codestral, можливо, не вартий використання: щоб запустити ШІ-модель із 22 мільярдами параметрів, треба доволі потужний комп’ютер. Тож він буде непрактичним для більшості розробників.

Скрин з сайту Mistral

Чому це важливо

Опитування  Stack Overflow 2023 року показало, що 44% розробників використовують інструменти ШІ, а 26% планують зробити це найближчим часом. Проте ці інструменти мають недоліки.

GitClear зробили аналіз понад 150 мільйонів рядків коду, розміщених у репозиторіях проєктів за останні кілька років. Він показав, що ШІ-інструменти призводять до збільшення в базах помилкового коду.  А згідно з дослідженням Університету Пердью, більша частина відповідей ChatGPT від OpenAI про програмування неправильні.

Дослідники безпеки попереджають, що такі інструменти можуть посилити наявні помилки і проблеми з безпекою в проєктах програмного забезпечення.