Mistral створює першу генеративну ШІ модель для написання коду, під назвою Codestral
Французький стартап Mistral, підтримуваний компанією Microsoft і оцінений у 6 мільярдів доларів, презентував свою першу генеративну ШІ модель для програмістів та написання коду під назвою Codestral. Ця модель, як і інші аналогічні інструменти, створена для допомоги розробникам у написанні та взаємодії з кодом. Відповідно до інформації, опублікованої в блозі компанії, Codestral навчалася на понад 80 програмних мовах, включаючи Python, Java, C++ та JavaScript.
Можливості Codestral для програмістів
Codestral здатна виконувати різноманітні завдання, такі як автозавершення функцій, написання тестів та “заповнення” частково написаного коду. Крім того, модель може відповідати на запитання про базу коду англійською мовою. Це робить її корисним інструментом для розробників, які шукають способи підвищення ефективності своєї роботи.
Ліцензійні обмеження
Попри те, що Mistral описує модель як “відкриту”, це твердження викликає дискусії. Ліцензія на використання Codestral забороняє комерційне використання моделі та її результатів. Виключенням є “розробка”, але навіть у цьому випадку існують обмеження: ліцензія забороняє будь-яке внутрішнє використання працівниками у контексті бізнесової діяльності компанії.
Причиною таких обмежень може бути те, що Codestral частково навчалася на захищеному авторським правом контенті. Mistral не підтвердила і не заперечила це в своєму блозі, але існує ймовірність, що у тренувальних наборах даних стартапу раніше були захищені авторськім правом дані.
Технічні вимоги та продуктивність
Codestral має 22 мільярди параметрів, що вимагає потужного комп’ютера для її роботи. Параметри визначають здатність штучного інтелекту аналізувати та генерувати текст. Хоча модель перевершує конкурентів за деякими показниками, загальна продуктивність не є значним проривом.
Використання ШІ у розробці
Незважаючи на практичні обмеження для більшості розробників та незначні покращення у продуктивності, Codestral безсумнівно підживить дискусії щодо доцільності використання генеративних AI-моделей як помічників у програмуванні. Розробники вже активно впроваджують інструменти генеративного ШІ для виконання деяких завдань. Згідно з опитуванням Stack Overflow, проведеним у червні 2023 року, 44% розробників вже використовують ШІ інструменти у своїй роботі, а 26% планують це зробити найближчим часом. Проте ці інструменти мають очевидні недоліки.
Недоліки та ризики використання штучного інтелекту у кодуванні
Аналіз понад 150 мільйонів рядків коду, виконаний GitClear, показав, що використання генеративних ШІ інструментів призводить до збільшення кількості помилок у кодових базах. Крім того, дослідники з безпеки попереджають, що такі інструменти можуть посилювати існуючі баги та проблеми безпеки у програмних проектах. Дослідження, проведене в університеті Purdue, виявило, що більше половини відповідей, наданих ChatGPT від OpenAI на програмні запитання, є неправильними.
Це не зупиняє компанії, такі як Mistral, від спроб монетизувати свої моделі та завоювати визнання на ринку. Сьогодні вранці Mistral запустила хостинг-версію Codestral на своїй платформі Le Chat та платний API. Компанія також працює над інтеграцією Codestral у фреймворки та середовища розробки, такі як LlamaIndex, LangChain, Continue.dev та Tabnine.
Випуск Codestral від Mistral є важливим кроком у розвитку генеративних AI технологій для кодування. Незважаючи на наявні обмеження та недоліки, цей інструмент має потенціал для підвищення ефективності розробників та прискорення процесу написання коду. Проте, розробники повинні бути обережними та усвідомлювати можливі ризики, пов’язані з використанням AI моделей у своїй роботі.
Джерело: techcrunch.com