Mistral, la startup francesa de IA respaldada por Microsoft y valorada en 6.000 millones de dólares, ha liberado su primer modelo de IA generativa para codificación, denominado Codestral.
Codestral, al igual que otros modelos de generación de código, está diseñado para ayudar a los desarrolladores a escribir código e interactuar con él. Fue entrenado en más de 80 lenguajes de programación, incluidos Python, Java, C++ y JavaScript, explica Mistral en una publicación de blog. Codestral puede completar funciones de codificación, escribir pruebas y “rellenar” código parcial, así como responder preguntas sobre un código base en inglés.
Mistral describe el modelo como “abierto”, pero eso es objeto de debate. La licencia de la startup prohíbe el uso de Codestral y sus salidas para cualquier actividades comerciales. Hay una excepción para el “desarrollo”, pero incluso eso tiene salvedades: la licencia continúa prohibiendo explícitamente “cualquier uso interno por parte de los empleados en el contexto de las actividades comerciales de la empresa”.
La razón podría ser que Codestral fue capacitado en parte en contenido protegido por derechos de autor. Mistral no confirmó ni negó esto en la publicación del blog, pero no sería sorprendente; hay evidencia que los conjuntos de datos de entrenamiento anteriores de la startup contenían datos protegidos por derechos de autor.
En cualquier caso, es posible que Codestral no valga la pena. Con 22 mil millones de parámetros, el modelo requiere una PC robusta para funcionar. (Los parámetros esencialmente definen la habilidad de un modelo de IA en un problema, como analizar y generar texto). Y si bien supera a la competencia según algunos puntos de referencia (que, como sabemos, no son confiables), no es una explosión.
Si bien no es práctico para la mayoría de los desarrolladores y es incremental en términos de mejoras de rendimiento, Codestral seguramente alimentará el debate sobre la conveniencia de confiar en modelos de generación de código como asistentes de programación.
Sin duda, los desarrolladores están adoptando herramientas de IA generativa para al menos algunas tareas de codificación. En un desbordamiento de pila encuesta Desde junio de 2023, el 44% de los desarrolladores dijeron que ahora utilizan herramientas de inteligencia artificial en su proceso de desarrollo, mientras que el 26% planea hacerlo pronto. Sin embargo, estas herramientas tienen defectos obvios.
Un análisis de más de 150 millones de líneas de código comprometidas con repositorios de proyectos durante los últimos años realizado por GitClear encontró que Las herramientas de desarrollo de IA generativa están generando más códigos erróneos siendo empujado a las bases de código. En otros lugares, los investigadores de seguridad han advertido que tales herramientas pueden amplificar errores existentes y problemas de seguridad en proyectos de software; Más de la mitad de las respuestas que da ChatGPT de OpenAI a preguntas de programación son incorrectas, según un estudio de Purdue.
Eso no impedirá que empresas como Mistral y otras intenten monetizar (y ganar reconocimiento) con sus modelos. Esta mañana, Mistral lanzó una versión alojada de Codestral en su plataforma de IA conversacional Le Chat, así como en su API paga. Mistral dice que también ha trabajado para integrar Codestral en marcos de aplicaciones y entornos de desarrollo como LlamaIndex, LangChain, Continuar.dev y Tabnine.