Según se informa, Meta lanzará versiones más pequeñas de su modelo de lenguaje Llama a medida que las empresas busquen ofrecer modelos de IA más rentables al público.
La información informes que la compañía planea lanzar dos versiones pequeñas de Llama 3 este mes antes de lanzar el modelo insignia este verano. El borde contacté a Meta para hacer comentarios.
Por lo general, estos modelos no pueden manejar largas cadenas de instrucciones de los usuarios, pero son más rápidos, más flexibles y, lo más importante, más baratos de ejecutar que un modelo de tamaño normal. Pero estos siguen siendo modelos de IA potentes, capaces de resumir archivos PDF y conversaciones y escribir código. Los modelos más grandes se suelen utilizar para tareas más complicadas, como generar fotografías o tareas que requieren varios comandos para ejecutarse. Dado que los modelos pequeños sólo funcionan con un número menor de parámetros (datos que aprende), estos también requieren menos potencia de cálculo y, por tanto, son más rentables.
Los modelos ligeros tienden a atraer a usuarios que no necesariamente quieren utilizar la amplitud de un modelo de lenguaje grande para sus aplicaciones. Los modelos más pequeños a menudo se pueden implementar en proyectos específicos, como asistencia de código o en dispositivos que no pueden manejar el uso de energía de un modelo de IA más grande, como teléfonos o computadoras portátiles.