Google ha lanzado Gema 2B y 7B, un par de modelos de inteligencia artificial de código abierto que permiten a los desarrolladores utilizar más libremente la investigación realizada en su buque insignia Gemini. Si bien Gemini es un gran modelo de IA cerrado que compite directamente con (y es casi tan poderoso) ChatGPT de OpenAI, el liviano Gemma probablemente será adecuado para tareas más pequeñas como chatbots simples o resúmenes.
Pero lo que a estos modelos les falta en complicaciones, pueden compensarlo en velocidad y costo de uso. A pesar de su tamaño más pequeño, Google afirma que los modelos Gemma “superan a los modelos significativamente más grandes en puntos de referencia clave” y son “capaces de ejecutarse directamente en una computadora portátil o de escritorio para desarrolladores”. Estarán disponibles a través de Kaggle, Hugging Face, NeMo de Nvidia y Vertex AI de Google.
El lanzamiento de Gemma en el ecosistema de código abierto es marcadamente diferente de cómo se lanzó Gemini. Si bien los desarrolladores pueden desarrollar Gemini, lo hacen a través de API o trabajando en la plataforma Vertex AI de Google. Géminis se considera un modelo de IA cerrado. Al hacer que Gemma sea de código abierto, más personas pueden experimentar con la IA de Google en lugar de recurrir a competidores que ofrecen mejor acceso.
Ambos tamaños de modelo estarán disponibles con una licencia comercial independientemente del tamaño de la organización, la cantidad de usuarios y el tipo de proyecto. Sin embargo, Google, al igual que otras empresas, a menudo prohíbe que sus modelos se utilicen para tareas específicas, como programas de desarrollo de armas.
Gemma también se entregará con “kits de herramientas de inteligencia artificial responsable”, ya que puede ser más difícil colocar barreras en los modelos abiertos que en sistemas más cerrados como Gemini. Tris Warkentin, director de gestión de productos de Google DeepMind, dijo que la compañía llevó a cabo “un equipo rojo más extenso con Gemma debido a los riesgos inherentes que implican los modelos abiertos”.
El conjunto de herramientas de IA responsable permitirá a los desarrolladores crear sus propias pautas o una lista de palabras prohibidas al implementar Gemma en sus proyectos. También incluye una herramienta de depuración de modelos que permite a los usuarios investigar el comportamiento de Gemma y corregir problemas.
Según Warkentin, por ahora los modelos funcionan mejor para tareas relacionadas con el lenguaje en inglés. “Esperamos poder colaborar con la comunidad para abordar las necesidades del mercado fuera de las tareas del idioma inglés”, dijo a los periodistas.
Los desarrolladores pueden usar Gemma de forma gratuita en Kaggle, y los usuarios nuevos de Google Cloud obtienen $300 en créditos para usar los modelos. La compañía dijo que los investigadores pueden solicitar hasta 500.000 dólares en créditos de nube.
Si bien no está claro cuánta demanda existe de modelos más pequeños como Gemma, otras compañías de inteligencia artificial también han lanzado versiones más livianas de sus modelos de base emblemáticos. Meta lanzó Llama 2 7B, la versión más pequeña de Llama 2, el año pasado. El propio Gemini viene en varios pesos, incluidos Gemini Nano, Gemini Pro y Gemini Ultra, y Google anunció recientemente un Gemini 1.5 más rápido, nuevamente, por ahora para usuarios comerciales y desarrolladores.
Gemma, por cierto, significa piedra preciosa.