Anthropic afirma que su último modelo es el mejor de su clase

Anthropic, rival de OpenAI, está lanzando un nuevo y potente modelo de IA generativa llamado Claude 3.5 Sonnet. Pero es más un paso gradual que un salto monumental hacia adelante.

Claude 3.5 Sonnet puede analizar texto e imágenes, así como generar texto, y es el modelo de mejor rendimiento de Anthropic hasta el momento, al menos en papel. En varios puntos de referencia de IA para lectura, codificación, matemáticas y visión, Claude 3.5 Sonnet supera al modelo al que reemplaza, Claude 3 Sonnet. y Supera al modelo insignia anterior de Anthropic, Claude 3 Opus.

Los puntos de referencia no son necesariamente la medida más útil del progreso de la IA, en parte porque muchos de ellos evalúan casos extremos esotéricos que no son aplicables a la persona promedio, como responder preguntas de exámenes de salud. Pero por si sirve de algo, Claude 3.5 Sonnet apenas supera a los principales modelos rivales, incluido el GPT-4o lanzado recientemente por OpenAI, en algunos de los puntos de referencia con los que Anthropic lo probó.

Junto con el nuevo modelo, Anthropic está lanzando lo que llama Artifacts, un espacio de trabajo donde los usuarios pueden editar y agregar contenido (por ejemplo, código y documentos) generado por los modelos de Anthropic. Actualmente en versión preliminar, Artifacts obtendrá nuevas características, como formas de colaborar con equipos más grandes y almacenar bases de conocimiento, en un futuro cercano, dice Anthropic.

Centrarse en la eficiencia

Claude 3.5 Sonnet tiene un rendimiento un poco mayor que Claude 3 Opus, y Anthropic dice que el modelo comprende mejor instrucciones complejas y matizadas, además de conceptos como el humor. (La IA es notoriamente divertido, sin embargo.) Pero quizás lo más importante para los desarrolladores que crean aplicaciones con Claude que requieren respuestas rápidas (por ejemplo, chatbots de servicio al cliente) es que Claude 3.5 Sonnet es más rápido. Es aproximadamente el doble de velocidad que Claude 3 Opus, afirma Anthropic.

La visión (análisis de fotografías) es un área en la que Claude 3.5 Sonnet mejora enormemente con respecto a 3 Opus, según Anthropic. Claude 3.5 Sonnet puede interpretar cuadros y gráficos con mayor precisión y transcribir texto a partir de imágenes “imperfectas”, como fotografías con distorsiones y artefactos visuales.

Michael Gerstenhaber, líder de producto de Anthropic, dice que las mejoras son el resultado de ajustes arquitectónicos y nuevos datos de entrenamiento, incluidos datos generados por IA. ¿Qué datos específicamente? Gerstenhaber no quiso revelarlo, pero dio a entender que Claude 3.5 Sonnet obtiene gran parte de su fuerza de estos conjuntos de entrenamiento.

Créditos de imagen: antrópico

“Lo que le importa [businesses] “La cuestión es si la IA les está ayudando o no a satisfacer sus necesidades comerciales, no si la IA es competitiva o no en un punto de referencia”, dijo Gerstenhaber a TechCrunch. “Y desde esa perspectiva, creo que Claude 3.5 Sonnet será un paso adelante de cualquier otra cosa que tengamos disponible, y también de cualquier otra cosa en la industria”.

El secreto en torno a los datos de entrenamiento podría deberse a razones competitivas. Pero también podría servir para proteger a Anthropic de desafíos legales, en particular desafíos relacionados con uso justo. Los tribunales aún tienen que decidir si proveedores como Anthropic y sus competidores, como OpenAI, Google, Amazon, etc., tienen derecho a capacitarse sobre datos públicos, incluidos datos protegidos por derechos de autor, sin compensar ni acreditar a los creadores de esos datos.

Entonces, todo lo que sabemos es que Claude 3.5 Sonnet fue entrenado con una gran cantidad de texto e imágenes, como los modelos anteriores de Anthropic, además de comentarios de evaluadores humanos para intentar “alinear” el modelo con las intenciones de los usuarios, con suerte evitando que emita sustancias tóxicas o de otro tipo. texto problemático.

Soneto antrópico de Claude 3.5 — **Créditos de imagen:** antrópico

¿Qué más sabemos? Bueno, la ventana de contexto de Claude 3.5 Sonnet (la cantidad de texto que el modelo puede analizar antes de generar texto nuevo) es de 200.000 tokens, lo mismo que la de Claude 3 Sonnet. Los tokens son bits subdivididos de datos sin procesar, como las sílabas “fan”, “tas” y “tic” en la palabra “fantástico”; 200.000 tokens equivalen a unas 150.000 palabras.

Y sabemos que Claude 3.5 Sonnet ya está disponible. Los usuarios gratuitos del cliente web de Anthropic y de la aplicación Claude para iOS pueden acceder a él sin coste alguno; Los suscriptores de los planes pagos de Anthropic, Claude Pro y Claude Team, obtienen límites de tarifas 5 veces más altos. Claude 3.5 Sonnet también está disponible en la API de Anthropic y en plataformas administradas como Amazon Bedrock y Vertex AI de Google Cloud.

“Claude 3.5 Sonnet es realmente un cambio radical en inteligencia sin sacrificar la velocidad, y nos prepara para futuros lanzamientos en toda la familia de modelos Claude”, dijo Gerstenhaber.

Claude 3.5 Sonnet también impulsa Artifacts, que muestra una ventana emergente dedicada en el cliente web de Claude cuando un usuario le pide al modelo que genere contenido como fragmentos de código, documentos de texto o diseños de sitios web. Gerstenhaber explica: “Los artefactos son la salida del modelo que deja a un lado el contenido generado y le permite, como usuario, iterar sobre ese contenido. Digamos que desea generar código: el artefacto se colocará en la interfaz de usuario y luego podrá hablar con Claude e iterar sobre el documento para mejorarlo y poder ejecutar el código”.

La fotografía más grande

Entonces, ¿cuál es el significado de Claude 3.5 Sonnet en el contexto más amplio de Anthropic y, en todo caso, del ecosistema de IA?

Claude 3.5 Sonnet muestra que el progreso incremental es el alcance de lo que podemos esperar ahora mismo en el frente de los modelos, salvo que se produzca un avance importante en la investigación. En los últimos meses se han visto lanzamientos emblemáticos de Google (Gemini 1.5 Pro) y OpenAI (GPT-4o) que mueven la aguja marginalmente en términos de referencia y rendimiento cualitativo. Pero no ha habido un salto que iguale el salto de GPT-3 a GPT-4 desde hace bastante tiempo, debido a la rigidez de las arquitecturas de modelos actuales y la inmensa computación que requieren para entrenar.

A medida que los proveedores de IA generativa centran su atención en la conservación de datos y la concesión de licencias en lugar de nuevas y prometedoras arquitecturas escalables, hay señales de que los inversores se están volviendo cautelosos del camino más largo de lo previsto hacia el retorno de la inversión (ROI) para la IA generativa. Anthropic está algo inoculado de esta presión, ubicándose en la envidiable posición del seguro de Amazon (y en menor medida de Google) contra OpenAI. Pero los ingresos de la empresa, que se prevé alcancen poco menos de mil millones de dólares para finales de 2024, es un fracción de OpenAI, y estoy seguro de que los patrocinadores de Anthropic no permiten que olvide ese hecho.

A pesar de una creciente base de clientes que incluye marcas domésticas como Bridgewater, Brave, Slack y DuckDuckGo, Anthropic todavía carece de cierto prestigio empresarial. Es revelador que fuera OpenAI (no Anthropic) con quien PwC se asoció recientemente para revender ofertas de IA generativa a la empresa.

Por lo tanto, Anthropic está adoptando un enfoque estratégico y ya trillado para avanzar, invirtiendo tiempo de desarrollo en productos como Claude 3.5 Sonnet para ofrecer un rendimiento ligeramente mejor a precios de productos básicos. Claude 3.5 Sonnet tiene el mismo precio que Claude 3 Sonnet: 3 dólares por millón de tokens introducidos en el modelo y 15 dólares por millón de tokens generados por el modelo.

Gerstenhaber habló de esto en nuestra conversación. “Cuando se crea una aplicación, el usuario final no debería tener que saber qué modelo se está utilizando o cómo un ingeniero optimizó su experiencia”, dijo, “pero el ingeniero podría tener las herramientas disponibles para optimizar esa experiencia”. a lo largo de los vectores que deben optimizarse, y el costo es sin duda uno de ellos”.

Claude 3.5 Sonnet no resuelve el problema de las alucinaciones. Es casi seguro que comete errores. Pero podría ser lo suficientemente atractivo como para que los desarrolladores y las empresas se cambien a la plataforma de Anthropic. Y al final del día, eso es lo que le importa a Anthropic.

Con el mismo fin, Anthropic ha duplicado su apuesta por herramientas como su IA de dirección experimentalque permite a los desarrolladores “dirigir” las características internas de sus modelos; integraciones para permitir que sus modelos tomen acciones dentro de las aplicaciones; y herramientas construidas en la parte superior de sus modelos como la experiencia Artifacts antes mencionada. También contrató a un cofundador de Instagram como jefe de producto. Y ha ampliado la disponibilidad de sus productos, más recientemente trajo a Claude a Europa y estableció oficinas en Londres y Dublín.

Anthropic, en definitiva, parece haber llegado a la idea de que construir un ecosistema en torno a modelos (no simplemente modelos aislados) es la clave para retener a los clientes a medida que se reduce la brecha de capacidades entre los modelos.

Aun así, Gerstenhaber insistió en que hay modelos más grandes y mejores, como el Claude 3.5 Opus, en el horizonte cercano, con funciones como búsqueda web y la capacidad de recordar preferencias.

“No he visto El aprendizaje profundo todavía se topó con una pared“Y dejaré que los investigadores especulen sobre el muro, pero creo que es un poco pronto para llegar a conclusiones al respecto, especialmente si nos fijamos en el ritmo de la innovación”, afirmó. “Hay un desarrollo muy rápido y una innovación muy rápida, y no tengo motivos para creer que vaya a desacelerarse”.

Ya veremos.

Anthropic afirma que su último modelo es el mejor de su clase

Yieldstreet afirma que algunos de sus clientes se vieron afectados por la filtración de datos de Evolve Bank

Anthropic busca financiar una nueva generación más completa de puntos de referencia de IA

El modelo de “pago o consentimiento” de Meta incumple las normas de competencia de la UE, según la Comisión

Descubra estrategias preparadas para el futuro para la evolución del personal y la tecnología con Sand Technologies

Un fallo de seguridad de BMW expuso información confidencial de la empresa, según un investigador

Minuto TechCrunch: Cómo el estafador fundador de Headspin casi se sale con la suya mintiendo a los inversores

Iniciada durante más de una década, esta empresa de Dallas acaba de obtener 110 millones de dólares para ayudar a las personas a pagar facturas mediante mensajes de texto.

Los Google Pixel añaden soporte para las fotos Ultra HDR de Instagram

Desmitificando los imperativos comerciales del Metaverso

Revisión: dos semanas con Apple Vision Pro

Anthropic afirma que su último modelo es el mejor de su clase

Centrarse en la eficiencia

La fotografía más grande

Related Posts