Entre todas las nuevas empresas jóvenes de IA que los capitalistas de riesgo persiguen despiadadamente en estos días, GPTZero ya ha alcanzado la rentabilidad en su primer año y medio de vida, generando millones en ingresos. Fundada por Edward Tian, de 24 años, y Alex Cui, de 26, que son amigos desde la escuela secundaria, GPTZero ofrece una herramienta de detección que ayuda a identificar si un contenido fue generado por IA.
Los fundadores han optado por adquirir una Serie A “preventiva” de 10 millones de dólares liderada por el cofundador de Footwork, Nikhil Basu Trivedi, según ha dicho el equipo en exclusiva a TechCrunch. (“Preemptive” es la jerga de VC para referirse a cuando un inversionista logra un acuerdo antes de que los fundadores intentaran recaudar dinero).
Este es todo un golpe para Basu Trivedi. GPTZero ha sido observado por las principales empresas de capital de riesgo prácticamente desde que Tian lanzó una versión inicial como aplicación web en diciembre de 2022, y 30.000 personas la invadieron instantáneamente, colapsando su sitio web alojado en Streamlit. (Adrien Treuille, cofundador de Streamlit, que vendió a Snowflake por 800 millones de dólares, luego se convirtió en un inversionista ángel, dice Tian). La compañía se lanzó formalmente en enero de 2023.
A lo largo de 2024 hasta ahora, a medida que su base de clientes ha ido creciendo, los jóvenes fundadores recibieron de cuatro a cinco llamadas de capitalistas de riesgo por semana, dijeron.
GPTZero creció un 500% en ARR en los últimos seis meses, dijeron los fundadores a TechCrunch, y agregaron que su base de usuarios ha crecido de 1 millón a 4 millones en los últimos 12 meses. Esto la convierte en una de las aplicaciones para consumidores de más rápido crecimiento del año. por algunas medidas.
La empresa ha sido rentable durante los últimos meses, dijeron, y agregaron que tienen más dinero en el banco que el total recaudado durante la vida de la empresa. Para ponerle una cifra: más de 13 millones de dólares entre su semilla de 3,5 millones de dólares y los nuevos 10 millones de dólares.
Y el crecimiento continúa. Los usuarios y los ingresos “se han más que duplicado, tal vez incluso triplicado, desde enero”, dijo Basu Trivedi. Si bien no comentaron sobre la valoración, basada en una ronda típica de Serie A del 20%, el acuerdo ha valorado a la compañía en algún lugar alrededor de los 50 millones de dólares antes del dinero. Otros inversores en la ronda incluyen Reach Capital, centrado en la educación (y liderado por mujeres); Capital alternativo de Jack Altman; Uncork Capital (el fondo de Jeff Clavier); y Neo (el fondo de Ali Partovi).
Cómo ganó el VC el trato
Basu Trivedi, un ex alumno de Princeton, tomó la delantera en este acuerdo jugando a largo plazo. Conoció a Tian en 2022, antes de la locura de GPTZero, durante un evento anual en el que un pequeño grupo de estudiantes de Princeton visita empresas de Silicon Valley. Basu Trivedi siempre lleva al grupo a recorrer el Stanford Dish.
Tian desarrolló GPTZero mientras estudiaba informática, procesamiento del lenguaje natural y periodismo en la escuela Ivy League. Durante sus pasantías en la BBC y luego en The New York Times, escribió código que ayudó a los periodistas a identificar contenido generado por IA.
Después de la salvaje respuesta que obtuvo su aplicación web inicial, Tian pidió ayuda a su amigo Cui. Cui tiene una maestría en aprendizaje automático de la Universidad de Toronto y abandonó su programa de doctorado para convertirse en cofundador.
Los dos reescribieron la aplicación en su plataforma independiente actual y recaudaron 3,5 millones de dólares en semillas después de llegar a alrededor de 1,5 millones de usuarios en sus primeros cinco meses. Esto provino principalmente de inversores ángeles como Tom Glocer, ex director ejecutivo de Reuters; Russ Salakhutdinov, profesor de la Universidad Carnegie Mellon y exdirector de investigación de IA en Apple (después de vender su startup, Perceptual Machines, a Apple en 2016); y Mark Thompson, director ejecutivo de CNN y ex director ejecutivo del New York Times.
Basu Trivedi vio cómo GPTZero estaba ganando prensa y ángeles impresionantes, y escuchó los rumores al respecto entre los rumores de VC. Como inversor inicial que respaldaba empresas como Canva, ClassDojo y Frame.io, reconocía una empresa de moda en cuanto la veía.
Le envió un mensaje de texto a Tian en enero de 2023 para registrarse. Cortejó a los fundadores con su red y conocimiento de productos de sus empresas de rápido crecimiento como Canva, y con la experiencia del cofundador de su fondo, Mike Smith, ex director de operaciones de Stitch Fix. y Walmart.
Inversores con experiencia tanto en productos como en operaciones era lo que los dos fundadores de veintitantos años “anhelaban, especialmente porque Alex y yo estamos aprendiendo cómo construir una gran empresa”, dijo Tian.
Para demostrarlo, poco después de cerrar la ronda, Footwork organizó un evento de networking con líderes de IA, incluido Jack Altman (hermano de Sam Altman de OpenAI, quien se unió a la ronda Seed A), quien también fue compañero de clase universitario de Basu Trivedi, y Jensen Huang, director ejecutivo y fundador de Nvidia.
“Una ventaja del big data“
GPTZero está lejos de ser la única empresa que trabaja para identificar contenido generado por IA. Otros incluyen AI Writing Check, Copyleaks, GPT Radar, CatchGPT y Originality.ai.
Pero muchos en la industria de detección de IA tienen una precisión abismal, los investigadores encuentran. Tanto es así que OpenAI, que fue presionada por la paranoia de la industria de la IA para lanzar su propio detector de IA a principios de 2023, cerró la herramienta unos siete meses después, en julio, después de que fuera ampliamente criticada por su mal funcionamiento.
Curiosamente, cuando Kyle Wiggers de TechCrunch hizo su propio experimento con estas herramientas, todas reprobaron excepto GPTZero.
Naturalmente, GPTZero tiene sus propios puntos de referencia, particularmente a través de una asociación con investigadores de Penn State, que le ayudan a demostrar que su tecnología funciona bien, a pesar de la reputación general de la industria.
Cui dice que GPTZero es más preciso porque tiene acceso a más datos y ha creado sus propios modelos LLM utilizando las herramientas de código abierto más avanzadas, que no revelará.
“Tenemos una gran ventaja de datos. Tenemos millones de ejemplos de texto humano versus IA”, dijo Cui. “También hemos combinado esto con algunos de los mejores modelos y aprendizaje profundo. De hecho, estamos utilizando modelos de lenguaje para detectar modelos de lenguaje”.
Si bien la startup puede ser más conocida por ayudar a los profesores a detectar el trabajo de los estudiantes generado por IA (en octubre, GPTZero consiguió un acuerdo con la Federación Estadounidense de Maestros), su base de clientes se ha ampliado. Ahora incluye agencias de adquisiciones gubernamentales, organizaciones que otorgan subvenciones, gerentes de contratación y, especialmente interesante, etiquetadores de datos de capacitación en IA.
Resulta que el uso de datos generados por IA para el entrenamiento de la IA “provoca el colapso del modelo”, dice Tian, porque enseñar un modelo usando ejemplos inventados no es la mejor manera de lograr que funcione en el mundo real.
Naturalmente, los jóvenes fundadores tienen una visión más grandiosa a largo plazo. Quieren crear una capa nueva e independiente de Internet que asuma la responsabilidad y garantice que el contenido humano y de inteligencia artificial se atribuya correctamente.
Para ello, el equipo está trabajando actualmente en la detección de alucinaciones mediante IA. Las alucinaciones, donde la IA presenta ficción generada por IA como si fuera un hecho, son la pesadilla de la industria GenAI. El primer paso de la compañía para abordar este problema es una verificación gratuita de derechos de autor de texto de IA recientemente disponible para conjuntos de datos de capacitación LLM. Esto les ayudará a generar datos de entrenamiento para una detección más amplia de alucinaciones.
“Simplemente estamos tratando de evitar un mundo en el que todo Internet sea contenido generado por IA”, dijo Tian. “Una Internet donde todo el mundo usa IA no preserva la oportunidad para que las personas sigan contribuyendo con contenido creativo y original”.