Google Books, que indexa material publicado y se ha vuelto esencial para los académicos, ha comenzado a indexar libros de baja calidad, lo que podría afectar la forma en que informa a su herramienta de seguimiento de idiomas, Ngram.
404Medios informes Google Books incluía varios libros que la IA podría haber escrito. La publicación buscó en Google Libros con el término “a partir de mi última actualización de conocimientos”, una frase común que utilizan los chatbots como ChatGPT. Puede buscar en Google Libros frases o términos específicos y normalmente le devolverá trabajos escritos con esas frases.
Descubrió que la mayoría de los libros en las primeras páginas de la búsqueda eran trabajos sobre IA, pero entre esos resultados había algunos que no hablaban sobre la tecnología y parecían escritos por un robot.
404Medios dijeron los libros que encontró, como el de Tristin McIver Osos, toros y lobos: negociación de acciones para jóvenes de veinte años, parecía que buscaban en Wikipedia información sobre eventos financieros e incluían la frase “a partir de mi última actualización de conocimientos”. Otros libros sobre temas como Twitter todavía contenían información de 2021, cuando algunos modelos de IA habrían obtenido datos de entrenamiento por última vez.
Google Books constituye la mayor parte de los datos que respaldan su visor Ngram, una herramienta de investigación que rastrea cómo ha cambiado el idioma con el tiempo. Ngram toma información de trabajos escritos para mostrar cómo evoluciona el uso del lenguaje.
Google Books escaneó e indexó obras escritas que datan del siglo XVI, y Ngram actualizó por última vez los datos que cita en 2019. Aunque Ngram no es perfecto, muchos lingüistas y otros académicos utilizan la herramienta para recopilar investigaciones.
Google dijo 404Medios que los trabajos recientes en Google Books no aparecen en los resultados de Ngram, pero es posible que aparezcan en futuras actualizaciones de datos.