ÚLTIMO MINUTO
jueves, 6 de noviembre, 25
25.7 C
Caracas

La IA no cumplió sus planes para el 2025 de sustituir personas

2025 iba a ser el año de los agentes capaces de sustituir personas. Pero la mejor IA solo es capaz de hacer el 2,5% de tareas humanas

2025 iba a ser, según muchas previsiones, el año de los agentes: (IA) inteligencias artificiales capaces de asumir proyectos completos, planificar tareas, coordinar recursos y entregar resultados profesionales sin supervisión humana. El hype no solo estaba en el ambiente: Microsoft hablaba de trabajadores IA.

La realidad es otra, de momento. Un nuevo estudio de Scale AI ha querido comprobar hasta qué punto los grandes modelos actuales pueden desempeñar encargos reales de trabajo. Nada de benchmarks ininteligibles: las pruebas fueron proyectos freelance resales, evaluados por un panel de 40 jueces como si fueran clientes humanos. Abarcaban desde diseño de producto y desarrollo de videojuegos hasta análisis de datos o redacción de textos científicos. Para expertos como Andrej Karpathy, cofundador de OpenAI, los agentes, simplemente, no están ahí.  

Cuántos de esos trabajos alcanzarían un nivel «aceptable» para un cliente corriente. El modelo Manus fue el que mejor rendimiento logró, y frente a lo que cabría esperar según las promesas, no fue brillante: solo el 2,5% de sus entregas fueron consideradas aceptables. A partir de ahí, todo fue a menos: Grok alcanzó un 2,1%, Claude se quedó en cifras similares, GPT-5 en un 1,7%, y Gemini 2.5 Pro acabó último 0,8%.

Lo más reciente

COP30 en Brasil: El mundo se une en la Amazonia para salvar el planeta

La COP30, la trigésima edición de la Conferencia de...

[EN VIVO] Encuentro de líderes previo a la COP30

https://www.youtube.com/live/-Yh2rXVsQDQ

La frecuencia ideal de sexo para ser felices: ¿una vez por semana es la clave?

La frecuencia con la que una persona necesita tener...

Noticias

Artículos relacionados