El nuevo modelo de OpenAI resultados alcanza de nivel humano en una prueba de inteligencia general
El sistema o3 de OpenAI logra un puntaje de 85% en la prueba ARC-AGI, un avance significativo hacia la inteligencia artificial general
En un logro reciente, OpenAI ha demostrado avances notables en el campo de la inteligencia artificial. El sistema o3, desarrollado por la compañía, obtuvo un puntaje de 85% en la prueba ARC-AGI, una medida clave diseñada para evaluar la "inteligencia general". Este resultado no solo supera el 55% alcanzado previamente por otros modelos de IA, sino que también iguala el puntaje promedio de los seres humanos en esta prueba.
©Photo by Michael M. Santiago/Getty Images
El objetivo a largo plazo de OpenAI y otros laboratorios de investigación en inteligencia artificial es lograr lo que se conoce como inteligencia artificial general (AGI), un tipo de IA capaz de realizar tareas cognitivas humanas. Si bien el camino hacia la AGI aún está lleno de desafíos, este reciente resultado ha generado un entusiasmo renovado en la comunidad científica.
Para entender el impacto de este avance, es importante conocer cómo funciona la prueba ARC-AGI. Esta prueba mide la capacidad de un sistema de IA para adaptarse a situaciones nuevas con solo unos pocos ejemplos. Los sistemas tradicionales de IA, como ChatGPT, tienden a necesitar grandes cantidades de datos para funcionar correctamente, lo que limita su capacidad para abordar tareas inusuales o desconocidas. En contraste, la capacidad de generalización, es decir, la habilidad para aprender de pocos ejemplos, se considera fundamental para alcanzar una inteligencia más cercana a la humana.
El sistema o3 de OpenAI ha logrado superar este obstáculo, mostrando una capacidad impresionante para resolver problemas complejos y desconocidos, lo que acerca a la IA a un nivel de adaptabilidad que antes se consideraba exclusivo de los seres humanos. Sin embargo, aunque este avance es prometedor, muchos investigadores aún mantienen un grado de escepticismo, ya que la AGI sigue siendo un desafío a gran escala. No obstante, este resultado marca un paso importante hacia un futuro donde las IA puedan aprender y adaptarse de manera más eficiente.