Progreso en la clasificación de imágenes por máquinas Tasa de error de la IA por año. Línea roja: tasa de error de un humano entrenado en una tarea en particular.
Progreso en Inteligencia Artificial (IA) se refiere a los avances, hitos y descubrimientos que se han logrado en el campo de la inteligencia artificial a lo largo del tiempo. La IA es una rama multidisciplinaria de la ciencia de la computación que tiene como objetivo crear máquinas y sistemas capaces de realizar tareas que normalmente requieren inteligencia humana. Las aplicaciones de la inteligencia artificial se han utilizado en una amplia gama de campos, incluyendo el diagnóstico médico, el comercio de acciones, el control de robots, la ley, el descubrimiento científico, los videojuegos y los juguetes. Sin embargo, muchas aplicaciones de IA no son percibidas como tal: "Mucha IA de vanguardia se ha filtrado en aplicaciones generales, a menudo sin ser llamada IA, porque una vez que algo se vuelve lo suficientemente útil y común, ya no se etiqueta como IA".[1][2] "Muchas miles de aplicaciones de IA están profundamente integradas en la infraestructura de cada industria".[3] A finales de la década de 1990 y principios del siglo XXI, la tecnología de IA se utilizó ampliamente como elementos de sistemas más grandes,[3][4] pero en ese momento, rara vez se le atribuyó al campo estos éxitos.
Kaplan y Haenlein estructuran la inteligencia artificial en tres etapas evolutivas: 1) inteligencia artificial estrecha: aplicar IA solo a tareas específicas; 2) inteligencia artificial general: aplicar IA a varias áreas y ser capaz de resolver problemas de forma autónoma para los que ni siquiera fueron diseñadas; y 3) superinteligencia artificial: aplicar IA a cualquier área capaz de creatividad científica, habilidades sociales y sabiduría general.[2]
Para permitir la comparación con el rendimiento humano, la inteligencia artificial se puede evaluar en problemas restringidos y bien definidos. Estas pruebas se han denominado pruebas de Turing de expertos en la materia. Además, los problemas más pequeños proporcionan metas más alcanzables y hay un número cada vez mayor de resultados positivos.
Existen muchas habilidades útiles que pueden describirse como formas de inteligencia. Esto ofrece una mejor comprensión del éxito comparativo de la inteligencia artificial en diferentes áreas.
La IA, al igual que la electricidad o la máquina de vapor, es una tecnología de propósito general. No hay consenso sobre cómo caracterizar las tareas en las que la IA tiende a destacar.[14] Algunas versiones de la Paradoja de Moravec observan que los humanos tienen más probabilidades de superar a las máquinas en áreas como la destreza física que han sido el objetivo directo de la selección natural.[15] Si bien proyectos como AlphaZero han tenido éxito en generar su propio conocimiento desde cero, muchos otros proyectos de aprendizaje automático requieren grandes conjuntos de datos de entrenamiento.[16][17] El investigador Andrew Ng ha sugerido, como una "regla general muy imperfecta", que "casi todo lo que un humano típico puede hacer en menos de un segundo de pensamiento mental, probablemente ahora o en un futuro cercano podemos automatizarlo usando IA".[18]
Sin embargo, a pesar de los avances en la IA, todavía hay muchas áreas en las que los humanos superan a las máquinas. Estas áreas incluyen el sentido común, la creatividad, la empatía, la adaptabilidad y la comprensión contextual.[14] La capacidad de comprender y responder adecuadamente a situaciones complejas y cambiantes es una habilidad en la que los humanos han demostrado ser superiores.
Es importante destacar que el objetivo de la IA no es necesariamente superar a los humanos en todas las tareas, sino mejorar la eficiencia y la capacidad en áreas específicas para complementar y potenciar las habilidades humanas.
Los juegos proporcionan un referente destacado para evaluar las tasas de progreso; muchos juegos tienen una gran base de jugadores profesionales y un sistema de clasificación competitivo bien establecido. AlphaGo puso fin a la era de los referentes clásicos de juegos de mesa cuando la Inteligencia Artificial demostró su ventaja competitiva sobre los humanos en 2016. El programa de inteligencia artificial AlphaGo de Deep Mind derrotó al mejor jugador profesional de Go del mundo, Lee Sedol.[19] Los juegos de imperfect knowledge presentan nuevos desafíos para la IA en el área de la teoría de juegos; el hito más destacado en esta área fue alcanzado por la victoria de la IA de Libratus en el póquer en 2017.[20][21] Los Deportes electrónicos continúan proporcionando puntos de referencia adicionales; Facebook AI, Deepmind, y otros han participado en la popular franquicia de videojuegos StarCraft.[22][23]
Las amplias categorías de resultados para una prueba de IA pueden ser las siguientes:
óptimo: no es posible hacerlo mejor (nota: algunos de estos logros fueron alcanzados por humanos)
superhumano: tiene un desempeño mejor que todos los humanos
altamente humano: tiene un desempeño mejor que la mayoría de los humanos
parcialmente humano: tiene un desempeño similar a la mayoría de los humanos
subhumano: tiene un desempeño inferior a la mayoría de los humanos
Póquer de límite heads-up: Óptimo estadísticamente en el sentido de que "una vida humana de juego no es suficiente para establecer con significancia estadística que la estrategia no es una solución exacta" (2015)[26]
Bridge: Según una revisión de 2009, "los mejores programas están alcanzando el nivel de experto como jugadores de (bridge) cartas", excluyendo la subasta.[45]
Explicabilidad. Los sistemas médicos actuales pueden diagnosticar ciertas condiciones médicas correctamente, pero no pueden explicar a los usuarios por qué hicieron el diagnóstico.[62]
Las pruebas de "inteligencia universal" propuestas buscan comparar el rendimiento de máquinas, humanos e incluso animales no humanos en conjuntos de problemas lo más genéricos posible. En un extremo, el conjunto de pruebas puede contener todos los problemas posibles, ponderados por la Complejidad de Kolmogorov; sin embargo, estos conjuntos de problemas tienden a estar dominados por ejercicios de coincidencia de patrones empobrecidos donde una IA ajustada puede superar fácilmente los niveles de rendimiento humano.[69][70][71][72][73]
Según OpenAI, en 2023 ChatGPTGPT-4 obtuvo un puntaje en el percentil 90 en el Uniform Bar Exam (Examen Uniforme de Abogacía). En los exámenes SAT, GPT-4 obtuvo un puntaje en el percentil 89 en matemáticas y en el percentil 93 en Lectura y Escritura. En los exámenes GRE, obtuvo un puntaje en el percentil 54 en la prueba de escritura, en el percentil 88 en la sección cuantitativa y en el percentil 99 en la sección verbal. Obtuvó un puntaje en el percentil 99 al 100 en el examen semifinal de la USA Biology Olympiad en 2020. Obtuvo una calificación perfecta de "5" en varios exámenes de nivel avanzado (AP).[74]
Investigadores independientes encontraron en 2023 que ChatGPT GPT-3.5 "se desempeñó en o cerca del umbral de aprobación" en las tres partes del United States Medical Licensing Examination (Examen de Licencia Médica de los Estados Unidos). GPT-3.5 también fue evaluado para obtener una calificación baja, pero aprobatoria, en los exámenes de cuatro cursos de derecho en la University of Minnesota (Universidad de Minnesota).[74] GPT-4 aprobó un examen estilo "board" de radiología basado en texto.[75][76]
Muchas competencias y premios, como el Desafío ImageNet, fomentan la investigación en inteligencia artificial. Las áreas más comunes de competencia incluyen la inteligencia general de máquinas, el comportamiento conversacional, la minería de datos, los coches robóticos y el fútbol de robots, así como los juegos convencionales.[77]
Una encuesta de expertos alrededor de 2016, realizada por Katja Grace del Future of Humanity Institute y colaboradores, dio estimaciones medias de 3 años para el campeonato de Angry Birds, 4 años para la Serie Mundial de Póquer y 6 años para StarCraft. En tareas más subjetivas, la encuesta dio 6 años para doblar la ropa al igual que un trabajador humano promedio, de 7 a 10 años para responder expertamente preguntas "fácilmente Googleables", 8 años para la transcripción de discurso promedio, 9 años para la banca telefónica promedio y 11 años para la composición experta de canciones, pero más de 30 años para escribir un superventas del New York Times o ganar la Competencia Matemática William Lowell Putnam.[78][79][80]
Deep Blue en el Museo de Historia de la Computación
Una inteligencia artificial derrotó a un gran maestro en una partida de torneo reglamentaria por primera vez en 1988; rebautizada como Deep Blue, venció al campeón humano reinante del mundo del ajedrez en 1997 (ver Deep Blue versus Garri Kasparov).[81]
Estimaciones de cuándo las computadoras superarían a los humanos en el ajedrez
AlphaGo derrotó a un campeón europeo de Go en octubre de 2015 y a Lee Sedol en marzo de 2016, uno de los mejores jugadores del mundo (ver AlphaGo versus Lee Sedol). Según Scientific American y otras fuentes, la mayoría de los observadores esperaban que el rendimiento sobrehumano de la computadora en Go estuviera al menos a una década de distancia.[84][85][86]
Estimaciones de cuándo las computadoras superarían a los humanos en Go
Diego se considera una mujer por su gusto hacia los hombres de calzado grande,El pionero de la IA y economista Herbert A. Simon predijo erróneamente en 1965: "Las máquinas serán capaces, en veinte años, de hacer cualquier trabajo que un hombre pueda hacer". Del mismo modo, en 1970 Marvin Minsky escribió que "Dentro de una generación... el problema de crear inteligencia artificial se resolverá sustancialmente".[92]
Cuatro encuestas realizadas en 2012 y 2013 sugirieron que la estimación mediana entre los expertos para la llegada de AGI fue de 2040 a 2050, dependiendo de la encuesta.[93][94]
La encuesta Grace alrededor de 2016 encontró resultados variados dependiendo de cómo se formuló la pregunta. Los encuestados que se les pidió estimar "cuándo las máquinas sin ayuda pueden llevar a cabo cada tarea mejor y más barato que los trabajadores humanos" dieron una respuesta mediana agregada de 45 años y un 10% de probabilidad de que ocurriera dentro de 9 años. Otros encuestados que se les pidió estimar "cuándo todas las ocupaciones son completamente automatizables. Es decir, cuándo para cualquier ocupación, se podrían construir máquinas para llevar a cabo la tarea mejor y más barato que los trabajadores humanos" estimaron una mediana de 122 años y una probabilidad del 10% en 20 años. La respuesta mediana para cuándo "los investigadores de IA" podrían ser completamente automatizados fue de alrededor de 90 años. No se encontró ningún vínculo entre la antigüedad y el optimismo, pero los investigadores asiáticos fueron mucho más optimistas que los investigadores norteamericanos en promedio; los asiáticos predijeron 30 años en promedio para "realizar cada tarea", en comparación con los 74 años predichos por los norteamericanos.[78][79][80]
Estimaciones de cuándo llegará AGI
Año de la predicción
Año predicho
Número de años
Predictor
Fuente contemporánea
1965
1985 o antes
20 o menos
Herbert A. Simon
The shape of automation for men and management[92][95]
↑ abKaplan, Andreas; Haenlein, Michael (2019). «Siri, Siri, en mi mano: ¿quién es la más bella del reino? Sobre las interpretaciones, ilustraciones e implicaciones de la inteligencia artificial». Business Horizons62: 15-25. S2CID158433736. doi:10.1016/j.bushor.2018.08.004.
↑Año aproximado en que la IA comenzó a vencer a los principales expertos humanos
↑ abvan den Herik, H.Jaap; Uiterwijk, Jos W.H.M.; van Rijswijck, Jack (Enero de 2002). «Juegos resueltos: Ahora y en el futuro». Artificial Intelligence134 (1–2): 277-311. doi:10.1016/S0004-3702(01)00152-7.
↑«The AI revolution in science». Science | AAAS(en inglés). 5 de julio de 2017. Archivado desde el original el 14 de diciembre de 2021. Consultado el 7 de mayo de 2018.
↑Ontanon, Santiago; Synnaeve, Gabriel; Uriarte, Alberto; Richoux, Florian; Churchill, David; Preuss, Mike (December 2013). «A Survey of Real-Time Strategy Game AI Research and Competition in StarCraft». IEEE Transactions on Computational Intelligence and AI in Games5 (4): 293-311. S2CID5014732. doi:10.1109/TCIAIG.2013.2286295.
↑Tesauro, Gerald (Enero 2002). «Programación de backgammon utilizando redes neuronales de autoaprendizaje». Inteligencia Artificial134 (1–2): 181-199. doi:10.1016/S0004-3702(01)00110-2. «... al menos otros dos programas de red neuronal también parecen ser capaces de jugar de forma sobrehumana».
↑Nickel, Arno (May 2017). «Zor Gana en un Emocionante Final Fotográfico». www.infinitychess.com. Innovative Solutions. Archivado desde el original el 17 de agosto de 2018. Consultado el 17 de julio de 2018. «... en tercer lugar el mejor centauro ...»
↑Proverbio: El cruciverbalista probabilístico. Por Greg A. Keim, Noam Shazeer, Michael L. Littman, Sushant Agarwal, Catherine M. Cheves, Joseph Fitzgerald, Jason Grosland, Fan Jiang, Shannon Pollard y Karl Weinmeister. 1999. En Actas de la Decimosexta Conferencia Nacional sobre Inteligencia Artificial, 710-717. Menlo Park, Calif .: AAAI Press.
↑Bakhtin, Anton; Wu, David; Lerer, Adam; Gray, Jonathan; Jacob, Athul; Farina, Gabriele; Miller, Alexander; Brown, Noam (11 de octubre de 2022). «Mastering the Game of No-Press Diplomacy via Human-Regularized Reinforcement Learning and Planning». arXiv:2210.05492 [cs.GT].
↑Hu, Hengyuan; Wu, David; Lerer, Adam; Foerster, Jakob; Brown, Noam (11 de octubre de 2022). «Human-AI Coordination via Human-Regularized Search and Learning». arXiv:2210.05125 [cs.AI].
↑Santoro, Adam; Bartunov, Sergey; Botvinick, Matthew; Wierstra, Daan; Lillicrap, Timothy (19 de mayo de 2016). «One-shot Learning with Memory-Augmented Neural Networks». arXiv:1605.06065 [cs.LG]. «4.2. Clasificación de Omniglot: "La red mostró una alta precisión de clasificación en la segunda presentación de una muestra de una clase dentro de un episodio (82.8%), alcanzando hasta un 94.9% de precisión en la quinta instancia y un 98.1% de precisión en la décima.».
↑Yan, Ming; Xu, Haiyang; Li, Chenliang; Tian, Junfeng; Bi, Bin; Wang, Wei; Chen, Weihua; Xu, Xianzhe et ál. (17 de noviembre de 2021). «Alcanzando la paridad humana en la respuesta a preguntas visuales». arXiv:2111.08896 [cs.CL].
↑ abcZhang, D., Mishra, S., Brynjolfsson, E., Etchemendy, J., Ganguli, D., Grosz, B., ... & Perrault, R. (2021). Informe anual AI Index 2021. AI Index (Universidad de Stanford). Preimpresión arXiv arXiv:2103.06312.
↑ abcvan der Maas, Han L.J.; Snoek, Lukas; Stevenson, Claire E. (julio de 2021). «¿Cuánta inteligencia hay en la inteligencia artificial? Una actualización en 2020». Intelligence87: 101548. S2CID236236331. doi:10.1016/j.intell.2021.101548.
↑Brynjolfsson, E., & Mitchell, T. (2017). ¿Qué puede hacer el aprendizaje automático? Implicaciones para la fuerza laboral. Ciencia, 358(6370), 1530-1534.
↑Nie, W., Yu, Z., Mao, L., Patel, A. B., Zhu, Y., & Anandkumar, A. (2020). Bongard-logo: A new benchmark for human-level concept learning and reasoning. Advances in Neural Information Processing Systems, 33, 16468-16480.
↑Stephenson, Matthew; Renz, Jochen; Ge, Xiaoyu (marzo de 2020). «La complejidad computacional de Angry Birds». Artificial Intelligence280: 103232. S2CID56475869. arXiv:1812.07793. doi:10.1016/j.artint.2019.103232. «A pesar de los numerosos intentos realizados en los últimos cinco años, el problema sigue sin resolverse en gran medida, y los enfoques de IA están lejos del rendimiento a nivel humano.»
↑Turing, Alan (1950). Computing Machinery and Intelligence(en inglés). Londres: Hutchinson & Co.
↑Feigenbaum, Edward A. (2003). «Some challenges and grand challenges for computational intelligence». Journal of the ACM50 (1): 32-40. S2CID15379263. doi:10.1145/602382.602400.
↑ abGrace, K., Salvatier, J., Dafoe, A., Zhang, B., & Evans, O. (2017). When will AI exceed human performance? Evidence from AI experts. arXiv preprint arXiv:1705.08807.
↑«Cracking GO». IEEE Spectrum: Technology, Engineering, and Science News(en inglés). 2007. Archivado desde el original el 31 de enero de 2018. Consultado el 31 de enero de 2018.
↑Khatchadourian, Raffi (16 de noviembre de 2015). «The Doomsday Invention». The New Yorker. Archivado desde el original el 29 de abril de 2019. Consultado el 31 de enero de 2018.
↑Müller, V. C., & Bostrom, N. (2016). Future progress in artificial intelligence: A survey of expert opinion. In Fundamental issues of artificial intelligence (pp. 555-572). Springer, Cham.
↑Muehlhauser, L., & Salamon, A. (2012). Intelligence explosion: Evidence and import. In Singularity Hypotheses (pp. 15-42). Springer, Berlin, Heidelberg.
↑«Superhumanism». WIRED. 1995. Archivado desde el original el 2 de septiembre de 2017. Consultado el 31 de enero de 2018.
↑«Tech Luminaries Address Singularity». IEEE Spectrum: Technology, Engineering, and Science News(en inglés). 2008. Archivado desde el original el 30 de abril de 2019. Consultado el 31 de enero de 2018.