التقدم في التصنيف الآلي للصور معدل الخطأ في الذكاء الاصطناعي حسب السنة.الخط الأحمر - معدل خطأ الإنسان المدرب في مهمة معينة.
التقدم في الذكاء الاصطناعي ( بالانجليزيةProgress in artificial: intelligence ) يشير إلى التقدم والإنجازات التي تم تحقيقها في مجال الذكاء الاصطناعي مع مرور الوقت. الذكاء الاصطناعي هو فرع متعدد التخصصات من علوم الحاسب الآلي يهدف إلى إنشاء آلات وأنظمة قادرة على أداء المهام التي تتطلب عادة الذكاء البشري.
اُستخدمت تطبيقات الذكاء الاصطناعي في مجموعة واسعة من المجالات بما في ذلك التشخيص الطبي، والتطبيقات الاقتصادية والمالية، والتحكم في الروبوت، والقانون ، والاكتشاف العلمي كذلك، وألعاب الفيديو ، وألعاب الأطفال. ومع ذلك، لاتعتبر كل التطبيقات للذكاء الاصطناعي في حد ذاتها ذكاءا اصطناعيا : "لقد تم ترشيح الكثير من تطبيقات الذكاء الاصطناعي المتطورة إلى تطبيقات عامة، غالبًا دون أن يطلق عليها اسم الذكاء الاصطناعي لأنه بمجرد أن يصبح شيء ما مفيدًا وشائعًا بدرجة كافية، فإنه لا يُسمى ذكاء اصطناعي بعد الآن ." [1][2] "الالاف من تطبيقات الذكاء الاصطناعي مدمجة بعمق في البنية التحتية لكل صناعة." [3] في أواخر التسعينيات وأوائل القرن الحادي والعشرين، أصبحت تكنولوجيا الذكاء الاصطناعي تُستخدم على نطاق واسع كعناصر لأنظمة أكبر، [3][4] ولكن نادرًا ما يُنسب الفضل إلى هذا المجال في هذه النجاحات في ذلك الوقت.
يقوم كابلان وهاينلاين ببناء الذكاء الاصطناعي على ثلاث مراحل تطورية:
الذكاء الاصطناعي الضيق - تطبيق الذكاء الاصطناعي فقط على مهام محددة؛
الذكاء العام الاصطناعي تطبيق الذكاء الاصطناعي على العديد من المجالات والقادر على حل المشكلات التي لم تكن مصممة من أجلها بشكل مستقل؛
كي تتم المقارنة مع الاداء البشري ، يمكن تقييم الذكاء الاصطناعي على أساس مشاكل مقيدة ومحددة بشكل جيد. وقد تم تسمية مثل هذه الاختبارات باختبارات تورينج المتخصصة. كما أن المشكلات الأصغر توفر أهدافًا أكثر قابلية للتحقيق، وهناك عدد متزايد باستمرار من النتائج الإيجابية.
لا يزال البشر يتفوقون بشكل كبير على كل من شات جي بي تي 4 والنماذج المدربة وفقًا لمعيار ConceptARC الذي سجل 60% في معظم الفئات، و77% في فئة واحدة، بينما حقق البشر 91% في جميع الفئات و97% في فئة واحدة.[5]
هناك العديد من القدرات المفيدة التي يمكن وصفها بأنها تظهر شكلاً من أشكال الذكاء. وهذا يعطي نظرة أفضل للنجاح المقارن للذكاء الاصطناعي في مجالات مختلفة.
الذكاء الاصطناعي، مثل الكهرباء أو المحرك البخاري، هو تقنية ذات أغراض عامة . لا يوجد إجماع حول كيفية تحديد المهام التي يميل الذكاء الاصطناعي إلى التفوق فيها.[6] تلاحظ بعض إصدارات مفارقة مورافيك أن البشر هم أكثر عرضة للتفوق على الآلات في مجالات مثل البراعة الجسدية التي كانت الهدف المباشر للانتقاء الطبيعي.[7] في حين نجحت مشاريع مثل AlphaZero في توليد المعرفة الخاصة بها من الصفر، فإن العديد من مشاريع التعلم الآلي الأخرى تتطلب مجموعات بيانات تدريب كبيرة.[8][9] اقترح الباحث أندرو إنج ، باعتبارها "قاعدة عامة غير كاملة إلى حد كبير"، أن "أي شيء يمكن أن يفعله الإنسان العادي تقريبًا بأقل من ثانية واحدة من التفكير العقلي، ربما يمكننا الآن أو في المستقبل القريب أتمتة باستخدام الذكاء الاصطناعي".[10]
توفر الألعاب معيارًا رفيع المستوى لتقييم معدلات التقدم؛ تتمتع العديد من الألعاب بقاعدة كبيرة من اللاعبين المحترفين ونظام تصنيف تنافسي راسخ. أنهى برنامج AlphaGo عصر معايير ألعاب الطاولة الكلاسيكية عندما أثبت الذكاء الاصطناعي قدرته التنافسية على البشر في عام 2016. هزم برنامج AlphaGo AI التابع لشركة Deep Mind أفضل لاعب Go محترف في العالم Lee Sedol .[11] توفر الألعاب ذات المعرفة غير الكاملة تحديات جديدة للذكاء الاصطناعي في مجال نظرية الألعاب ؛ تم الانتهاء من أبرز المعالم في هذا المجال بفوز Libratus في لعبة البوكر في عام 2017.[12][13] تستمر الرياضات الإلكترونية في تقديم معايير إضافية؛ لقد تفاعل Facebook AI و Deepmind وآخرون مع امتياز StarCraft الشهير لألعاب الفيديو.[14][15]
يمكن تقديم فئات واسعة من نتائج اختبار الذكاء الاصطناعي على النحو التالي:
الأمثل : ليس من الممكن تقديم أداء أفضل (ملاحظة: تم حل بعض هذه الإدخالات بواسطة البشر)
لعبة البوكر هولدم الفردية : مثالية إحصائيًا بمعنى أن "عمر الإنسان من اللعب ليس كافيًا لإثبات ذات دلالة إحصائية أن الإستراتيجية ليست حلاً دقيقًا" (2015) [18]
الشطرنج : الكمبيوتر العملاق (ج. 1997); الكمبيوتر الشخصي (ج. 2006)؛ [25] الهاتف المحمول (ج. 2009)؛ [26] الكمبيوتر يهزم الإنسان + الكمبيوتر (ج. 2017) [27]
في اختبار تورينج الشهير، اختار آلان تورينج اللغة، السمة المميزة للبشر ، كأساس لها. يعتبر اختبار تورينج الآن قابلاً للاستغلال بدرجة كبيرة بحيث لا يكون معيارًا ذا معنى.[61]
تهدف اختبارات "الذكاء العالمي" المقترحة إلى مقارنة مدى نجاح الآلات والبشر وحتى الحيوانات غير البشرية في حل مجموعة من المشكلات العامة قدر الإمكان. في أقصى الحالات، يمكن لمجموعة الاختبار أن تحتوي على كل مشكلة محتملة، مرجحة بتعقيد كولموغوروف ؛ ومع ذلك، فإن مجموعات المشكلات هذه تميل إلى أن تهيمن عليها تمارين مطابقة الأنماط الفقيرة، حيث يمكن للذكاء الاصطناعي المضبوط أن يتجاوز مستويات الأداء البشري بسهولة.[64][65][66][67][68]
وفقًا لـ OpenAI ، في عام 2023، حصل ChatGPTGPT-4 على النسبة المئوية التسعين في اختبار نقابة المحامين الموحد . في اختبارات SAT ، حصل GPT-4 على نسبة 89% في الرياضيات، و93% في القراءة والكتابة. في اختبارات GRE ، حصلت على نسبة 54 في المئة في اختبار الكتابة، و88 في المئة في القسم الكمي، و99 في المئة في القسم اللفظي. لقد حصلت على نسبة 99 إلى 100 في المئة في امتحان نصف النهائي لأولمبياد الأحياء بالولايات المتحدة الأمريكية لعام 2020. لقد حصل على درجة "5" كاملة في العديد من اختبارات AP .[69]
وجد باحثون مستقلون في عام 2023 أن ChatGPT GPT-3.5 "أدى عند أو بالقرب من عتبة النجاح" للأجزاء الثلاثة من امتحان الترخيص الطبي بالولايات المتحدة . تم تقييم GPT-3.5 أيضًا للحصول على درجة منخفضة ولكن ناجحة في امتحانات أربع دورات في كلية الحقوق في جامعة مينيسوتا .[69] اجتاز GPT-4 اختبارًا على غرار لوحة الأشعة النصية.[70][71]
تعمل العديد من المسابقات والجوائز، مثل تحدي Imagenet ، على تشجيع الأبحاث في مجال الذكاء الاصطناعي. تشمل مجالات المنافسة الأكثر شيوعًا الذكاء الآلي العام، وسلوك المحادثة، واستخراج البيانات، والسيارات الآلية ، وكرة القدم الآلية بالإضافة إلى الألعاب التقليدية.[72]
أعطى استطلاع للخبراء في عام 2016 تقريبًا، أجرته Katja Grace من معهد مستقبل الإنسانية وشركاؤها، تقديرات متوسطة لـ 3 سنوات لبطولة Angry Birds ، و4 سنوات لبطولة العالم للبوكر، و6 سنوات لـ StarCraft . وفي المهام الأكثر ذاتية، أعطى الاستطلاع 6 سنوات ل Star craft بالإضافة إلى العامل البشري العادي، و7-10 سنوات للإجابة بخبرة على الأسئلة "التي يمكن الوصول إليها بسهولة عبر Google"، و8 سنوات لمتوسط نسخ الكلام، و9 سنوات لمتوسط الخدمات المصرفية الهاتفية، و11 عامًا. سنوات من الخبرة في كتابة الأغاني، ولكن أكثر من 30 عامًا من كتابة كتاب من أكثر الكتب مبيعًا في صحيفة نيويورك تايمز أو الفوز في مسابقة بوتنام للرياضيات .[73][74][75]
هزم الذكاء الاصطناعي أستاذًا كبيرًا في إحدى مباريات البطولة التنظيمية لأول مرة في عام 1988؛ تم تغيير علامتها التجارية إلى Deep Blue ، وقد تغلبت على بطل العالم في الشطرنج البشري في عام 1997 (انظر Deep Blue vs Garry Kasparov ).[76]
تقديرات متى ستتفوق أجهزة الكمبيوتر على البشر في لعبة الشطرنج
هزم AlphaGo بطل Go الأوروبي في أكتوبر 2015، و Lee Sedol في مارس 2016، وهو أحد أفضل اللاعبين في العالم (انظر AlphaGo مقابل Lee Sedol ). وفقًا لمجلة ساينتفيك أمريكان ومصادر أخرى، توقع معظم المراقبين أن يكون أداء لعبة Computer Go الخارقة بعد عقد من الزمن على الأقل.[79][80][81]
تقديرات متى ستتفوق أجهزة الكمبيوتر على البشر في لعبة Go
تنبأ رائد الذكاء الاصطناعي والاقتصادي هربرت أ. سيمون بشكل غير دقيق في عام 1965: "ستكون الآلات قادرة، في غضون عشرين عامًا، على القيام بأي عمل يمكن للإنسان القيام به". وبالمثل، كتب مارفن مينسكي في عام 1970 أنه "في غضون جيل واحد... سيتم حل مشكلة إنشاء الذكاء الاصطناعي بشكل كبير".[87]
أشارت أربعة استطلاعات للرأي أجريت في عامي 2012 و2013 إلى أن متوسط التقدير بين الخبراء لموعد وصول الذكاء الاصطناعي العام هو من 2040 إلى 2050، اعتمادًا على الاستطلاع.[88][89]
وجد استطلاع غريس في عام 2016 أن النتائج تختلف اعتمادًا على كيفية صياغة السؤال. طُلب من المشاركين تقدير "متى يمكن للآلات غير المدعومة إنجاز كل مهمة بشكل أفضل وبتكلفة أقل من العمال البشر" أعطوا إجابة متوسطة مجمعة تبلغ 45 عامًا وفرصة 10٪ لحدوث ذلك في غضون 9 سنوات. طلب من المشاركين الآخرين تقدير "متى تصبح جميع المهن قابلة للتشغيل الآلي بالكامل. أي متى يمكن بناء آلات لأي مهنة لتنفيذ المهمة بشكل أفضل وبتكلفة أقل من العمال البشريين" وقدر متوسط 122 عامًا واحتمال 10٪ 20 سنه. كان متوسط الاستجابة عندما يمكن أن يصبح "باحث الذكاء الاصطناعي" مؤتمتًا بالكامل حوالي 90 عامًا. ولم يتم العثور على صلة بين الأقدمية والتفاؤل، لكن الباحثين الآسيويين كانوا أكثر تفاؤلاً بكثير من الباحثين في أمريكا الشمالية في المتوسط؛ وتوقع الآسيويون 30 عاما في المتوسط "لإنجاز كل مهمة"، مقارنة بـ 74 عاما تنبأ بها سكان أمريكا الشمالية.[73][74][75]
^ ابKaplan، Andreas؛ Haenlein، Michael (2019). "Siri, Siri, in my hand: Who's the fairest in the land? On the interpretations, illustrations, and implications of artificial intelligence". Business Horizons. ج. 62: 15–25. DOI:10.1016/j.bushor.2018.08.004. S2CID:158433736.
^Ontanon، Santiago؛ Synnaeve، Gabriel؛ Uriarte، Alberto؛ Richoux، Florian؛ Churchill، David؛ Preuss، Mike (ديسمبر 2013). "A Survey of Real-Time Strategy Game AI Research and Competition in StarCraft". IEEE Transactions on Computational Intelligence and AI in Games. ج. 5 ع. 4: 293–311. CiteSeerX:10.1.1.406.2524. DOI:10.1109/TCIAIG.2013.2286295. S2CID:5014732.
^Tesauro، Gerald (يناير 2002). "Programming backgammon using self-teaching neural nets". Artificial Intelligence. ج. 134 ع. 1–2: 181–199. DOI:10.1016/S0004-3702(01)00110-2. ...at least two other neural net programs also appear to be capable of superhuman play
^Nickel، Arno (مايو 2017). "Zor Winner in an Exciting Photo Finish". www.infinitychess.com. Innovative Solutions. مؤرشف من الأصل في 2018-08-17. اطلع عليه بتاريخ 2018-07-17. ... on third place the best centaur ...
^Proverb: The probabilistic cruciverbalist. By Greg A. Keim, Noam Shazeer, Michael L. Littman, Sushant Agarwal, Catherine M. Cheves, Joseph Fitzgerald, Jason Grosland, Fan Jiang, Shannon Pollard, and Karl Weinmeister. 1999. In Proceedings of the Sixteenth National Conference on Artificial Intelligence, 710-717. Menlo Park, Calif.: AAAI Press.
^Wernick، Adam (24 سبتمبر 2014). "'Dr. Fill' vies for crossword solving supremacy, but still comes up short". Public Radio International. مؤرشف من الأصل في 2017-12-28. اطلع عليه بتاريخ 2017-12-27. The first year, Dr. Fill came in 141st out of about 600 competitors. It did a little better the second-year; last year it was 65th
^Santoro، Adam؛ Bartunov، Sergey؛ Botvinick، Matthew؛ Wierstra، Daan؛ Lillicrap، Timothy (19 مايو 2016). "One-shot Learning with Memory-Augmented Neural Networks". p. 5, Table 1. arXiv:1605.06065 [cs.LG]. 4.2. Omniglot Classification: "The network exhibited high classification accuracy on just the second presentation of a sample from a class within an episode (82.8%), reaching up to 94.9% accuracy by the fifth instance and 98.1% accuracy by the tenth.
^Yan، Ming؛ Xu، Haiyang؛ Li، Chenliang؛ Tian، Junfeng؛ Bi، Bin؛ Wang، Wei؛ Chen، Weihua؛ Xu، Xianzhe؛ Wang، Fan (17 نوفمبر 2021). "Achieving Human Parity on Visual Question Answering". arXiv:2111.08896 [cs.CL].
^ ابجZhang, D., Mishra, S., Brynjolfsson, E., Etchemendy, J., Ganguli, D., Grosz, B., ... & Perrault, R. (2021). The AI index 2021 annual report. AI Index (Stanford University). arXiv preprint arXiv:2103.06312.
^Brynjolfsson, E., & Mitchell, T. (2017). What can machine learning do? Workforce implications. Science, 358(6370), 1530-1534.
^Nie, W., Yu, Z., Mao, L., Patel, A. B., Zhu, Y., & Anandkumar, A. (2020). Bongard-logo: A new benchmark for human-level concept learning and reasoning. Advances in Neural Information Processing Systems, 33, 16468-16480.
^Stephenson، Matthew؛ Renz، Jochen؛ Ge، Xiaoyu (مارس 2020). "The computational complexity of Angry Birds". Artificial Intelligence. ج. 280: 103232. arXiv:1812.07793. DOI:10.1016/j.artint.2019.103232. S2CID:56475869. Despite many different attempts over the past five years the problem is still largely unsolved, with AI approaches far from human-level performance.
^Schoenick، Carissa؛ Clark، Peter؛ Tafjord، Oyvind؛ Turney، Peter؛ Etzioni، Oren (23 أغسطس 2017). "Moving beyond the Turing Test with the Allen AI Science Challenge". Communications of the ACM. ج. 60 ع. 9: 60–64. arXiv:1604.04315. DOI:10.1145/3122814. S2CID:6383047.
^Feigenbaum، Edward A. (2003). "Some challenges and grand challenges for computational intelligence". Journal of the ACM. ج. 50 ع. 1: 32–40. DOI:10.1145/602382.602400. S2CID:15379263.
^Hernandez-Orallo، Jose (2000). "Beyond the Turing Test". Journal of Logic, Language and Information. ج. 9 ع. 4: 447–466. DOI:10.1023/A:1008367325700. S2CID:14481982.
^ ابGrace, K., Salvatier, J., Dafoe, A., Zhang, B., & Evans, O. (2017). When will AI exceed human performance? Evidence from AI experts. arXiv preprint arXiv:1705.08807.
^"Cracking GO". IEEE Spectrum: Technology, Engineering, and Science News (بالإنجليزية). 2007. Archived from the original on 2018-01-31. Retrieved 2018-01-31.
^Khatchadourian، Raffi (16 نوفمبر 2015). "The Doomsday Invention". The New Yorker. مؤرشف من الأصل في 2019-04-29. اطلع عليه بتاريخ 2018-01-31.
^Müller, V. C., & Bostrom, N. (2016). Future progress in artificial intelligence: A survey of expert opinion. In Fundamental issues of artificial intelligence (pp. 555-572). Springer, Cham.
^Muehlhauser, L., & Salamon, A. (2012). Intelligence explosion: Evidence and import. In Singularity Hypotheses (pp. 15-42). Springer, Berlin, Heidelberg.