Интелигентен агент (на английски: intelligent agent), още наричан рационален агент (rational agent), е понятие от изкуствения интелект, с което се означава автономен обект, който възприема околната си среда посредством сензори и извършва действия над тази среда посредством ефектори (actuators) в опит за изпълнение на известни цели. Концепцията за интелигентните агенти е силно застъпвана от теоретиците на изкуствения интелект Стюарт Ръсел и Питър Норвиг.
В литературата интелигентните агенти още се наричат:
Като конкретни примери на това широко определение се включват:
На тази база, една по-строга дефиниция на рационален агент е следната:
Оценката на ефективността на поведението, средата, ефекторите и сензорите на агента (PEAS, Performance measure, Environment, Actuators, Sensors) са елементи на спецификацията на всеки конкретен интелигентен агент. В този смисъл, първоначално вградените и впоследствие възприетите знания за средата могат да се смятат за ограничения или условия, които определят колко рационално / интелигентно е поведението на агента, но е възможно при различен набор от вградени и възприети знания поведението му да се окаже нерационално / неинтелигентно. Когато се говори за интелигентни агенти, се прави общото допускане, че агентът може да възприема собствените си действия, но не винаги може да възприема резултатите от тях.
Математически казано, поведението на интелигентния агент се описва от функция на агента, която представлява изображение , която съпоставя на всяка възможна поредица от възприятия действие , което агентът е способен да извърши. Това изображение може да се представи като таблица, която може да бъде и безкрайна, освен ако не се въведе ограничение върху дължината на разглежданите поредици от възприятия.
Таблицата на изображението е външна характеристика на агента; вътрешното представяне на функцията на агента е програмата на агента, стартирана над определена архитектура. Всъщност, точно проектирането на програми на интелигентни агенти, според Ръсел и Норвиг, е задачата на изкуствения интелект. В предложената от тях структура на интелигентен агент
където архитектурата представлява изчислителното устройство с физически сензори и ефектори и памет, съхраняваща част от историята на възприятията и действията на агента. Тялото на програмата представлява цикъл, всяка стъпка на който включва възприятие (отразявано в паметта), избиране и осъществяване на действие (също отразявано в паметта).
За реализацията на програмата на агента могат да се използват различни, често нетрадиционни техники: разсъждения, основани на знания, статистически анализ, размита логика, невронни мрежи, генетично програмиране и други.
Ръсел и Норвиг групират агентите в пет класа, на базата на възприетата им интелигентност и способности:
Простите рефлекторни агенти действат единствено на базата на текущото си възприятие (рефлекс). Функцията на агента е базирана на правила за причинна следственост от вид „условие – действие“ (condition-action rules). Този вид агент може да функционира само ако правилното решение за действие може да се вземе на базата само на текущото възприятие, т.е. ако средата е напълно обозрима. Програмите на такива агенти могат да бъдат много ефективни, но приложимостта им е малка.
Агентите, основани на модели, могат да функционират в частично обозрими светове (среди). Текущото състояние на агента се съхранява в своеобразна структура в паметта на агента, която описва онази част от средата, която не може да бъде възприета, както и историята от въздействието на агента над тази среда. Агент с такова поведение има нужда от информация за това какво е поведението и действието на тази част от света. Изборът на действие също се основава на правила за причинна следственост, както при простите рефлекторни агенти.
Агентите, основани на цели, са разновидност на агентите, основани на модели, които пазят информация за желани ситуации. Това позволява на агента да избира измежду множество възможни действия онова, чиито резултати водят до достигането на дефинираното желано състояние.
Тези агенти правят разлика само между целеви (желани) състояния и нецелеви. Възможно е да се дефинира оценка колко желано е дадено конкретно състояние. Оценката може да се получи, като се използва функция на полезността (utility function), която задава съответствието между състояние (или поредица от състояния) и реално число, описващо степента на удовлетвореност от или полезност на състоянието.
Пълната спецификация на функцията на полезността позволява да се вземат рационални решения в двата случая, когато целите са неадекватни:
Самообучението има предимството, че позволява на агентите първоначално да функционират в неизвестни среди и с функционирането си да стават по-компетентни и опитни, отколкото първоначално заложените в тях знания сами по себе си им позволяват да са – идея, която лансира още Алан Тюринг през 1950 година.
Обучаващите се агенти са своеобразна еманация на останалите четири вида. Когато интелигентен агент се проектира за обучаващ се, той се разделя на четири концептуални елемента:
Средите, в които агентите функционират, могат да се определят по различни начини. Техните характеристики до голяма степен определят подходящия подход към проектирането на агента.
Ако сензорите на агента му дават достъп, във всеки момент от време, до цялостното състояние на средата, то тя се нарича напълно обозрима. Средата е дори ефективно обозрима, ако сензорите на агента могат да уловят всички аспекти, които имат отношение към избора на действие от старта на агента. Средата може да бъде частично обозрима, ако за някои аспекти от средата агентът няма необходимите сензори или те са неточни или съдържат шум.
Среда, която е напълно детерминирана, е такава, при която следващото състояние на средата е изцяло зависимо от предходното ѝ състояние и от действието на агента върху нея. Ако в средата присъства елемент на несигурност, то средата е стохастична. От гледна точка на агента дори детерминирана, но частично обозрима среда също ще изглежда стохастична. Среда, която е напълно определена от предшестващото състояние и действията на множество агенти, се нарича стратегическа.
В епизодичната среда, възприятията и опитът на агента се разделят на атомарни епизоди, като всеки епизод се състои от възприятие, последвано от действие. Съществената характеристика е, че следващият епизод не зависи от действията на агента в предния епизод. Много от класификационните задачи се извършват в епизодични среди; например класифицирането на елементи от поточна линия като изправни и дефектни е задача в епизодична среда: поведението на агента и класифицирането на следващия елемент от поточната линия като не зависи от това как е бил класифициран предния елемент. Обратно, при серийни среди текущото решение може да повлияе на всички следващи решения и от агента се иска да „мисли в перспектива“.
Статичната среда е такава, която не се променя от едно състояние в друго, докато агентът анализира възприятието и обмисля действието си. С други деми, единствените промени, които настъпват в средата, са тези, предизвикани от самия агент. Динамичната среда може да се променя междувременно и ако агентът не реагира на промяната навреме, това се интерпретира като негов избор да не предприеме действие. Ако средата сама по себе си не се променя с времето, но функционирането на агента се променя, то наричаме тази среда полудинамична.
Разграничението се отнася до това дали средата се състои от краен или безкраен брой от възможни състояния. Дискретната среда съдържа краен брой възможни състояния, или от гледна точка на агента – краен брой възприятия и действия. От друга страна, ако средата е дискретна и броят състояния е краен, но изключително голям, това за интелигентния агент е равносилно на непрекъсната среда.
Дадена среда се счита за многоагентна, ако разглежданият интелигентен агент трябва да функционира в сътрудничество или в конкуренция с друг агент, за да изпълни определени задачи или да постигне определена цел. В противен случай, другият агент в средата ще се възприема като стохастично действаща част от средата. Задачите при проектиране на многоагентни среди обикновено са по-различни от тези при едноагентните: често в рамките на рационалното поведение на агентите в многоагентна среда възниква комуникация.
Агентна среда | Обозримост | Детерминираност | Епизодичност | Статичност | Дискретност | Брой агенти |
---|---|---|---|---|---|---|
Кръстословица | напълно обозрима | детерминирана | серийна | статична | дискретна | едноагентна |
Шах с контрол на времето | напълно обозрима | стратегическа | серийна | полудинамична | дискретна | многоагентна |
Покер | частично обозрима | стратегическа | серийна | статична | дискретна | многоагентна |
Табла | напълно обозрима | стохастична | серийна | статична | дискретна | многоагентна |
Шофиране на автопилот | частично обозрима | стохастична | серийна | динамична | непрекъсната | многоагентна |
Медицинска диагностика | частично обозрима | стохастична | серийна | динамична | дискретна | едноагентна |
Анализ на образи | напълно обозрима | детерминирана | епизодична | полудинамична | непрекъсната | едноагентна |
Робот на поточна линия | частично обозрима | стохастична | епизодична | динамична | непрекъсната | едноагентна |
Контролер в рафинерия | частично обозрима | стохастична | серийна | динамична | непрекъсната | едноагентна |
Интерактивен самоучител по език |
частично обозрима | стохастична | серийна | динамична | дискретна | многоагентна |