Opisany poprzednio agent handlowy wykonał proste zadanie, które zresztą zostało naprawione. Jego interakcja ze światem została pokazana na rysunku
Agent znalazł to, czego chciał i powiedział użytkownikowi. Ale załóżmy, że użytkownikowi nie spodobało się to, co zobaczył? A może użytkownik kupił wtedy towar i miał złe doświadczenia z dostawą od konkretnego sprzedawcy? Oczywiście powinien istnieć sposób na modyfikację zachowania agenta w celu poprawy przyszłych wyników w odpowiedzi na informacje zwrotne ze świata zewnętrznego (w tym przypadku klienta
Cel pozostał ten sam, ale strategia obejmuje teraz zdolność adaptacyjną, która reaguje na otoczenie zewnętrzne. Adaptacyjni agenci tego typu są wykorzystywane do wielu zadań, głównie do selektywnego wyszukiwania informacji, w ramach opisów profilowania osobistego, preferowania itp. Mają one na celu stopniowe poznawanie preferencji osób i dostarczanie tylko tych informacji, które spełniają określone wymagania. profil użytkownika na podstawie poprzedniego wyboru. Mechanizm uczenia się może być zainicjowany przez indywidualnego użytkownika, który opiniuje wcześniejsze informacje dostarczone przez agenta lub w wyniku zbiorowych decyzji zebranych przez agenta centralnego i rozesłanych do poszczególnych agentów użytkownika jako informacja zwrotna ze świata zewnętrznego. Wyjaśniając to ostatnie bardziej szczegółowo: wyobraź sobie, że zbierasz informacje o wyborach filmowych wielu użytkowników. Analiza statystyczna prawie na pewno wykaże, że grupa użytkowników, którzy lubią jeden film bardziej niż przeciętna populacja, będzie również podzielała wspólną opinię o innym filmie. Tak więc, jeśli mój agent zebrał tabelę moich upodobań i niechęci, może zaoferować ją agentowi maklerskiemu, który może przechowywać tabele preferencji dla dużej populacji widzów. Porównując moje sympatie i antypatie z preferencjami innych widzów, można zidentyfikować filmy, które widzowie o podobnych poglądach widzieli i polubili, ale których ja nie widziałem. Agent brokerski może następnie wysłać te informacje do mojego spersonalizowanego agenta, mówiąc: „Myślę, że ci się to spodoba”. Jeśli zdecyduję się go obejrzeć, zostaniesz poproszony o jego przejrzenie, a to doprowadzi do modyfikacji mojej tabeli preferencji. Oznacza to, że element adaptacyjny wszedł w strategię doboru mojego agenta. (Ale nie do mojego celu, którym pozostaje „Znajdź przyjemny film”).