
Collective coordination in dynamic environments
C2S2 Seminars

Abstract
Comportamenti intelligenti, sia nei sistemi biologici sia in quelli artificiali, sono di natura adattiva: rispondono in modo flessibile ai cambiamenti delle condizioni esterne, tenendo conto degli stati interni del sistema e dei suoi obiettivi. Fatta eccezione per gli organismi unicellulari, i sistemi adattivi sono generalmente composti da più componenti che interagiscono tra loro. Questo solleva una questione centrale: come possono tali componenti coordinare le proprie azioni a beneficio dell’intero sistema, soprattutto in ambienti dinamici dove le strategie ottimali possono cambiare nel tempo?
Nei contesti di apprendimento, questa sfida è nota come problema dell’assegnazione strutturale del merito (structural credit assignment problem): la difficoltà di determinare in che modo le azioni individuali contribuiscano ai risultati collettivi. In questo intervento presento un lavoro in corso che utilizza un compito multi-agente basato sul paradigma multi-armed bandit (MAMAB) in un ambiente dinamico con ricompense collettive. L’obiettivo è esplorare come possa emergere un coordinamento efficace a partire da semplici meccanismi cognitivi e sociali, attraverso simulazioni basate su agenti e esperimenti condotti con esseri umani.
Passcode: 882647