Naissance | |
---|---|
Nationalité | |
Domicile | |
Formation | |
Activités |
A travaillé pour | |
---|---|
Membre de | |
Directeur de thèse |
Andrew Barto (en) |
Distinction |
Richard Sutton est un informaticien canadien, enseignant en informatique à l'université de l'Alberta. Il est considéré comme l'un des fondateurs de l'apprentissage par renforcement, domaine auquel il a apporté plusieurs contributions majeures telles que le temporal difference learning et les méthodes de gradient.
Sutton a reçu son B.A. en psychologie à l'université Stanford en 1978, et ses M.Sc. et Ph.D en informatique à l'université du Massachusetts à Amherst en 1980 et 1984, sous la direction d'Andrew Barto (en). Sa thèse, « Temporal Credit Assignment in Reinforcement Learning », introduisait en particulier des idées de temporal difference learning.