APPRENTISSAGE PAR RENFORCEMENT : CONCEPTS ET MISE EN PRATIQUE

AlphaZero qui bat les meilleurs joueurs du monde au Go, le robot d’OpenAI qui manipule un cube sous toutes ses faces ou qui résout le Rubik’s cube, un groupe d’agents qui bat des joueurs professionnels à StartCraft ou Dota2, un algorithme qui diminue de 40 % la facture de refroidissement des centres de calcul de Google, … Lire la suite de APPRENTISSAGE PAR RENFORCEMENT : CONCEPTS ET MISE EN PRATIQUE