Deep Reinforcing Learning

L'apprentissage profond par renforcement (Deep Reinforcement Learning, DRL) est un domaine de l'intelligence artificielle qui combine l'apprentissage par renforcement classique et les réseaux de neurones profonds. Il s'agit d'entraîner un agent à prendre des décisions séquentielles dans un environnement complexe, où l'agent apprend à maximiser une récompense cumulative. Le DRL se distingue des autres méthodes d'apprentissage automatique en ce qu'il n'est pas supervisé par des exemples de sorties correctes, mais apprend par essais et erreurs, en interagissant avec l'environnement. Cette approche permet de traiter des problèmes avec des espaces d'états et d'actions très vastes ou continus, là où les méthodes traditionnelles échouent.

Cas d'usages et exemples d'utilisation

Le DRL est utilisé dans le contrôle de robots, permettant à des machines d'apprendre des tâches complexes comme la manipulation d'objets ou la locomotion. Il est également exploité dans les jeux vidéo (AlphaGo, Dota 2), la gestion de portefeuilles financiers, l'optimisation des réseaux de communication, la gestion énergétique des bâtiments intelligents, ou encore la conception de stratégies pour la conduite autonome.

Principaux outils logiciels, librairies, frameworks, logiciels

Parmi les principaux outils de DRL, on retrouve TensorFlow Agents, Stable Baselines3, RLlib (Ray), OpenAI Baselines, ou encore Keras-RL. Ces librairies offrent des implémentations prêtes à l'emploi des principaux algorithmes tels que DQN, PPO, A3C, DDPG, ou SAC, facilitant la conception, l'entraînement et l'évaluation d'agents en environnement simulé ou réel.

Derniers développements, évolutions et tendances

Les recherches récentes s'orientent vers une meilleure stabilité de l'apprentissage, la généralisation à des environnements inconnus, et la réduction des besoins en données d'entraînement. L'intégration du DRL avec l'apprentissage par imitation, le meta-learning et l'apprentissage multi-agent ouvre de nouvelles perspectives, tout comme l'application à des environnements réels complexes et dynamiques. Les tendances incluent aussi l'amélioration de l'efficacité computationnelle et la démocratisation de l'accès via des plateformes open source.

9 articles liés à ce sujet

Retour sur la seconde édition du symposium « Artificial Intelligence and Medicine : promises and limits »

Le CSAIL, laboratoire d’informatique et d’intelligence artificielle du MIT, l’Institut d’ingénierie et des sciences médicales du MIT, l’Académie natio...

Recherche en intelligence artificielle Marché de l'IA

04/11/2022 Lire la suite →

Inflection AI, nouvelle société de logiciels fondée par Reid Hoffman, Mustafa Suleyman et Karén Simonyan

Reid Hoffman, co-fondateur du réseau social professionnel LinkedIn, Mustafa Suleyman, co-fondateur de Deepmind et Karén Simonyan, anciennement cherche...

Marché de l'IA

10/03/2022 Lire la suite →

DeepMind présente une solution de génération automatique d’algorithmes d’apprentissage par renforcement

Les chercheurs de DeepMind ont présenté le 17 juillet dernier dans un article sur Arxiv une étude sur les algorithmes d’apprentissage par renforcement...

Recherche en intelligence artificielle

23/07/2020 Lire la suite →

Appel à papiers pour la conférence sur l'Apprentissage Automatique CAp 2018

La conférence sur l'Apprentissage Automatique CAp se tiendra du 20 au 22 juin prochain. Organisée par l'INSA de Rouen, elle se veut un rassemblement i...

Recherche en intelligence artificielle

12/03/2018 Lire la suite →

Grâce au Lifelong Learning et au projet LIHLITH, Synapse cherche à améliorer les capacités d'auto-apprentissage des IA

Machine learning, Deep learning, apprentissage supervisé ou non-supervisé, de nombreux projets cherchent à améliorer les techniques d'apprentissage de...

Recherche en intelligence artificielle

19/02/2018 Lire la suite →

Facebook ouvre un nouveau laboratoire laboratoire de recherche en intelligence artificielle et investit à Montréal

En 2015, Facebook avait créé à Paris le FAIR, son laboratoire de recherche en intelligence artificielle, dirigé par Yann LeCun. C'est désormais à Mont...

Recherche en intelligence artificielle Marché de l'IA

18/09/2017 Lire la suite →

Salesforce Research se concentre sur le langage naturel pour les bases SQL

Salesforce Research a publié cette semaine un article dévoilant ses avancées sur le langage naturel. Intitulé « Seq2SQL : générer des requêtes structu...

Produit commercial

01/09/2017 Lire la suite →

DeepLoco: un modèle informatique bipède entrainé par apprentissage à renforcement hiérarchique

Des chercheurs de l'Université Nationale de Singapour et de l'Université de Colombie-Britannique travaillent sur un modèle informatique bipède capable...

Recherche en intelligence artificielle

03/08/2017 Lire la suite →

Sonnet, la bibliothèque de réseau neuronal orientée objet de DeepMind, devient open source

En 2015, Google rendait open source TensorFlow, sa bibliothèque d'apprentissage automatique. La firme a également lancé en open source, en décembre 20...

Outils et technos

18/04/2017 Lire la suite →

Tendances

Comprendre l'IA

Applications de l'IA

Deep Reinforcing Learning

Cas d'usages et exemples d'utilisation

Principaux outils logiciels, librairies, frameworks, logiciels

Derniers développements, évolutions et tendances

Retour sur la seconde édition du symposium « Artificial Intelligence and Medicine : promises and limits »

Inflection AI, nouvelle société de logiciels fondée par Reid Hoffman, Mustafa Suleyman et Karén Simonyan

DeepMind présente une solution de génération automatique d’algorithmes d’apprentissage par renforcement

Appel à papiers pour la conférence sur l'Apprentissage Automatique CAp 2018

Grâce au Lifelong Learning et au projet LIHLITH, Synapse cherche à améliorer les capacités d'auto-apprentissage des IA

Facebook ouvre un nouveau laboratoire laboratoire de recherche en intelligence artificielle et investit à Montréal

Salesforce Research se concentre sur le langage naturel pour les bases SQL

DeepLoco: un modèle informatique bipède entrainé par apprentissage à renforcement hiérarchique

Sonnet, la bibliothèque de réseau neuronal orientée objet de DeepMind, devient open source