Auteur : Côme Allard de Grandmaison

Couverture : Franck V.

Cet été, la société DeepMind a réalisé une percée sans précédent dans le domaine de l’intelligence artificielle. Avec le développement d’Impala — un outil capable notamment de jouer et progresser simultanément sur 49 jeux vidéo Atari — l’entreprise rachetée par Alphabet (maison mère de Google) en 2014 semble en effet plus proche que jamais de développer la première forme d’intelligence artificielle générale, le Graal pour tous les chercheurs dans le domaine.

Une méta-intelligence

Le site Extreme Tech définit l’intelligence artificielle générale comme une forme d’intelligence artificielle, ou algorithme, capable d’apprendre à réaliser plusieurs actions simultanément tout en réalisant des transferts positifs de manière à accroître encore son efficacité et sa rapidité au cours du processus d’apprentissage. Concrètement, l’algorithme est capable de réemployer des éléments utilisés lors de l’apprentissage d’une tâche afin d’apprendre à en réaliser plus rapidement une autre. Par exemple, si l’on demande à une intelligence artificielle d’apprendre le français, elle va développer un certain nombre d’aptitudes qu’elle va pouvoir utiliser simultanément pour apprendre l’espagnol, sans redémarrer le processus à zéro. Il s’agit donc d’un processus de méta-apprentissage, l’intelligence artificielle apprenant à apprendre afin de maîtriser des tâches variées.

Contrairement aux intelligences artificielles développées jusqu’à aujourd’hui, dites mono-activités, l’intelligence artificielle générale n’a donc pas besoin d’être reprogrammée pour réaliser de nouvelles tâches. Jamais avant Impala un algorithme unique n’avait pu gérer simultanément 30 activités différentes, en l’occurrence jouer à des jeux vidéo, requérant chacune des capacités et connaissances spécifiques. On se contentait pour l’instant d’algorithmes de recommandation pour des sites de streaming, ou sur un mode plus complexe d’intelligence artificielle capables de conduire des véhicules autonomes. Aujourd’hui, cette sectorisation est remise en cause, et des chercheurs envisagent une hypothétique (et imprévisible) « explosion d’intelligence ».

Un fonctionnement radicalement nouveau

Concrètement, Impala se base tout d’abord sur un apprentissage par renforcement. Cette technique est notamment utilisée pour enseigner des jeux complexes ou des émotions aux intelligences artificielles, et décrite par le professeur Dominique Revuz dans l’un de ses cours. Il explique en substance que la répétition enseigne à l’intelligence artificielle, par observation, à adopter le comportement idéal afin de maximiser ses performances et atteindre ses objectifs.

Mais une telle technique n’est pas suffisante pour rendre Impala si révolutionnaire. Cette intelligence artificielle ajoute à l’apprentissage par renforcement « classique » une dimension supplémentaire, qui permet ce « transfert positif » évoqué plus haut. Pour cela, DeepMind a ajouté un nouvel outil d’apprentissage par renforcement, nommé V-trace. Il s’agit d’une version améliorée d’un algorithme « asynchronous advantageactor-critic reinforcement learning », qui permet une évaluation de l’ « acteur » (la partie agissante de l’algorithme) par le « critique » (la partie pensante de l’algorithme), qui réalise ensuite le transfert d’apprentissage. C’est ainsi qu’Impala passe d’un niveau spécifique à un niveau général d’intelligence artificielle. Toutefois, et cela n’est pas pour l’instant l’objectif de DeepMind, l’algorithme n’arrive pas à un niveau de conscience humaine.

Des applications sans limites ?

Au-delà des jeux vidéo, les domaines auxquels peut être appliquée l’intelligence artificielle générale sont multiples, puisqu’elle n’est plus cantonnée à une seule tâche. En 2017, dans un article pour le Global Catastrophic Risk Institute, Seth Baum a recensé 45 projets de recherche autour de l’intelligence artificielle générale, à l’initiative de chercheurs et entreprises. Il estime qu’une majorité d’entre eux ont pour objectifs de bénéficier à l’humanité dans son ensemble ou de « repousser les frontières de la connaissance. » Il identifie quatre buts secondaires : la protection et le bien-être animal ; la protection de l’environnement ; la réalisation du transhumanisme, c’est-à-dire l’accroissement des capacités humaines grâce aux machines ; la génération de profit.

DeepMind, officiellement, s’inscrit dans cette lignée en promettant de tâcher de résoudre, par l’intelligence artificielle, les problèmes les plus pressants de l’époque (les problèmes environnementaux, de santé, de développement). L’atout de l’intelligence artificielle générale est qu’il s’agit d’un algorithme capable de raisonner dans l’incertitude, comme l’explique dans une vidéo Axel Dupuy, directeur de la branche Technology Strategy and Architecture chez Deloitte. Cela peut donc l’amener, au même titre qu’un être humain, à prendre une décision dans un environnement inconnu, contrairement aux intelligences artificielles actuelles qui ne peuvent pas faire plus que ce pour quoi elles ont été programmées. En revanche, contrairement à un être humain, l’intelligence artificielle générale possède une capacité de calculs potentiellement infinie, et peut donc démultiplier la capacité des humains à répondre aux problèmes actuels.

Des réticences infondées ?

DeepMind proclame vouloir développer l’intelligence artificielle de manière à ce que celle-ci ait un « impact positif ». En clair, il s’agit de transformer le monde à l’aide des machines, tout en les gardant sous contrôle. Aucun algorithme n’est pour l’instant capable de s’auto-assigner des objectifs. Cependant, au-delà des cercles technophobes, certains s’inquiètent du développement de l’intelligence artificielle générale et évoquent la singularité technologique, un concept développé en 1993 par le chercheur Vernor Vinge dans un texte célèbre. Dans ce cas de figure, selon le journaliste Jacques Henno, « le progrès ne sera plus l’oeuvre que d’intelligences artificielles en recherche constante d’amélioration de leurs performances, mais aussi de leur autonomie vis-à-vis de leur créateur ». Il tempère toutefois cette idée, en citant des chercheurs qui estiment que si les machines peuvent apprendre de mieux en mieux, et de plus en plus, encore faut-il pour l’instant qu’on leur en intime l’ordre.

Dans le Livre blanc de l’intelligence artificielle, rédigé par Deloitte, une citation de Demis Hassabis, le fondateur de DeepMind, peut apparaître comme révélateur d’une volonté d’abolir progressivement la frontière entre l’homme et la machine : « chez DeepMind, les ingénieurs ont créé des programmes basés sur des réseaux de neurones, sur le modèle du cerveau humain. Ces systèmes font des erreurs, mais apprennent et s’améliorent avec le temps. Ils peuvent se mettre à jouer à d’autres jeux, que ceux pour lesquels ils ont été programmés, et à résoudre d’autres tâches, de sorte que l’intelligence est générale, donc non spécifique. Cette IA “pense” comme les humains. »

L’intelligence artificielle générale semble donc bel et bien avoir le potentiel de transformer le monde. Si Google et ceux qui suivront parviennent à développer cette technologie en lui assignant des buts précis, ce changement pourrait être contrôlé et, éventuellement, bénéfique à l’humanité. Mais si l’avènement de la singularité technologique devient une réalité, alors les humains pourraient perdre le contrôle des machines et voir le monde changer contre leurs intérêts. Ce scénario catastrophe semble encore loin, mais les prochaines années devraient être riches en enseignement, puisqu’elles pourraient voir l’avènement d’une intelligence artificielle générale fonctionnelle.