À l’été 2018, la société DeepMind a réalisé une percée sans précédent dans le domaine de l’intelligence artificielle (IA). Rachetée par Alphabet, la maison mère de Google, en 2014, la compagnie a développé Impala, un outil capable de jouer et de progresser simultanément sur 49 jeux vidéo Atari. Une innovation qui la rapproche du  Graal pour tous les chercheurs dans le domaine : la création de la première forme d’IA générale.

Une méta-intelligence

Le site Extreme Tech définit l’IA générale comme une forme d’intelligence artificielle, ou un algorithme, capable d’apprendre à réaliser plusieurs actions simultanément, tout en réalisant des transferts positifs de manière à accroître encore son efficacité et sa rapidité, au cours du processus d’apprentissage. Concrètement, l’algorithme est capable de réemployer des éléments utilisés lors de l’apprentissage d’une tâche afin d’apprendre à en réaliser plus rapidement une autre. Par exemple, si l’on demande à une IA d’apprendre le français, elle va développer un certain nombre d’aptitudes qu’elle pourra ensuite utiliser simultanément pour apprendre l’espagnol, sans redémarrer le processus à zéro. Il s’agit donc d’une expérience de méta-apprentissage, l’IA apprenant à apprendre, afin de maîtriser des tâches variées.

Contrairement aux IA développées jusqu’ici, et dites mono-activités, l’IA générale n’a donc pas besoin d’être reprogrammée pour réaliser de nouvelles tâches. Jamais avant Impala un algorithme unique n’avait pu gérer simultanément 30 activités différentes, en l’occurrence jouer à des jeux vidéo, requérant chacune des capacités et connaissances spécifiques. On se contentait pour l’instant d’algorithmes de recommandation pour des sites de streaming, ou sur un mode plus complexe d’IA capables de conduire des véhicules autonomes. Aujourd’hui, cette sectorisation est remise en cause, et des chercheurs envisagent une hypothétique (et imprévisible) « explosion d’intelligence ».

Concrètement, Impala se base tout d’abord sur un apprentissage par renforcement. Cette technique est notamment utilisée pour enseigner des jeux complexes ou des émotions aux IA, et décrite par le professeur Dominique Revuz dans un cours : la répétition enseigne à l’IA, par observation, à adopter le comportement idéal afin de maximiser ses performances et atteindre ses objectifs.

Mais une telle technique n’est pas suffisante pour rendre Impala si révolutionnaire. Cette IA ajoute à l’apprentissage par renforcement « classique » une dimension supplémentaire, qui permet ce « transfert positif » évoqué plus haut. Pour cela, DeepMind a ajouté un nouvel outil d’apprentissage par renforcement, nommé V-trace. Il s’agit d’une version améliorée d’un algorithme « asynchronous advantage actor-critic reinforcement learning », qui permet une évaluation de l’« acteur » (la partie agissante de l’algorithme) par le « critique » (la partie pensante de l’algorithme), qui réalise ensuite le transfert d’apprentissage. C’est ainsi qu’Impala passe d’un niveau spécifique à un niveau général d’IA. Toutefois, et cela n’est pas pour l’instant l’objectif de DeepMind, l’algorithme n’arrive pas à un niveau de conscience humaine.

Au-delà des frontières

Au-delà des jeux vidéo, les domaines auxquels peut être appliquée l’IA générale sont multiples, puisqu’elle n’est plus cantonnée à une seule tâche. En 2017, dans un article pour le Global Catastrophic Risk Institute, Seth Baum a recensé 45 projets de recherche autour de l’IA générale, à l’initiative de chercheurs et entreprises. Il estime qu’une majorité d’entre eux ont pour objectif de bénéficier à l’humanité dans son ensemble, ou de « repousser les frontières de la connaissance ». Il identifie quatre buts secondaires : la protection et le bien-être animal ; la protection de l’environnement ; la réalisation du transhumanisme, c’est-à-dire l’accroissement des capacités humaines grâce aux machines ; la génération de profit.

DeepMind, officiellement, s’inscrit dans cette lignée en promettant de résoudre, par l’IA, les problèmes les plus pressants de l’époque (environnementaux, de santé, de développement). L’atout de l’IA générale est qu’il s’agit d’un algorithme capable de raisonner dans l’incertitude, comme l’explique dans une vidéo Axel Dupuy, directeur de la branche Technology Strategy and Architecture chez Deloitte. Cela peut donc l’amener, au même titre qu’un être humain, à prendre une décision dans un environnement inconnu, contrairement aux IA actuelles qui ne peuvent pas faire plus que ce pour quoi elles ont été programmées. En revanche, contrairement à un être humain, l’IA générale possède une capacité de calculs potentiellement infinie, et peut donc démultiplier la capacité des humains à répondre aux problèmes actuels.

DeepMind proclame vouloir développer l’IA de manière à ce que celle-ci ait un « impact positif ». En clair, il s’agit de transformer le monde à l’aide des machines, tout en les gardant sous contrôle. Aucun algorithme n’est pour l’instant capable de s’auto-assigner des objectifs. Cependant, au-delà des cercles technophobes, certains s’inquiètent du développement de l’IA générale et évoquent la singularité technologique, un concept développé en 1993 par le chercheur Vernor Vinge dans un texte devenu célèbre. Dans ce cas de figure, selon le journaliste Jacques Henno, « le progrès ne sera plus l’oeuvre que d’intelligences artificielles en recherche constante d’amélioration de leurs performances, mais aussi de leur autonomie vis-à-vis de leur créateur ». Il tempère toutefois cette idée, en citant des chercheurs qui estiment que si les machines peuvent apprendre de mieux en mieux, et de plus en plus, encore faut-il pour l’instant qu’on leur en intime l’ordre.

Dans le Livre blanc de l’intelligence artificielle, rédigé par Deloitte, une citation de Demis Hassabis, le fondateur de DeepMind, peut apparaître comme révélateur d’une volonté d’abolir progressivement la frontière entre l’homme et la machine : « Chez DeepMind, les ingénieurs ont créé des programmes basés sur des réseaux de neurones, sur le modèle du cerveau humain. Ces systèmes font des erreurs, mais apprennent et s’améliorent avec le temps. Ils peuvent se mettre à jouer à d’autres jeux, que ceux pour lesquels ils ont été programmés, et à résoudre d’autres tâches, de sorte que l’intelligence est générale, donc non spécifique. Cette IA « pense » comme les humains ».

L’intelligence artificielle générale semble donc bel et bien avoir le potentiel de transformer le monde. Si Google et ceux qui suivront parviennent à développer cette technologie en lui assignant des buts précis, ce changement pourrait être contrôlé et, éventuellement, bénéfique à l’humanité. Mais si l’avènement de la singularité technologique devient une réalité, alors les humains pourraient perdre le contrôle des machines et voir le monde changer contre leurs intérêts. Ce scénario catastrophe semble encore loin, mais les prochaines années devraient être riches en enseignement, puisqu’elles pourraient voir l’avènement d’une intelligence artificielle générale fonctionnelle.