Médaille
N°1 pour apprendre & réviser du collège au lycée.

L’intelligence artificielle : enjeux et débats

Déjà plus de

1 million

d'inscrits !

Big data

  • On appelle intelligence artificielle (IA) l’ensemble des théories et techniques mises en œuvre en vue de réaliser des machines capables de simuler l’intelligence humaine.
  • L’expression big data (« données massives » ou « mégadonnées » en français) désigne la récente explosion du nombre de données générées et exploitées informatiquement.
  • Ces big data se caractérisent par :
  • le volume (quantité massive de données) ;
  • la variété (signaux, textes, images, sons, vidéos, dans différents formats) ;
  • la vélocité (vitesse de génération, de collecte, de stockage, de misa à jour et de diffusion des données, de plus en plus en temps réel).
  • Étant à la fois consommateurs et producteurs de contenus et de données, les internautes contribuent par leurs publications et leurs navigations sur Internet à l’essor des big data.
  • Les coûts de stockage informatique des données ont diminué avec l’essor de l’économie numérique, permettant de conserver des volumes toujours plus importants de données : le développement du cloud permet notamment le stockage ou le traitement de données en ligne (plus besoin de posséder ou d’exploiter des serveurs physiques).
  • Cette masse de données est organisée en ensembles cohérents dotés de caractéristiques communes, appelés jeux de données (datasets en anglais). Ces jeux de données sont constitués dans tous les domaines d’activité.
  • La surabondance de données disponibles est telle depuis plusieurs années que l’aide de la machine s’est vite avérée indispensable pour leur analyse.
  • Dans le même temps, l’augmentation de la puissance de calcul informatique et la baisse de son coût ont rendu possible la mise au point et l’exploitation en production de modèles d’intelligence artificielle à base de réseaux de neurones artificiels.

Apprentissage automatique

  • L’apprentissage automatique par la machine consiste à conférer aux ordinateurs la capacité d’apprendre à partir des données.
  • L’intelligence artificielle combine des bases mathématiques, notamment probabilistes et statistiques, et des bases informatiques, parmi lesquelles les réseaux de neurones artificiels, capables d’adapter leur configuration pour effectuer un apprentissage.
  • Contrairement à la programmation traditionnelle où on donne un programme et des données à la machine pour qu’elle fournisse un résultat, en intelligence artificielle, la machine apprend à partir des données : données + résultat = programme.
  • Il existe différentes modalités d’apprentissage par la machine, notamment l’apprentissage supervisé. Celui-ci implique que les données à analyser (texte, image, son, etc.) sont fournies à la machine avec les résultats attendus.
  • L’apprentissage supervisé est progressif et fonctionne par essais et corrections d’erreurs : la base de cet apprentissage est l’inférence bayésienne, une méthode de calcul consistant à ajuster un modèle basé sur des probabilités extraites à partir de données connues.
  • Les données utilisées pour l’entraînement du modèle sont réparties en deux catégories :
  • les données d’apprentissage (proportion d’environ 80 %) ;
  • les données de validation de la fiabilité du modèle (proportion d’environ 20 %).
  • L’évaluation du modèle consiste à vérifier s’il produit bien le comportement attendu et si ses prédictions peuvent être considérées comme suffisamment fiables, car il se peut en effet que le modèle commette des erreurs, qui peuvent être de différents types.
  • La matrice de confusion permet de mesurer les performances d’un modèle en vérifiant les prédictions avec la réalité : on parle de vrais positifs et de vrais négatifs quand le modèle effectue des prédictions correctes, et de faux positifs et faux négatifs quand le modèle effectue des prédictions erronées.

Aspects éthiques

  • L’usage croissant de l’intelligence artificielle pose un certain nombre de questions et constitue un enjeu non négligeable pour l’avenir de la société.
  • Quel que soit le type d’activité, le fait de déléguer des contrôles, des analyses et même des décisions à un programme informatique n’est pas anodin. Cela constitue une forme d’externalisation de l’intelligence humaine, bien que limitée à une tâche précise.
  • Plusieurs problématiques générales sont soulevées :
  • les modèles rencontrent parfois des soucis de fiabilité ;
  • des manipulations de données peuvent avoir lieu lorsque la collecte et l’utilisation des données ne sont pas faites dans le respect de la vie privée, ce qui peut avoir des conséquences sur les libertés individuelles.
  • Les enjeux liés à l’essor de l’intelligence artificielle sont majeurs pour l’avenir de notre société et suscitent de nombreux débats, notamment au sujet des usages policiers ou militaires, mais aussi à l’encontre des risques de surveillance généralisée des faits et gestes des citoyens. Des voix se font entendre pour appeler à un encadrement de ces usages : des appels à moratoire ou à bannissement ont été lancés dans plusieurs pays, en particulier pour la reconnaissance faciale.
  • Concernant plus spécifiquement l’apprentissage machine, d’autres problématiques apparaissent :
  • la qualité des données d’apprentissage peut parfois être remise en question : les jeux de données servant à développer les modèles d’intelligence artificielle doivent être annotés par des humains, souvent mal rémunérés, via des plateformes spécialisées de micro-tâches en télétravail ;
  • la représentativité des données d’apprentissage peut aussi parfois être questionnée : certaines intelligences artificielles ont été entraînées avec des données d’apprentissage comportant des biais. Ces intelligences artificielles reproduisent et amplifient parfois les biais avec lesquels elles ont été entraînées, ce qui génère notamment des traitements différenciés.
  • L’existence récurrente de biais dans les solutions d’intelligence artificielle peut entretenir ou renforcer des inégalités et discriminations. Il est donc essentiel de veiller à faire un usage raisonnable des technologies d’intelligence artificielle afin d’y remédier.