Touchant à tous les domaines de l'informatique, le Machine Learning, ou Apprentissage Automatique, est une technique utilisée en Intelligence Artificielle pour entraîner les programmes à acquérir un savoir par eux même. Les applications sont innombrables et la plupart restent à découvrir.
Théorisé dans les années 50 par Alan Turing, le Machine Learning ou Apprentissage Automatique, est une composante de l'Intelligence Artificielle. Le concept désigne la capacité qu'a un ordinateur à apprendre en se basant sur une analyse de données. Le but est de permettre à la machine de s'adapter, ce qui n'est pas possible lorsque l'on suit des règles fixes. Ces applications couvrent de nombreux domaines, depuis le tri et la reconnaissance d'image à la traduction automatisée en passant par la conduite de voitures sans pilote.
Déjà objet de recherche en informatique dans les années 80, mais difficilement applicable à l'époque en l'absence de machines assez puissantes, l'Apprentissage Automatique est devenu une réalité peu avant 2000. Le coup d'accélérateur a été l'arrivée de microprocesseurs capables de traiter de grandes quantités de données en même temps et non plus séquentiellement, comme c'était le cas jusqu'alors.
Toutefois, c'est avec l'avènement des géants du Web et la collecte de données massives que les recherches sur l'Apprentissage Automatique sont devenues prioritaires. Parce qu'ils disposent d'une quantité phénoménale de données et de moyens, mais aussi parce que ce gisement constitue leur capital et qu'il est impératif qu'ils puissent l'exploiter efficacement, les géants du big data font progresser la recherche dans ce domaine.
S’ajoutent les notions de IA at the Edge et Edge Computing soutenues notamment par HP. Ici, l’intelligence et les données sont traitées et utilisées directement sur les lieux qui en ont besoin. C’est une approche complémentaire à l’IA dans le cloud qui présente deux avantages : plus de sécurité et un traitement en temps réel. Les applications sont déjà exploitées avec par exemple la reconnaissance faciale vidéo dans une agence bancaire ou encore un magasin. HP, pionnier de l’IA dans les environnements bureautiques et micro-informatiques, propose des stations de travail optimisées pour l’IA et le machine learning.
Mieux et plus rapidement que les humains
L'Apprentissage Automatique consiste pour un ordinateur à décortiquer les données qu'on lui fournit, afin de créer des modèles, puis de les exploiter par la suite. Par modèles, on entend la représentation d'un ensemble de critères. L’intérêt est de pouvoir faire effectuer par les ordinateurs des tâches trop complexes ou trop chronophages pour les humains, voire impossible à réaliser autrement en raison du trop grand nombre de paramètres.
À l’Université de Standford, on a ainsi mis au point un programme d'imagerie médicale qui différencie tumeurs bénignes et malignes. Ce programme ne se substitue pas aux médecins, qui sont aussi capables de le faire, mais la comparaison et le repérage des différences se font bien plus rapidement et de façon automatisée.
À Hong Kong, par l'analyse d'images aériennes, on tente de déduire les types de terrains potentiellement instables, afin de prévenir les glissements de terrain. Durant la phase d'apprentissage, on compte ici entièrement sur l'Apprentissage Automatique pour découvrir les structures cachées qui différencient un terrain stable d'un terrain problématique. On espère que des détails imperceptibles à l’œil, des configurations particulières, des motifs, pourront être repérés et servir à créer un modèle exploitable.
Dans ces exemples, l'apprentissage se fait par analyse des pixels de l'image afin d'y découvrir des agencements spécifiques de formes, de contrastes, d'angle, etc. Cette méthode particulière d'Apprentissage Automatique est appelée Deep Learning ou apprentissage profond.
Aider à apprendre
Selon le type de problématique et la connaissance que l'on en a, on peut aider ou non un programme lors de la création des modèles. On parle « d'apprentissage supervisé » ou « d'apprentissage non supervisé ». Cette phase est cruciale, d'autant qu'une erreur de méthodologie peut avoir des répercussions insoupçonnées. La chercheuse Joy Buolamwini s'est ainsi rendu compte qu'au MediaLab du MIT, pour entraîner les IA à la reconnaissance de visages, on utilisait des bases de données composées de portraits de scientifiques. Résultat imprévu, comme la proportion de mâles blancs est surreprésentée dans le milieu de la recherche en IA aux États-Unis, les programmes de reconnaissances faciales étaient moitié moins efficaces quand on leur présentait des visages féminins à la peau foncée...
Bien employée, l'Intelligence Artificielle résout plus de problèmes qu'elle n'en créé. En nous obligeant à étudier notre propre fonctionnement, l'Apprentissage Automatique contribue à faire progresser les sciences cognitives.
Ainsi, lorsque nous, humains, sommes confrontés à une graphie inconnue, nous avons la capacité de reconnaître les lettres qui la composent, bien que celles-ci ne ressemblent que très peu à l'alphabet de départ. À quelle gymnastique se livre notre cerveau pour y parvenir ? Comment reconnaît-on un visage ? Une mélodie ? Des proportions ?
En observant comment opère un programme d'Apprentissage Automatique, en découvrant quelles sont les données qui lui ont servi à déduire un modèle, c'est le fonctionnement de notre propre cerveau qui se dévoile. Une progression commune en quelque sorte.