Introduction à l'apprentissage machine
Ce qu’on va voir!
1. Définition
Si vous êtes ici, j’imagine qu’il n’est pas nécessaire de vous vanter les avantages de l’apprentissage machine, vous les connaissez sans doute déjà. Par contre, comme lorsqu’on apprend à programmer pour la première fois, il est probable que ce soit difficile pour vous d’imaginer comment tout cela fonctionne.
Dans mon cours de communication, on m’a dit que de commencer une présentation avec une citation n’était pas une bonne façon de faire. Sur ce :
Apprentissage machine : Champ d’études qui donne aux ordinateurs l’habilité d’apprendre sans être explicitement programmés. (Samuel, 1959, traduit de l’anglais)1
Deux points ont retenu mon attention la première fois que j’ai vu cette citation :
- 1959?! Pourtant, je n’avais jamais entendu ce terme avant 2016 (j’étais probablement en retard sur la mode, il faut dire). La réalité, c’est que les techniques d’apprentissage machine existent depuis bien longtemps, mais les ordinateurs n’étaient pas assez puissants pour permettre aux algorithmes d’être performants.
- “Sans être explicitement programmés”. Pourtant, il doit bien y avoir de la programmation quelque part, non? Évidemment, la réponse est oui! Mais ce n’est sûrement fait de la manière dont vous pensez que c’est fait.
(Parenthèse)
J’espère (ou pas) vous surprendre en vous informant du fait que vous avez très probablement déjà implémenté un algorithme d’apprentissage machine par vous-même, avant même que vous ayez eu vos connaissances en informatique.
Throwback aux cours de maths en 5e secondaire, introduction aux statistiques. Si vous avez fait votre secondaire au Québec dans les… au moins 15 dernières années, vous avez sans doute été introduit aux deux concepts suivants : la corrélation linéaire et la régression linéaire.
Et bien, la régression linéaire est une technique d’apprentissage machine, vous êtes (presque) déjà des experts. Yoshua Bengio et Yann LeCun n’ont qu’à bien se tenir! (Si vous ne les connaissez pas, il s’agit de personnalités pas mal connues dans le milieu. En plus, monsieur Bengio est une fierté de chez nous. Du Québec, pas de l’ÉTS)
Dans le prochain article de ce blogue, nous reviendrons sur les détails et l’implémentation de la régression linéaire. (EXCITEMENT)
(Fin de la parenthèse)
L’apprentissage machine, c’est un sujet profond (pun intended). Peut-être que je veux que mon algorithme puisse :
- Conduire une voiture dans GTA5
- Prédire le prix du bitcoin
- Te proposer le nouveau film (plate) d’Adam Sandler sur Netflix
- Remplacer les faces d’acteurs par Nicolas Cage dans des films
Ces quatre exemples n’utilisent vraisemblablement pas les mêmes techniques (focus sur les 3 premiers, le dernier est là parce que ça me fait rire) et n’ont pas les mêmes objectifs. Nous reviendrons sur les différents types d’algorithme (Teaser : On parle d’algorithmes supervisés vs. non-supervisés et de classification vs. de régression).
2. Comment ça marche, à peu près?
Préparez-vous pour le parallèle le plus incroyable au monde
Lorsqu’on est enfant, on apprend à parler en écoutant nos parents parler (disclaimer : je ne suis pas un pro de bébés). Plus nos parents répètent des mots, plus il y a de chances que le bébé finisse par les répéter, avant même de savoir ce qu’ils veulent dire.
Le bébé apprend par observation!
Deuxième exemple : Prenons le même bébé fictif, qui apprend maintenant à marcher. Les probabilités sont fortes que la première fois que le bébé va marcher, il va tomber. En tombant, on peut dire qu’il se fait mal. On peut donc dire qu’il est “puni” parce qu’il est tombé. À vouloir éviter les punitions, le bébé va s’adapter et finir par être capable de marcher. Il apprend donc à marcher à force de se tromper et de se corriger (comme ce bot)
Le bébé apprend par renforcement!
Dernièrement, imaginons un monde fictif où il n’y a pas de règles sur la maltraitance des enfants (oops). Si je prenais ce même bébé, mais que je l’enfermais dans une pièce en lui présentant des photos de chiens. Pour toutes ces photos, on lui indiquerait toujours “Ceci est un [insérer la race du chien]”. À un point (encore une fois, je ne suis pas un pro de bébés), on pourrait montrer des nouvelles photos de chiens au bébé et il serait capable de dire de quel type de chien il s’agit s’il l’a vu avant, mais il ne serait pas capable de faire quoi que ce soit d’autre :’(.
Les exemples précédents représentent parfaitement l’apprentissage machine. Si nous reprenons l’exemple de la reconnaissances de chiens, on fournierait à l’algorithme des photos de chiens duement identifiées, puis l’algorithme serait capable de reconnaître les races sur de nouvelles photos où on ne lui indiquerait pas celle-ci et ce, avec une précision surprenante!
Comparativement au bébé, qui a la chance d’avoir un cerveau incroyablement puissant comparativement à un ordinateur, l’algorithme a besoin d’un immense volume de données. Il doit recevoir des milliers, voir des dizaines de milliers (ou plus!) de photos avant d’être à l’aise de faire des “prédictions”.
Comment ça se passe concrètement? Ce n’est pas le but de cet article :/ On y reviendra dans le prochain, parce que ça va demander du travail!
3. La suite
Cet article fut de courte durée! J’ai réfléchi “longuement” à savoir si je devrais rajouter du contenu pour le rendre plus charnu. Je ne pense pas que ce soit une bonne idée. Le but de cet article et des prochains est de fournir une approche simple vers l’apprentissage machine et je crois que ce sera plus facile de faire cela si les articles sont de courtes durées avec de l’information concise.
Dans le prochain article, nous reviendrons sur la régression linéaire. On y abordera aussi les techniques d’optimisation en apprentissage machine. Bref, ça risque d’être beaucoup plus intéressant!
Francis