Pas d’IA sérieuse sans données solides
En mai 2020, comme Directeur technique chez HLC, je vis une démonstration grandeur nature d’un principe que je répète depuis des années: l’IA remet les données au centre. La pandémie vient de bouleverser tous les comportements — les ventes, les habitudes de nos dealers, la demande, tout a changé d’un coup. Pis devinez quoi? Nos modèles prédictifs, entraînés sur le monde « d’avant », se mettent à se tromper. C’est la preuve brutale que l’IA ne vaut que par les données qui la nourrissent, pis que ces données viennent de changer du tout au tout.
Un modèle de prévision, c’est de la mémoire du passé projetée sur l’avenir. Tant que le futur ressemble au passé, ça marche. Mais quand un événement comme la pandémie casse les schémas, le modèle continue de prédire selon un monde qui n’existe plus. Il a l’air confiant, mais il se plante.
Quand le sol bouge sous les modèles
C’est là que je réalise à quel point la donnée est le vrai centre de gravité. L’algorithme n’est qu’un miroir du passé. Si le contexte change radicalement, le miroir ment.
flowchart TD
A[Modele predictif] --> B[Entraine sur les donnees d'avant COVID]
B --> C[Predit comme si rien n'avait change]
D[Pandemie 2020] --> E[Comportements bouleverses]
E --> F[Les donnees recentes ne ressemblent plus au passe]
C --> G{Le modele se trompe}
F --> G
G --> H[Lecon: l'IA ne vaut que ses donnees]
H --> I[Surveiller la derive, reentrainer, garder l'humain]
Pour nos dealers, ça veut dire que je ne peux pas faire aveuglément confiance aux prévisions cet été. Je dois surveiller la dérive des modèles, comparer aux observations récentes, pis garder un jugement humain par-dessus. Une réponse trop confiante d’un modèle peut avoir l’air professionnelle même quand elle part d’une prémisse devenue fausse.
Remettre les données au centre, pour vrai
Ce que la crise m’enseigne, c’est qu’il faut traiter la donnée comme l’actif central, pas l’algorithme. Surveiller sa fraîcheur, sa représentativité, sa pertinence dans le contexte actuel.
Je garde un carnet des cas où nos modèles ont bien ou mal prédit pendant la crise, avec les seuils pis les validations humaines. Pas besoin que ce soit long. Ça aide à voir quand l’outil décroche du réel. La pandémie est un rappel sévère mais utile: l’IA n’est jamais meilleure que les données qu’on lui donne, pis ces données doivent refléter le monde tel qu’il est, pas tel qu’il était.
Ce que je retiens
En mai 2020, la pandémie offre une leçon brutale sur l’IA: elle remet les données au centre. Nos modèles entraînés sur le monde d’avant se trompent parce que le contexte a basculé. L’algorithme n’est qu’un miroir du passé; quand le passé ne ressemble plus au présent, il ment avec assurance.
Ce que je retiens, comme Directeur technique, c’est qu’il faut surveiller la dérive, revalider les données, pis garder l’humain par-dessus les prédictions. Pour nos dealers, ça veut dire ne pas suivre les modèles aveuglément cet été. L’IA est puissante, mais elle dépend entièrement de la qualité pis de la fraîcheur de ses données. La crise vient de le démontrer mieux que tous mes discours.