L’IA générative ne sauve pas des données sales
En mai 2023, au milieu de l’euphorie de l’IA générative, je remarque une ironie qui me fait sourire. Tout le monde court après le modèle le plus brillant, le chatbot le plus impressionnant — pis pourtant, ce qui fait la différence pour vrai, c’est la chose la moins glamour qui soit: la qualité de tes données. L’IA la plus puissante du monde, branchée sur des données croches, va te sortir des réponses croches avec une belle assurance. Comme Directeur TI passé par les années données pis BI, je vois cette ruée pour ce qu’elle est: une ruée vers les données propres qui ne dit pas son nom.
J’ai passé des années chez HLC à bâtir nos entrepôts de données, à nettoyer, à réconcilier des sources qui ne se parlaient pas. À l’époque, c’était un travail de l’ombre, pas vendeur en réunion. Aujourd’hui, l’IA générative met une lumière crue dessus. Ceux qui ont fait leurs devoirs sur leurs données vont pouvoir bâtir des choses utiles par-dessus. Ceux qui ont remis ça à plus tard découvrent que l’IA amplifie leur désordre au lieu de le régler.
La ruée invisible
flowchart TD
A[Euphorie de l'IA generative] --> B{Sur quoi ca repose?}
B --> C[Donnees propres et bien structurees]
B --> D[Donnees sales, eparpillees, en double]
C --> E[L'IA bati du solide par-dessus]
D --> F[L'IA amplifie le desordre, avec assurance]
E --> G[Avantage reel: prevision, reco, analyse]
F --> H[Reponses croches, confiance trompeuse]
G --> I[La vraie course: les donnees, pas le modele]
H --> I
Le réflexe que je rappelle à mon monde, c’est qu’on n’achète pas l’intelligence d’un modèle: on la nourrit avec ce qu’on lui donne. Pour nos dealers, une IA qui aide à prévoir la demande de pièces ne vaut quelque chose que si nos historiques de ventes sont propres, complets pis cohérents. Garbage in, garbage out — la vieille règle n’a jamais été aussi vraie qu’en pleine vague d’IA générative.
Le travail de l’ombre redevient stratégique
Ce qui me réjouit, dans le fond, c’est que l’IA redonne ses lettres de noblesse à un travail longtemps tenu pour acquis. La gouvernance des données, la qualité, la structure: tout ça redevient stratégique, parce que c’est la fondation sur laquelle l’IA va pouvoir s’appuyer.
Pour HLC, ça veut dire que ma priorité comme directeur n’est pas de chasser le dernier modèle à la mode, mais de continuer à soigner nos fondations de données. C’est moins spectaculaire qu’un chatbot, mais c’est ce qui décidera si l’IA nous sert vraiment ou si elle nous expose juste plus vite à nos propres faiblesses.
Ce que je retiens
En mai 2023, l’IA générative remet les données au centre — pis ça me rappelle pourquoi le travail de l’ombre que j’ai fait pendant des années comptait pour vrai. La ruée vers l’IA est, au fond, une ruée vers les données propres qui ne dit pas son nom.
Ce que je retiens, c’est que l’IA amplifie ce qu’on lui donne: des données solides bâtissent du solide, des données croches sortent des réponses croches avec assurance. Garbage in, garbage out n’a jamais été aussi vrai. Ma priorité de directeur, ce n’est pas de courir après le dernier modèle, mais de soigner nos fondations — qualité, gouvernance, structure. C’est ça qui décidera si l’IA sert vraiment HLC pis ses dealers, ou si elle ne fait qu’exposer nos faiblesses plus vite. La fondation avant le modèle, toujours.