1 septembre 2023

Même générative, l’IA dépend de tes données

En septembre 2023, l’IA générative remet encore les données au centre, mais cette fois par une porte que les gens regardent moins: celle des permissions pis de la confidentialité. Au printemps, je parlais de la qualité des données — le fameux garbage in, garbage out. Là, comme Directeur TI, la question qui me tient éveillé la nuit est différente: qui a le droit de voir quoi, pis où s’en vont nos données quand on les donne à manger à une IA?

Parce que dès qu’on branche une IA sur nos documents d’entreprise, deux vieux problèmes endormis se réveillent d’un coup. Premièrement, les permissions: si nos partages de fichiers laissent traîner des accès trop larges depuis des années, l’IA va joyeusement révéler à tout le monde ce qui aurait dû rester restreint. Deuxièmement, la confidentialité: un employé bien intentionné qui colle un contrat de dealer dans un outil public envoie potentiellement nos secrets dehors, sans même s’en rendre compte.

Les données reviennent au premier plan

flowchart TD
    A[IA branchee sur nos donnees] --> B[Question 1: les permissions]
    A --> C[Question 2: la confidentialite]
    B --> D[Acces trop larges oublies depuis des annees]
    D --> E[L'IA revele ce qui aurait du rester restreint]
    C --> F[Donnees collees dans un outil public]
    F --> G[Nos secrets potentiellement sortis dehors]
    E --> H[Gouvernance des donnees: pas optionnelle]
    G --> H
    H --> I[Qui voit quoi + ou vont nos donnees]

Ce que je trouve sain, au fond, c’est que l’IA force enfin à régler des problèmes qu’on repoussait depuis longtemps. La gouvernance des accès, ce n’était jamais le dossier le plus excitant. Mais maintenant qu’une IA peut faire ressortir n’importe quel fichier mal protégé en une question, le ménage devient urgent. L’IA agit comme un révélateur impitoyable de notre hygiène de données.

Le réflexe que je martèle

Ma règle, je la répète à mon monde jusqu’à ce qu’elle rentre: ne jamais mettre de données confidentielles dans un outil d’IA public. Pour le reste, on travaille les permissions, on cadre les outils approuvés, on garde nos données sensibles dans des environnements qu’on contrôle. La donnée redevient le cœur de la stratégie — pas par mode, mais par nécessité.

Pour HLC, ça veut dire que ma feuille de route IA passe autant par la gouvernance que par la technologie. Avant de rêver à des assistants brillants, je dois m’assurer que nos données sont rangées, protégées, pis que chacun comprend où elles ont le droit d’aller. C’est moins vendeur qu’une démo, mais c’est la fondation qui rend tout le reste possible sans se mettre en danger.

Ce que je retiens

En septembre 2023, l’IA générative remet les données au centre par la porte des permissions pis de la confidentialité. Dès qu’on branche une IA sur nos documents, deux problèmes endormis se réveillent: les accès trop larges qu’elle va révéler, pis le risque que des données confidentielles partent dehors par un simple copier-coller.

Ce que je retiens, c’est que l’IA agit comme un révélateur impitoyable de notre hygiène de données — pis que c’est une bonne chose, parce que ça force enfin le ménage qu’on repoussait. Ma règle ne change pas: jamais de données confidentielles dans un outil public, ménage dans les accès, sensible gardé dans nos environnements. Pour HLC, la feuille de route IA passe autant par la gouvernance que par la techno. C’est moins vendeur qu’une démo, mais c’est ce qui nous permet d’avancer sans se mettre en danger.