C1 — Fuite par l'IA : reconnaître le shadow IA, sans céder à la panique
Sujet
Les fuites de données dans une organisation viennent classiquement de deux sources : le piratage externe et la divulgation interne. À ces deux sources s'ajoute désormais une troisième, propre à l'ère IA : le **shadow IA** — le fait que des collaborateurs envoient quotidiennement des données de l'entreprise vers des outils IA grand public, souvent sans en mesurer les implications. Cette troisième fuite ne se règle pas par les mêmes outils que les deux premières : elle relève d'une nouvelle hygiène informatique adaptée à des usages que la plupart des chartes internes n'ont pas encore intégrés.
Conseil
Nous vous conseillons d'aborder le sujet avec pragmatisme. Pour la grande majorité des données quotidiennes, l'hygiène simple suffit : anonymiser quand c'est possible, choisir des fournisseurs avec garanties de non-réutilisation, sensibiliser les équipes au shadow IA. Pour les données critiques (secrets industriels, dossiers stratégiques, données médicales ou juridiques sensibles), une discipline plus stricte s'impose — pas d'envoi vers des IA grand public, recours à des solutions internes ou contractuellement encadrées. Liren AI Mapper cartographie qui envoie quoi à l'IA dans votre organisation et identifie les zones où le shadow IA crée un risque réel. La philosophie CLAVIS soutient ce principe : ce qui se mesure se gouverne ; ce qui n'est pas connu ne peut pas être protégé.
L1 Niveau 1 — Néophyte
Quand un de vos collaborateurs envoie un document ou un texte à une IA grand public pour lui demander de l'aider, ce contenu sort de votre entreprise. Suivant le fournisseur et ses conditions d'utilisation, il peut être conservé, utilisé pour améliorer le modèle, ou simplement enregistré dans des serveurs hors de votre contrôle. C'est ce qu'on appelle le **shadow IA** — l'usage non encadré d'IA externes par les équipes. Ce n'est pas forcément grave pour des contenus banals, mais pour des données sensibles c'est l'équivalent d'un partage sur les réseaux sociaux. Une bonne pratique consiste à informer clairement vos équipes de ce qui peut ou ne peut pas être envoyé à une IA externe, et à anonymiser les données chaque fois que c'est possible.
L2 Niveau 2 — Utilisateur
Trois sources principales de fuite de données existent aujourd'hui dans une entreprise. La première, classique : le piratage externe — quelqu'un accède sans autorisation à vos systèmes. La deuxième, classique aussi : la divulgation interne — un collaborateur partage volontairement ou par négligence des informations à l'extérieur. La troisième, plus récente : le **shadow IA** — vos équipes utilisent des IA grand public au quotidien, et y déversent des données de l'entreprise par recherche de productivité. La troisième source est aujourd'hui sous-estimée. Elle ne vient pas d'une mauvaise intention, mais d'une méconnaissance des implications. Coller un fichier client dans une IA grand public pour le résumer rapidement, transmettre du code source confidentiel pour qu'il soit relu, partager un document RH pour qu'il soit reformulé — ces gestes sont devenus quotidiens, et personne ne les voit comme des fuites. Pour la majorité des cas, l'hygiène simple suffit : anonymiser quand c'est possible, choisir des fournisseurs IA fiables avec garanties contractuelles, sensibiliser les équipes au sujet. Pour les données vraiment critiques — secrets industriels, dossiers stratégiques, données médicales ou juridiques sensibles —, la règle devient stricte : pas d'envoi vers une IA grand public, point. La bonne pratique consiste à ne pas tout traiter de la même manière, et à identifier ce qui mérite vraiment d'être protégé.
L3 Niveau 3 — Averti
Le sujet de la fuite de données par IA gagne à être abordé avec pragmatisme — ni minimisation, ni panique. Une part très significative des informations personnelles courantes des Français est déjà disponible sur des espaces non-officiels du web, et la quantité d'informations volontairement partagées par les utilisateurs sur les réseaux sociaux dépasse de loin ce qui pourrait fuiter par usage d'IA grand public. Sur ce terrain, l'enjeu est moins celui d'un risque catastrophique que celui d'une **hygiène informatique nouvelle** à intégrer dans les pratiques. La spécificité du shadow IA tient à sa diffusion : il ne touche pas une fonction informatique isolée, il concerne potentiellement tous les collaborateurs au quotidien. Le geste est anodin (coller, partager, demander), les implications sont rarement explicites pour l'utilisateur, et la charte d'entreprise n'a souvent pas anticipé ces usages. La posture mature consiste à distinguer deux régimes. **Régime courant** : pour les données quotidiennes non critiques, l'hygiène raisonnable suffit — anonymisation préalable quand c'est possible, choix de fournisseurs avec garanties contractuelles (non-réutilisation, hébergement contrôlé), sensibilisation explicite des équipes. **Régime critique** : pour les données stratégiques (secrets industriels, dossiers à forte valeur ajoutée, données médicales ou juridiques sensibles), la règle se durcit — pas d'envoi vers des IA grand public, recours à des LLM hébergés en interne ou à des fournisseurs contractuellement engagés. Le dilemme opérationnel sous-jacent est réel : utiliser l'IA expose, ne pas l'utiliser fait perdre en compétitivité. La réponse n'est pas binaire — c'est un arbitrage à conduire usage par usage, type de donnée par type de donnée. Sans cette qualification consciente, l'organisation subit le shadow IA plutôt que de le gouverner.
L4 Niveau 4 — Expert
La fuite de données par usage d'IA constitue une catégorie distincte des risques sécurité classiques, à articuler avec le piratage externe et la divulgation interne. Le shadow IA — usage non-encadré d'IA externes par les collaborateurs — est aujourd'hui le canal le plus actif de ce risque, avec des incidents publics documentés dans plusieurs grands groupes depuis 2023 (interdictions internes d'outils IA chez plusieurs acteurs industriels et financiers). Sur le plan opérationnel, trois mécanismes alimentent le shadow IA. Premier : la méconnaissance — les utilisateurs ne savent pas ce que devient leur prompt après envoi (conservation, réutilisation pour entraînement, accès des équipes du fournisseur, transferts hors UE). Deuxième : la recherche de productivité — coller un document dans une IA permet un gain de temps immédiat, dont l'arbitrage coût/risque est rarement conscient. Troisième : l'absence de cadre — la plupart des chartes internes n'ont pas encore intégré le shadow IA comme catégorie distincte de risque. La posture mature consiste à dimensionner la réponse à la sensibilité des données plutôt qu'à appliquer un régime uniforme. **Pour les données non-critiques** : l'hygiène raisonnable suffit. Anonymisation préalable quand c'est possible, choix de fournisseurs avec clauses contractuelles claires (non-réutilisation pour entraînement, hébergement, durées de conservation), sensibilisation explicite des équipes, charte d'usage IA dédiée. Une part importante de l'information quotidienne courante n'est pas, à l'observation, plus exposée par l'usage IA grand public qu'elle ne l'est par les pratiques de partage sur les outils numériques déjà installés. **Pour les données critiques** (secrets industriels, données médicales sensibles, dossiers juridiques confidentiels, propriété intellectuelle à forte valeur) : régime strict — interdiction de l'envoi vers des IA grand public, recours à des LLM hébergés en interne ou à des fournisseurs contractuellement engagés avec garanties d'isolement. La maintenance d'une IA interne reste coûteuse et n'est pas adaptée à toutes les organisations, mais elle est nécessaire pour les fonctions sensibles. Liren AI Mapper instrumente la cartographie du shadow IA — qui envoie quoi à l'IA, sur quels usages, avec quel niveau de sensibilité — et identifie les zones où la gouvernance doit être renforcée. Le principe directeur reste constant : ce qui se mesure se gouverne ; ce qui n'est pas connu ne peut pas être protégé.
Contextes où cet enjeu est critique
Auditer la souveraineté technique
AI Validator + Mapper combinés tracent les flux de données et attestent du périmètre de sortie. Pour la conformité technique.
Découvrir l'outil