C5 — Intégrité : savoir ce qui se passe vraiment dans la cuisine de l'IA
Sujet
L'intégrité des données dans un usage IA recouvre la capacité à savoir, avec certitude, ce qu'est devenue une donnée à chaque étape d'un traitement — non altérée, traçable, et idéalement signée. La spécificité IA tient à ce que les modèles fonctionnent comme des boîtes noires : on observe leurs sorties, on connaît imparfaitement le détail interne du raisonnement, et dans les architectures agentiques, les sorties d'un agent nourrissent les entrées d'un autre — sans qu'aucun marquage cryptographique permette nativement de tracer les transformations.
Conseil
Nous vous conseillons deux approches complémentaires selon votre niveau de maturité. **Pour une intégrité de base** : tracer systématiquement chaque sortie IA significative (prompt utilisé, modèle, horodatage, validation humaine), conserver ces traces dans un système non modifiable, vérifier ex post avant publication ou exécution. **Pour une intégrité par construction** : signer cryptographiquement chaque artefact à sa production (HMAC ou équivalent), de sorte que toute altération devient immédiatement détectable, et que la traçabilité ne dépend pas d'un acte de mémoire mais d'une preuve technique. Liren AI Validator produit des attestations signées HMAC-SHA256 pour chaque cycle de test. Liren AI Mapper cartographie les flux de données IA dans votre organisation et identifie les points où l'intégrité n'est pas garantie. La philosophie CLAVIS soutient ce principe : chaque action est documentée, signée, archivée — l'intégrité par construction est plus solide que la vérification après coup.
L1 Niveau 1 — Néophyte
L'IA est comme un plat cuisiné servi dans votre assiette. Vous le mangez, vous le trouvez bon, mais vous ne savez pas ce qu'il contient — pas les ingrédients précis, pas les proportions, pas les apports nutritifs, pas la qualité des produits utilisés. Vous lui faites confiance. C'est ce qu'on appelle le problème de la boîte noire. Avec l'agentique, on passe au niveau supérieur : on cuisine de nouveaux plats à partir de cette cuisine qu'on ne connaît pas, et on les sert à d'autres convives. À chaque étape, on perd un peu plus la maîtrise de ce qui se passe vraiment. Une bonne pratique consiste à garder une trace de chaque sortie IA importante — quoi, quand, validé par qui — pour pouvoir vérifier après coup si nécessaire.
L2 Niveau 2 — Utilisateur
Le problème de la boîte noire de l'IA est largement reconnu, et plusieurs travaux annoncent qu'il sera prochainement résolu. La réalité est plus prudente : sur les démonstrations actuelles, seul un faible pourcentage des modèles est réellement auditable de bout en bout, et à des coûts élevés. Pour la grande majorité des usages, vous travaillez avec un système dont les transformations internes ne sont pas pleinement traçables. L'agentique aggrave ce phénomène. Quand un premier agent produit une sortie qui devient l'entrée d'un second, lui-même nourrissant un troisième, vous obtenez ce qu'on pourrait appeler la cuisine d'une cuisine inconnue. À chaque étape, l'opacité s'accumule. Si une altération survient — accidentelle ou malveillante — il devient extrêmement difficile de savoir où elle s'est produite et qui en porte la responsabilité. Deux stratégies permettent de garder la main. La première : tracer systématiquement chaque sortie IA importante (quoi, quand, avec quel prompt, validé par qui), et conserver ces traces hors de portée d'éventuelles modifications. La seconde, plus exigeante mais plus solide : signer cryptographiquement chaque sortie à sa production, de sorte que toute altération devient immédiatement détectable. Cette signature ne demande pas de comprendre la boîte noire — elle protège vos données à l'extérieur de la boîte, là où vous avez prise.
L3 Niveau 3 — Averti
L'intégrité des données dans un usage IA articule plusieurs niveaux d'enjeu. **Niveau interne au modèle** : la boîte noire des LLM reste largement non auditable. Les travaux sur l'interprétabilité progressent mais ne couvrent à ce stade qu'un faible pourcentage des comportements observés, et à des coûts d'analyse élevés. Pour la grande majorité des usages, le déployeur doit composer avec un système dont le détail interne du raisonnement reste opaque. **Niveau externe au modèle** : c'est ici que se joue l'essentiel de la protection accessible. Tracer chaque entrée et chaque sortie significative, conserver ces traces dans un système non modifiable, et idéalement les signer cryptographiquement à leur production — cela ne demande pas de comprendre l'intérieur de la boîte noire, cela contraint son contexte d'usage. **Niveau des chaînes agentiques** : c'est le point où l'enjeu d'intégrité monte le plus rapidement. Quand un agent A produit une sortie qui devient l'entrée d'un agent B, qui produit à son tour pour un agent C, l'opacité s'accumule à chaque maillon. Sans marquage cryptographique de chaque sortie à sa production, l'origine d'une éventuelle altération devient indétectable — et l'effet papillon (cf. E5) s'amplifie sans mécanisme de contrôle. Deux stratégies se complètent. L'**intégrité par vérification** : vérification systématique des sorties IA importantes avant publication ou exécution. Cette stratégie reste accessible à toutes les organisations, sans investissement technique lourd. L'**intégrité par construction** : signature cryptographique automatique de chaque artefact à sa production (HMAC-SHA256 ou équivalent). Cette stratégie est plus solide — elle détecte les altérations immédiatement plutôt qu'après coup — mais elle suppose une infrastructure qui le permet.
L4 Niveau 4 — Expert
L'intégrité des données dans un système IA productif articule trois niveaux d'analyse opérationnellement distincts. **Niveau 1 — interprétabilité interne du modèle.** Les travaux d'interprétabilité (mechanistic interpretability, sparse autoencoders, circuit analysis) progressent rapidement mais ne couvrent à ce stade qu'un faible pourcentage des comportements observés en production, avec des coûts d'analyse élevés. Pour la quasi-totalité des déploiements, la boîte noire du modèle reste un fait à composer avec — pas un problème à résoudre dans le périmètre d'un projet d'entreprise. **Niveau 2 — intégrité externe au modèle.** C'est sur ce niveau que la protection accessible se construit. Chaque sortie IA significative peut être tracée (prompt source, modèle utilisé, paramètres, horodatage, validation humaine éventuelle) et conservée dans un système d'archivage non modifiable. La signature cryptographique systématique (HMAC-SHA256 ou équivalent) déplace la posture de la traçabilité vers l'authenticité prouvable — toute altération devient mathématiquement détectable, indépendamment de la mémoire ou de la rigueur opérationnelle. **Niveau 3 — chaînes agentiques.** Les architectures où les sorties d'un agent deviennent les entrées d'un autre représentent le point critique. Sans signature cryptographique de chaque sortie à sa production, l'origine d'une altération devient indétectable, et l'effet papillon (cf. E5) s'amplifie en cascade sans mécanisme natif de contrôle. La distinction altération malveillante / dérive accidentelle s'efface — toute deux ont les mêmes conséquences observables. Une signature systématique permet de circonscrire l'enquête et la responsabilité. Deux stratégies opérationnelles se complètent. **Intégrité par vérification ex post** : contrôle systématique des sorties importantes avant publication ou exécution, journal d'audit immuable, revue régulière. Stratégie accessible à toutes les organisations, sans investissement technique lourd. **Intégrité par construction** : signature cryptographique automatique de chaque artefact à sa production. Stratégie plus solide — détection immédiate plutôt qu'après coup — mais suppose une infrastructure conçue pour cela. CLAVIS, l'infrastructure qui soutient Liren, applique ce principe à tous ses artefacts (chaque action documentée, signée, archivée). Cette posture n'élimine pas le besoin de vérification ex post, mais elle déplace son point de départ d'une enquête à une attestation. Le principe directeur : l'intégrité par construction est plus solide que la vérification après coup, parce qu'elle ne dépend ni de la mémoire ni de la rigueur — elle dépend uniquement de la cryptographie.
Contextes où cet enjeu est critique
Auditer la souveraineté technique
AI Validator + Mapper combinés tracent les flux de données et attestent du périmètre de sortie. Pour la conformité technique.
Découvrir l'outil