C'est la première question d'un Responsable de la Sécurité des Systèmes d'Information (RSSI) quand on lui présente une licence ChatGPT à déployer sur 500 collaborateurs : « avant de signer, j'ai besoin de savoir où partent les données que mes équipes vont taper dans l'outil ».
La bonne question. Parce que selon le modèle et l'abonnement, la réponse va de « nulle part, c'est chiffré et supprimé à la fin de la session » à « dans la mémoire collective du modèle, et ça ne reviendra plus ».
Le problème ne vient pas des outils. Il vient du fait que cinq IA grand public sont aujourd'hui présentes dans la plupart des entreprises (ChatGPT, Claude, Gemini, Mistral, Copilot), chacune avec trois ou quatre niveaux d'abonnement, et des règles qui changent tous les six mois.
Confidentialité des données et IA : les 5 critères de sécurité à examiner
Vos données entraînent-elles le modèle ?
C'est la question qui change tout. Si oui, ce que vous tapez part dans ce que le modèle apprend, et un utilisateur ultérieur pourrait potentiellement en retrouver une trace dans une réponse générée. Sur la plupart des offres grand public (gratuites ou Plus/Pro), l'entraînement est activé par défaut : il faut désactiver manuellement dans les paramètres. Sur les offres entreprise (Business, Team, Enterprise), la règle s'inverse : aucun entraînement sur vos données, et cette garantie est inscrite dans le contrat.
Combien de temps sont-elles conservées ?
Même sans entraînement, vos données dorment quelque part. Les durées vont de quelques heures (mode éphémère) à plusieurs années. Les offres entreprise permettent souvent de configurer cette rétention, ou de l'éteindre complètement avec un contrat de non-conservation des données (Zero Data Retention).
Où sont-elles stockées ?
États-Unis ? Europe ? Sur vos propres serveurs ? Pour une entreprise européenne soumise au RGPD, ce n'est pas un détail. Certains éditeurs offrent maintenant un hébergement régional en Europe ; d'autres restent par défaut aux États-Unis avec des clauses contractuelles types pour le transfert.
Quelles certifications de sécurité ?
Trois standards font autorité : SOC 2 Type II (audit indépendant des contrôles de sécurité), ISO 27001 (management de la sécurité de l'information), et ISO 42001 (la plus récente, dédiée au management des systèmes d'IA). HIPAA s'y ajoute pour le secteur santé. Un éditeur sérieux les publie sur un portail de conformité accessible sous accord de confidentialité.
Quelle gouvernance pour piloter l'usage en entreprise ?
C'est ce qui permet à un DSI/RSSI de garder la main : authentification unique (SSO) via votre annuaire d'entreprise, journaux d'audit (qui a fait quoi, quand), contrat de traitement des données (DPA) signable comme base juridique RGPD, rôles d'administration, contrôles d'accès par équipe, création et suppression automatiques des comptes depuis votre annuaire RH (SCIM). Sans ces outils, vous offrez une licence sans pouvoir la piloter.
Comparatif des principales IA
ChatGPT (OpenAI)
Sur ChatGPT Business, Enterprise, Edu et l'API, OpenAI s'engage par contrat à ne pas utiliser les données client pour entraîner ses modèles, et les données sont chiffrées en transit et au repos. L'Enterprise va plus loin : vous contrôlez la durée de rétention, et OpenAI a passé avec succès un audit SOC 2.
Côté gouvernance, l'offre Enterprise propose tout l'arsenal attendu : authentification unique compatible avec votre annuaire d'entreprise, création et suppression automatiques des comptes utilisateurs, rôles d'administration, accès programmatique aux journaux d'audit, et possibilité d'utiliser vos propres clés de chiffrement. La résidence des données est disponible dans dix régions : Europe, Royaume-Uni, États-Unis, Canada, Japon, Corée du Sud, Singapour, Inde, Australie et Émirats Arabes Unis.
Point d'attention : suite à une décision de justice dans le procès New York Times contre OpenAI, certaines conversations historiques (avril-septembre 2025) sont conservées le temps du litige pour les abonnés ChatGPT Free, Plus, Pro, Team et API. En revanche, ChatGPT Enterprise est explicitement exclu, tout comme les conversations originaires de l'EEE, de la Suisse et du Royaume-Uni.
Claude (Anthropic)
Sur les offres Claude Team, Enterprise (Claude for Work) et l'API Anthropic, Anthropic ne réutilise pas vos conversations pour entraîner ses modèles. Les données sont chiffrées en transit et au repos, et par défaut aucun employé d'Anthropic n'a accès à vos conversations, sauf si vous donnez explicitement votre accord ou en cas d'enquête sur une violation de la politique d'utilisation.
Côté certifications, Anthropic publie sur son portail de conformité quatre titres : SOC 2 Type I & II, ISO 27001:2022 (sécurité de l'information), ISO/IEC 42001:2023 (management des systèmes d'IA) et une configuration conforme HIPAA pour le secteur santé. Pour les données les plus sensibles, l'option Zero Data Retention est disponible via un accord dédié.
Point d'attention pour les entreprises européennes : l'API directe d'Anthropic ne propose pas encore d'hébergement exclusivement en Europe (seules les régions États-Unis et « monde » sont disponibles). Pour héberger vos données en Europe, deux solutions documentées : passer par les plateformes cloud d'Amazon (AWS Bedrock) ou de Google (Vertex AI), qui proposent les modèles Claude dans leurs régions européennes.
Gemini (Google)
Sur Google Workspace Business/Enterprise (la suite collaborative de Google pour les entreprises) et sur Vertex AI (sa plateforme cloud dédiée à l'IA), vos contenus ne sont pas utilisés pour entraîner les modèles publics et ne sont pas examinés par des réviseurs humains en dehors de votre domaine, sans votre autorisation. Vos contenus restent dans votre organisation. Côté certifications, la liste officielle est large : SOC 1/2/3, ISO 9001, ISO 27001, 27017, 27018, 27701, ISO/IEC 42001 et FedRAMP High. Hébergement régional possible (régions UE notamment).
Avantage natif si vous êtes déjà dans l'écosystème Workspace : Gemini hérite des permissions Drive/Gmail existantes, l'administration passe par la même console.
Point d'attention : pour les comptes grand public (Gemini gratuit, compte Gmail perso), les règles sont différentes, l'activité est conservée 18 mois par défaut, avec possibilité de modifier ce paramètre ou de désactiver l'activité. Sur Workspace entreprise avec contrat de traitement des données signé, le traitement est encadré contractuellement.
Mistral (Le Chat)
La seule alternative européenne sérieuse. Mistral AI est une société française dont le siège est à Paris. Les données traitées sur Le Chat et sur La Plateforme sont hébergées chez plusieurs fournisseurs cloud, dont Azure en Suède et Google Cloud Platform en Irlande, ce qui place l'offre dans le périmètre RGPD, avec un déploiement sur site possible pour les secteurs très régulés.
Attention au choix de l'offre : sur Le Chat gratuit, les conversations peuvent être utilisées pour entraîner les modèles (vous pouvez vous y opposer en contactant privacy@mistral.ai). Sur Le Chat Pro, l'opposition se fait directement depuis votre compte. Sur Le Chat Team, Le Chat Enterprise et l'API La Plateforme payante, par défaut, vos données ne sont pas utilisées pour l'entraînement. Sur La Plateforme, la rétention est de 30 jours (modération) avec une option Zero Data Retention disponible.
Copilot (Microsoft 365)
Pas d'entraînement sur vos données, c'est contractuel et explicite : « Les invites, les réponses et les données accessibles via Microsoft Graph ne sont pas utilisées pour entraîner les LLM de base ». Avantage clé pour les utilisateurs européens : les données traitées par Copilot restent hébergées en Europe.
La gouvernance, c'est celle de Microsoft 365 que vous connaissez déjà : Microsoft Entra (le service d'identité Microsoft) pour l'authentification unique, Microsoft Purview (l'outil de gouvernance des données Microsoft) pour les politiques de rétention et les étiquettes de sensibilité, des données cloisonnées dans un espace dédié à votre entreprise et séparées des autres clients, et un chiffrement complet des données stockées et en transit. Certifications publiées : RGPD, ISO 27001, ISO/IEC 42001, HIPAA.
À noter : depuis janvier 2026, Microsoft intègre les modèles Anthropic dans Copilot. Mais Microsoft précise explicitement que ces modèles sont hors de portée de la frontière de données européenne et hors des engagements de traitement LLM dans le pays, à activer en connaissance de cause si votre cadre réglementaire l'exige.
Comment garantir la sécurité des données IA dans votre entreprise ?
Trois réflexes :
- Aucun collaborateur ne doit utiliser une version personnelle (gratuite ou Plus) pour manipuler des données de l'entreprise. La différence de sécurité avec une offre entreprise est considérable, et le surcoût (quelques dizaines d'euros par mois et par utilisateur) est minime comparé au risque de fuite ou d'exfiltration signalé par les régulateurs.
- Signez un DPA (Data Processing Agreement, ou accord de traitement des données) avec l'éditeur retenu, même si votre entreprise ne compte que 10 personnes. C'est l'exigence de base du RGPD, et le premier document qu'un client ou un auditeur vous réclamera.
- Activez l'authentification unique (SSO) et les journaux d'audit dès la mise en service, sans attendre six mois. C'est le seul moyen de pouvoir répondre à un auditeur ou à un client qui vous demande qui a consulté quelle donnée.
Conclusion
La sécurité d'une IA en entreprise se vérifie sur cinq critères concrets : entraînement, rétention, hébergement, certifications, gouvernance. Et se contractualise dans un DPA. Les cinq grands éditeurs ont tous publié des engagements solides sur leurs offres entreprise. Le vrai sujet, ce sont les comptes personnels que vos collaborateurs utilisent en parallèle, sans vous le dire.
Le seul moyen de garder la main, c'est de leur fournir une alternative officielle, encadrée et payée par l'entreprise.






