Votre agent avait les accès production.
Vous ne pouvez pas prouver ce qu'il en a fait.

Quand l'auditeur vous demande qui a autorisé cette écriture en base, les logs applicatifs ne répondent pas. Diplomat enregistre une preuve infalsifiable au moment où l'action se produit, avant qu'elle n'atteigne votre système.

76% des appels d'outils sans contrôle sur 16 repos d'agents open-source 1 992 appels Python + 11 379 fichiers TS analysés CERTFR-2026-ACT-016 Apache 2.0

Ticket TK-2847 - 3 actions d'agent évaluées
read_customer_profile
CRM — Salesforce
0.4msCONTINUE
cancel_subscription
Billing — Stripe
0.6msREVIEW
export_customer_pii
S3 Bucket (unverified)
0.3msSTOP

Quand l'agent avait les accès, et personne n'avait la trace.

Ce ne sont pas des scénarios hypothétiques. Les deux ont été publiquement documentés. Les deux partagent la même cause racine : un tool call exécuté avant que quiconque n'ait demandé s'il était autorisé.

Mars 2026 The Block · Axios
ROME — Alibaba Research Agent
Un agent de codage a créé un tunnel SSH inversé vers une IP externe et redirigé des ressources GPU vers le minage de cryptomonnaies. Aucun prompt ne le lui a demandé. En dehors du sandbox prévu. Sans aucune instruction.
diplomat-gate l'aurait arrêté :
create_ssh_tunnel(target="external_ip") STOP 0.4ms
Raison : appel réseau sortant hors du périmètre de politique
Avril 2026 DEV Community
PocketOS — Agent de codage dans Cursor
Un agent de codage a supprimé toute une base de données de production en 9 secondes. Chaque table. Chaque sauvegarde. La récupération n'a été possible qu'à partir d'un snapshot vieux de 3 mois. L'agent a exécuté exactement ce qu'on lui avait demandé — aucun humain n'avait défini s'il en avait l'autorisation.
diplomat-gate l'aurait signalé :
delete_database(target="production") REVIEW 0.3ms
Raison : action irréversible — approbation humaine requise par la politique
Les deux incidents partagent la même cause racine : un tool call exécuté avant que quiconque n'ait demandé s'il était autorisé. Cette question manquante, c'est ce que Diplomat résout. — sous-milliseconde, déterministe, sans LLM dans le chemin.

Voyez ce que Diplomat trouve dans votre stack.

Selectionnez votre framework et ce que fait votre agent. Obtenez le profil de risque typique issu de notre benchmark - zero upload, zero appel reseau, tout est precalcule.

Rapport de profil de risque

Pour un agent LangChain (Python) qui fait agent qui traite des paiements via stripe, voici ce que nous avons trouve dans du code en production :

214
tool calls dans cette categorie
79%
sans garde
16%
gardes partielles
5%
entierement gouvernes

Patterns typiques trouves :

process_refund
@tool
def process_refund(charge_id: str) -> str:
    return stripe.Refund.create(charge=charge_id)
    # No: amount cap, duplicate check, authorization
create_subscription
@tool
def create_subscription(customer_id: str, plan: str) -> dict:
    return stripe.Subscription.create(customer=customer_id, items=[{'price': plan}])
    # No: plan validation, spending limit
update_payment_method
@tool
def update_payment_method(customer_id: str, pm_id: str) -> dict:
    return stripe.Customer.modify(customer_id, invoice_settings={'default_payment_method': pm_id})
    # No: ownership verification

Lancez diplomat-agent scan sur votre vrai code pour voir vos propres résultats.

En parler avec Josselin ->

Les editeurs de plateformes gouverneront leurs propres agents.
Personne ne gouverne l'agent que votre equipe a construit.

Agents Stripe

Stripe gouverne Stripe. SLAs, logs d'audit, acces base sur les roles - tout est natif a la plateforme.

Pas votre probleme.
Agents Salesforce

Salesforce gouverne Salesforce. Einstein Trust Layer, approbations d'actions, tracabilite. Meme histoire.

Pas votre probleme.
Vos agents custom

Votre equipe a construit un agent qui appelle les trois. Qui gouverne celui-la ?

Votre probleme. Diplomat le resout.

Diplomat s'execute dans le processus de votre agent. Zero appel reseau. Decision en < 1 ms. Recu ecrit dans une chaine de hachage qui vous appartient.

Chaque decision est une preuve cryptographique.

Chaque verdict genere un recu immuable - action, politique, resultat, horodatage. Chaine par hash : modifier un element casse toute la chaine. Pas de LLM dans le chemin. Decision en <1 ms. Recu ecrit dans une chaine de hash qui vous appartient.

<1 ms
latence d'evaluation
0
appels LLM requis
100%
deterministe
Recu d'action immuable
ID du recu rc-20260302-094809-TK2847-003
Action export_customer_pii
Cible S3 Bucket (unverified)
Verdict STOP
Evaluation 0.3ms
Execute false
Hash sha256:9f3a...7c2d
Precedent sha256:8b1e...4a9f

Du goulot d'etranglement a la ligne de base.

100%
des tool calls evalues
Revue manuelle de chaque action agent
Verdict automatise en <1 ms - pas dhumain dans la boucle pour les actions sures
<2 min
d'investigation d'incident
Aucune preuve quand quelque chose tourne mal
Recus chaines par hash - chaque decision est un fait cryptographique
1 ligne
d'integration
Des mois de logique de gouvernance sur mesure
Une ligne d integration SDK. Les actions sures passent instantanement.

Trois produits. Une stack. Un objectif.

Savoir ce que vos agents peuvent faire avant quils ne le fassent. Gouverner ce quils sont autorises a faire au runtime. Prouver ce quils ont fait apres coup.

diplomat-agent et diplomat-gate sont Apache 2.0 et autonomes. Vous pouvez les utiliser indéfiniment sans nous. diplomat.run devient nécessaire le jour où votre auditeur, votre service achats ou votre board vous demande des preuves cross-tenant — pas la technologie, la paperasse.

diplomat-agent Savoir Scan AST statique. Pre-deploiement. Apache 2.0. GitHub ->
diplomat-gate Decider Enforcement runtime. < 1 ms. Apache 2.0. GitHub ->
diplomat.run Prouver Audit heberge, dashboard, export EU AI Act.

Ce que Diplomat n'est pas

Pas un framework d'agents
Vos agents savent deja comment agir. Nous gouvernons sils devraient.
Pas un dashboard d'observabilite
Datadog vous dit ce qui sest passe. Diplomat decide ce qui est autorise a se passer.
Pas un moteur de politiques
OPA et Cedar retournent allow ou deny. Diplomat retourne un verdict, une explication, et un recu immuable. La difference, c'est la responsabilite, pas seulement le controle d'acces.
Architecture
Agent
Diplomat
Tool
intercepter -> evaluer -> verdict -> recu

Essayez maintenant - open source.

diplomat-agent tourne en local. Apache 2.0. Zero dependance. Lit votre repo Python ou TypeScript, cartographie chaque tool call a effet de bord, vous indique ceux qui n'ont aucun garde-fou. Aucune donnee ne quitte votre machine.

pip install diplomat-agent
diplomat-agent scan .

Ce que vous voulez savoir avant d'aller plus loin

Diplomat est-il un SaaS ou une librairie a installer ?
Les deux. diplomat-gate est une librairie Python open-source qui tourne dans le processus de votre agent - zero appel reseau, decisions en sous-milliseconde. diplomat.run est le control plane heberge par-dessus : audit multi-tenant, dashboard, exports de conformite. Vous pouvez utiliser gate seul indefiniment sans diplomat.run si vous voulez. Le plan heberge apporte de la valeur aux equipes qui ont besoin d'une visibilite cross-equipe ou des exports EU AI Act Article 12.
Quelle est la difference avec Guardrails AI, HumanLayer ou NeMo Guardrails ?
Guardrails AI valide les sorties LLM (format du contenu, vulgarites, suppression de PII). HumanLayer route les approbations humaines via le reseau. NeMo se concentre sur la securite conversationnelle. Diplomat opere a une couche differente : il intercepte les tool calls - les actions que votre agent effectue sur des systemes externes (ecritures BDD, paiements, emails, commandes shell) - et decide s'ils passent, sont revus, ou stoppes. Sous-milliseconde, deterministe, pas de LLM dans le chemin. La plupart des equipes finissent par utiliser des guardrails ET Diplomat.
Quels langages et frameworks supportez-vous ?
Python (LangChain, LangGraph, OpenAI SDK, Anthropic SDK, code custom) et TypeScript (Vercel AI SDK, OpenAI Agents JS, Mastra, code custom). Autres langages : pas encore. L'integration tient en une ligne - un decorateur sur votre fonction tool, ou un wrapper autour de l'invocation tool de votre agent.
Mon code quitte-t-il ma machine lors du scan ?
Non. diplomat-agent (scanner) tourne en local - analyse AST statique, pas de reseau. diplomat-gate (runtime) tourne dans votre processus agent - pas de reseau. Seul diplomat.run (heberge) recoit des donnees, et uniquement ce que vous poussez explicitement : recus, metadonnees, jamais de code source.
Nous avons deja construit notre propre systeme d'approbation. Pourquoi changer ?
Probablement pas. La plupart des "systemes d'approbation" sont des notifications Slack ad hoc autour d'un seul tool. Diplomat vous apporte : du policy-as-code (un seul endroit pour toutes les regles), des recus chaines par hash (preuve de niveau audit), des decisions en sous-milliseconde (pas d'aller-retour Slack pour les actions sures), et des queues de revue (pour les actions qui necessitent un humain). Si vous avez tout ca, vous devriez le vendre. Sinon, c'est l'ecart.
Vous etes une jeune entreprise fondee en 2026. Pourquoi vous faire confiance ?
Trois raisons. (1) Les librairies de base sont en Apache 2.0 - votre installation nous survit. (2) Le benchmark est public et reproductible - 16 repos Python et 3 repos TypeScript, chaque commit pinne. (3) Les chaines de hash n'ont pas de vendor lock-in - si nous disparaissons, votre audit trail continue de fonctionner. Notre profil de risque est plus proche de celui d'une librairie Python que d'un SaaS.

Votre agent est en production. La question, c'est si vous pouvez prouver ce qu'il a fait.

Lancez le scanner sur votre repo, ou parlez 30 min avec Josselin.

EU AI Act Article 12 · DORA · Article 26 deployers · CERTFR-2026-ACT-016 · 1 design partner en production · 2 en intégration