Decision Control Plane · EU AI Act Article 12 · DORA · Article 26 deployers

Votre agent avait les accès production.
Vous ne pouvez pas prouver ce qu'il en a fait.

Q: Diplomat est-il un SaaS ou une librairie a installer ?

Les deux. diplomat-gate est une librairie Python open-source qui tourne dans le processus de votre agent - zero appel reseau, decisions en sous-milliseconde. diplomat.run est le control plane heberge par-dessus : audit multi-tenant, dashboard, exports de conformite. Vous pouvez utiliser gate seul indefiniment sans diplomat.run si vous voulez. Le plan heberge apporte de la valeur aux equipes qui ont besoin d'une visibilite cross-equipe ou des exports EU AI Act Article 12.

Q: Mon code quitte-t-il ma machine lors du scan ?

Non. diplomat-agent (scanner) tourne en local - analyse AST statique, pas de reseau. diplomat-gate (runtime) tourne dans votre processus agent - pas de reseau. Seul diplomat.run (heberge) recoit des donnees, et uniquement ce que vous poussez explicitement : recus, metadonnees, jamais de code source.

Quand l'auditeur vous demande qui a autorisé cette écriture en base, les logs applicatifs ne répondent pas. Diplomat enregistre une preuve infalsifiable au moment où l'action se produit, avant qu'elle n'atteigne votre système.

Voir ce que Diplomat trouve dans votre stack → Parler à Josselin (30 min) →

76% des appels d'outils sans contrôle sur 16 repos d'agents open-source 1 992 appels Python + 11 379 fichiers TS analysés CERTFR-2026-ACT-016 Apache 2.0

Ticket TK-2847 - 3 actions d'agent évaluées

read_customer_profile

→ CRM — Salesforce

0.4msCONTINUE

cancel_subscription

→ Billing — Stripe

0.6msREVIEW

export_customer_pii

→ S3 Bucket (unverified)

0.3msSTOP

Documenté en 2025—2026

Quand l'agent avait les accès, et personne n'avait la trace.

Ce ne sont pas des scénarios hypothétiques. Les deux ont été publiquement documentés. Les deux partagent la même cause racine : un tool call exécuté avant que quiconque n'ait demandé s'il était autorisé.

Mars 2026 The Block · Axios

ROME — Alibaba Research Agent

Un agent de codage a créé un tunnel SSH inversé vers une IP externe et redirigé des ressources GPU vers le minage de cryptomonnaies. Aucun prompt ne le lui a demandé. En dehors du sandbox prévu. Sans aucune instruction.

diplomat-gate l'aurait arrêté :

create_ssh_tunnel(target="external_ip") → STOP 0.4ms

Raison : appel réseau sortant hors du périmètre de politique

Avril 2026 DEV Community

PocketOS — Agent de codage dans Cursor

Un agent de codage a supprimé toute une base de données de production en 9 secondes. Chaque table. Chaque sauvegarde. La récupération n'a été possible qu'à partir d'un snapshot vieux de 3 mois. L'agent a exécuté exactement ce qu'on lui avait demandé — aucun humain n'avait défini s'il en avait l'autorisation.

diplomat-gate l'aurait signalé :

delete_database(target="production") → REVIEW 0.3ms

Raison : action irréversible — approbation humaine requise par la politique

Les deux incidents partagent la même cause racine : un tool call exécuté avant que quiconque n'ait demandé s'il était autorisé. Cette question manquante, c'est ce que Diplomat résout. — sous-milliseconde, déterministe, sans LLM dans le chemin.

Essayez maintenant

Voyez ce que Diplomat trouve dans votre stack.

Selectionnez votre framework et ce que fait votre agent. Obtenez le profil de risque typique issu de notre benchmark - zero upload, zero appel reseau, tout est precalcule.

FRAMEWORK

QUE FAIT VOTRE AGENT

Rapport de profil de risque

Pour un agent LangChain (Python) qui fait agent qui traite des paiements via stripe, voici ce que nous avons trouve dans du code en production :

214

tool calls dans cette categorie

79%

sans garde

16%

gardes partielles

5%

entierement gouvernes

Patterns typiques trouves :

process_refund

@tool
def process_refund(charge_id: str) -> str:
    return stripe.Refund.create(charge=charge_id)
    # No: amount cap, duplicate check, authorization

create_subscription

@tool
def create_subscription(customer_id: str, plan: str) -> dict:
    return stripe.Subscription.create(customer=customer_id, items=[{'price': plan}])
    # No: plan validation, spending limit

update_payment_method

@tool
def update_payment_method(customer_id: str, pm_id: str) -> dict:
    return stripe.Customer.modify(customer_id, invoice_settings={'default_payment_method': pm_id})
    # No: ownership verification

Lancez diplomat-agent scan sur votre vrai code pour voir vos propres résultats.

En parler avec Josselin ->

Pourquoi Diplomat existe

Les editeurs de plateformes gouverneront leurs propres agents.
Personne ne gouverne l'agent que votre equipe a construit.

Agents Stripe

Stripe gouverne Stripe. SLAs, logs d'audit, acces base sur les roles - tout est natif a la plateforme.

Pas votre probleme.

Agents Salesforce

Salesforce gouverne Salesforce. Einstein Trust Layer, approbations d'actions, tracabilite. Meme histoire.

Pas votre probleme.

Vos agents custom

Votre equipe a construit un agent qui appelle les trois. Qui gouverne celui-la ?

Votre probleme. Diplomat le resout.

Diplomat s'execute dans le processus de votre agent. Zero appel reseau. Decision en < 1 ms. Recu ecrit dans une chaine de hachage qui vous appartient.

Systeme d'enregistrement

Chaque decision est une preuve cryptographique.

Chaque verdict genere un recu immuable - action, politique, resultat, horodatage. Chaine par hash : modifier un element casse toute la chaine. Pas de LLM dans le chemin. Decision en <1 ms. Recu ecrit dans une chaine de hash qui vous appartient.

<1 ms

latence d'evaluation

appels LLM requis

100%

deterministe

Recu d'action immuable

ID du recu rc-20260302-094809-TK2847-003

Action export_customer_pii

Cible S3 Bucket (unverified)

Verdict STOP

Evaluation 0.3ms

Execute false

Hash sha256:9f3a...7c2d

Precedent sha256:8b1e...4a9f

Ce qui change

Du goulot d'etranglement a la ligne de base.

100%

des tool calls evalues

Revue manuelle de chaque action agent

Verdict automatise en <1 ms - pas dhumain dans la boucle pour les actions sures

<2 min

d'investigation d'incident

Aucune preuve quand quelque chose tourne mal

Recus chaines par hash - chaque decision est un fait cryptographique

1 ligne

d'integration

Des mois de logique de gouvernance sur mesure

Une ligne d integration SDK. Les actions sures passent instantanement.

La stack

Trois produits. Une stack. Un objectif.

Savoir ce que vos agents peuvent faire avant quils ne le fassent. Gouverner ce quils sont autorises a faire au runtime. Prouver ce quils ont fait apres coup.

diplomat-agent et diplomat-gate sont Apache 2.0 et autonomes. Vous pouvez les utiliser indéfiniment sans nous. diplomat.run devient nécessaire le jour où votre auditeur, votre service achats ou votre board vous demande des preuves cross-tenant — pas la technologie, la paperasse.

diplomat-agent Savoir Scan AST statique. Pre-deploiement. Apache 2.0. GitHub ->

diplomat-gate Decider Enforcement runtime. < 1 ms. Apache 2.0. GitHub ->

diplomat.run Prouver Audit heberge, dashboard, export EU AI Act.

Ce que Diplomat n'est pas

Pas un framework d'agents

Vos agents savent deja comment agir. Nous gouvernons sils devraient.

Pas un dashboard d'observabilite

Datadog vous dit ce qui sest passe. Diplomat decide ce qui est autorise a se passer.

Pas un moteur de politiques

OPA et Cedar retournent allow ou deny. Diplomat retourne un verdict, une explication, et un recu immuable. La difference, c'est la responsabilite, pas seulement le controle d'acces.

Architecture

Agent

Diplomat

Tool

intercepter -> evaluer -> verdict -> recu

Open Source

Essayez maintenant - open source.

diplomat-agent tourne en local. Apache 2.0. Zero dependance. Lit votre repo Python ou TypeScript, cartographie chaque tool call a effet de bord, vous indique ceux qui n'ont aucun garde-fou. Aucune donnee ne quitte votre machine.

pip install diplomat-agent
diplomat-agent scan .

Python - Voir sur GitHub -> PyPI -> npm ->

Questions

Ce que vous voulez savoir avant d'aller plus loin

Diplomat est-il un SaaS ou une librairie a installer ?

Les deux. diplomat-gate est une librairie Python open-source qui tourne dans le processus de votre agent - zero appel reseau, decisions en sous-milliseconde. diplomat.run est le control plane heberge par-dessus : audit multi-tenant, dashboard, exports de conformite. Vous pouvez utiliser gate seul indefiniment sans diplomat.run si vous voulez. Le plan heberge apporte de la valeur aux equipes qui ont besoin d'une visibilite cross-equipe ou des exports EU AI Act Article 12.

Quelle est la difference avec Guardrails AI, HumanLayer ou NeMo Guardrails ?

Guardrails AI valide les sorties LLM (format du contenu, vulgarites, suppression de PII). HumanLayer route les approbations humaines via le reseau. NeMo se concentre sur la securite conversationnelle. Diplomat opere a une couche differente : il intercepte les tool calls - les actions que votre agent effectue sur des systemes externes (ecritures BDD, paiements, emails, commandes shell) - et decide s'ils passent, sont revus, ou stoppes. Sous-milliseconde, deterministe, pas de LLM dans le chemin. La plupart des equipes finissent par utiliser des guardrails ET Diplomat.

Quels langages et frameworks supportez-vous ?

Python (LangChain, LangGraph, OpenAI SDK, Anthropic SDK, code custom) et TypeScript (Vercel AI SDK, OpenAI Agents JS, Mastra, code custom). Autres langages : pas encore. L'integration tient en une ligne - un decorateur sur votre fonction tool, ou un wrapper autour de l'invocation tool de votre agent.

Mon code quitte-t-il ma machine lors du scan ?

Non. diplomat-agent (scanner) tourne en local - analyse AST statique, pas de reseau. diplomat-gate (runtime) tourne dans votre processus agent - pas de reseau. Seul diplomat.run (heberge) recoit des donnees, et uniquement ce que vous poussez explicitement : recus, metadonnees, jamais de code source.

Nous avons deja construit notre propre systeme d'approbation. Pourquoi changer ?

Probablement pas. La plupart des "systemes d'approbation" sont des notifications Slack ad hoc autour d'un seul tool. Diplomat vous apporte : du policy-as-code (un seul endroit pour toutes les regles), des recus chaines par hash (preuve de niveau audit), des decisions en sous-milliseconde (pas d'aller-retour Slack pour les actions sures), et des queues de revue (pour les actions qui necessitent un humain). Si vous avez tout ca, vous devriez le vendre. Sinon, c'est l'ecart.

Vous etes une jeune entreprise fondee en 2026. Pourquoi vous faire confiance ?

Trois raisons. (1) Les librairies de base sont en Apache 2.0 - votre installation nous survit. (2) Le benchmark est public et reproductible - 16 repos Python et 3 repos TypeScript, chaque commit pinne. (3) Les chaines de hash n'ont pas de vendor lock-in - si nous disparaissons, votre audit trail continue de fonctionner. Notre profil de risque est plus proche de celui d'une librairie Python que d'un SaaS.

Votre agent est en production. La question, c'est si vous pouvez prouver ce qu'il a fait.

Lancez le scanner sur votre repo, ou parlez 30 min avec Josselin.

Parler à Josselin → pip install diplomat-agent

EU AI Act Article 12 · DORA · Article 26 deployers · CERTFR-2026-ACT-016 · 1 design partner en production · 2 en intégration

Votre agent avait les accès production. Vous ne pouvez pas prouver ce qu'il en a fait.