MCP Workbench env : devEnvironnement courant de ce banc de tests. Les audits tournent contre le MCP Opquast et le rejeu serve locaux.

Documentation de la chaîne

Documentation vivante : le rôle de chaque brique de la chaîne d'audit aveugle, et le diagramme de leurs dépendances et de leur workflow.

Workflow de bout en bout

capture → store → serve → audit (MCP) → comparaison étalon → ESM (init one-shot) → étalon.

flowchart LR
    capture["capture
(webarchive-capture)"] --> store[("store
(volume partagé)")] store --> serve["serve
(webarchive-serve)"] serve --> audit["audit MCP
(claude -p)"] audit --> compare{"comparaison
étalon"} compare --> esm["ESM
(init one-shot)"] esm --> oracle[("étalon")] oracle -.-> compare workbench["workbench
(tour de contrôle)"] -.-> capture workbench -.-> serve workbench -.-> audit workbench -.-> esm

Les briques

capture (webarchive-capture)

Pilote un navigateur pour visiter une page web et la capturer fidèlement. Entrée : une URL (avec consentement). Sortie : un WACZ + un rendu figé, publiés dans le store sous le slug du site.

store (volume partagé)

Source de vérité indexée par site. Chaque slug y range « capsule.wacz, manifest.json, oracle/…, esm-link.json ». Entrée : les artefacts de capture ; sortie : l'index consommé par serve, workbench et la comparaison étalon.

serve (webarchive-serve)

Rejeu host-based autonome du WACZ : sert la page capturée en passe hermétique, sans aucun hôte vivant. Entrée : la capsule.wacz du store ; sortie : des URLs de rejeu stables, auditées comme un vrai site.

workbench (tour de contrôle)

Ce service : orchestre toute la chaîne. Il lance la capture, sélectionne le rejeu, déclenche l'audit MCP de la capsule, compare les verdicts à l'étalon et pousse vers ESM. Entrée : un site du store ; sortie : runs, métriques et matrice diff.

MCP audit (claude -p + outils Opquast)

Lance « claude -p » avec les outils MCP Opquast pour auditer la capsule rejouée. Entrée : les URLs de rejeu + la méthode d'inspection ; sortie : des verdicts dans le vocabulaire fermé (respectée, non respectée, NA, indéterminable).

ESM (eServices Manager)

Reçoit une seule fois (one-shot) l'audit corrigé d'un site. Entrée : l'audit validé ; sortie : il devient l'étalon de référence du site — invariant one-shot, jamais réécrit ensuite.

étalon (vérité de référence)

Vérité de référence par site, issue d'ESM. Entrée : l'audit one-shot ; sortie : la base à laquelle workbench compare les verdicts de l'agent pour calculer l'accord et les écarts.