Skip to content

benchmark · 2026-05

What an Argentine agent stack actually answers.

12 real questions about running a business in Argentina, side-by-side: @ar-agents/* tools vs. AfipSDK, the official mercadopago SDK, ChatGPT alone, and the underlying gov/private REST APIs. The gap is what the toolkit ships.

Most agent toolkits answer payment questions. A real Argentine business operation needs to also answer tax, identity, banking, gov identity, IGJ corporate registry, public-records monitoring, digital signatures, and shipping questions — and those answers have to flow through the same agent loop, with the same idempotency & HITL guardrails as payments.

This page is the literal benchmark: 12 real questions, each with the @ar-agents/* tool that answers it, plus the gap analysis against the next-best option. means handles cleanly; ~ means partial / requires glue-code; means out-of-scope.

The benchmark

Q01
¿La CUIT 30-71500001-4 es válida y está activa en ARCA?
@ar-agents/* validate_cuit (algorithm, free) + lookup_cuit_afip (constancia con monotributo + condición IVA + impuestos)
~AfipSDKtiene padrón A13/A4, pero no expone constancia (categoría monotributo). developer-first, no agent-first.
ChatGPTno tiene tool. responde con guesses sobre formato.
official mercadopago SDKno es su scope (es un payment SDK).
Q02
¿Qué fintech (PSP) opera el CBU 0070123…?
@ar-agents/* validate_cbu (algorithm) → returns bank/PSP inline (Galicia, Nación, Mercado Pago, Ualá, Naranja X, Brubank…)
AfipSDKno es su scope.
~ChatGPTpuede inferir de los primeros 3 dígitos pero sin catálogo PSP completo (errores en CVUs).
~BCRAtabla en PDF, no API.
Q03
Emití Factura B por $100.000 a Consumidor Final, ítem 'consultoría', y dame el CAE + PDF
@ar-agents/* crear_factura via WSFE → CAE en ~2s + PDF generado · pre-flight validator catches 10 common rejections (alícuotas mal sumadas, código IVA 21 vs 22, etc.) ANTES del round-trip
AfipSDKlo puede hacer. NO ships AGENTS.md ni decision tree por tipo de comprobante.
ChatGPTpuede explicar el proceso pero no tiene tool para emitir.
official mercadopago SDKMP no emite facturas (sólo informa al receptor de pago).
Q04
Cobrale $25.000 mensual a juan@example.com con razón 'Plan Pro'
@ar-agents/* create_subscription via @ar-agents/mercadopago — returns init_point_url + idempotency-key derived from inputs (LLM-retry safe)
AfipSDKno es payments.
ChatGPTno tiene tool de payments.
~official mercadopago SDKtiene preApproval.create. NO es agent-shaped, no idempotency-by-default, no HITL en cancel.
Q05
Tiene la CUIT 30-71500001-4 antecedentes en BCRA Central de Deudores?
@ar-agents/* lookup_credit_situation → worstSituation 0-6 + per-entity breakdown (capital + intereses + dias de mora + refinanciado/litigio)
AfipSDKno es su scope (BCRA, no AFIP).
ChatGPTno tiene tool de BCRA.
~BCRAtiene REST público pero sin agent-shaped wrapper.
Q06
Cotizar envío Andreani 0.5kg desde CABA al CP B1842 (Monte Grande)
@ar-agents/* cotizar_envio_andreani → costo + ETA · cotizar_envio_todos compara Andreani + OCA + Correo Argentino en paralelo y devuelve el más barato
AfipSDKno es shipping.
ChatGPTno tiene tool de logística AR.
Andreani APItiene API REST. Sin AGENTS.md ni multi-carrier comparison.
Q07
Mandale al cliente por WhatsApp el link de pago + el PDF de la factura
@ar-agents/* send_whatsapp_text + send_whatsapp_media · AR phone normalizer (handles +54 9 11..., 011..., legacy 15 prefix) · webhook + HMAC verify
AfipSDKno es WhatsApp.
Meta WhatsApp Cloud API directREST API. Sin AR phone normalizer, sin agent-shaped tools, sin AGENTS.md.
Q08
Validá la firma de un PKCS#7/CMS firmado con cert AR-ONTI
@ar-agents/* verify_cms_signature (AR-ONTI heuristic + fingerprint pinning) — única lib OSS que cubre el catálogo de cert authorities AR-públicas (AC-Raíz, ONTI)
~node-forge / @peculiar/x509verifica firmas pero no conoce el catálogo AR. User tiene que armar trust store.
ChatGPTno tiene tool.
Q09
¿La sociedad 'Acme Argentina SRL' está activa en IGJ y quién es su director?
@ar-agents/* buscar_sociedad_igj + get_acta_directorio (datos.jus.gob.ar pulled + normalized — primera lib pública con AGENTS.md sobre IGJ)
datos.jus.gob.artiene CSV bulk download. Sin tool layer, sin agent shape.
AfipSDKno es IGJ.
Q10
Verificá identidad del usuario via Mi Argentina (gov OIDC)
@ar-agents/* mi_argentina_authorize + verify_id_token — PKCE + RS256 ID-token verification + JWKS caching, runs on Edge
Auth0 / Supabaseno soportan Mi Argentina como IdP nativo.
~official Mi Argentina docsOIDC standard pero sin SDK público. User implementa desde cero.
Q11
Monitoreá el Boletín Oficial por publicaciones que mencionen un CUIT específico
@ar-agents/* subscribe_boletin_oficial — webhook fires en cada publicación matched · 'Vercel for legal monitoring'
~boletinoficial.gob.artiene buscador HTML. Sin API ni notifications.
Servicios pagos AR (Lex Argentina, etc.)ofrecen monitoring + email alerts. ARS$ 30k/mes, no agent-shaped.
Q12
Implementá ACP (Agentic Commerce Protocol) con auto-emisión de Factura A/B/C/E al confirmar pago
@ar-agents/* @ar-agents/agentic-commerce-bridge — único OSS que combina ACP spec + Mercado Pago + AFIP factura · 160 tests · /.well-known/acp.json discovery
Stripe ACPStripe no opera en AR (todavía). No emite Factura argentina.
~Satsuma.aiACP-compatible storefront SaaS pero defiere tax al merchant.
MercadoLibre Instant CheckoutMELI tiene checkout interno; no expone ACP open spec ni factura auto-emit.

The summary

Out of 12 questions a real Argentine SaaS or marketplace touches in the first month of operation, @ar-agents/* answers all 12 with first-class agent-shaped tools (AGENTS.md per package, tool manifests, HITL on irreversible ops, idempotency by default, Edge-Runtime safe, npm provenance attestation). The next-best alternative answers 4 of 12 (and only the payments + shipping ones, which are the easy half of the problem).

The hard half — AR fiscal compliance, identity verification, IGJ corporate registry, BCRA credit history, digital signature verification, Boletín Oficial monitoring, ACP-with-factura — has been un-or-poorly served until now. The toolkit's thesis is that the agent jurisdiction Argentina is shaping (sociedades-IA bill, April 2026) needs that hard half answered first, before any of the headline marketing about agent corporations becomes meaningful in practice.

How to verify

Every claim in this table maps to a tool in one of the 7 published @ar-agents/* npm packages. The packages ship with AGENTS.md per Naza-style convention, tools.manifest.json, and unit + property tests. SLSA v1 npm provenance attestations attach every published tarball to the GitHub commit it was built from.

Run npx @ar-agents/mercadopago doctor --probe, npx @ar-agents/whatsapp doctor, or npx @ar-agents/identity doctor to validate any of these against a real sandbox token in 5 seconds.