Frameworks agénticos para construir agentes IA

CrewAI, LangGraph, AutoGen, Pydantic AI y más — comparativa completa 2026

“No eliges un framework por sus estrellas. Eliges el que encaja con tu stack, tu velocidad de iteración y el tipo de producto que vas a construir.”


⚠️ Importante: las 2 familias de frameworks agénticos

El término “framework agéntico” se usa para dos categorías completamente distintas. Este artículo cubre la Familia A: librerías para construir agentes IA como producto.

🅰️ Familia A — Frameworks para CONSTRUIR agentes IA (ESTE ARTÍCULO)

Librerías Python/TypeScript que importas en tu código para construir tus propios agentes (chatbots, asistentes autónomos, pipelines RAG, sistemas multi-agente).

Ejemplos que analizamos aquí: LangGraph, CrewAI, AutoGen, Pydantic AI, Mastra, Agno, LlamaIndex, Semantic Kernel, Letta, OpenAI Agents SDK, Google ADK, Claude Agent SDK y más.

Usuario objetivo: developer que construye un producto con IA.

🅱️ Familia B — Frameworks para GUIAR tu asistente de coding

Plugins, skills o metodologías que estructuran cómo tu asistente de IA (Claude Code, Cursor, Codex) te ayuda a programar.

👉 Comparativa de frameworks agénticos para Claude Code (Superpowers, gentle-ai, BMAD…) ← artículo hermano



Tabla maestra: los frameworks más relevantes en 2026

(Click en cualquier cabecera para ordenar — ⭐ GitHub verificadas vía API a 18 abril 2026)

Framework Autor / Org ⭐ GitHub Lenguaje Tipo Categoría
Langflow langflow-ai 147.071 Python Visual Builder No-code
Dify langgenius 138.216 TypeScript Visual Builder Platform
MetaGPT geekan 67.190 Python Library Multi-agent
AutoGen Microsoft 57.181 Python / .NET Library Conversational multi-agent
Flowise FlowiseAI 52.032 TypeScript Visual Builder LangChain.js drag-drop
CrewAI crewAIInc 49.139 Python Library Role-based crews
LlamaIndex run-llama 48.665 Python / TS Library Document agents + RAG
Agno (ex-Phidata) agno-agi 39.516 Python Library High-performance runtime
LangGraph langchain-ai 29.555 Python / TS Library Graph-based state machines
Semantic Kernel Microsoft 27.731 C# / Python / Java Library Enterprise .NET
SmolAgents HuggingFace 26.705 Python Library Code-as-action
Haystack deepset-ai 24.887 Python Library RAG + agents production
Mastra mastra-ai 23.116 TypeScript Library TS-first full-stack
Letta (ex-MemGPT) letta-ai 22.137 Python Library Stateful memory agents
OpenAI Agents SDK OpenAI 22.003 Python Official SDK Sucesor de Swarm
Google ADK Google 19.085 Python Official SDK Gemini-native
CAMEL camel-ai 16.725 Python Library Research multi-agent
Pydantic AI pydantic 16.445 Python Library Type-safe agents
Microsoft Agent Framework Microsoft 9.558 Python / .NET Library AutoGen + SK unificados
Claude Agent SDK (Python) Anthropic 6.392 Python Official SDK Anthropic oficial
Atomic Agents BrainBlend-AI 5.823 Python Library Composable sin magia

Marco conceptual: los 3 tipos

Los frameworks de la Familia A se dividen en 3 tipos según cómo los usas:

🧩 Libraries (code-first)

Las importas en tu código Python/TypeScript. Tú escribes el código que define agentes, tools, flujos. Son la opción de los developers serios.

Ejemplos: LangGraph, CrewAI, AutoGen, Pydantic AI, Mastra, Agno.

🎨 Visual Builders (no-code / low-code)

Interfaces drag-and-drop para montar flujos sin escribir código. Ideal para prototipos rápidos, equipos no técnicos, demos.

Ejemplos: Langflow, Dify, Flowise, Rivet.

🔌 Official SDKs (de proveedores LLM)

SDKs oficiales de los proveedores de modelos. Optimizados para su stack, con menos abstracciones pero máxima integración.

Ejemplos: OpenAI Agents SDK, Google ADK, Anthropic Claude Agent SDK.


Matriz comparativa consolidada

Feature LangGraph CrewAI AutoGen Pydantic AI Mastra LlamaIndex SmolAgents Agno Atomic
Python
TypeScript ✅✅
Type-safe ⚙️ ⚙️ ⚙️ ✅✅ ⚙️ ⚙️ ⚙️
Multi-agent ✅✅ ✅✅ ⚙️ ⚙️ ⚙️ ⚙️
Memoria persistente ⚙️ ⚙️ ⚙️ ⚙️ ✅✅ ⚙️
RAG built-in ⚙️ ✅✅
Observabilidad ✅ LangSmith ⚙️ ⚙️ ✅ Logfire ⚙️ ⚙️
Production users notables ✅✅ ✅✅ ✅✅ ⚙️ ⚙️
Learning curve 🔴 Alta 🟢 Baja 🟡 Media 🟢 Baja 🟢 Baja 🟡 Media 🟢 Baja 🟢 Baja 🟡 Media

LangGraph

Qué es

Framework graph-based de LangChain para modelar agentes como máquinas de estado. Cada agente es un grafo de nodos con edges condicionales sobre un State schema tipado.

Filosofía

Control de flujo explícito. En lugar de “magia” agéntica, tú defines el grafo: nodos que procesan, edges condicionales que deciden siguiente paso, state que persiste.

Diferenciadores clave

  • Durability (checkpointing) — el estado se persiste en cada step
  • Time-travel debugging — puedes revertir a cualquier estado anterior
  • Human-in-the-loop nativo
  • Integración con LangSmith para observabilidad trace-level
  • Integración con MCP (Model Context Protocol de Anthropic)

Casos de uso ideales

  • Workflows complejos multi-step con backtracking
  • Sistemas donde necesitas audit trail completo
  • Producción enterprise con requisitos de durabilidad
  • Pipelines que deben pausar, esperar aprobación humana, y continuar

Casos donde NO usarlo

  • Prototipos simples (es verbose incluso para flujos básicos)
  • Equipos pequeños sin tiempo para aprender curva media-alta

Tiempo de aprendizaje

Media-alta. Schema + nodes + edges + compile. Verbose.

Madurez y adopción

Production-ready. Superó a CrewAI en estrellas a principios de 2026. LangGraph Platform GA en 2025.

Usuarios en producción

Klarna, Replit, LinkedIn, Elastic, Uber, AppFolio.

Recursos


CrewAI

Qué es

Framework role-based donde cada agente tiene role, goal y backstory. Los agentes forman “crews” que trabajan en tasks asignadas siguiendo processes (sequential, hierarchical, consensual).

Filosofía

Metáfora de equipo humano aplicada a agentes IA. Arquitecta tu sistema como un equipo real: tienes un researcher, un writer, un reviewer, y les das objetivos claros.

Diferenciadores clave

  • La curva de aprendizaje más baja del sector — probablemente el framework más fácil de arrancar
  • Standalone desde 2024 (ya no depende de LangChain)
  • Soporte nativo MCP + A2A desde v1.x
  • Metáfora intuitiva que no requiere saber teoría de grafos ni máquinas de estado

Casos de uso ideales

  • Multi-agent colaborativo con roles claros (research → write → review)
  • Equipos que quieren prototipar rápido
  • Cuando tu problema tiene estructura de “equipo humano”
  • MVPs y primeros productos agénticos

Casos donde NO usarlo

  • Workflows con lógica condicional muy compleja (usa LangGraph)
  • Cuando necesitas control extremo de flujo (usa Atomic Agents o LangGraph)

Tiempo de aprendizaje

Bajo. Arrancar en horas, no días.

Madurez y adopción

  • $24.5M funding total (Series A liderada por Insight Partners)
  • ~2.000 millones de ejecuciones agénticas/año reportadas
  • Uso en ~50% del Fortune 500 (dato de la empresa)

Usuarios en producción

PwC, IBM, Capgemini, NVIDIA.

Recursos


AutoGen (Microsoft)

Qué es

Framework event-driven, async, conversational multi-agent donde los agentes se comunican vía mensajes asíncronos. Rewrite completo en v0.4 (enero 2025).

⚠️ Estado actual

Importante: Microsoft fusionó AutoGen con Semantic Kernel en Microsoft Agent Framework (preview oct-2025, v1.0 GA abril 2026). AutoGen queda como proyecto “research/innovation” pero el roadmap de producción migra a Agent Framework.

Si empiezas nuevo, arranca con Microsoft Agent Framework.

Diferenciadores clave

  • Rewrite async/event-driven en v0.4
  • AutoGen Studio — low-code UI
  • Magentic-One — generalist multi-agent system
  • Python + .NET

Casos de uso ideales

  • Research y prototipado multi-agent conversacional
  • Empresas en stack Microsoft que necesitan puente hasta Agent Framework

Tiempo de aprendizaje

Medio.

Licencia

CC-BY-4.0 (atípica, no la MIT estándar — revisar compatibilidad comercial).

Recursos


Pydantic AI

Qué es

Agents type-safe al estilo Pydantic. FastAPI-feel pero para GenAI — structured outputs con validación Pydantic, dependency injection, streaming validado.

Filosofía

“La forma Pydantic de construir agentes.” Si vienes de FastAPI y Pydantic, esto te va a encantar.

Diferenciadores clave

  • Type safety end-to-end
  • Dependency injection integrada
  • Streaming validado con schemas Pydantic
  • Logfire integration para observabilidad
  • v1.0 lanzado 4 septiembre 2025 — API stability commitment de 6 meses
  • Thoughtworks Radar: ASSESS/TRIAL

Casos de uso ideales

  • Agents con outputs estructurados críticos (sistemas que deben parsear la salida)
  • Equipos que valoran type safety
  • Developers que ya usan Pydantic o FastAPI
  • Integración con Amazon Bedrock AgentCore

Tiempo de aprendizaje

Bajo si ya usas Pydantic/FastAPI.

Novedades v1

  • Human-in-the-loop tool approval
  • Durable execution

Recursos


Mastra (el TypeScript-first)

Qué es

El framework TypeScript de referencia para construir agentes. Full-stack TS: workflows (durable graph), agents, RAG, evals, memory — todo integrado.

Filosofía

TS-first. Creado por ex-team de Gatsby. Si tu stack es Next.js, Node o React, esto es tu opción nativa sin salir de TS.

Diferenciadores clave

  • TypeScript de primera clase (no es un port Python → TS)
  • Dev playground local
  • Compatible con Vercel AI SDK
  • Durable workflows

Madurez y adopción

  • $13M seed round YC-led (Paul Graham, Guillermo Rauch, Amjad Masad, Balaji como inversores)
  • 220k weekly downloads
  • “Tercer JS framework que más rápido crece” según telemetría propia

Usuarios en producción

Replit, SoftBank, Marsh McLennan, PayPal, Adobe, Docker.

Casos de uso ideales

  • Stacks Next.js / Node / React que quieren agentes sin salir de TS
  • Full-stack devs que prefieren TypeScript sobre Python
  • Edge deployments (Vercel, Cloudflare Workers)

Licencia

Elastic License / custom (NOASSERTION en GitHub). Revisa los términos si tu uso es comercial.

Recursos


Agno (ex-Phidata)

Qué es

High-performance multi-agent runtime. Rebranded de Phidata en enero 2025 con rewrite de rendimiento.

Diferenciadores clave

  • Performance: ~3μs instantiation según el equipo
  • Built-in: memory, knowledge base, reasoning
  • AgentOS — runtime managed

Casos de uso ideales

  • Agents de producción con memoria persistente y knowledge base
  • Alta concurrencia (miles de agents simultáneos)
  • Cuando performance importa más que flexibilidad

Tiempo de aprendizaje

Bajo-medio.

Licencia

Apache-2.0 (el marketing web menciona Mozilla Public License para Agno 2.0 — ambigüedad no verificada, revisar antes de uso comercial).

Recursos


LlamaIndex (el pivot 2025)

Qué es

Antes: framework RAG por excelencia.
Ahora (pivot 2025): “Leading document agent and OCR platform” (descripción oficial actualizada).

Filosofía

Workflows event-driven + LlamaParse/LlamaCloud como producto principal. Document parsing/OCR agéntico de clase enterprise.

Diferenciadores clave

  • Document parsing enterprise (PDFs con tablas/gráficos complejos vía LlamaParse)
  • Workflows event-driven
  • LlamaIndex TS también disponible

Madurez y adopción

  • 700%+ growth self-serve revenue en 2025
  • Pivot exitoso validado por mercado

Usuarios en producción

Cemex, Rakuten, Carlyle Group.

Casos de uso ideales

  • RAG sobre documentos complejos (contratos, papers, reports con tablas)
  • Knowledge assistants enterprise
  • OCR agéntico

Recursos


SmolAgents (HuggingFace)

Qué es

“Agents that think in code”. El CodeAgent genera y ejecuta código Python en vez de tool-calls JSON.

Filosofía

Code-as-action: si quieres que el agente haga algo, que escriba código y lo ejecute. Minimalista (~1000 LoC core).

Diferenciadores clave

  • Code-as-action paradigm (único en esta lista)
  • Integración nativa HuggingFace Hub — agents shareables
  • Sandboxing E2B para seguridad
  • Apache-2.0 (licencia clara)

Casos de uso ideales

  • Agents locales con modelos open-source
  • Prototipos simples sin overhead
  • Education / demos

Recursos


Letta (ex-MemGPT)

Qué es

El líder indiscutible en agentes con memoria persistente. Rebrand de MemGPT en 2024.

Filosofía

Agentes stateful que recuerdan interacciones pasadas y se auto-mejoran con memoria de largo plazo.

Diferenciadores clave

  • Stateful memory persistente out-of-the-box
  • Agentes que aprenden de su historial
  • Self-improvement capabilities

Casos de uso ideales

  • Chatbots con memoria de conversaciones largas
  • Agents personalizados que recuerdan preferencias del usuario
  • Asistentes persistentes

Recursos


OpenAI Agents SDK

Qué es

Sucesor oficial de OpenAI Swarm. Framework lightweight para multi-agent con handoffs, guardrails y tracing.

Filosofía

Lightweight y production-ready. OpenAI lo lanzó en marzo 2025 para reemplazar Swarm (que era “educational”).

Diferenciadores clave

  • Oficial OpenAI — integración perfecta con GPT-4/GPT-5
  • Handoffs entre agentes
  • Guardrails integrados
  • Tracing nativo

Casos de uso ideales

  • Productos construidos 100% sobre modelos OpenAI
  • Multi-agent con handoffs simples
  • Cuando quieres el SDK “bendecido” por el proveedor

Recursos


Google ADK (Agent Development Kit)

Qué es

SDK oficial de Google para agentes. Lanzado abril 2025. Code-first, Gemini-native.

Diferenciadores clave

  • Gemini-native — optimizado para modelos Google
  • Eval + deploy integrados
  • MCP-native (Model Context Protocol)

Casos de uso ideales

  • Productos construidos sobre Gemini
  • Google Cloud / Vertex AI stack
  • Cuando necesitas eval + deploy en un solo SDK

Recursos


Claude Agent SDK (Anthropic)

Qué es

SDK oficial de Anthropic para construir agentes con Claude. Hooks, MCP tools, subagents.

Disponible en 2 lenguajes

Diferenciadores clave

  • Oficial Anthropic — integración perfecta con Claude
  • Hooks para intercepción
  • MCP tools nativos
  • Subagents integrados

Casos de uso ideales

  • Productos construidos 100% sobre Claude
  • Cuando quieres features Anthropic-specific (prompt caching, extended thinking)
  • Integración con ecosistema Claude Code

Microsoft Agent Framework (el sucesor)

Qué es

La fusión oficial de AutoGen + Semantic Kernel lanzada en v1.0 GA en abril 2026. El futuro del agentic stack Microsoft.

Por qué importa

Microsoft admite que eran dos productos solapados. Ahora uno solo, unificado:

  • Python + .NET en un solo SDK
  • Hereda lo mejor de AutoGen (multi-agent) y Semantic Kernel (enterprise .NET)
  • Azure-first pero no exclusivo
  • Es efectivamente “Semantic Kernel v2.0” según el propio equipo Microsoft

Casos de uso ideales

  • Cualquier proyecto nuevo en stack Microsoft Azure
  • Migración desde AutoGen 0.4 o Semantic Kernel 1.x
  • Python + .NET híbrido

Recursos


Semantic Kernel (Microsoft — legacy)

Qué es

SDK lightweight para integrar LLMs en apps enterprise. C#, Python y Java.

⚠️ Estado actual

Mantenimiento, no desarrollo nuevo. Microsoft recomienda migrar a Agent Framework para features nuevas. SK v1.x sigue con bugfixes y security patches.

Cuándo sigue teniendo sentido usarlo

  • Si ya tienes producción estable en SK v1.x
  • Apps Microsoft 365 Copilot existentes
  • Si necesitas soporte Java (Agent Framework es Python + .NET)

Recursos


Atomic Agents

Qué es

Framework anti-magia. Composabilidad atómica, I/O via schemas Pydantic, inspirado en Atomic Design.

Filosofía

“Sin abstracciones mágicas.” Control total, cada componente reusable individualmente. Rechazo explícito al “black-box” de LangChain/CrewAI.

Casos de uso ideales

  • Equipos que rechazan la magia de otros frameworks
  • Pipelines deterministas donde cada paso debe ser explícito
  • Cuando debug es crítico

Recursos


Haystack (deepset-ai)

Qué es

RAG + agents production-ready. Pipelines modulares de deepset.

Diferenciadores clave

  • RAG de clase enterprise
  • Pipelines modulares
  • Production-ready desde hace años

Casos de uso ideales

  • RAG sobre grandes volúmenes de documentos
  • Sistemas de búsqueda semántica enterprise
  • Pipelines híbridos (retrieval + generación + tools)

Recursos


CAMEL

Qué es

Framework multi-agente research-oriented con énfasis en role-playing y “scaling law of agents”.

Casos de uso ideales

  • Investigación académica
  • Experimentación multi-agente
  • Sistemas inspirados en dinámicas sociales

Recursos


MetaGPT

Qué es

Framework multi-agente que simula una “software company”: PM, Architect, Engineer, QA como agentes que colaboran.

⚠️ Señal de desaceleración

Push parado desde enero 2026. No verificado si es pausa estratégica o declive. Revisa antes de comprometerte.

Recursos


Visual Builders (no-code / low-code)

Langflow

147.071 ⭐ — Visual builder sobre LangChain. Drag-drop de flujos. El rey por estrellas.

Dify

138.216 ⭐ — Plataforma production-ready agentic workflow con LLMOps integrado. Mayor tracción enterprise que Langflow.

Flowise

52.032 ⭐ — Drag-drop sobre LangChain.js. Node-based al estilo n8n pero para agentes.

Rivet (Ironclad)

4.539 ⭐ — Visual IDE + librería TypeScript embebible. Crecimiento más modesto.

Cuándo usar visual builders

  • Prototipos rápidos / demos
  • Equipos no técnicos
  • Cuando el flujo es estable y no necesita código custom
  • Onboarding de stakeholders no-devs

Cuándo NO usar visual builders

  • Productos de producción con requisitos complejos (usa libraries)
  • Cuando necesitas testing automatizado, versionado de código, CI/CD
  • Performance crítica

Tiempos de aprendizaje

Framework Tiempo productivo Tiempo dominio
CrewAI Horas 1 semana
SmolAgents Horas 3-5 días
Pydantic AI 1 día (si conoces Pydantic) 1 semana
Mastra 1 día 1-2 semanas
Agno 1-2 días 1-2 semanas
OpenAI Agents SDK 1-2 días 1 semana
Google ADK 1-2 días 1-2 semanas
Claude Agent SDK 1-2 días 1 semana
LlamaIndex 2-3 días 2-3 semanas
Atomic Agents 2-3 días 2 semanas
AutoGen 3-5 días 2-4 semanas
LangGraph 3-5 días 3-4 semanas
Microsoft Agent Framework 3-5 días 3-4 semanas
Haystack 3-5 días 2-4 semanas
Semantic Kernel 5 días 3-4 semanas

Recomendaciones por perfil

“Soy solo dev, quiero prototipar YA”

Ganador: CrewAI
Curva más baja del sector. Prototipo funcionando en horas.

“Necesito agentes production-ready con observabilidad”

Ganador: LangGraph + LangSmith
Durabilidad, checkpointing, time-travel debugging, audit trails.

“Mi stack es TypeScript / Next.js / Node”

Ganador claro: Mastra
TS-first real, no port. Compatible con Vercel AI SDK.

“Quiero type safety obsesiva”

Ganador: Pydantic AI
v1.0 estable, FastAPI feel, structured outputs validados.

“Mi caso es RAG sobre documentos complejos”

Ganador: LlamaIndex + LlamaParse
PDF, tablas, gráficos, OCR agéntico. 700% growth 2025.

“Solo uso modelos OpenAI”

Ganador: OpenAI Agents SDK
SDK oficial, handoffs + guardrails + tracing.

“Solo uso Claude”

Ganador: Claude Agent SDK de Anthropic
Features Anthropic-native: prompt caching, extended thinking, MCP.

“Solo uso Gemini / Google Cloud”

Ganador: Google ADK
Gemini-native, eval + deploy integrados.

“Stack Microsoft / Azure / .NET”

Ganador: Microsoft Agent Framework
AutoGen + Semantic Kernel unificados. Python + .NET. NO empieces con AutoGen o SK sueltos en 2026.

“Necesito agentes con memoria persistente”

Ganador: Letta
Líder indiscutible en stateful memory.

“Quiero algo sin magia, control total”

Ganador: Atomic Agents
Anti-black-box por diseño.

“No soy dev, necesito drag-and-drop”

Ganador: Dify (si quieres LLMOps integrado) o Langflow (si ya usas LangChain).

“Research académico”

Ganador: CAMEL
Role-playing, scaling law of agents.


Stacks ganadores 2026

Stack “Startup ágil Python”

CrewAI (rápido de arrancar)
   ↓
Pydantic AI (cuando necesitas type safety en partes críticas)
   ↓
LangSmith (observabilidad)

Stack “Producción enterprise Python”

LangGraph (workflows complejos con state)
   ↓
LangSmith (observabilidad + evals)
   ↓
LlamaIndex (RAG sobre documentos)

Stack “TypeScript full-stack”

Mastra (core)
   ↓
Vercel AI SDK (integración con Next.js)
   ↓
MCP servers (integración con herramientas externas)

Stack “Azure / Microsoft”

Microsoft Agent Framework (no AutoGen ni SK por separado)
   ↓
Azure OpenAI Service
   ↓
Azure AI Foundry

Stack “Solo OpenAI”

OpenAI Agents SDK (nativo)
   ↓
OpenAI Tracing Platform

Stack “Solo Claude”

Claude Agent SDK (Python o TS)
   ↓
MCP tools
   ↓
Anthropic Workbench

Tendencias y novedades 2025-2026

📉 Lo que está en declive

  • OpenAI Swarm — deprecated de facto, reemplazado por Agents SDK
  • AutoGen standalone — migra a Microsoft Agent Framework
  • Semantic Kernel — mantenimiento, no desarrollo nuevo
  • MetaGPT — push parado desde enero 2026 (unverified si es pausa o declive)

📈 Lo que está surgiendo con fuerza

  • Mastra — 0 → 23k ⭐ en 14 meses, $13M YC seed
  • Pydantic AI — 0 → 16k ⭐ en 18 meses, v1.0 estable
  • Google ADK — 19k ⭐ desde su lanzamiento en 2025
  • OpenAI Agents SDK — 22k ⭐ como reemplazo de Swarm
  • Claude Agent SDK — 6.4k + 1.3k, entrada oficial de Anthropic

🔄 Cambios estructurales

  • LlamaIndex pivot de framework RAG a plataforma document agent (700% revenue growth)
  • Microsoft consolidation con Agent Framework
  • Visual builders masivos: Langflow (147k) y Dify (138k) superan a librerías tradicionales en estrellas
  • Entrada de los 3 big LLM providers (OpenAI, Google, Anthropic) con SDKs oficiales

🧠 Patrón de mercado claro

Cada proveedor de LLM (OpenAI, Google, Anthropic, Microsoft) está lanzando su SDK oficial. Esto fragmenta el mercado pero simplifica la decisión: si usas solo UN proveedor, su SDK es la opción más integrada.

Los frameworks cross-provider (LangGraph, CrewAI, Pydantic AI, Mastra) mantienen su ventaja para equipos que cambian de modelo o multi-proveedor.


Decisión: ¿SDK oficial o framework cross-provider?

Criterio SDK oficial (OpenAI/Anthropic/Google/Microsoft) Framework cross-provider (LangGraph/CrewAI/etc)
Integración con su proveedor 🟢🟢 Máxima 🟡 Buena
Cross-provider 🔴 No 🟢🟢 Sí
Vendor lock-in 🔴 Alto 🟢 Bajo
Features proveedor-específicas 🟢🟢 Primeras en llegar 🟡 Tardan
Comunidad / templates 🟡 Menor 🟢🟢 Grande
Riesgo de cambio de API 🟡 Medio (políticas proveedor) 🟢 Bajo
Coste inicial 🟢 Mínimo 🟡 Medio

Regla práctica: - Producto 100% sobre un solo proveedor → SDK oficial de ese proveedor - Producto multi-modelo o que puede cambiar → framework cross-provider - Equipo experimental / research → framework con más comunidad (LangGraph, CrewAI)


Glosario

  • Agent: sistema que razona, decide y actúa usando un LLM como “cerebro”
  • Multi-agent: múltiples agentes que colaboran (roles distintos, mensajes, handoffs)
  • Handoff: transferencia de control entre agentes
  • State machine: modelo de computación donde cada paso cambia un estado explícito
  • Checkpointing: persistir el estado del agente en cada step para poder recuperar/revertir
  • Tool calling: el LLM decide invocar una función externa (API, DB, código)
  • MCP (Model Context Protocol): protocolo de Anthropic para comunicación entre agentes y herramientas externas
  • RAG (Retrieval-Augmented Generation): enriquecer el prompt del LLM con documentos recuperados
  • Code-as-action: el agente genera y ejecuta código en vez de tool-calls JSON
  • Guardrails: validaciones que filtran inputs/outputs peligrosos o fuera de política
  • Observability: tracing, logs, métricas del comportamiento del agente
  • Durable execution: ejecuciones que sobreviven crashes y restarts
  • Human-in-the-loop: pausar la ejecución automática para pedir aprobación humana

Recursos consolidados

Libraries Python principales

Framework Repo Docs
LangGraph github docs
CrewAI github docs.crewai.com
AutoGen github microsoft.github.io/autogen
Pydantic AI github ai.pydantic.dev
LlamaIndex github docs.llamaindex.ai
Agno github docs.agno.com
SmolAgents github HuggingFace docs
Haystack github haystack.deepset.ai
Semantic Kernel github learn.microsoft.com/semantic-kernel
Letta github docs.letta.com
CAMEL github camel-ai.org
Atomic Agents github README del repo
MetaGPT github docs.deepwisdom.ai

Libraries TypeScript

Framework Repo Docs
Mastra github mastra.ai/docs

SDKs oficiales de proveedores

Proveedor SDK Repo
OpenAI Agents SDK github
Anthropic Claude Agent SDK (Python) github
Anthropic Claude Agent SDK (TS) github
Google ADK (Agent Development Kit) github
Microsoft Agent Framework (NUEVO) github

Visual Builders

Plataforma Repo
Langflow github
Dify github
Flowise github
Rivet github

Artículo relacionado

👉 Frameworks agénticos para Claude Code: Superpowers, gentle-ai, BMAD y más

Si lo que buscas no es construir agentes sino estructurar cómo tu asistente de IA (Claude Code, Cursor, Codex) te ayuda a programar, ese es el artículo complementario. Cubre la Familia B: frameworks para coding workflow.


Guía actualizada en Abril 2026. Las estrellas de GitHub y estado de mantenimiento se verificaron directamente contra la API oficial el 18 de abril de 2026. Información de funding, production users y releases verificada contra blogs oficiales de cada empresa.