Frameworks agénticos para construir agentes IA

CrewAI, LangGraph, AutoGen, Pydantic AI y más — comparativa completa 2026

“No eliges un framework por sus estrellas. Eliges el que encaja con tu stack, tu velocidad de iteración y el tipo de producto que vas a construir.”

⚠️ Importante: las 2 familias de frameworks agénticos

El término “framework agéntico” se usa para dos categorías completamente distintas. Este artículo cubre la Familia A: librerías para construir agentes IA como producto.

🅰️ Familia A — Frameworks para CONSTRUIR agentes IA (ESTE ARTÍCULO)

Librerías Python/TypeScript que importas en tu código para construir tus propios agentes (chatbots, asistentes autónomos, pipelines RAG, sistemas multi-agente).

Ejemplos que analizamos aquí: LangGraph, CrewAI, AutoGen, Pydantic AI, Mastra, Agno, LlamaIndex, Semantic Kernel, Letta, OpenAI Agents SDK, Google ADK, Claude Agent SDK y más.

Usuario objetivo: developer que construye un producto con IA.

🅱️ Familia B — Frameworks para GUIAR tu asistente de coding

Plugins, skills o metodologías que estructuran cómo tu asistente de IA (Claude Code, Cursor, Codex) te ayuda a programar.

👉 Comparativa de frameworks agénticos para Claude Code (Superpowers, gentle-ai, BMAD…) ← artículo hermano

📰 La noticia que cambia el mapa en 2026: Microsoft Agent Framework

Antes de entrar al catálogo, hay una noticia estructural que debes conocer para no invertir en tecnología obsoleta:

Microsoft fusionó AutoGen + Semantic Kernel en un solo framework oficial: Microsoft Agent Framework (v1.0 GA abril 2026).

Qué significa

AutoGen (57.181 ⭐) queda como proyecto “research/innovation”
Semantic Kernel (27.731 ⭐) sigue con bugfixes y security patches, pero features nuevas van al nuevo framework
Microsoft Agent Framework (9.558 ⭐, creciendo rápido) es “Semantic Kernel v2.0” según el propio equipo de Microsoft
Soporta Python + .NET en un solo SDK unificado

Implicación práctica

Si vas a empezar un proyecto nuevo en el ecosistema Microsoft (Azure, .NET) en 2026 y usarías AutoGen o Semantic Kernel, arranca directamente con Agent Framework. Si ya tienes producción con AutoGen 0.4, el roadmap de migración está publicado. Si tienes SK 1.x, igual.

📦 github.com/microsoft/agent-framework

Tabla maestra: los frameworks más relevantes en 2026

(Click en cualquier cabecera para ordenar — ⭐ GitHub verificadas vía API a 18 abril 2026)

Framework	Autor / Org	⭐ GitHub	Lenguaje	Tipo	Categoría
Langflow	langflow-ai	147.071	Python	Visual Builder	No-code
Dify	langgenius	138.216	TypeScript	Visual Builder	Platform
MetaGPT	geekan	67.190	Python	Library	Multi-agent
AutoGen	Microsoft	57.181	Python / .NET	Library	Conversational multi-agent
Flowise	FlowiseAI	52.032	TypeScript	Visual Builder	LangChain.js drag-drop
CrewAI	crewAIInc	49.139	Python	Library	Role-based crews
LlamaIndex	run-llama	48.665	Python / TS	Library	Document agents + RAG
Agno (ex-Phidata)	agno-agi	39.516	Python	Library	High-performance runtime
LangGraph	langchain-ai	29.555	Python / TS	Library	Graph-based state machines
Semantic Kernel	Microsoft	27.731	C# / Python / Java	Library	Enterprise .NET
SmolAgents	HuggingFace	26.705	Python	Library	Code-as-action
Haystack	deepset-ai	24.887	Python	Library	RAG + agents production
Mastra	mastra-ai	23.116	TypeScript	Library	TS-first full-stack
Letta (ex-MemGPT)	letta-ai	22.137	Python	Library	Stateful memory agents
OpenAI Agents SDK	OpenAI	22.003	Python	Official SDK	Sucesor de Swarm
Google ADK	Google	19.085	Python	Official SDK	Gemini-native
CAMEL	camel-ai	16.725	Python	Library	Research multi-agent
Pydantic AI	pydantic	16.445	Python	Library	Type-safe agents
Microsoft Agent Framework	Microsoft	9.558	Python / .NET	Library	AutoGen + SK unificados
Claude Agent SDK (Python)	Anthropic	6.392	Python	Official SDK	Anthropic oficial
Atomic Agents	BrainBlend-AI	5.823	Python	Library	Composable sin magia

Marco conceptual: los 3 tipos

Los frameworks de la Familia A se dividen en 3 tipos según cómo los usas:

🧩 Libraries (code-first)

Las importas en tu código Python/TypeScript. Tú escribes el código que define agentes, tools, flujos. Son la opción de los developers serios.

Ejemplos: LangGraph, CrewAI, AutoGen, Pydantic AI, Mastra, Agno.

🎨 Visual Builders (no-code / low-code)

Interfaces drag-and-drop para montar flujos sin escribir código. Ideal para prototipos rápidos, equipos no técnicos, demos.

Ejemplos: Langflow, Dify, Flowise, Rivet.

🔌 Official SDKs (de proveedores LLM)

SDKs oficiales de los proveedores de modelos. Optimizados para su stack, con menos abstracciones pero máxima integración.

Ejemplos: OpenAI Agents SDK, Google ADK, Anthropic Claude Agent SDK.

Matriz comparativa consolidada

Feature	LangGraph	CrewAI	AutoGen	Pydantic AI	Mastra	LlamaIndex	SmolAgents	Agno	Atomic
Python	✅	✅	✅	✅	❌	✅	✅	✅	✅
TypeScript	✅	❌	❌	❌	✅✅	✅	❌	❌	❌
Type-safe	⚙️	⚙️	⚙️	✅✅	✅	⚙️	⚙️	⚙️	✅
Multi-agent	✅	✅✅	✅✅	⚙️	✅	⚙️	⚙️	✅	⚙️
Memoria persistente	⚙️	⚙️	⚙️	⚙️	✅	✅	❌	✅✅	⚙️
RAG built-in	⚙️	❌	❌	❌	✅	✅✅	❌	✅	❌
Observabilidad	✅ LangSmith	⚙️	⚙️	✅ Logfire	✅	⚙️	⚙️	✅	❌
Production users notables	✅✅	✅✅	✅	✅	✅	✅✅	⚙️	⚙️	❌
Learning curve	🔴 Alta	🟢 Baja	🟡 Media	🟢 Baja	🟢 Baja	🟡 Media	🟢 Baja	🟢 Baja	🟡 Media

LangGraph

Qué es

Framework graph-based de LangChain para modelar agentes como máquinas de estado. Cada agente es un grafo de nodos con edges condicionales sobre un State schema tipado.

Filosofía

Control de flujo explícito. En lugar de “magia” agéntica, tú defines el grafo: nodos que procesan, edges condicionales que deciden siguiente paso, state que persiste.

Diferenciadores clave

Durability (checkpointing) — el estado se persiste en cada step
Time-travel debugging — puedes revertir a cualquier estado anterior
Human-in-the-loop nativo
Integración con LangSmith para observabilidad trace-level
Integración con MCP (Model Context Protocol de Anthropic)

Casos de uso ideales

Workflows complejos multi-step con backtracking
Sistemas donde necesitas audit trail completo
Producción enterprise con requisitos de durabilidad
Pipelines que deben pausar, esperar aprobación humana, y continuar

Casos donde NO usarlo

Prototipos simples (es verbose incluso para flujos básicos)
Equipos pequeños sin tiempo para aprender curva media-alta

Tiempo de aprendizaje

Media-alta. Schema + nodes + edges + compile. Verbose.

Madurez y adopción

Production-ready. Superó a CrewAI en estrellas a principios de 2026. LangGraph Platform GA en 2025.

Usuarios en producción

Klarna, Replit, LinkedIn, Elastic, Uber, AppFolio.

Recursos

📦 github.com/langchain-ai/langgraph · 29.555 ⭐
📚 Documentación oficial con ejemplos pattern-based
🔗 LangSmith para observabilidad

CrewAI

Qué es

Framework role-based donde cada agente tiene role, goal y backstory. Los agentes forman “crews” que trabajan en tasks asignadas siguiendo processes (sequential, hierarchical, consensual).

Filosofía

Metáfora de equipo humano aplicada a agentes IA. Arquitecta tu sistema como un equipo real: tienes un researcher, un writer, un reviewer, y les das objetivos claros.

Diferenciadores clave

La curva de aprendizaje más baja del sector — probablemente el framework más fácil de arrancar
Standalone desde 2024 (ya no depende de LangChain)
Soporte nativo MCP + A2A desde v1.x
Metáfora intuitiva que no requiere saber teoría de grafos ni máquinas de estado

Casos de uso ideales

Multi-agent colaborativo con roles claros (research → write → review)
Equipos que quieren prototipar rápido
Cuando tu problema tiene estructura de “equipo humano”
MVPs y primeros productos agénticos

Casos donde NO usarlo

Workflows con lógica condicional muy compleja (usa LangGraph)
Cuando necesitas control extremo de flujo (usa Atomic Agents o LangGraph)

Tiempo de aprendizaje

Bajo. Arrancar en horas, no días.

Madurez y adopción

$24.5M funding total (Series A liderada por Insight Partners)
~2.000 millones de ejecuciones agénticas/año reportadas
Uso en ~50% del Fortune 500 (dato de la empresa)

Usuarios en producción

PwC, IBM, Capgemini, NVIDIA.

Recursos

📦 github.com/crewAIInc/crewAI · 49.139 ⭐
🌐 CrewAI Enterprise cloud
🎨 Multi-agent builder visual (v1.10.x)

AutoGen (Microsoft)

Qué es

Framework event-driven, async, conversational multi-agent donde los agentes se comunican vía mensajes asíncronos. Rewrite completo en v0.4 (enero 2025).

⚠️ Estado actual

Importante: Microsoft fusionó AutoGen con Semantic Kernel en Microsoft Agent Framework (preview oct-2025, v1.0 GA abril 2026). AutoGen queda como proyecto “research/innovation” pero el roadmap de producción migra a Agent Framework.

Si empiezas nuevo, arranca con Microsoft Agent Framework.

Diferenciadores clave

Rewrite async/event-driven en v0.4
AutoGen Studio — low-code UI
Magentic-One — generalist multi-agent system
Python + .NET

Casos de uso ideales

Research y prototipado multi-agent conversacional
Empresas en stack Microsoft que necesitan puente hasta Agent Framework

Tiempo de aprendizaje

Medio.

Licencia

CC-BY-4.0 (atípica, no la MIT estándar — revisar compatibilidad comercial).

Recursos

📦 github.com/microsoft/autogen · 57.181 ⭐
🆕 github.com/microsoft/agent-framework · 9.558 ⭐ (sucesor recomendado)

Pydantic AI

Qué es

Agents type-safe al estilo Pydantic. FastAPI-feel pero para GenAI — structured outputs con validación Pydantic, dependency injection, streaming validado.

Filosofía

“La forma Pydantic de construir agentes.” Si vienes de FastAPI y Pydantic, esto te va a encantar.

Diferenciadores clave

Type safety end-to-end
Dependency injection integrada
Streaming validado con schemas Pydantic
Logfire integration para observabilidad
v1.0 lanzado 4 septiembre 2025 — API stability commitment de 6 meses
Thoughtworks Radar: ASSESS/TRIAL

Casos de uso ideales

Agents con outputs estructurados críticos (sistemas que deben parsear la salida)
Equipos que valoran type safety
Developers que ya usan Pydantic o FastAPI
Integración con Amazon Bedrock AgentCore

Tiempo de aprendizaje

Bajo si ya usas Pydantic/FastAPI.

Novedades v1

Human-in-the-loop tool approval
Durable execution

Recursos

📦 github.com/pydantic/pydantic-ai · 16.445 ⭐
📚 Docs con Pydantic + FastAPI familiar API

Mastra (el TypeScript-first)

Qué es

El framework TypeScript de referencia para construir agentes. Full-stack TS: workflows (durable graph), agents, RAG, evals, memory — todo integrado.

Filosofía

TS-first. Creado por ex-team de Gatsby. Si tu stack es Next.js, Node o React, esto es tu opción nativa sin salir de TS.

Diferenciadores clave

TypeScript de primera clase (no es un port Python → TS)
Dev playground local
Compatible con Vercel AI SDK
Durable workflows

Madurez y adopción

$13M seed round YC-led (Paul Graham, Guillermo Rauch, Amjad Masad, Balaji como inversores)
220k weekly downloads
“Tercer JS framework que más rápido crece” según telemetría propia

Usuarios en producción

Replit, SoftBank, Marsh McLennan, PayPal, Adobe, Docker.

Casos de uso ideales

Stacks Next.js / Node / React que quieren agentes sin salir de TS
Full-stack devs que prefieren TypeScript sobre Python
Edge deployments (Vercel, Cloudflare Workers)

Licencia

Elastic License / custom (NOASSERTION en GitHub). Revisa los términos si tu uso es comercial.

Recursos

📦 github.com/mastra-ai/mastra · 23.116 ⭐
💰 Seed round blog post

Agno (ex-Phidata)

Qué es

High-performance multi-agent runtime. Rebranded de Phidata en enero 2025 con rewrite de rendimiento.

Diferenciadores clave

Performance: ~3μs instantiation según el equipo
Built-in: memory, knowledge base, reasoning
AgentOS — runtime managed

Casos de uso ideales

Agents de producción con memoria persistente y knowledge base
Alta concurrencia (miles de agents simultáneos)
Cuando performance importa más que flexibilidad

Tiempo de aprendizaje

Bajo-medio.

Licencia

Apache-2.0 (el marketing web menciona Mozilla Public License para Agno 2.0 — ambigüedad no verificada, revisar antes de uso comercial).

Recursos

📦 github.com/agno-agi/agno · 39.516 ⭐

LlamaIndex (el pivot 2025)

Qué es

Antes: framework RAG por excelencia.
Ahora (pivot 2025): “Leading document agent and OCR platform” (descripción oficial actualizada).

Filosofía

Workflows event-driven + LlamaParse/LlamaCloud como producto principal. Document parsing/OCR agéntico de clase enterprise.

Diferenciadores clave

Document parsing enterprise (PDFs con tablas/gráficos complejos vía LlamaParse)
Workflows event-driven
LlamaIndex TS también disponible

Madurez y adopción

700%+ growth self-serve revenue en 2025
Pivot exitoso validado por mercado

Usuarios en producción

Cemex, Rakuten, Carlyle Group.

Casos de uso ideales

RAG sobre documentos complejos (contratos, papers, reports con tablas)
Knowledge assistants enterprise
OCR agéntico

Recursos

📦 github.com/run-llama/llama_index · 48.665 ⭐
📚 LlamaCloud

SmolAgents (HuggingFace)

Qué es

“Agents that think in code”. El CodeAgent genera y ejecuta código Python en vez de tool-calls JSON.

Filosofía

Code-as-action: si quieres que el agente haga algo, que escriba código y lo ejecute. Minimalista (~1000 LoC core).

Diferenciadores clave

Code-as-action paradigm (único en esta lista)
Integración nativa HuggingFace Hub — agents shareables
Sandboxing E2B para seguridad
Apache-2.0 (licencia clara)

Casos de uso ideales

Agents locales con modelos open-source
Prototipos simples sin overhead
Education / demos

Recursos

📦 github.com/huggingface/smolagents · 26.705 ⭐

Letta (ex-MemGPT)

Qué es

El líder indiscutible en agentes con memoria persistente. Rebrand de MemGPT en 2024.

Filosofía

Agentes stateful que recuerdan interacciones pasadas y se auto-mejoran con memoria de largo plazo.

Diferenciadores clave

Stateful memory persistente out-of-the-box
Agentes que aprenden de su historial
Self-improvement capabilities

Casos de uso ideales

Chatbots con memoria de conversaciones largas
Agents personalizados que recuerdan preferencias del usuario
Asistentes persistentes

Recursos

📦 github.com/letta-ai/letta · 22.137 ⭐

OpenAI Agents SDK

Qué es

Sucesor oficial de OpenAI Swarm. Framework lightweight para multi-agent con handoffs, guardrails y tracing.

Filosofía

Lightweight y production-ready. OpenAI lo lanzó en marzo 2025 para reemplazar Swarm (que era “educational”).

Diferenciadores clave

Oficial OpenAI — integración perfecta con GPT-4/GPT-5
Handoffs entre agentes
Guardrails integrados
Tracing nativo

Casos de uso ideales

Productos construidos 100% sobre modelos OpenAI
Multi-agent con handoffs simples
Cuando quieres el SDK “bendecido” por el proveedor

Recursos

📦 github.com/openai/openai-agents-python · 22.003 ⭐

Google ADK (Agent Development Kit)

Qué es

SDK oficial de Google para agentes. Lanzado abril 2025. Code-first, Gemini-native.

Diferenciadores clave

Gemini-native — optimizado para modelos Google
Eval + deploy integrados
MCP-native (Model Context Protocol)

Casos de uso ideales

Productos construidos sobre Gemini
Google Cloud / Vertex AI stack
Cuando necesitas eval + deploy en un solo SDK

Recursos

📦 github.com/google/adk-python · 19.085 ⭐

Claude Agent SDK (Anthropic)

Qué es

SDK oficial de Anthropic para construir agentes con Claude. Hooks, MCP tools, subagents.

Disponible en 2 lenguajes

Python: github.com/anthropics/claude-agent-sdk-python · 6.392 ⭐
TypeScript: github.com/anthropics/claude-agent-sdk-typescript · 1.300 ⭐

Diferenciadores clave

Oficial Anthropic — integración perfecta con Claude
Hooks para intercepción
MCP tools nativos
Subagents integrados

Casos de uso ideales

Productos construidos 100% sobre Claude
Cuando quieres features Anthropic-specific (prompt caching, extended thinking)
Integración con ecosistema Claude Code

Microsoft Agent Framework (el sucesor)

Qué es

La fusión oficial de AutoGen + Semantic Kernel lanzada en v1.0 GA en abril 2026. El futuro del agentic stack Microsoft.

Por qué importa

Microsoft admite que eran dos productos solapados. Ahora uno solo, unificado:

Python + .NET en un solo SDK
Hereda lo mejor de AutoGen (multi-agent) y Semantic Kernel (enterprise .NET)
Azure-first pero no exclusivo
Es efectivamente “Semantic Kernel v2.0” según el propio equipo Microsoft

Casos de uso ideales

Cualquier proyecto nuevo en stack Microsoft Azure
Migración desde AutoGen 0.4 o Semantic Kernel 1.x
Python + .NET híbrido

Recursos

📦 github.com/microsoft/agent-framework · 9.558 ⭐
📰 Microsoft blog oficial

Semantic Kernel (Microsoft — legacy)

Qué es

SDK lightweight para integrar LLMs en apps enterprise. C#, Python y Java.

⚠️ Estado actual

Mantenimiento, no desarrollo nuevo. Microsoft recomienda migrar a Agent Framework para features nuevas. SK v1.x sigue con bugfixes y security patches.

Cuándo sigue teniendo sentido usarlo

Si ya tienes producción estable en SK v1.x
Apps Microsoft 365 Copilot existentes
Si necesitas soporte Java (Agent Framework es Python + .NET)

Recursos

📦 github.com/microsoft/semantic-kernel · 27.731 ⭐

Atomic Agents

Qué es

Framework anti-magia. Composabilidad atómica, I/O via schemas Pydantic, inspirado en Atomic Design.

Filosofía

“Sin abstracciones mágicas.” Control total, cada componente reusable individualmente. Rechazo explícito al “black-box” de LangChain/CrewAI.

Casos de uso ideales

Equipos que rechazan la magia de otros frameworks
Pipelines deterministas donde cada paso debe ser explícito
Cuando debug es crítico

Recursos

📦 github.com/BrainBlend-AI/atomic-agents · 5.823 ⭐

Haystack (deepset-ai)

Qué es

RAG + agents production-ready. Pipelines modulares de deepset.

Diferenciadores clave

RAG de clase enterprise
Pipelines modulares
Production-ready desde hace años

Casos de uso ideales

RAG sobre grandes volúmenes de documentos
Sistemas de búsqueda semántica enterprise
Pipelines híbridos (retrieval + generación + tools)

Recursos

📦 github.com/deepset-ai/haystack · 24.887 ⭐

CAMEL

Qué es

Framework multi-agente research-oriented con énfasis en role-playing y “scaling law of agents”.

Casos de uso ideales

Investigación académica
Experimentación multi-agente
Sistemas inspirados en dinámicas sociales

Recursos

📦 github.com/camel-ai/camel · 16.725 ⭐

MetaGPT

Qué es

Framework multi-agente que simula una “software company”: PM, Architect, Engineer, QA como agentes que colaboran.

⚠️ Señal de desaceleración

Push parado desde enero 2026. No verificado si es pausa estratégica o declive. Revisa antes de comprometerte.

Recursos

📦 github.com/geekan/MetaGPT · 67.190 ⭐

Visual Builders (no-code / low-code)

Langflow

147.071 ⭐ — Visual builder sobre LangChain. Drag-drop de flujos. El rey por estrellas.

📦 github.com/langflow-ai/langflow

Dify

138.216 ⭐ — Plataforma production-ready agentic workflow con LLMOps integrado. Mayor tracción enterprise que Langflow.

📦 github.com/langgenius/dify

Flowise

52.032 ⭐ — Drag-drop sobre LangChain.js. Node-based al estilo n8n pero para agentes.

📦 github.com/FlowiseAI/Flowise

Rivet (Ironclad)

4.539 ⭐ — Visual IDE + librería TypeScript embebible. Crecimiento más modesto.

📦 github.com/Ironclad/rivet

Cuándo usar visual builders

Prototipos rápidos / demos
Equipos no técnicos
Cuando el flujo es estable y no necesita código custom
Onboarding de stakeholders no-devs

Cuándo NO usar visual builders

Productos de producción con requisitos complejos (usa libraries)
Cuando necesitas testing automatizado, versionado de código, CI/CD
Performance crítica

Tiempos de aprendizaje

Framework	Tiempo productivo	Tiempo dominio
CrewAI	Horas	1 semana
SmolAgents	Horas	3-5 días
Pydantic AI	1 día (si conoces Pydantic)	1 semana
Mastra	1 día	1-2 semanas
Agno	1-2 días	1-2 semanas
OpenAI Agents SDK	1-2 días	1 semana
Google ADK	1-2 días	1-2 semanas
Claude Agent SDK	1-2 días	1 semana
LlamaIndex	2-3 días	2-3 semanas
Atomic Agents	2-3 días	2 semanas
AutoGen	3-5 días	2-4 semanas
LangGraph	3-5 días	3-4 semanas
Microsoft Agent Framework	3-5 días	3-4 semanas
Haystack	3-5 días	2-4 semanas
Semantic Kernel	5 días	3-4 semanas

Recomendaciones por perfil

“Soy solo dev, quiero prototipar YA”

Ganador: CrewAI
Curva más baja del sector. Prototipo funcionando en horas.

“Necesito agentes production-ready con observabilidad”

Ganador: LangGraph + LangSmith
Durabilidad, checkpointing, time-travel debugging, audit trails.

“Mi stack es TypeScript / Next.js / Node”

Ganador claro: Mastra
TS-first real, no port. Compatible con Vercel AI SDK.

“Quiero type safety obsesiva”

Ganador: Pydantic AI
v1.0 estable, FastAPI feel, structured outputs validados.

“Mi caso es RAG sobre documentos complejos”

Ganador: LlamaIndex + LlamaParse
PDF, tablas, gráficos, OCR agéntico. 700% growth 2025.

“Solo uso modelos OpenAI”

Ganador: OpenAI Agents SDK
SDK oficial, handoffs + guardrails + tracing.

“Solo uso Claude”

Ganador: Claude Agent SDK de Anthropic
Features Anthropic-native: prompt caching, extended thinking, MCP.

“Solo uso Gemini / Google Cloud”

Ganador: Google ADK
Gemini-native, eval + deploy integrados.

“Stack Microsoft / Azure / .NET”

Ganador: Microsoft Agent Framework
AutoGen + Semantic Kernel unificados. Python + .NET. NO empieces con AutoGen o SK sueltos en 2026.

“Necesito agentes con memoria persistente”

Ganador: Letta
Líder indiscutible en stateful memory.

“Quiero algo sin magia, control total”

Ganador: Atomic Agents
Anti-black-box por diseño.

“No soy dev, necesito drag-and-drop”

Ganador: Dify (si quieres LLMOps integrado) o Langflow (si ya usas LangChain).

“Research académico”

Ganador: CAMEL
Role-playing, scaling law of agents.

Stacks ganadores 2026

Stack “Startup ágil Python”

CrewAI (rápido de arrancar)
   ↓
Pydantic AI (cuando necesitas type safety en partes críticas)
   ↓
LangSmith (observabilidad)

Stack “Producción enterprise Python”

LangGraph (workflows complejos con state)
   ↓
LangSmith (observabilidad + evals)
   ↓
LlamaIndex (RAG sobre documentos)

Stack “TypeScript full-stack”

Mastra (core)
   ↓
Vercel AI SDK (integración con Next.js)
   ↓
MCP servers (integración con herramientas externas)

Stack “Azure / Microsoft”

Microsoft Agent Framework (no AutoGen ni SK por separado)
   ↓
Azure OpenAI Service
   ↓
Azure AI Foundry

Stack “Solo OpenAI”

OpenAI Agents SDK (nativo)
   ↓
OpenAI Tracing Platform

Stack “Solo Claude”

Claude Agent SDK (Python o TS)
   ↓
MCP tools
   ↓
Anthropic Workbench

Tendencias y novedades 2025-2026

📉 Lo que está en declive

OpenAI Swarm — deprecated de facto, reemplazado por Agents SDK
AutoGen standalone — migra a Microsoft Agent Framework
Semantic Kernel — mantenimiento, no desarrollo nuevo
MetaGPT — push parado desde enero 2026 (unverified si es pausa o declive)

📈 Lo que está surgiendo con fuerza

Mastra — 0 → 23k ⭐ en 14 meses, $13M YC seed
Pydantic AI — 0 → 16k ⭐ en 18 meses, v1.0 estable
Google ADK — 19k ⭐ desde su lanzamiento en 2025
OpenAI Agents SDK — 22k ⭐ como reemplazo de Swarm
Claude Agent SDK — 6.4k + 1.3k, entrada oficial de Anthropic

🔄 Cambios estructurales

LlamaIndex pivot de framework RAG a plataforma document agent (700% revenue growth)
Microsoft consolidation con Agent Framework
Visual builders masivos: Langflow (147k) y Dify (138k) superan a librerías tradicionales en estrellas
Entrada de los 3 big LLM providers (OpenAI, Google, Anthropic) con SDKs oficiales

🧠 Patrón de mercado claro

Cada proveedor de LLM (OpenAI, Google, Anthropic, Microsoft) está lanzando su SDK oficial. Esto fragmenta el mercado pero simplifica la decisión: si usas solo UN proveedor, su SDK es la opción más integrada.

Los frameworks cross-provider (LangGraph, CrewAI, Pydantic AI, Mastra) mantienen su ventaja para equipos que cambian de modelo o multi-proveedor.

Decisión: ¿SDK oficial o framework cross-provider?

Criterio	SDK oficial (OpenAI/Anthropic/Google/Microsoft)	Framework cross-provider (LangGraph/CrewAI/etc)
Integración con su proveedor	🟢🟢 Máxima	🟡 Buena
Cross-provider	🔴 No	🟢🟢 Sí
Vendor lock-in	🔴 Alto	🟢 Bajo
Features proveedor-específicas	🟢🟢 Primeras en llegar	🟡 Tardan
Comunidad / templates	🟡 Menor	🟢🟢 Grande
Riesgo de cambio de API	🟡 Medio (políticas proveedor)	🟢 Bajo
Coste inicial	🟢 Mínimo	🟡 Medio

Regla práctica: - Producto 100% sobre un solo proveedor → SDK oficial de ese proveedor - Producto multi-modelo o que puede cambiar → framework cross-provider - Equipo experimental / research → framework con más comunidad (LangGraph, CrewAI)

Glosario

Agent: sistema que razona, decide y actúa usando un LLM como “cerebro”
Multi-agent: múltiples agentes que colaboran (roles distintos, mensajes, handoffs)
Handoff: transferencia de control entre agentes
State machine: modelo de computación donde cada paso cambia un estado explícito
Checkpointing: persistir el estado del agente en cada step para poder recuperar/revertir
Tool calling: el LLM decide invocar una función externa (API, DB, código)
MCP (Model Context Protocol): protocolo de Anthropic para comunicación entre agentes y herramientas externas
RAG (Retrieval-Augmented Generation): enriquecer el prompt del LLM con documentos recuperados
Code-as-action: el agente genera y ejecuta código en vez de tool-calls JSON
Guardrails: validaciones que filtran inputs/outputs peligrosos o fuera de política
Observability: tracing, logs, métricas del comportamiento del agente
Durable execution: ejecuciones que sobreviven crashes y restarts
Human-in-the-loop: pausar la ejecución automática para pedir aprobación humana

Recursos consolidados

Libraries Python principales

Framework	Repo	Docs
LangGraph	github	docs
CrewAI	github	docs.crewai.com
AutoGen	github	microsoft.github.io/autogen
Pydantic AI	github	ai.pydantic.dev
LlamaIndex	github	docs.llamaindex.ai
Agno	github	docs.agno.com
SmolAgents	github	HuggingFace docs
Haystack	github	haystack.deepset.ai
Semantic Kernel	github	learn.microsoft.com/semantic-kernel
Letta	github	docs.letta.com
CAMEL	github	camel-ai.org
Atomic Agents	github	README del repo
MetaGPT	github	docs.deepwisdom.ai

Libraries TypeScript

Framework	Repo	Docs
Mastra	github	mastra.ai/docs

SDKs oficiales de proveedores

Proveedor	SDK	Repo
OpenAI	Agents SDK	github
Anthropic	Claude Agent SDK (Python)	github
Anthropic	Claude Agent SDK (TS)	github
Google	ADK (Agent Development Kit)	github
Microsoft	Agent Framework (NUEVO)	github

Visual Builders

Plataforma	Repo
Langflow	github
Dify	github
Flowise	github
Rivet	github

Artículo relacionado

👉 Frameworks agénticos para Claude Code: Superpowers, gentle-ai, BMAD y más

Si lo que buscas no es construir agentes sino estructurar cómo tu asistente de IA (Claude Code, Cursor, Codex) te ayuda a programar, ese es el artículo complementario. Cubre la Familia B: frameworks para coding workflow.

Guía actualizada en Abril 2026. Las estrellas de GitHub y estado de mantenimiento se verificaron directamente contra la API oficial el 18 de abril de 2026. Información de funding, production users y releases verificada contra blogs oficiales de cada empresa.