Frameworks agénticos para construir agentes IA
CrewAI, LangGraph, AutoGen, Pydantic AI y más — comparativa completa 2026
“No eliges un framework por sus estrellas. Eliges el que encaja con tu stack, tu velocidad de iteración y el tipo de producto que vas a construir.”
⚠️ Importante: las 2 familias de frameworks agénticos
El término “framework agéntico” se usa para dos categorías completamente distintas. Este artículo cubre la Familia A: librerías para construir agentes IA como producto.
🅰️ Familia A — Frameworks para CONSTRUIR agentes IA (ESTE ARTÍCULO)
Librerías Python/TypeScript que importas en tu código para construir tus propios agentes (chatbots, asistentes autónomos, pipelines RAG, sistemas multi-agente).
Ejemplos que analizamos aquí: LangGraph, CrewAI, AutoGen, Pydantic AI, Mastra, Agno, LlamaIndex, Semantic Kernel, Letta, OpenAI Agents SDK, Google ADK, Claude Agent SDK y más.
Usuario objetivo: developer que construye un producto con IA.
🅱️ Familia B — Frameworks para GUIAR tu asistente de coding
Plugins, skills o metodologías que estructuran cómo tu asistente de IA (Claude Code, Cursor, Codex) te ayuda a programar.
👉 Comparativa de frameworks agénticos para Claude Code (Superpowers, gentle-ai, BMAD…) ← artículo hermano
📰 La noticia que cambia el mapa en 2026: Microsoft Agent Framework
Antes de entrar al catálogo, hay una noticia estructural que debes conocer para no invertir en tecnología obsoleta:
Microsoft fusionó AutoGen + Semantic Kernel en un solo framework oficial: Microsoft Agent Framework (v1.0 GA abril 2026).
Qué significa
- AutoGen (57.181 ⭐) queda como proyecto “research/innovation”
- Semantic Kernel (27.731 ⭐) sigue con bugfixes y security patches, pero features nuevas van al nuevo framework
- Microsoft Agent Framework (9.558 ⭐, creciendo rápido) es “Semantic Kernel v2.0” según el propio equipo de Microsoft
- Soporta Python + .NET en un solo SDK unificado
Implicación práctica
Si vas a empezar un proyecto nuevo en el ecosistema Microsoft (Azure, .NET) en 2026 y usarías AutoGen o Semantic Kernel, arranca directamente con Agent Framework. Si ya tienes producción con AutoGen 0.4, el roadmap de migración está publicado. Si tienes SK 1.x, igual.
Tabla maestra: los frameworks más relevantes en 2026
(Click en cualquier cabecera para ordenar — ⭐ GitHub verificadas vía API a 18 abril 2026)
| Framework | Autor / Org | ⭐ GitHub | Lenguaje | Tipo | Categoría |
|---|---|---|---|---|---|
| Langflow | langflow-ai | 147.071 | Python | Visual Builder | No-code |
| Dify | langgenius | 138.216 | TypeScript | Visual Builder | Platform |
| MetaGPT | geekan | 67.190 | Python | Library | Multi-agent |
| AutoGen | Microsoft | 57.181 | Python / .NET | Library | Conversational multi-agent |
| Flowise | FlowiseAI | 52.032 | TypeScript | Visual Builder | LangChain.js drag-drop |
| CrewAI | crewAIInc | 49.139 | Python | Library | Role-based crews |
| LlamaIndex | run-llama | 48.665 | Python / TS | Library | Document agents + RAG |
| Agno (ex-Phidata) | agno-agi | 39.516 | Python | Library | High-performance runtime |
| LangGraph | langchain-ai | 29.555 | Python / TS | Library | Graph-based state machines |
| Semantic Kernel | Microsoft | 27.731 | C# / Python / Java | Library | Enterprise .NET |
| SmolAgents | HuggingFace | 26.705 | Python | Library | Code-as-action |
| Haystack | deepset-ai | 24.887 | Python | Library | RAG + agents production |
| Mastra | mastra-ai | 23.116 | TypeScript | Library | TS-first full-stack |
| Letta (ex-MemGPT) | letta-ai | 22.137 | Python | Library | Stateful memory agents |
| OpenAI Agents SDK | OpenAI | 22.003 | Python | Official SDK | Sucesor de Swarm |
| Google ADK | 19.085 | Python | Official SDK | Gemini-native | |
| CAMEL | camel-ai | 16.725 | Python | Library | Research multi-agent |
| Pydantic AI | pydantic | 16.445 | Python | Library | Type-safe agents |
| Microsoft Agent Framework | Microsoft | 9.558 | Python / .NET | Library | AutoGen + SK unificados |
| Claude Agent SDK (Python) | Anthropic | 6.392 | Python | Official SDK | Anthropic oficial |
| Atomic Agents | BrainBlend-AI | 5.823 | Python | Library | Composable sin magia |
Marco conceptual: los 3 tipos
Los frameworks de la Familia A se dividen en 3 tipos según cómo los usas:
🧩 Libraries (code-first)
Las importas en tu código Python/TypeScript. Tú escribes el código que define agentes, tools, flujos. Son la opción de los developers serios.
Ejemplos: LangGraph, CrewAI, AutoGen, Pydantic AI, Mastra, Agno.
🎨 Visual Builders (no-code / low-code)
Interfaces drag-and-drop para montar flujos sin escribir código. Ideal para prototipos rápidos, equipos no técnicos, demos.
Ejemplos: Langflow, Dify, Flowise, Rivet.
🔌 Official SDKs (de proveedores LLM)
SDKs oficiales de los proveedores de modelos. Optimizados para su stack, con menos abstracciones pero máxima integración.
Ejemplos: OpenAI Agents SDK, Google ADK, Anthropic Claude Agent SDK.
Matriz comparativa consolidada
| Feature | LangGraph | CrewAI | AutoGen | Pydantic AI | Mastra | LlamaIndex | SmolAgents | Agno | Atomic |
|---|---|---|---|---|---|---|---|---|---|
| Python | ✅ | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ |
| TypeScript | ✅ | ❌ | ❌ | ❌ | ✅✅ | ✅ | ❌ | ❌ | ❌ |
| Type-safe | ⚙️ | ⚙️ | ⚙️ | ✅✅ | ✅ | ⚙️ | ⚙️ | ⚙️ | ✅ |
| Multi-agent | ✅ | ✅✅ | ✅✅ | ⚙️ | ✅ | ⚙️ | ⚙️ | ✅ | ⚙️ |
| Memoria persistente | ⚙️ | ⚙️ | ⚙️ | ⚙️ | ✅ | ✅ | ❌ | ✅✅ | ⚙️ |
| RAG built-in | ⚙️ | ❌ | ❌ | ❌ | ✅ | ✅✅ | ❌ | ✅ | ❌ |
| Observabilidad | ✅ LangSmith | ⚙️ | ⚙️ | ✅ Logfire | ✅ | ⚙️ | ⚙️ | ✅ | ❌ |
| Production users notables | ✅✅ | ✅✅ | ✅ | ✅ | ✅ | ✅✅ | ⚙️ | ⚙️ | ❌ |
| Learning curve | 🔴 Alta | 🟢 Baja | 🟡 Media | 🟢 Baja | 🟢 Baja | 🟡 Media | 🟢 Baja | 🟢 Baja | 🟡 Media |
LangGraph
Qué es
Framework graph-based de LangChain para modelar agentes como máquinas de estado. Cada agente es un grafo de nodos con edges condicionales sobre un State schema tipado.
Filosofía
Control de flujo explícito. En lugar de “magia” agéntica, tú defines el grafo: nodos que procesan, edges condicionales que deciden siguiente paso, state que persiste.
Diferenciadores clave
- Durability (checkpointing) — el estado se persiste en cada step
- Time-travel debugging — puedes revertir a cualquier estado anterior
- Human-in-the-loop nativo
- Integración con LangSmith para observabilidad trace-level
- Integración con MCP (Model Context Protocol de Anthropic)
Casos de uso ideales
- Workflows complejos multi-step con backtracking
- Sistemas donde necesitas audit trail completo
- Producción enterprise con requisitos de durabilidad
- Pipelines que deben pausar, esperar aprobación humana, y continuar
Casos donde NO usarlo
- Prototipos simples (es verbose incluso para flujos básicos)
- Equipos pequeños sin tiempo para aprender curva media-alta
Tiempo de aprendizaje
Media-alta. Schema + nodes + edges + compile. Verbose.
Madurez y adopción
Production-ready. Superó a CrewAI en estrellas a principios de 2026. LangGraph Platform GA en 2025.
Usuarios en producción
Klarna, Replit, LinkedIn, Elastic, Uber, AppFolio.
Recursos
- 📦 github.com/langchain-ai/langgraph · 29.555 ⭐
- 📚 Documentación oficial con ejemplos pattern-based
- 🔗 LangSmith para observabilidad
CrewAI
Qué es
Framework role-based donde cada agente tiene role, goal y backstory. Los agentes forman “crews” que trabajan en tasks asignadas siguiendo processes (sequential, hierarchical, consensual).
Filosofía
Metáfora de equipo humano aplicada a agentes IA. Arquitecta tu sistema como un equipo real: tienes un researcher, un writer, un reviewer, y les das objetivos claros.
Diferenciadores clave
- La curva de aprendizaje más baja del sector — probablemente el framework más fácil de arrancar
- Standalone desde 2024 (ya no depende de LangChain)
- Soporte nativo MCP + A2A desde v1.x
- Metáfora intuitiva que no requiere saber teoría de grafos ni máquinas de estado
Casos de uso ideales
- Multi-agent colaborativo con roles claros (research → write → review)
- Equipos que quieren prototipar rápido
- Cuando tu problema tiene estructura de “equipo humano”
- MVPs y primeros productos agénticos
Casos donde NO usarlo
- Workflows con lógica condicional muy compleja (usa LangGraph)
- Cuando necesitas control extremo de flujo (usa Atomic Agents o LangGraph)
Tiempo de aprendizaje
Bajo. Arrancar en horas, no días.
Madurez y adopción
- $24.5M funding total (Series A liderada por Insight Partners)
- ~2.000 millones de ejecuciones agénticas/año reportadas
- Uso en ~50% del Fortune 500 (dato de la empresa)
Usuarios en producción
PwC, IBM, Capgemini, NVIDIA.
Recursos
- 📦 github.com/crewAIInc/crewAI · 49.139 ⭐
- 🌐 CrewAI Enterprise cloud
- 🎨 Multi-agent builder visual (v1.10.x)
AutoGen (Microsoft)
Qué es
Framework event-driven, async, conversational multi-agent donde los agentes se comunican vía mensajes asíncronos. Rewrite completo en v0.4 (enero 2025).
⚠️ Estado actual
Importante: Microsoft fusionó AutoGen con Semantic Kernel en Microsoft Agent Framework (preview oct-2025, v1.0 GA abril 2026). AutoGen queda como proyecto “research/innovation” pero el roadmap de producción migra a Agent Framework.
Si empiezas nuevo, arranca con Microsoft Agent Framework.
Diferenciadores clave
- Rewrite async/event-driven en v0.4
- AutoGen Studio — low-code UI
- Magentic-One — generalist multi-agent system
- Python + .NET
Casos de uso ideales
- Research y prototipado multi-agent conversacional
- Empresas en stack Microsoft que necesitan puente hasta Agent Framework
Tiempo de aprendizaje
Medio.
Licencia
CC-BY-4.0 (atípica, no la MIT estándar — revisar compatibilidad comercial).
Recursos
- 📦 github.com/microsoft/autogen · 57.181 ⭐
- 🆕 github.com/microsoft/agent-framework · 9.558 ⭐ (sucesor recomendado)
Pydantic AI
Qué es
Agents type-safe al estilo Pydantic. FastAPI-feel pero para GenAI — structured outputs con validación Pydantic, dependency injection, streaming validado.
Filosofía
“La forma Pydantic de construir agentes.” Si vienes de FastAPI y Pydantic, esto te va a encantar.
Diferenciadores clave
- Type safety end-to-end
- Dependency injection integrada
- Streaming validado con schemas Pydantic
- Logfire integration para observabilidad
- v1.0 lanzado 4 septiembre 2025 — API stability commitment de 6 meses
- Thoughtworks Radar: ASSESS/TRIAL
Casos de uso ideales
- Agents con outputs estructurados críticos (sistemas que deben parsear la salida)
- Equipos que valoran type safety
- Developers que ya usan Pydantic o FastAPI
- Integración con Amazon Bedrock AgentCore
Tiempo de aprendizaje
Bajo si ya usas Pydantic/FastAPI.
Novedades v1
- Human-in-the-loop tool approval
- Durable execution
Recursos
- 📦 github.com/pydantic/pydantic-ai · 16.445 ⭐
- 📚 Docs con Pydantic + FastAPI familiar API
Mastra (el TypeScript-first)
Qué es
El framework TypeScript de referencia para construir agentes. Full-stack TS: workflows (durable graph), agents, RAG, evals, memory — todo integrado.
Filosofía
TS-first. Creado por ex-team de Gatsby. Si tu stack es Next.js, Node o React, esto es tu opción nativa sin salir de TS.
Diferenciadores clave
- TypeScript de primera clase (no es un port Python → TS)
- Dev playground local
- Compatible con Vercel AI SDK
- Durable workflows
Madurez y adopción
- $13M seed round YC-led (Paul Graham, Guillermo Rauch, Amjad Masad, Balaji como inversores)
- 220k weekly downloads
- “Tercer JS framework que más rápido crece” según telemetría propia
Usuarios en producción
Replit, SoftBank, Marsh McLennan, PayPal, Adobe, Docker.
Casos de uso ideales
- Stacks Next.js / Node / React que quieren agentes sin salir de TS
- Full-stack devs que prefieren TypeScript sobre Python
- Edge deployments (Vercel, Cloudflare Workers)
Licencia
Elastic License / custom (NOASSERTION en GitHub). Revisa los términos si tu uso es comercial.
Recursos
- 📦 github.com/mastra-ai/mastra · 23.116 ⭐
- 💰 Seed round blog post
Agno (ex-Phidata)
Qué es
High-performance multi-agent runtime. Rebranded de Phidata en enero 2025 con rewrite de rendimiento.
Diferenciadores clave
- Performance: ~3μs instantiation según el equipo
- Built-in: memory, knowledge base, reasoning
- AgentOS — runtime managed
Casos de uso ideales
- Agents de producción con memoria persistente y knowledge base
- Alta concurrencia (miles de agents simultáneos)
- Cuando performance importa más que flexibilidad
Tiempo de aprendizaje
Bajo-medio.
Licencia
Apache-2.0 (el marketing web menciona Mozilla Public License para Agno 2.0 — ambigüedad no verificada, revisar antes de uso comercial).
Recursos
- 📦 github.com/agno-agi/agno · 39.516 ⭐
LlamaIndex (el pivot 2025)
Qué es
Antes: framework RAG por excelencia.
Ahora (pivot 2025): “Leading document agent and OCR
platform” (descripción oficial actualizada).
Filosofía
Workflows event-driven + LlamaParse/LlamaCloud como producto principal. Document parsing/OCR agéntico de clase enterprise.
Diferenciadores clave
- Document parsing enterprise (PDFs con tablas/gráficos complejos vía LlamaParse)
- Workflows event-driven
- LlamaIndex TS también disponible
Madurez y adopción
- 700%+ growth self-serve revenue en 2025
- Pivot exitoso validado por mercado
Usuarios en producción
Cemex, Rakuten, Carlyle Group.
Casos de uso ideales
- RAG sobre documentos complejos (contratos, papers, reports con tablas)
- Knowledge assistants enterprise
- OCR agéntico
Recursos
- 📦 github.com/run-llama/llama_index · 48.665 ⭐
- 📚 LlamaCloud
SmolAgents (HuggingFace)
Qué es
“Agents that think in code”. El CodeAgent genera y ejecuta código Python en vez de tool-calls JSON.
Filosofía
Code-as-action: si quieres que el agente haga algo, que escriba código y lo ejecute. Minimalista (~1000 LoC core).
Diferenciadores clave
- Code-as-action paradigm (único en esta lista)
- Integración nativa HuggingFace Hub — agents shareables
- Sandboxing E2B para seguridad
- Apache-2.0 (licencia clara)
Casos de uso ideales
- Agents locales con modelos open-source
- Prototipos simples sin overhead
- Education / demos
Recursos
- 📦 github.com/huggingface/smolagents · 26.705 ⭐
Letta (ex-MemGPT)
Qué es
El líder indiscutible en agentes con memoria persistente. Rebrand de MemGPT en 2024.
Filosofía
Agentes stateful que recuerdan interacciones pasadas y se auto-mejoran con memoria de largo plazo.
Diferenciadores clave
- Stateful memory persistente out-of-the-box
- Agentes que aprenden de su historial
- Self-improvement capabilities
Casos de uso ideales
- Chatbots con memoria de conversaciones largas
- Agents personalizados que recuerdan preferencias del usuario
- Asistentes persistentes
Recursos
- 📦 github.com/letta-ai/letta · 22.137 ⭐
OpenAI Agents SDK
Qué es
Sucesor oficial de OpenAI Swarm. Framework lightweight para multi-agent con handoffs, guardrails y tracing.
Filosofía
Lightweight y production-ready. OpenAI lo lanzó en marzo 2025 para reemplazar Swarm (que era “educational”).
Diferenciadores clave
- Oficial OpenAI — integración perfecta con GPT-4/GPT-5
- Handoffs entre agentes
- Guardrails integrados
- Tracing nativo
Casos de uso ideales
- Productos construidos 100% sobre modelos OpenAI
- Multi-agent con handoffs simples
- Cuando quieres el SDK “bendecido” por el proveedor
Recursos
- 📦 github.com/openai/openai-agents-python · 22.003 ⭐
Google ADK (Agent Development Kit)
Qué es
SDK oficial de Google para agentes. Lanzado abril 2025. Code-first, Gemini-native.
Diferenciadores clave
- Gemini-native — optimizado para modelos Google
- Eval + deploy integrados
- MCP-native (Model Context Protocol)
Casos de uso ideales
- Productos construidos sobre Gemini
- Google Cloud / Vertex AI stack
- Cuando necesitas eval + deploy en un solo SDK
Recursos
- 📦 github.com/google/adk-python · 19.085 ⭐
Claude Agent SDK (Anthropic)
Qué es
SDK oficial de Anthropic para construir agentes con Claude. Hooks, MCP tools, subagents.
Disponible en 2 lenguajes
- Python: github.com/anthropics/claude-agent-sdk-python · 6.392 ⭐
- TypeScript: github.com/anthropics/claude-agent-sdk-typescript · 1.300 ⭐
Diferenciadores clave
- Oficial Anthropic — integración perfecta con Claude
- Hooks para intercepción
- MCP tools nativos
- Subagents integrados
Casos de uso ideales
- Productos construidos 100% sobre Claude
- Cuando quieres features Anthropic-specific (prompt caching, extended thinking)
- Integración con ecosistema Claude Code
Microsoft Agent Framework (el sucesor)
Qué es
La fusión oficial de AutoGen + Semantic Kernel lanzada en v1.0 GA en abril 2026. El futuro del agentic stack Microsoft.
Por qué importa
Microsoft admite que eran dos productos solapados. Ahora uno solo, unificado:
- Python + .NET en un solo SDK
- Hereda lo mejor de AutoGen (multi-agent) y Semantic Kernel (enterprise .NET)
- Azure-first pero no exclusivo
- Es efectivamente “Semantic Kernel v2.0” según el propio equipo Microsoft
Casos de uso ideales
- Cualquier proyecto nuevo en stack Microsoft Azure
- Migración desde AutoGen 0.4 o Semantic Kernel 1.x
- Python + .NET híbrido
Recursos
- 📦 github.com/microsoft/agent-framework · 9.558 ⭐
- 📰 Microsoft blog oficial
Semantic Kernel (Microsoft — legacy)
Qué es
SDK lightweight para integrar LLMs en apps enterprise. C#, Python y Java.
⚠️ Estado actual
Mantenimiento, no desarrollo nuevo. Microsoft recomienda migrar a Agent Framework para features nuevas. SK v1.x sigue con bugfixes y security patches.
Cuándo sigue teniendo sentido usarlo
- Si ya tienes producción estable en SK v1.x
- Apps Microsoft 365 Copilot existentes
- Si necesitas soporte Java (Agent Framework es Python + .NET)
Recursos
- 📦 github.com/microsoft/semantic-kernel · 27.731 ⭐
Atomic Agents
Qué es
Framework anti-magia. Composabilidad atómica, I/O via schemas Pydantic, inspirado en Atomic Design.
Filosofía
“Sin abstracciones mágicas.” Control total, cada componente reusable individualmente. Rechazo explícito al “black-box” de LangChain/CrewAI.
Casos de uso ideales
- Equipos que rechazan la magia de otros frameworks
- Pipelines deterministas donde cada paso debe ser explícito
- Cuando debug es crítico
Recursos
- 📦 github.com/BrainBlend-AI/atomic-agents · 5.823 ⭐
Haystack (deepset-ai)
Qué es
RAG + agents production-ready. Pipelines modulares de deepset.
Diferenciadores clave
- RAG de clase enterprise
- Pipelines modulares
- Production-ready desde hace años
Casos de uso ideales
- RAG sobre grandes volúmenes de documentos
- Sistemas de búsqueda semántica enterprise
- Pipelines híbridos (retrieval + generación + tools)
Recursos
- 📦 github.com/deepset-ai/haystack · 24.887 ⭐
CAMEL
Qué es
Framework multi-agente research-oriented con énfasis en role-playing y “scaling law of agents”.
Casos de uso ideales
- Investigación académica
- Experimentación multi-agente
- Sistemas inspirados en dinámicas sociales
Recursos
- 📦 github.com/camel-ai/camel · 16.725 ⭐
MetaGPT
Qué es
Framework multi-agente que simula una “software company”: PM, Architect, Engineer, QA como agentes que colaboran.
⚠️ Señal de desaceleración
Push parado desde enero 2026. No verificado si es pausa estratégica o declive. Revisa antes de comprometerte.
Recursos
- 📦 github.com/geekan/MetaGPT · 67.190 ⭐
Visual Builders (no-code / low-code)
Langflow
147.071 ⭐ — Visual builder sobre LangChain. Drag-drop de flujos. El rey por estrellas.
Dify
138.216 ⭐ — Plataforma production-ready agentic workflow con LLMOps integrado. Mayor tracción enterprise que Langflow.
Flowise
52.032 ⭐ — Drag-drop sobre LangChain.js. Node-based al estilo n8n pero para agentes.
Rivet (Ironclad)
4.539 ⭐ — Visual IDE + librería TypeScript embebible. Crecimiento más modesto.
Cuándo usar visual builders
- Prototipos rápidos / demos
- Equipos no técnicos
- Cuando el flujo es estable y no necesita código custom
- Onboarding de stakeholders no-devs
Cuándo NO usar visual builders
- Productos de producción con requisitos complejos (usa libraries)
- Cuando necesitas testing automatizado, versionado de código, CI/CD
- Performance crítica
Tiempos de aprendizaje
| Framework | Tiempo productivo | Tiempo dominio |
|---|---|---|
| CrewAI | Horas | 1 semana |
| SmolAgents | Horas | 3-5 días |
| Pydantic AI | 1 día (si conoces Pydantic) | 1 semana |
| Mastra | 1 día | 1-2 semanas |
| Agno | 1-2 días | 1-2 semanas |
| OpenAI Agents SDK | 1-2 días | 1 semana |
| Google ADK | 1-2 días | 1-2 semanas |
| Claude Agent SDK | 1-2 días | 1 semana |
| LlamaIndex | 2-3 días | 2-3 semanas |
| Atomic Agents | 2-3 días | 2 semanas |
| AutoGen | 3-5 días | 2-4 semanas |
| LangGraph | 3-5 días | 3-4 semanas |
| Microsoft Agent Framework | 3-5 días | 3-4 semanas |
| Haystack | 3-5 días | 2-4 semanas |
| Semantic Kernel | 5 días | 3-4 semanas |
Recomendaciones por perfil
“Soy solo dev, quiero prototipar YA”
Ganador: CrewAI
Curva más baja del sector. Prototipo funcionando en horas.
“Necesito agentes production-ready con observabilidad”
Ganador: LangGraph + LangSmith
Durabilidad, checkpointing, time-travel debugging, audit trails.
“Mi stack es TypeScript / Next.js / Node”
Ganador claro: Mastra
TS-first real, no port. Compatible con Vercel AI SDK.
“Quiero type safety obsesiva”
Ganador: Pydantic AI
v1.0 estable, FastAPI feel, structured outputs validados.
“Mi caso es RAG sobre documentos complejos”
Ganador: LlamaIndex + LlamaParse
PDF, tablas, gráficos, OCR agéntico. 700% growth 2025.
“Solo uso modelos OpenAI”
Ganador: OpenAI Agents SDK
SDK oficial, handoffs + guardrails + tracing.
“Solo uso Claude”
Ganador: Claude Agent SDK de Anthropic
Features Anthropic-native: prompt caching, extended thinking, MCP.
“Solo uso Gemini / Google Cloud”
Ganador: Google ADK
Gemini-native, eval + deploy integrados.
“Stack Microsoft / Azure / .NET”
Ganador: Microsoft Agent Framework
AutoGen + Semantic Kernel unificados. Python + .NET. NO empieces
con AutoGen o SK sueltos en 2026.
“Necesito agentes con memoria persistente”
Ganador: Letta
Líder indiscutible en stateful memory.
“Quiero algo sin magia, control total”
Ganador: Atomic Agents
Anti-black-box por diseño.
“No soy dev, necesito drag-and-drop”
Ganador: Dify (si quieres LLMOps integrado) o Langflow (si ya usas LangChain).
“Research académico”
Ganador: CAMEL
Role-playing, scaling law of agents.
Stacks ganadores 2026
Stack “Startup ágil Python”
CrewAI (rápido de arrancar)
↓
Pydantic AI (cuando necesitas type safety en partes críticas)
↓
LangSmith (observabilidad)
Stack “Producción enterprise Python”
LangGraph (workflows complejos con state)
↓
LangSmith (observabilidad + evals)
↓
LlamaIndex (RAG sobre documentos)
Stack “TypeScript full-stack”
Mastra (core)
↓
Vercel AI SDK (integración con Next.js)
↓
MCP servers (integración con herramientas externas)
Stack “Azure / Microsoft”
Microsoft Agent Framework (no AutoGen ni SK por separado)
↓
Azure OpenAI Service
↓
Azure AI Foundry
Stack “Solo OpenAI”
OpenAI Agents SDK (nativo)
↓
OpenAI Tracing Platform
Stack “Solo Claude”
Claude Agent SDK (Python o TS)
↓
MCP tools
↓
Anthropic Workbench
Tendencias y novedades 2025-2026
📉 Lo que está en declive
- OpenAI Swarm — deprecated de facto, reemplazado por Agents SDK
- AutoGen standalone — migra a Microsoft Agent Framework
- Semantic Kernel — mantenimiento, no desarrollo nuevo
- MetaGPT — push parado desde enero 2026 (unverified si es pausa o declive)
📈 Lo que está surgiendo con fuerza
- Mastra — 0 → 23k ⭐ en 14 meses, $13M YC seed
- Pydantic AI — 0 → 16k ⭐ en 18 meses, v1.0 estable
- Google ADK — 19k ⭐ desde su lanzamiento en 2025
- OpenAI Agents SDK — 22k ⭐ como reemplazo de Swarm
- Claude Agent SDK — 6.4k + 1.3k, entrada oficial de Anthropic
🔄 Cambios estructurales
- LlamaIndex pivot de framework RAG a plataforma document agent (700% revenue growth)
- Microsoft consolidation con Agent Framework
- Visual builders masivos: Langflow (147k) y Dify (138k) superan a librerías tradicionales en estrellas
- Entrada de los 3 big LLM providers (OpenAI, Google, Anthropic) con SDKs oficiales
🧠 Patrón de mercado claro
Cada proveedor de LLM (OpenAI, Google, Anthropic, Microsoft) está lanzando su SDK oficial. Esto fragmenta el mercado pero simplifica la decisión: si usas solo UN proveedor, su SDK es la opción más integrada.
Los frameworks cross-provider (LangGraph, CrewAI, Pydantic AI, Mastra) mantienen su ventaja para equipos que cambian de modelo o multi-proveedor.
Decisión: ¿SDK oficial o framework cross-provider?
| Criterio | SDK oficial (OpenAI/Anthropic/Google/Microsoft) | Framework cross-provider (LangGraph/CrewAI/etc) |
|---|---|---|
| Integración con su proveedor | 🟢🟢 Máxima | 🟡 Buena |
| Cross-provider | 🔴 No | 🟢🟢 Sí |
| Vendor lock-in | 🔴 Alto | 🟢 Bajo |
| Features proveedor-específicas | 🟢🟢 Primeras en llegar | 🟡 Tardan |
| Comunidad / templates | 🟡 Menor | 🟢🟢 Grande |
| Riesgo de cambio de API | 🟡 Medio (políticas proveedor) | 🟢 Bajo |
| Coste inicial | 🟢 Mínimo | 🟡 Medio |
Regla práctica: - Producto 100% sobre un solo proveedor → SDK oficial de ese proveedor - Producto multi-modelo o que puede cambiar → framework cross-provider - Equipo experimental / research → framework con más comunidad (LangGraph, CrewAI)
Glosario
- Agent: sistema que razona, decide y actúa usando un LLM como “cerebro”
- Multi-agent: múltiples agentes que colaboran (roles distintos, mensajes, handoffs)
- Handoff: transferencia de control entre agentes
- State machine: modelo de computación donde cada paso cambia un estado explícito
- Checkpointing: persistir el estado del agente en cada step para poder recuperar/revertir
- Tool calling: el LLM decide invocar una función externa (API, DB, código)
- MCP (Model Context Protocol): protocolo de Anthropic para comunicación entre agentes y herramientas externas
- RAG (Retrieval-Augmented Generation): enriquecer el prompt del LLM con documentos recuperados
- Code-as-action: el agente genera y ejecuta código en vez de tool-calls JSON
- Guardrails: validaciones que filtran inputs/outputs peligrosos o fuera de política
- Observability: tracing, logs, métricas del comportamiento del agente
- Durable execution: ejecuciones que sobreviven crashes y restarts
- Human-in-the-loop: pausar la ejecución automática para pedir aprobación humana
Recursos consolidados
Libraries Python principales
| Framework | Repo | Docs |
|---|---|---|
| LangGraph | github | docs |
| CrewAI | github | docs.crewai.com |
| AutoGen | github | microsoft.github.io/autogen |
| Pydantic AI | github | ai.pydantic.dev |
| LlamaIndex | github | docs.llamaindex.ai |
| Agno | github | docs.agno.com |
| SmolAgents | github | HuggingFace docs |
| Haystack | github | haystack.deepset.ai |
| Semantic Kernel | github | learn.microsoft.com/semantic-kernel |
| Letta | github | docs.letta.com |
| CAMEL | github | camel-ai.org |
| Atomic Agents | github | README del repo |
| MetaGPT | github | docs.deepwisdom.ai |
Libraries TypeScript
| Framework | Repo | Docs |
|---|---|---|
| Mastra | github | mastra.ai/docs |
SDKs oficiales de proveedores
| Proveedor | SDK | Repo |
|---|---|---|
| OpenAI | Agents SDK | github |
| Anthropic | Claude Agent SDK (Python) | github |
| Anthropic | Claude Agent SDK (TS) | github |
| ADK (Agent Development Kit) | github | |
| Microsoft | Agent Framework (NUEVO) | github |
Visual Builders
| Plataforma | Repo |
|---|---|
| Langflow | github |
| Dify | github |
| Flowise | github |
| Rivet | github |
Artículo relacionado
👉 Frameworks agénticos para Claude Code: Superpowers, gentle-ai, BMAD y más
Si lo que buscas no es construir agentes sino estructurar cómo tu asistente de IA (Claude Code, Cursor, Codex) te ayuda a programar, ese es el artículo complementario. Cubre la Familia B: frameworks para coding workflow.
Guía actualizada en Abril 2026. Las estrellas de GitHub y estado de mantenimiento se verificaron directamente contra la API oficial el 18 de abril de 2026. Información de funding, production users y releases verificada contra blogs oficiales de cada empresa.