Agent API: Un runtime administrado para flujos de trabajo con agentes

Hoy lanzamos la Perplexity Agent API, un runtime administrado para crear flujos de trabajo con agentes con búsqueda integrada, ejecución de herramientas y orquestación de múltiples modelos.

Reemplaza un enrutador de modelos, una capa de búsqueda, un proveedor de embeddings, un servicio de sandbox y una pila de monitoreo por un solo punto de integración.

El ciclo agéntico como modelo de cómputo

Una CPU convencional ejecuta un ciclo determinista: obtiene una instrucción, la decodifica, la ejecuta y guarda el resultado. El contador de programa avanza. El procesador nunca decide qué hacer.

La Agent API implementa un modelo de cómputo diferente. El procesador es un modelo de lenguaje de frontera. Recibe un objetivo y determina cómo lograrlo. Descompone ese objetivo en un plan, elige qué herramientas usar de su conjunto disponible, ejecuta, observa los resultados, evalúa si el objetivo se cumplió e itera. La ventana de contexto funciona como registros. El razonamiento y la orquestación funcionan como el planificador.

Piensa en prepararte para una llamada de ventas con un prospecto con quien ya hablaste un par de veces. Envías una sola solicitud a la Agent API con tres herramientas: una para buscar en tu CRM interno, web_search y fetch_url. El modelo primero llama a tu herramienta de CRM y recupera contexto de conversaciones pasadas. Después llama a web_search para encontrar noticias recientes e inteligencia competitiva, y devuelve varias páginas relevantes. Decide que dos de esas páginas ameritan una lectura más profunda y llama a fetch_url en cada una. En tres pasos, el modelo reunió historial interno, contexto amplio de la web y detalle completo de páginas en una sola respuesta bien fundamentada. Ese es el ciclo del agente.

Orquestación de todo el ciclo agéntico

Es importante distinguir la Agent API de los servicios de enrutamiento de modelos. La Agent API es un runtime administrado que orquesta todo el ciclo agéntico: recuperación, ejecución de herramientas, razonamiento y respaldo entre múltiples modelos, además de cualquier herramienta personalizada a la que le des acceso. Reemplaza un enrutador de modelos, una capa de búsqueda, un proveedor de embeddings, un servicio de sandbox y una pila de monitoreo con un solo endpoint, cuenta y clave de API.

La API es agnóstica al modelo en todos los proveedores de modelos de frontera. Para aplicaciones de alta disponibilidad, la API admite cadenas de respaldo entre modelos: especifica varios modelos y la API prueba automáticamente el siguiente si uno no está disponible. Esto asegura una disponibilidad cercana al 100%.

Herramientas integradas y potentes

Hay dos herramientas integradas disponibles: web_search y fetch_url. web_search admite filtrado por dominio (listas de permitidos y bloqueados, hasta 20 dominios), filtrado por actualidad, filtrado por rango de fechas, filtrado por idioma y límites de contenido configurables por página. fetch_url recupera y extrae el contenido completo de páginas desde URLs específicas.

Además de las herramientas integradas, las funciones personalizadas permiten a los desarrolladores conectar el agente a sus propios backends, bases de datos y APIs.

Presets de modelos de frontera optimizados continuamente

Crear una configuración de agente efectiva desde cero requiere elegir el modelo correcto, calibrar la profundidad del razonamiento, seleccionar herramientas y ajustar presupuestos de tokens. Perplexity hace esto de forma continua para sus propios productos, con el respaldo de un equipo interno de evaluación que compara configuraciones con cargas de trabajo reales.

Presets comparten esa experiencia. Cada preset es una configuración preconfigurada y totalmente transparente, optimizada para un caso de uso específico: búsquedas rápidas de hechos, investigación equilibrada, análisis profundo de múltiples fuentes e investigación de nivel institucional. Publicamos el prompt de sistema recomendado, las herramientas y el perfil de costo de cada uno. A medida que evoluciona el panorama de modelos, actualizamos las configuraciones subyacentes para que el preset siempre refleje el estado del arte a un costo predecible. Todos los parámetros del preset se pueden sobrescribir: los desarrolladores pueden usar un preset como punto de partida y ajustar el modelo, las herramientas, la cantidad de pasos o los presupuestos de tokens en una sola solicitud.

Deep Research 2.0, disponible a través del preset advanced-deep-research, es el mismo motor de razonamiento de varios pasos que impulsa el producto de consumo de Perplexity. Realiza decenas de búsquedas por consulta, lee cientos de documentos fuente y refina su análisis de forma iterativa. El desempeño en DRACO, ResearchRubrics de Scale AI y DeepSearchQA de Google DeepMind se detalla en nuestro artículo del benchmark DRACO.

La Agent API ya está disponible. La documentación y las guías de inicio rápido están en docs.perplexity.ai