Agent API: Een managed runtime voor agentic workflows

Vandaag introduceren we de Perplexity Agent API, een managed runtime voor het bouwen van agentic workflows met geïntegreerde search, tool execution en multi-model orchestration.

Die vervangt een model router, een search layer, een embeddings provider, een sandbox service en een monitoring stack door één enkel integration point.

De agentic loop als compute model

Een conventionele CPU voert een deterministische cyclus uit: haal een instructie op, decodeer die, voer die uit, sla het resultaat op. De program counter gaat verder. De processor beslist nooit zelf wat hij moet doen.

De Agent API implementeert een ander compute model. De processor is een frontier language model. Die ontvangt een doel en bepaalt hoe dat bereikt moet worden. Het splitst dat doel op in een plan, selecteert welke tools uit de beschikbare tool set moeten worden gebruikt, voert ze uit, observeert de resultaten, beoordeelt of het doel is bereikt en itereert. Het context window dient als registers. Reasoning en orchestration dienen als scheduler.

Stel dat je je voorbereidt op een sales call met een prospect met wie je al een paar keer hebt gesproken. Je stuurt één request naar de Agent API met drie tools: één om je interne CRM te doorzoeken, web_search, en fetch_url. Het model roept eerst je CRM-tool aan en haalt context op uit eerdere gesprekken. Daarna roept het web_search aan om recent nieuws en competitive intelligence te vinden, en geeft het meerdere relevante pagina's terug. Het besluit dat twee van die pagina's een diepere lezing waard zijn en roept fetch_url aan voor elk daarvan. In drie stappen heeft het model interne geschiedenis, brede webcontext en volledige paginadetails samengebracht in één enkele, goed onderbouwde response. Dat is de agent loop.

Orchestration van de volledige agentic loop

Het is belangrijk om de Agent API te onderscheiden van model routing services. De Agent API is een managed runtime die de volledige agentic loop orkestreert: retrieval, tool execution, reasoning en multi-model fallback, plus alle custom tools waartoe je toegang geeft. Die vervangt een model router, een search layer, een embeddings provider, een sandbox service en een monitoring stack door één endpoint, account en API key.

De API is model-agnostic voor alle frontier model providers. Voor high-availability-applicaties ondersteunt de API model fallback chains: specificeer meerdere modellen, en de API probeert automatisch de volgende als er één niet beschikbaar is. Dit zorgt voor een beschikbaarheid van bijna 100%.

Krachtige, ingebouwde tools

Er zijn twee built-in tools beschikbaar: web_search en fetch_url. web_search ondersteunt domain filtering (allowlist en denylist, tot 20 domeinen), recency filtering, date range filtering, language filtering en configureerbare content budgets per pagina. fetch_url haalt volledige pagina-inhoud op van specifieke URL's en extraheert die.

Naast de built-in tools kunnen developers met custom functions de agent verbinden met hun eigen backends, databases en API's.

Continu geoptimaliseerde frontier model presets

Een effectieve agent configuration vanaf nul opbouwen vereist het kiezen van het juiste model, het kalibreren van reasoning depth, het selecteren van tools en het afstemmen van token budgets. Perplexity doet dit continu voor zijn eigen producten, ondersteund door een intern evaluation team dat configuraties benchmarkt tegen echte workloads.

Presets delen die expertise. Elke preset is een volledig transparante, vooraf geconfigureerde setup die is geoptimaliseerd voor een specifieke use case: snelle feitelijke lookups, gebalanceerd onderzoek, diepgaande multi-source analysis en research op institutioneel niveau. We publiceren de aanbevolen system prompt, tools en het cost profile voor elk daarvan. Terwijl het modellenlandschap evolueert, werken we de onderliggende configuraties bij zodat de preset altijd de huidige state of the art weerspiegelt tegen voorspelbare kosten. Alle preset parameters zijn overschrijfbaar: developers kunnen een preset gebruiken als startpunt en het model, de tools, het aantal stappen of de token budgets aanpassen in één enkel request.

Deep Research 2.0, beschikbaar via de preset advanced-deep-research, is dezelfde multi-step reasoning engine die Perplexity's consumentenproduct aandrijft. Die voert tientallen searches per query uit, leest honderden sourcedocumenten en verfijnt zijn analyse iteratief. De prestaties op DRACO, Scale AI's ResearchRubrics en Google DeepMind's DeepSearchQA worden beschreven in onze DRACO benchmark post.

De Agent API is vandaag beschikbaar. Documentatie en quickstart guides vind je op docs.perplexity.ai