Agent API: spravované runtime prostredie pre agentické workflowy

Dnes uvádzame Perplexity Agent API, spravované runtime prostredie na budovanie agentických workflowov s integrovaným vyhľadávaním, vykonávaním nástrojov a orchestráciou viacerých modelov.

Nahrádza smerovač modelov, vrstvu vyhľadávania, poskytovateľa embeddings, sandboxovú službu a monitorovací stack jediným integračným bodom.

Agentická slučka ako výpočtový model

Bežný CPU vykonáva deterministický cyklus: načíta inštrukciu, dekóduje ju, vykoná ju a uloží výsledok. Počítadlo programu sa posunie. Procesor sa nikdy nerozhoduje, čo má robiť.

Agent API implementuje odlišný výpočtový model. Procesorom je frontier jazykový model. Dostane cieľ a určí, ako ho dosiahnuť. Rozloží tento cieľ na plán, vyberie, ktoré nástroje použiť zo svojej dostupnej sady nástrojov, vykoná ich, pozoruje výsledky, vyhodnotí, či bol cieľ splnený, a iteruje. Kontextové okno slúži ako registre. Uvažovanie a orchestrácia slúžia ako plánovač.

Predstavte si prípravu na obchodný hovor s potenciálnym klientom, s ktorým ste už niekoľkokrát hovorili. Odošlete jednu požiadavku do Agent API s tromi nástrojmi: jedným na vyhľadávanie vo vašom internom CRM, web_search a fetch_url. Model najprv zavolá váš CRM nástroj a získa kontext z predchádzajúcich konverzácií. Následne zavolá web_search, aby našiel aktuálne správy a konkurenčné informácie, pričom vráti niekoľko relevantných stránok. Usúdi, že dve z týchto stránok si zaslúžia podrobnejšie prečítanie, a na každú z nich zavolá fetch_url. V troch krokoch model spojí internú históriu, široký webový kontext a detailný obsah celých stránok do jednej ucelenej odpovede. To je agentická slučka.

Orchestrácia celej agentickej slučky

Je dôležité odlíšiť Agent API od služieb smerovania modelov. Agent API je spravované runtime prostredie, ktoré orchestruje celú agentickú slučku: získavanie informácií, vykonávanie nástrojov, uvažovanie a fallback medzi viacerými modelmi, ako aj akékoľvek vlastné nástroje, ku ktorým mu udelíte prístup. Nahrádza smerovač modelov, vrstvu vyhľadávania, poskytovateľa embeddings, sandboxovú službu a monitorovací stack jediným endpointom, účtom a API kľúčom.

API je modelovo agnostické naprieč všetkými poskytovateľmi frontier modelov. Pre aplikácie s vysokou dostupnosťou API podporuje fallback reťazce modelov: zadajte viacero modelov a API automaticky vyskúša ďalší, ak je jeden nedostupný. Tým sa zabezpečí dostupnosť blízka 100 %.

Výkonné vstavané nástroje

K dispozícii sú dva vstavané nástroje: web_search a fetch_url. web_search podporuje filtrovanie domén (allowlist a denylist, až 20 domén), filtrovanie podľa aktuálnosti, filtrovanie podľa rozsahu dátumov, filtrovanie podľa jazyka a konfigurovateľné rozpočty obsahu na stránku. fetch_url načíta a extrahuje úplný obsah stránky z konkrétnych URL adries.

Okrem vstavaných nástrojov umožňujú vlastné funkcie vývojárom prepojiť agenta s ich vlastnými backendmi, databázami a API.

Priebežne optimalizované predvoľby frontier modelov

Vytvorenie efektívnej konfigurácie agenta od nuly si vyžaduje výber správneho modelu, kalibráciu hĺbky uvažovania, výber nástrojov a ladenie tokenových rozpočtov. Perplexity to robí priebežne pre svoje vlastné produkty, s podporou interného evaluačného tímu, ktorý porovnáva konfigurácie s reálnymi pracovnými záťažami.

Predvoľby sprístupňujú tieto odborné skúsenosti. Každá predvoľba predstavuje plne transparentné, predkonfigurované nastavenie optimalizované na konkrétny prípad použitia: rýchle faktické vyhľadávania, vyvážený výskum, hĺbkovú analýzu z viacerých zdrojov a výskum na inštitucionálnej úrovni. Pri každej z nich zverejňujeme odporúčaný systémový prompt, nástroje a nákladový profil. Ako sa prostredie modelov vyvíja, aktualizujeme podkladové konfigurácie tak, aby predvoľba vždy odrážala aktuálny stav techniky pri predvídateľných nákladoch. Všetky parametre predvoľby je možné prepísať: vývojári môžu použiť predvoľbu ako východiskový bod a v jednej požiadavke upraviť model, nástroje, počet krokov alebo tokenové rozpočty.

Deep Research 2.0, dostupný prostredníctvom predvoľby advanced-deep-research, je ten istý viacstupňový uvažovací engine, ktorý poháňa spotrebiteľský produkt Perplexity. Vykonáva desiatky vyhľadávaní na dopyt, číta stovky zdrojových dokumentov a iteratívne spresňuje svoju analýzu. Výkon na benchmarkoch DRACO, ResearchRubrics od Scale AI a DeepSearchQA od Google DeepMind je podrobne opísaný v našom príspevku o benchmarku DRACO.

Agent API je dostupné už dnes. Dokumentácia a príručky rýchleho štartu sú na docs.perplexity.ai