Agent API: upravljano izvršno okruženje za agentske radne tokove

Danas predstavljamo Perplexity Agent API, upravljano izvršno okruženje za izgradnju agentskih radnih tokova s integriranim pretraživanjem, izvršavanjem alata i orkestracijom više modela.

On zamjenjuje usmjerivač modela, sloj pretraživanja, pružatelja embeddingsa, sandbox uslugu i nadzorni skup s jednom točkom integracije.

Agentska petlja kao model računanja

Konvencionalni CPU izvršava deterministički ciklus: dohvaća instrukciju, dekodira je, izvršava je, pohranjuje rezultat. Brojač programa napreduje. Procesor nikada ne odlučuje što treba učiniti.

Agent API implementira drukčiji model računanja. Procesor je vodeći jezični model. Prima cilj i određuje kako ga ostvariti. Taj cilj raščlanjuje u plan, odabire koje će alate koristiti iz dostupnog skupa alata, izvršava ih, promatra rezultate, procjenjuje je li cilj postignut i iterira. Kontekstni prozor služi kao registri. Zaključivanje i orkestracija služe kao raspoređivač.

Zamislite da se pripremate za prodajni poziv s potencijalnim klijentom s kojim ste već razgovarali nekoliko puta. Agent API-ju šaljete jedan zahtjev s tri alata: jedan za pretraživanje vašeg internog CRM-a, web_search i fetch_url. Model najprije poziva vaš CRM alat i dohvaća kontekst iz prethodnih razgovora. Zatim poziva web_search kako bi pronašao nedavne vijesti i konkurentske uvide te vraća nekoliko relevantnih stranica. Procjenjuje da dvije od tih stranica zahtijevaju detaljnije čitanje te za svaku poziva fetch_url. U tri koraka model je objedinio internu povijest, široki web-kontekst i detalje cijelih stranica u jedinstven, utemeljen odgovor. To je agentska petlja.

Orkestracija cjelokupne agentske petlje

Važno je razlikovati Agent API od usluga usmjeravanja modela. Agent API je upravljano izvršno okruženje koje orkestrira cjelokupnu agentsku petlju: dohvat, izvršavanje alata, zaključivanje, višemodelni fallback i sve prilagođene alate kojima mu omogućite pristup. Zamjenjuje usmjerivač modela, sloj pretraživanja, pružatelja embeddingsa, sandbox uslugu i nadzorni skup jedinstvenom krajnjom točkom, računom i API ključem.

API je neovisan o modelu kod svih pružatelja vodećih modela. Za aplikacije visoke dostupnosti API podržava lance rezervnih modela: navedite više modela, a API automatski pokušava sljedeći ako jedan nije dostupan. Time se osigurava dostupnost blizu 100%.

Moćni, ugrađeni alati

Dostupna su dva ugrađena alata: web_search i fetch_url. web_search podržava filtriranje domena (popis dopuštenih i popis zabranjenih, do 20 domena), filtriranje prema svježini sadržaja, filtriranje prema datumskom rasponu, filtriranje prema jeziku i konfigurabilne budžete sadržaja po stranici. fetch_url dohvaća i izdvaja cjelokupan sadržaj stranice s određenih URL-ova.

Osim ugrađenih alata, prilagođene funkcije omogućuju razvojnim inženjerima povezivanje agenta s vlastitim pozadinskim sustavima, bazama podataka i API-jima.

Kontinuirano optimizirani predlošci vodećih modela

Izrada učinkovite konfiguracije agenta od nule zahtijeva odabir odgovarajućeg modela, kalibraciju dubine zaključivanja, odabir alata i podešavanje token budžeta. Perplexity to kontinuirano radi za vlastite proizvode, uz podršku internog evaluacijskog tima koji uspoređuje konfiguracije sa stvarnim radnim opterećenjima.

Predlošci dijele to stručno znanje. Svaki predložak potpuno je transparentna, unaprijed konfigurirana postavka optimizirana za određeni slučaj upotrebe: brza činjenična pretraživanja, uravnoteženo istraživanje, dubinska analiza iz više izvora i istraživanje institucionalne razine. Za svaki objavljujemo preporučeni sistemski prompt, alate i troškovni profil. Kako se područje modela razvija, ažuriramo temeljne konfiguracije kako bi predložak uvijek odražavao trenutačno najnaprednije stanje uz predvidljiv trošak. Svi parametri predloška mogu se redefinirati: razvojni inženjeri mogu upotrijebiti predložak kao početnu točku i prilagoditi model, alate, broj koraka ili token budžete u jednom zahtjevu.

Deep Research 2.0, dostupan putem predloška advanced-deep-research, isti je višekoračni mehanizam zaključivanja koji pokreće Perplexityjev proizvod za krajnje korisnike. Izvršava desetke pretraga po upitu, čita stotine izvornih dokumenata i iterativno usavršava svoju analizu. Učinak na DRACO-u, Scale AI's ResearchRubrics i Google DeepMind's DeepSearchQA detaljno je opisan u našem članku o DRACO benchmarku.

Agent API dostupan je već danas. Dokumentacija i vodiči za brzi početak dostupni su na docs.perplexity.ai