Agent API: Felügyelt futtatókörnyezet agentikus munkafolyamatokhoz

Ma elérhetővé tesszük a Perplexity Agent API-t, egy felügyelt futtatókörnyezetet agentikus munkafolyamatok létrehozásához integrált kereséssel, eszközvégrehajtással és többmodelles orchesztrációval.

Egyetlen integrációs ponttal vált ki egy modellroutert, egy keresési réteget, egy embedding-szolgáltatót, egy sandbox szolgáltatást és egy monitorozási stacket.

Az agentikus ciklus mint számítási modell

A hagyományos CPU egy determinisztikus ciklust hajt végre: beolvas egy utasítást, dekódolja, végrehajtja, eltárolja az eredményt. A programszámláló továbblép. A processzor soha nem dönti el, mit tegyen.

Az Agent API egy eltérő számítási modellt valósít meg. A processzor egy élvonalbeli nyelvi modell. Kap egy célt, és meghatározza, hogyan érje azt el. A célt tervre bontja, kiválasztja az elérhető eszközkészletből a használandó eszközöket, végrehajt, megfigyeli az eredményeket, értékeli, hogy teljesült-e a cél, majd iterál. A kontextusablak regiszterekként szolgál. A következtetés és az orchesztráció tölti be az ütemező szerepét.

Vegyük például azt, amikor egy olyan potenciális ügyféllel folytatandó értékesítési hívásra készül, akivel már néhányszor beszélt. Egyetlen kérést küld az Agent API-nak három eszközzel: egyet a belső CRM kereséséhez, web_search, valamint fetch_url. A modell először a CRM-eszközét hívja meg, és lekéri a korábbi beszélgetések kontextusát. Ezután meghívja a web_search eszközt, hogy friss híreket és versenytársi információkat találjon, és több releváns oldalt ad vissza. Úgy dönt, hogy ezek közül két oldal mélyebb átolvasást indokol, és mindkettőre meghívja a fetch_url eszközt. Három lépésben a modell egyetlen megalapozott válaszba állította össze a belső előzményeket, a széles webes kontextust és a teljes oldalas részleteket. Ez az agentikus ciklus.

A teljes agentikus ciklus orchesztrációja

Fontos megkülönböztetni az Agent API-t a modellirányítási szolgáltatásoktól. Az Agent API egy felügyelt futtatókörnyezet, amely a teljes agentikus ciklust orchestrálja: a visszakeresést, az eszközvégrehajtást, a következtetést, a többmodelles fallbacket, valamint minden egyéni eszközt, amelyhez hozzáférést ad neki. Egyetlen végponttal, fiókkal és API-kulccsal vált ki egy modellroutert, egy keresési réteget, egy embedding-szolgáltatót, egy sandbox szolgáltatást és egy monitorozási stacket.

Az API modellagnosztikus az összes élvonalbeli modellszolgáltató között. Magas rendelkezésre állású alkalmazásokhoz az API támogatja a modell-fallback láncokat: több modellt is megadhat, és az API automatikusan a következőt próbálja, ha valamelyik nem érhető el. Ez közel 100%-os rendelkezésre állást biztosít.

Nagy teljesítményű, beépített eszközök

Két beépített eszköz érhető el: web_search és fetch_url. A web_search támogatja a doménszűrést (engedélyezési és tiltólista, legfeljebb 20 domén), a frissesség szerinti szűrést, a dátumtartomány szerinti szűrést, a nyelvi szűrést, valamint az oldalanként konfigurálható tartalmi kereteket. A fetch_url adott URL-ekről tölti le és nyeri ki a teljes oldaltartalmat.

A beépített eszközökön túl az egyéni függvények lehetővé teszik a fejlesztők számára, hogy az agentet saját backendjeikhez, adatbázisaikhoz és API-jaikhoz kapcsolják.

Folyamatosan optimalizált élvonalbeli modellpresetek

Egy hatékony agentkonfiguráció felépítése a nulláról megköveteli a megfelelő modell kiválasztását, a következtetési mélység kalibrálását, az eszközök kiválasztását és a tokenkeretek finomhangolását. A Perplexity ezt saját termékeihez folyamatosan elvégzi, egy házon belüli értékelő csapat támogatásával, amely valós munkaterheléseken benchmarkolja a konfigurációkat.

Presetek teszik elérhetővé ezt a szakértelmet. Minden preset egy teljesen átlátható, előre konfigurált beállítás, amely egy adott felhasználási esetre van optimalizálva: gyors tényalapú keresésekre, kiegyensúlyozott kutatásra, mély többforrású elemzésre és intézményi szintű kutatásra. Mindegyikhez közzétesszük az ajánlott rendszerpromptot, az eszközöket és a költségprofilt. Ahogy a modellek világa fejlődik, frissítjük a mögöttes konfigurációkat, hogy a preset mindig a technika aktuális állását tükrözze előre jelezhető költség mellett. Minden presetparaméter felülbírálható: a fejlesztők kiindulópontként használhatnak egy presetet, és egyetlen kérésben módosíthatják a modellt, az eszközöket, a lépésszámot vagy a tokenkereteket.

A Deep Research 2.0, amely az advanced-deep-research preset révén érhető el, ugyanaz a többlépéses következtetési motor, amely a Perplexity fogyasztói termékét működteti. Lekérdezésenként több tucat keresést végez, több száz forrásdokumentumot olvas el, és iteratív módon finomítja elemzését. A DRACO, a Scale AI ResearchRubrics és a Google DeepMind DeepSearchQA teszteken nyújtott teljesítményét a DRACO benchmarkbejegyzésünkben részletezzük.

Az Agent API már ma elérhető. A dokumentáció és a gyors üzembe helyezési útmutatók itt találhatók: docs.perplexity.ai