Agent API : un environnement d’exécution géré pour les workflows agentiques

Aujourd’hui, nous lançons l’Agent API de Perplexity, un environnement d’exécution géré pour créer des workflows agentiques avec recherche intégrée, exécution d’outils et orchestration multi-modèles.

Elle remplace un routeur de modèles, une couche de recherche, un fournisseur d’embeddings, un service de sandbox et une pile de supervision par un point d’intégration unique.

La boucle agentique comme modèle de calcul

Un CPU conventionnel exécute un cycle déterministe : récupérer une instruction, la décoder, l’exécuter, stocker le résultat. Le compteur ordinal avance. Le processeur ne décide jamais quoi faire.

L’Agent API met en œuvre un modèle de calcul différent. Le processeur est un modèle de langage de pointe. Il reçoit un objectif et détermine comment l’atteindre. Il décompose cet objectif en un plan, sélectionne les outils à utiliser parmi son ensemble d’outils disponibles, exécute, observe les résultats, évalue si l’objectif est atteint, puis itère. La fenêtre de contexte tient lieu de registres. Le raisonnement et l’orchestration tiennent lieu d’ordonnanceur.

Prenons l’exemple de la préparation d’un appel commercial avec un prospect avec lequel vous avez déjà échangé à quelques reprises. Vous envoyez une seule requête à l’Agent API avec trois outils : un pour interroger votre CRM interne, web_search, et fetch_url. Le modèle appelle d’abord votre outil CRM, récupérant le contexte des conversations passées. Il appelle ensuite web_search pour trouver des actualités récentes et des informations concurrentielles, en renvoyant plusieurs pages pertinentes. Il décide que deux de ces pages justifient une lecture plus approfondie et appelle fetch_url pour chacune d’elles. En trois étapes, le modèle a réuni l’historique interne, un contexte web large et le détail complet des pages dans une réponse unique et étayée. C’est la boucle agentique.

Orchestration de l’ensemble de la boucle agentique

Il est important de distinguer l’Agent API des services de routage de modèles. L’Agent API est un environnement d’exécution géré qui orchestre l’ensemble de la boucle agentique : récupération, exécution d’outils, raisonnement, bascule multi-modèles, ainsi que tous les outils personnalisés auxquels vous lui donnez accès. Elle remplace un routeur de modèles, une couche de recherche, un fournisseur d’embeddings, un service de sandbox et une pile de supervision par un endpoint unique, un compte unique et une clé API unique.

L’API est agnostique au modèle sur l’ensemble des fournisseurs de modèles de pointe. Pour les applications à haute disponibilité, l’API prend en charge des chaînes de repli de modèles : spécifiez plusieurs modèles, et l’API essaie automatiquement le suivant si l’un d’eux n’est pas disponible. Cela garantit une disponibilité proche de 100 %.

Des outils intégrés puissants

Deux outils intégrés sont disponibles : web_search et fetch_url. web_search prend en charge le filtrage par domaine (liste d’autorisation et liste de refus, jusqu’à 20 domaines), le filtrage par récence, le filtrage par plage de dates, le filtrage par langue et des budgets de contenu configurables par page. fetch_url récupère et extrait le contenu intégral des pages à partir d’URL spécifiques.

Au-delà des outils intégrés, des fonctions personnalisées permettent aux développeurs de connecter l’agent à leurs propres backends, bases de données et API.

Presets de modèles de pointe optimisés en continu

Construire de zéro une configuration d’agent efficace exige de choisir le bon modèle, de calibrer la profondeur du raisonnement, de sélectionner les outils et d’ajuster les budgets de tokens. Perplexity le fait en continu pour ses propres produits, avec l’appui d’une équipe d’évaluation interne qui évalue les configurations sur des charges de travail réelles.

Presets mettent ce savoir-faire à votre disposition. Chaque preset est une configuration entièrement transparente, préconfigurée et optimisée pour un cas d’usage précis : recherches factuelles rapides, recherche équilibrée, analyse approfondie multi-sources et recherche de niveau institutionnel. Nous publions le prompt système recommandé, les outils et le profil de coût de chacun. À mesure que le paysage des modèles évolue, nous mettons à jour les configurations sous-jacentes afin que le preset reflète toujours l’état de l’art à un coût prévisible. Tous les paramètres des presets peuvent être remplacés : les développeurs peuvent utiliser un preset comme point de départ et ajuster le modèle, les outils, le nombre d’étapes ou les budgets de tokens en une seule requête.

Deep Research 2.0, disponible via le preset advanced-deep-research, est le même moteur de raisonnement multi-étapes qui alimente le produit grand public de Perplexity. Il effectue des dizaines de recherches par requête, lit des centaines de documents sources et affine son analyse de manière itérative. Les performances sur DRACO, ResearchRubrics de Scale AI et DeepSearchQA de Google DeepMind sont détaillées dans notre article sur le benchmark DRACO.

L’Agent API est disponible dès aujourd’hui. La documentation et les guides de démarrage rapide se trouvent sur docs.perplexity.ai