
Γραμμένο από
Ομάδα Perplexity
Δημοσιεύτηκε την
Agent API: Ένα διαχειριζόμενο περιβάλλον εκτέλεσης για πρακτορικές ροές εργασίας
Σήμερα κυκλοφορούμε το Perplexity Agent API, ένα διαχειριζόμενο περιβάλλον εκτέλεσης για τη δημιουργία πρακτορικών ροών εργασίας με ενσωματωμένη αναζήτηση, εκτέλεση εργαλείων και ενορχήστρωση πολλαπλών μοντέλων.
Αντικαθιστά έναν δρομολογητή μοντέλων, ένα επίπεδο αναζήτησης, έναν πάροχο embeddings, μια υπηρεσία sandbox και μια στοίβα παρακολούθησης με ένα ενιαίο σημείο ενσωμάτωσης.
Ο πρακτορικός βρόχος ως υπολογιστικό μοντέλο
Μια συμβατική CPU εκτελεί έναν ντετερμινιστικό κύκλο: ανακτά μια εντολή, την αποκωδικοποιεί, την εκτελεί, αποθηκεύει το αποτέλεσμα. Ο μετρητής προγράμματος προχωρά. Ο επεξεργαστής δεν αποφασίζει ποτέ τι θα κάνει.
Το Agent API υλοποιεί ένα διαφορετικό υπολογιστικό μοντέλο. Ο επεξεργαστής είναι ένα γλωσσικό μοντέλο αιχμής. Λαμβάνει έναν στόχο και καθορίζει πώς θα τον επιτύχει. Αποσυνθέτει αυτόν τον στόχο σε ένα σχέδιο, επιλέγει ποια εργαλεία θα χρησιμοποιήσει από το διαθέσιμο σύνολο εργαλείων του, εκτελεί, παρατηρεί τα αποτελέσματα, αξιολογεί εάν ο στόχος έχει επιτευχθεί και επαναλαμβάνει. Το παράθυρο συμφραζομένων λειτουργεί ως καταχωρητές. Η συλλογιστική και η ενορχήστρωση λειτουργούν ως ο χρονοπρογραμματιστής.
Σκεφθείτε ότι προετοιμάζεστε για μια κλήση πωλήσεων με έναν υποψήφιο πελάτη με τον οποίο έχετε μιλήσει μερικές φορές. Στέλνετε ένα μόνο αίτημα στο Agent API με τρία εργαλεία: ένα για αναζήτηση στο εσωτερικό CRM σας, web_search, και fetch_url. Το μοντέλο καλεί πρώτα το εργαλείο CRM σας, ανακτώντας συμφραζόμενα από προηγούμενες συνομιλίες. Στη συνέχεια, καλεί το web_search για να βρει πρόσφατες ειδήσεις και ανταγωνιστική πληροφόρηση, επιστρέφοντας αρκετές σχετικές σελίδες. Αποφασίζει ότι δύο από αυτές τις σελίδες δικαιολογούν βαθύτερη ανάγνωση και καλεί το fetch_url σε καθεμία. Σε τρία βήματα, το μοντέλο έχει συγκεντρώσει το εσωτερικό ιστορικό, το ευρύ διαδικτυακό πλαίσιο και τις πλήρεις λεπτομέρειες σελίδας σε μία ενιαία, τεκμηριωμένη απάντηση. Αυτός είναι ο πρακτορικός βρόχος.
Ενορχήστρωση του πλήρους πρακτορικού βρόχου
Είναι σημαντικό να διακρίνουμε το Agent API από τις υπηρεσίες δρομολόγησης μοντέλων. Το Agent API είναι ένα διαχειριζόμενο περιβάλλον εκτέλεσης που ενορχηστρώνει τον πλήρη πρακτορικό βρόχο: ανάκτηση, εκτέλεση εργαλείων, συλλογιστική και εφεδρεία πολλαπλών μοντέλων, καθώς και τυχόν προσαρμοσμένα εργαλεία στα οποία του παρέχετε πρόσβαση. Αντικαθιστά έναν δρομολογητή μοντέλων, ένα επίπεδο αναζήτησης, έναν πάροχο embeddings, μια υπηρεσία sandbox και μια στοίβα παρακολούθησης με ένα ενιαίο endpoint, λογαριασμό και κλειδί API.
Το API είναι ανεξάρτητο από μοντέλα σε όλους τους παρόχους μοντέλων αιχμής. Για εφαρμογές υψηλής διαθεσιμότητας, το API υποστηρίζει αλυσίδες εφεδρείας μοντέλων: καθορίστε πολλαπλά μοντέλα και το API δοκιμάζει αυτόματα το επόμενο εάν κάποιο δεν είναι διαθέσιμο. Αυτό εξασφαλίζει διαθεσιμότητα κοντά στο 100%.
Ισχυρά, ενσωματωμένα εργαλεία
Δύο ενσωματωμένα εργαλεία είναι διαθέσιμα: web_search και fetch_url. Το web_search υποστηρίζει φιλτράρισμα τομέων (allowlist και denylist, έως 20 τομείς), φιλτράρισμα επικαιρότητας, φιλτράρισμα εύρους ημερομηνιών, φιλτράρισμα γλώσσας και παραμετροποιήσιμους προϋπολογισμούς περιεχομένου ανά σελίδα. Το fetch_url ανακτά και εξάγει το πλήρες περιεχόμενο σελίδας από συγκεκριμένα URL.
Πέρα από τα ενσωματωμένα εργαλεία, οι προσαρμοσμένες συναρτήσεις επιτρέπουν στους προγραμματιστές να συνδέουν τον πράκτορα με τα δικά τους backends, βάσεις δεδομένων και API.
Προεπιλογές μοντέλων αιχμής που βελτιστοποιούνται συνεχώς
Η δημιουργία μιας αποτελεσματικής διαμόρφωσης πράκτορα από το μηδέν απαιτεί την επιλογή του κατάλληλου μοντέλου, τη βαθμονόμηση του βάθους συλλογιστικής, την επιλογή εργαλείων και τη ρύθμιση των προϋπολογισμών token. Το Perplexity το κάνει αυτό συνεχώς για τα δικά του προϊόντα, με την υποστήριξη μιας εσωτερικής ομάδας αξιολόγησης που συγκρίνει διαμορφώσεις με πραγματικά φορτία εργασίας.
Προεπιλογές μοιράζονται αυτήν την τεχνογνωσία. Κάθε προεπιλογή είναι μια πλήρως διαφανής, προδιαμορφωμένη ρύθμιση βελτιστοποιημένη για μια συγκεκριμένη περίπτωση χρήσης: γρήγορες πραγματολογικές αναζητήσεις, ισορροπημένη έρευνα, εις βάθος ανάλυση από πολλαπλές πηγές και έρευνα θεσμικού επιπέδου. Δημοσιεύουμε το προτεινόμενο system prompt, τα εργαλεία και το προφίλ κόστους για καθεμία. Καθώς το τοπίο των μοντέλων εξελίσσεται, ενημερώνουμε τις υποκείμενες διαμορφώσεις ώστε η προεπιλογή να αντανακλά πάντοτε την τρέχουσα αιχμή της τεχνολογίας με προβλέψιμο κόστος. Όλες οι παράμετροι των προεπιλογών μπορούν να παρακαμφθούν: οι προγραμματιστές μπορούν να χρησιμοποιήσουν μια προεπιλογή ως αφετηρία και να προσαρμόσουν το μοντέλο, τα εργαλεία, τον αριθμό βημάτων ή τους προϋπολογισμούς token σε ένα μόνο αίτημα.
Το Deep Research 2.0, διαθέσιμο μέσω της προεπιλογής advanced-deep-research, είναι η ίδια μηχανή συλλογιστικής πολλαπλών βημάτων που τροφοδοτεί το καταναλωτικό προϊόν της Perplexity. Εκτελεί δεκάδες αναζητήσεις ανά ερώτημα, διαβάζει εκατοντάδες έγγραφα πηγών και βελτιώνει επαναληπτικά την ανάλυσή του. Οι επιδόσεις στα DRACO, ResearchRubrics της Scale AI και DeepSearchQA της Google DeepMind παρουσιάζονται αναλυτικά στην ανάρτησή μας για το benchmark DRACO.
Το Agent API είναι διαθέσιμο από σήμερα. Η τεκμηρίωση και οι οδηγοί γρήγορης εκκίνησης βρίσκονται στο docs.perplexity.ai
Agent API: Ένα διαχειριζόμενο περιβάλλον εκτέλεσης για πρακτορικές ροές εργασίας
Σήμερα κυκλοφορούμε το Perplexity Agent API, ένα διαχειριζόμενο περιβάλλον εκτέλεσης για τη δημιουργία πρακτορικών ροών εργασίας με ενσωματωμένη αναζήτηση, εκτέλεση εργαλείων και ενορχήστρωση πολλαπλών μοντέλων.
Αντικαθιστά έναν δρομολογητή μοντέλων, ένα επίπεδο αναζήτησης, έναν πάροχο embeddings, μια υπηρεσία sandbox και μια στοίβα παρακολούθησης με ένα ενιαίο σημείο ενσωμάτωσης.
Ο πρακτορικός βρόχος ως υπολογιστικό μοντέλο
Μια συμβατική CPU εκτελεί έναν ντετερμινιστικό κύκλο: ανακτά μια εντολή, την αποκωδικοποιεί, την εκτελεί, αποθηκεύει το αποτέλεσμα. Ο μετρητής προγράμματος προχωρά. Ο επεξεργαστής δεν αποφασίζει ποτέ τι θα κάνει.
Το Agent API υλοποιεί ένα διαφορετικό υπολογιστικό μοντέλο. Ο επεξεργαστής είναι ένα γλωσσικό μοντέλο αιχμής. Λαμβάνει έναν στόχο και καθορίζει πώς θα τον επιτύχει. Αποσυνθέτει αυτόν τον στόχο σε ένα σχέδιο, επιλέγει ποια εργαλεία θα χρησιμοποιήσει από το διαθέσιμο σύνολο εργαλείων του, εκτελεί, παρατηρεί τα αποτελέσματα, αξιολογεί εάν ο στόχος έχει επιτευχθεί και επαναλαμβάνει. Το παράθυρο συμφραζομένων λειτουργεί ως καταχωρητές. Η συλλογιστική και η ενορχήστρωση λειτουργούν ως ο χρονοπρογραμματιστής.
Σκεφθείτε ότι προετοιμάζεστε για μια κλήση πωλήσεων με έναν υποψήφιο πελάτη με τον οποίο έχετε μιλήσει μερικές φορές. Στέλνετε ένα μόνο αίτημα στο Agent API με τρία εργαλεία: ένα για αναζήτηση στο εσωτερικό CRM σας, web_search, και fetch_url. Το μοντέλο καλεί πρώτα το εργαλείο CRM σας, ανακτώντας συμφραζόμενα από προηγούμενες συνομιλίες. Στη συνέχεια, καλεί το web_search για να βρει πρόσφατες ειδήσεις και ανταγωνιστική πληροφόρηση, επιστρέφοντας αρκετές σχετικές σελίδες. Αποφασίζει ότι δύο από αυτές τις σελίδες δικαιολογούν βαθύτερη ανάγνωση και καλεί το fetch_url σε καθεμία. Σε τρία βήματα, το μοντέλο έχει συγκεντρώσει το εσωτερικό ιστορικό, το ευρύ διαδικτυακό πλαίσιο και τις πλήρεις λεπτομέρειες σελίδας σε μία ενιαία, τεκμηριωμένη απάντηση. Αυτός είναι ο πρακτορικός βρόχος.
Ενορχήστρωση του πλήρους πρακτορικού βρόχου
Είναι σημαντικό να διακρίνουμε το Agent API από τις υπηρεσίες δρομολόγησης μοντέλων. Το Agent API είναι ένα διαχειριζόμενο περιβάλλον εκτέλεσης που ενορχηστρώνει τον πλήρη πρακτορικό βρόχο: ανάκτηση, εκτέλεση εργαλείων, συλλογιστική και εφεδρεία πολλαπλών μοντέλων, καθώς και τυχόν προσαρμοσμένα εργαλεία στα οποία του παρέχετε πρόσβαση. Αντικαθιστά έναν δρομολογητή μοντέλων, ένα επίπεδο αναζήτησης, έναν πάροχο embeddings, μια υπηρεσία sandbox και μια στοίβα παρακολούθησης με ένα ενιαίο endpoint, λογαριασμό και κλειδί API.
Το API είναι ανεξάρτητο από μοντέλα σε όλους τους παρόχους μοντέλων αιχμής. Για εφαρμογές υψηλής διαθεσιμότητας, το API υποστηρίζει αλυσίδες εφεδρείας μοντέλων: καθορίστε πολλαπλά μοντέλα και το API δοκιμάζει αυτόματα το επόμενο εάν κάποιο δεν είναι διαθέσιμο. Αυτό εξασφαλίζει διαθεσιμότητα κοντά στο 100%.
Ισχυρά, ενσωματωμένα εργαλεία
Δύο ενσωματωμένα εργαλεία είναι διαθέσιμα: web_search και fetch_url. Το web_search υποστηρίζει φιλτράρισμα τομέων (allowlist και denylist, έως 20 τομείς), φιλτράρισμα επικαιρότητας, φιλτράρισμα εύρους ημερομηνιών, φιλτράρισμα γλώσσας και παραμετροποιήσιμους προϋπολογισμούς περιεχομένου ανά σελίδα. Το fetch_url ανακτά και εξάγει το πλήρες περιεχόμενο σελίδας από συγκεκριμένα URL.
Πέρα από τα ενσωματωμένα εργαλεία, οι προσαρμοσμένες συναρτήσεις επιτρέπουν στους προγραμματιστές να συνδέουν τον πράκτορα με τα δικά τους backends, βάσεις δεδομένων και API.
Προεπιλογές μοντέλων αιχμής που βελτιστοποιούνται συνεχώς
Η δημιουργία μιας αποτελεσματικής διαμόρφωσης πράκτορα από το μηδέν απαιτεί την επιλογή του κατάλληλου μοντέλου, τη βαθμονόμηση του βάθους συλλογιστικής, την επιλογή εργαλείων και τη ρύθμιση των προϋπολογισμών token. Το Perplexity το κάνει αυτό συνεχώς για τα δικά του προϊόντα, με την υποστήριξη μιας εσωτερικής ομάδας αξιολόγησης που συγκρίνει διαμορφώσεις με πραγματικά φορτία εργασίας.
Προεπιλογές μοιράζονται αυτήν την τεχνογνωσία. Κάθε προεπιλογή είναι μια πλήρως διαφανής, προδιαμορφωμένη ρύθμιση βελτιστοποιημένη για μια συγκεκριμένη περίπτωση χρήσης: γρήγορες πραγματολογικές αναζητήσεις, ισορροπημένη έρευνα, εις βάθος ανάλυση από πολλαπλές πηγές και έρευνα θεσμικού επιπέδου. Δημοσιεύουμε το προτεινόμενο system prompt, τα εργαλεία και το προφίλ κόστους για καθεμία. Καθώς το τοπίο των μοντέλων εξελίσσεται, ενημερώνουμε τις υποκείμενες διαμορφώσεις ώστε η προεπιλογή να αντανακλά πάντοτε την τρέχουσα αιχμή της τεχνολογίας με προβλέψιμο κόστος. Όλες οι παράμετροι των προεπιλογών μπορούν να παρακαμφθούν: οι προγραμματιστές μπορούν να χρησιμοποιήσουν μια προεπιλογή ως αφετηρία και να προσαρμόσουν το μοντέλο, τα εργαλεία, τον αριθμό βημάτων ή τους προϋπολογισμούς token σε ένα μόνο αίτημα.
Το Deep Research 2.0, διαθέσιμο μέσω της προεπιλογής advanced-deep-research, είναι η ίδια μηχανή συλλογιστικής πολλαπλών βημάτων που τροφοδοτεί το καταναλωτικό προϊόν της Perplexity. Εκτελεί δεκάδες αναζητήσεις ανά ερώτημα, διαβάζει εκατοντάδες έγγραφα πηγών και βελτιώνει επαναληπτικά την ανάλυσή του. Οι επιδόσεις στα DRACO, ResearchRubrics της Scale AI και DeepSearchQA της Google DeepMind παρουσιάζονται αναλυτικά στην ανάρτησή μας για το benchmark DRACO.
Το Agent API είναι διαθέσιμο από σήμερα. Η τεκμηρίωση και οι οδηγοί γρήγορης εκκίνησης βρίσκονται στο docs.perplexity.ai
Μοιραστείτε αυτό το άρθρο
