Openai est finalement entré dans la course d'agent AI avec la publication de son opérateur AI en janvier. Le système agentique est conçu pour fonctionner de manière autonome au nom de son utilisateur et est prêt à concurrencer les rivaux de l'industrie déjà établis comme l'API de l'ordinateur de Claude et les agents de copilote de Microsoft – au moins, une fois qu'il perd son statut de «prévisualité de recherche». Voici tout ce que vous devez savoir sur le nouvel agent d'Openai et lorsque vous pourrez l'essayer par vous-même.
Qu'est-ce que l'opérateur?
L'opérateur d'OpenAI est un agent IA, ce qui signifie qu'il est conçu pour prendre des mesures autonomes en fonction des informations qui s'y trouvent. Mais contrairement aux programmes conventionnels, les agents de l'IA sont en mesure de revoir les conditions changeantes en temps réel et réagissent en conséquence, plutôt que d'exécuter simplement des commandes prédéterminées. En tant que tels, les agents de l'IA sont en mesure d'effectuer une variété de tâches complexes et en plusieurs étapes allant de la transcription, de la résumé et de la génération d'action d'une réunion d'affaires à la réservation du vol, de l'hébergement de l'hôtel et de la voiture de location pour des vacances à venir en fonction de votre famille en fonction de votre famille Divers programmes pour rechercher de manière autonome des sujets et assembler des études de plusieurs pages sur ces sujets.
L'opérateur fonctionne légèrement différemment des autres agents actuellement disponibles. Bien que l'utilisation de l'ordinateur de Claude soit une API et que les agents d'IA de Microsoft fonctionnent dans l'interface utilisateur de chat copilot lui-même, l'opérateur est conçu pour, bien, fonctionner, dans une fenêtre de navigateur Web dédiée qui s'exécute sur les serveurs d'Openai et exécute ses tâches à distance. Votre navigateur Web local n'a rien à voir avec le processus et peut être utilisé normalement même lorsque l'opérateur est en cours d'exécution.
L'application Opérateur est alimentée par un nouveau modèle «agent d'utilisation informatique» (CUA) qui est, à son tour, construit au sommet de GPT-4O, qui offre les capacités multimodales de l'application. Openai dit que CUA a été formé à la même manière que ses modèles de raisonnement O1 et O3. En tant que tel, le modèle CUA décomposera les tâches complexes en problèmes de composants avant d'essayer de les résoudre séquentiellement, en retour en arrière s'il se présente dans des barrages logiques logiques.
Quand l'opérateur a-t-il été libéré?
OpenAAI a publié l'opérateur le 23 janvier 2025. Il n'est actuellement disponible que pour les utilisateurs de 200 € / mois Pro aux États-Unis via le site Operator.chatgpt.com. « Notre plan est de s'étendre à des utilisateurs de plus, d'équipe et d'entreprise et d'intégrer ces capacités dans Chatgpt à l'avenir », a écrit la société dans son article d'annonce.
Comment fonctionne l'opérateur?
Les utilisateurs peuvent activer l'agent à partir de l'écran d'accueil de Chatgpt, qui apparaît d'une page de navigateur Web dédié dans une fenêtre latérale pour que l'opérateur exécute ses tâches. L'IA fournit un récit en cours d'exécution de ce qu'il fait actuellement et l'utilisateur peut reprendre le processus à tout moment. L'opérateur demandera l'aide de l'utilisateur dans certaines tâches, telles que la connexion à des sites Web sécurisés spécifiques, ainsi que la confirmation de l'utilisateur avant d'exécuter des tâches importantes. Il peut interagir avec les sites Web visuellement (c'est-à-dire via des captures d'écran) et tactiquement, lorsqu'il imite les robinets du clavier de l'utilisateur et les clics de souris.
Que peut faire l'opérateur et comment peut-il le faire?
Puisqu'il est limité au navigateur, l'opérateur ne peut effectuer que de simples tâches sur Internet, telles que la réservation de billets de concert, la commande de Doordash ou le remplissage des commandes Instacart. La société affirme également que l'agent sera en mesure d'automatiser des tâches comme la réservation d'hôtels et de compagnies aériennes, de réserver des tables dans les restaurants et même de faire vos achats en ligne.
Openai a opposé l'opérateur à l'utilisation de l'ordinateur d'Anthropic, ainsi qu'à l'agent marin de Google Deepmind, dans un certain nombre de repères de l'industrie et affirme que l'opérateur les a battus dans tous les domaines. Sur la référence Osworld, qui mesure dans quelle mesure un agent peut effectuer des tâches comme la fusion des fichiers PDF, CUA battait l'ordinateur de 38,1% à 22,0% – pour référence, les humains ont en moyenne 72% de succès sur ces tâches. Sur le benchmark WebVoyager, Cua a dominé Mariner de 87% à 83,5%. L'utilisation de l'ordinateur a marqué 56%.
Cependant, les réactions utilisateur initiales à l'agent d'IA ont été mitigées. Par exemple, New York Times Le chroniqueur Kevin Roost a écrit: «Dans l'ensemble, j'ai constaté que l'utilisation de l'opérateur était généralement plus de problème qu'elle ne valait. La plupart de ce que cela a fait pour moi, j'aurais pu faire moi-même plus vite, avec moins de maux de tête. »
«Même lorsque cela a fonctionné», a-t-il poursuivi, «cela a demandé tant de confirmations et de réassurances avant d'agir que je me sentais moins comme si j'avais un assistant virtuel et plus comme je supervise le stagiaire le plus peu sûr du monde.»
Comment puis-je essayer l'opérateur par moi-même?
Afin d'avoir accès à l'agent opérateur d'Openai, vous devrez vous inscrire à l'abonnement Pro Tier d'Openai, puis y accéder via le site Operator.chatgpt.com.