Les navigateurs Web entrent dans une nouvelle ère où les compétences en IA prennent le relais

Les navigateurs Web entrent dans une nouvelle ère où les compétences en IA prennent le relais

«Le navigateur est plus grand que le chat. C'est un produit plus collant, et c'est le seul moyen de construire des agents. C'est le seul moyen de construire des« flux de travail »de bout en bout, les commentaires du PDG de Perplexity, Aravind Srinivas, dans une interview récente. Le co-fondateur de la perplexité parlait de l'avenir des navigateurs Web, des agents de l'AI et des automations dans les navigateurs Web.

Srinivas a été optimiste sur les perspectives, en partie parce que son entreprise teste déjà un nouveau navigateur bourdonnant appelé Comet. Actuellement dans une phase bêta uniquement invite, le navigateur est livré avec un agent qui peut gérer des tâches complexes et longues en votre nom.

Pensez-y comme un outil d'IA tel que Chatgpt ou Gemini, mais qui vit exclusivement dans votre navigateur. L'approche de l'agent en navigateur, comme le soutient Srinivas, est plus familière et flexible. Vous n'avez pas à faire face aux restrictions habituelles de l'autorisation locale et du flux de travail croisé. De plus, les navigateurs fonctionneront comme nous le serons habitués, avec des produits comme Chrome ou Safari.

Mais les courants sont extrêmement différents, et le plus grand changement pourrait être le coucher du soleil des extensions de navigateur en faveur des compétences en IA et des agents générés par les utilisateurs. Fait intéressant, les outils de fondation ont été déposés il y a plus d'un an, mais nous n'entendons parler d'eux qu'avec l'arrivée de navigateurs AI-First comme Dia et Comet.

Les compétences en IA sont les nouveaux champions de travail

Tous les discussions sur les agents et les compétences de l'IA ressemble à un tas de jargon technologique, alors permettez-moi de le décomposer pour vous. Dans le navigateur DIAJ'ai récemment créé une compétence appelée «Expansion». Comment l'ai-je fait, même si je n'ai pas écrit une seule ligne de code? Je l'ai simplement décrit dans les mots suivants:

«Lorsque j'utilise cette compétence et que je colle un extrait, effectuez une recherche sur le Web profondément et rédigez toute l'historique sous la forme d'un article dans un ordre opportun. Tirez les informations uniquement à partir de médias fiables.»

J'ai lu et écrit des articles pour gagner ma vie, et je rencontre souvent des extraits et des événements dans des articles que je ne connais pas. Pour de tels scénarios, tout ce que j'ai à faire est de sélectionner le texte pertinent (ou de le copier-coller dans la barre latérale de chat) et d'utiliser une «commande« / »pour invoquer la compétence« développer ».

Comme décrit ci-dessus, l'agent d'IA du navigateur DIA recherchera les mentions de mon objectif dans les meilleurs médias et créera un bref rapport à ce sujet dans l'ordre chronologique. Cela m'économise beaucoup de temps précieux qui serait autrement consacré à des tentatives de recherche Google sauvages.

Mais plus important encore, je n'ai même pas besoin d'ouvrir un autre onglet, et je peux poser des questions de suivi dans la même boîte de discussion dans l'onglet de lecture active. C'est rapide et pratique. Je ne connais pas une extension qui peut faire exactement ce que cette compétence «d'extension» me fait.

Ce n'est pas possible non plus. Je l'ai créé avec un objectif et une intention spécifiques. Et je peux en créer autant que je le souhaite, ou affiner davantage en fonction de mon flux de travail. J'en ai créé un autre appelé «recherche» qui fait référence à une œuvre (ou à une phrase) et effectue des recherches sur le Web en examinant exclusivement les articles scientifiques évalués par des pairs.

La communauté des utilisateurs de DIA économise même de l'argent en créant des compétences qui recherchent des codes de réduction disponibles sur les produits juste avant le paiement. Pour mes achats Amazon, j'en ai créé un qui combine les avis, les notes et les fonctionnalités des produits dans différents onglets Amazon, crée une table de comparaison et m'aide à faire le meilleur choix. Tout cela se produit en tapant un seul mot!

Un autre recherche rapidement les erreurs grammaticales et la clarté du guide de style dans mes e-mails. Il y en a un qui crée un matériel de lecture basé sur le quiz pour les enfants que j'enseigne dans une institution à but non lucratif à proximité, sur la base du matériel d'apprentissage que j'ai préparé.

Je viens de faire un @diabrowser compétence qui m'a instantanément économisé pic.twitter.com/ybsaclrrtq

– Egor (@ eg0rev) 23 juillet 2025

Les étudiants aiment le ton amusant et ludique dans leurs questions à choix multiples qui testent leurs connaissances actuelles. Il y a même une galerie de dia officielle où vous pouvez trouver des compétences créées par les utilisateurs de DIA et un tableau de bord Web provenant de la foule où vous pouvez en trouver encore plus.

Mais voici la principale raison pour laquelle je pense que les compétences de navigateur sont plus importantes que les extensions. Tout le monde peut les créer en décrivant simplement ce qu'il veut. Avec des extensions, vous avez besoin de connaissances de codage et de compétences de base sur le fonctionnement du Web et de son architecture de navigation.

La sécurité est une autre raison pour laquelle je ferais plus confiance aux compétences du navigateur que aux extensions. Il y a une longue histoire d'extensions de navigateur étant armées mais de mauvais acteurs pour semer les logiciels malveillants. Un utilisateur moyen ne peut pas regarder ou donner un sens au fonctionnement interne d'une extension, et ne réalise que la folie lorsque les dégâts ont été causés.

La situation avec les compétences en IA dans les navigateurs est aussi transparente que possible. Comment fonctionne exactement une compétence est décrite en détail, en langage naturel et sans mises en garde cachées. Il vous suffit de le lire à fond, ou de le copier-le-coller et de créer le vôtre avec des modifications supplémentaires. Cette approche est flexible, beaucoup plus sûre et donne toute la puissance entre les mains des utilisateurs.

Les agents du navigateur sont là pour rester

Ensuite, nous avons des agents de navigateur. Navigateur d'opéra en a déjà mis en œuvre un, et il propose déjà une version plus avancée appelée opératrice. Ensuite, vous pouvez avoir des outils comme l'agent Chatgpt et le navigateur de comète de Perplexity. Considérez-le comme Siri, mais pour la navigation sur le Web.

Les agents sont plus adaptés aux tâches complexes et longues. Et ils fonctionnent mieux lorsqu'ils ont accès aux services que vous visitez quotidiennement, comme votre e-mail et votre calendrier. Par exemple, c'est ce que j'ai fait dans le navigateur de la comète de Perplexity hier soir:

«Vérifiez ma boîte de réception et mettez-moi une mise à jour sur toutes les demandes d'entrevue avec un scientifique ou un dirigeant d'entreprise que je comptais.

Sans ouvrir un autre onglet, l'assistant intégré est passé par ma boîte de réception Gmail, a recherché les e-mails pertinents, puis m'a fourni une liste de telles interactions dans une vue bien formulée. Pour plus de commodité, il comprenait même des liens Gmail en un clic afin que je puisse ouvrir directement cette chaîne de messagerie sans avoir à creuser manuellement.

C'est super pour beaucoup d'autres choses. Par exemple, lors d'un AMA Twitter, je lui ai simplement demandé de choisir les réponses par le haut-parleur et de les énumérer comme puces. Cela m'a évité beaucoup d'ouverture des allers-retours et de clôture des chaînes de conversation x.

Pour la planification des voyages, le shopping ou même la consommation de vidéos, l'assistant du navigateur Comet fonctionne bien. Le seul «ick» est que si vous en avez besoin pour faire plus de travail personnel, vous devrez donner accès aux connecteurs. Par exemple, pour gérer votre gmail, votre calendrier et votre conduite, vous devrez permettre l'accès.

Je l'ai également fait pour mon compte WhatsApp, et cela a très bien fonctionné dans le navigateur de comète. Tout le monde ne se sentira pas facile de le faire, et la prudence est totalement justifiée. Pour de tels scénarios, Google et OpenAI offrent des fonctionnalités agentiques similaires pour Gemini et Chatgpt, respectivement.

Il n'y a pas de retour

Juste la façon dont vous créez des compétences en DIA en tapant ou en narrant simplement vos besoins, Gemini et Chatgpt vous permettent également de créer des agents personnalisés pour des tâches spécifiques. Google les appelle des joyaux, tandis qu'Openai les appelle les GPT. Et oui, vous pouvez les partager comme des compétences. Les utiliser est gratuit, mais pour les créer, vous aurez besoin d'un abonnement qui coûte 20 € par mois.

J'ai créé de nombreux gemmes et GPT personnalisés pour accélérer mes tâches banales. Pour la publication sociale personnelle, j'ai créé un joyau qui décompose les articles que j'ai écrits en petits bits, qui sont ensuite publiés comme une chaîne sur X. De même, j'ai créé des agents personnalisés pour gérer mes e-mails.

L'un des joyaux a simplement besoin de moi pour taper «oui» ou «non», et il rédigera en conséquence une réponse polie tout en ramassant tout le contexte de l'e-mail. Avec les connecteurs entrant sur l'image, vous pouvez les relier à autant de services que vous le souhaitez.

La meilleure partie de ces joyaux est que vous pouvez également les utiliser sans effort sur un navigateur de bureau et des applications mobiles. Les extensions vous obligent à vous en tenir à un navigateur de bureau. Certains navigateurs mobiles prennent en charge les extensions, mais elles sont rares.

De plus, ils n'offrent pas la même flexibilité et la même tranquillité d'esprit que les compétences ou les agents du navigateur personnalisés créés par les utilisateurs. L'agent de Chatgpt et le projet Mariner de Google sont une nouvelle race d'assistants d'IA qui sont fabriqués sur mesure pour les tâches sur le Web, tout comme l'assistant construit dans le navigateur de comète de Perplexity.

Contrairement à une extension, ils peuvent gérer les workflows en plusieurs étapes et vous pouvez prendre le relais à n'importe quel stade. De plus, vous pouvez modifier le fonctionnement interne de votre automatisation de navigation Web et adapter les compétences en IA à vos spécifications exactes, ce qui n'est pas possible avec des extensions.

Bien sûr, ils ne sont pas parfaits. En même temps, vous pouvez le reprendre et terminer les choses quand il n'est pas en mesure de le faire parce qu'aucun agent d'IA n'est infaillible, surtout lorsque nous sommes à un moment où les modèles de raisonnement sont encore loin de la perfection », admet le PDG de Perplexity.

Mais le changement est clairement évident. Les extensions du navigateur ne vont pas disparaître du jour au lendemain, mais les agents de navigation et les compétences en IA créés par les utilisateurs vont prendre le relais. Ce n'est qu'une question de temps avant que les obstacles (lire: frais d'abonnement) ne baissent!

Rate this post
Total
0
Shares
Previous Post
Le MacBook M3 Pro est désormais inférieur à 1 500 $, mais ce ne sera pas le cas pour longtemps

Le MacBook M3 Pro est désormais inférieur à 1 500 €, mais ce ne sera pas le cas pour longtemps

Next Post
Il est temps pour une mise à niveau avec ce moniteur de jeu Samsung Oled - 500 $ de réduction!

Il est temps pour une mise à niveau avec ce moniteur de jeu Samsung Oled – 500 € de réduction!

Related Posts