Apple nous a promis un Siri plus intelligent et plus performant lors de la WWDC 2024. Le discours était convaincant : un Siri qui comprend votre contexte personnel, fouille dans vos messages et e-mails, effectue des actions dans vos applications et évolue vers un véritable assistant.
Deux ans plus tard, ce rêve reste toujours un rêve. Mais voici ce qui pourrait changer le cap de l'assistant d'Apple. Selon certaines informations, Siri n’est plus lié à un seul cerveau d’IA. Apple le construit pour qu'il soit flexible, capable d'acheminer les demandes vers le modèle externe qui fait le mieux le travail.
Cela m'a fait poser une question. Si Siri peut utiliser n’importe quelle IA, laquelle doit-il utiliser ? À l'heure actuelle, le modèle externe par défaut est ChatGPT. Mais je dirais que les Gémeaux sont le choix le plus logique, et voici pourquoi.
Siri est un moteur de recherche
Pensez à la façon dont vous utilisez réellement Siri au quotidien. Vous demandez la météo du jour. Vous demandez les restaurants les plus proches de chez vous. Vous lui demandez de rechercher des choses sur le Web. Une partie importante de l'utilisation de Siri implique des requêtes de recherche ou de type recherche, et aucune entreprise sur la planète ne fait de recherches mieux que Google.
Google a passé des décennies à créer le moteur de recherche le plus puissant, et cette expertise est désormais directement intégrée à Gemini. Lorsque vous demandez quelque chose à Gemini, cela ne s’appuie pas uniquement sur un modèle de langage. Il extrait les données de l'index Web en temps réel de Google, de Google Maps, de Google Shopping, etc.


L'utiliser pour alimenter la capacité de recherche de Siri lui permettra d'atteindre de nouveaux sommets qu'aucun autre fournisseur LLM ne peut égaler.
Apple a promis l'intelligence personnelle, mais Gemini la tient
L’un des principaux sujets de discussion lors de l’annonce d’Apple à la WWDC 2024 était l’intelligence personnelle. Apple a montré à Siri des informations contextuelles provenant de vos applications, répondant à des questions telles que « quand l'avion de ma mère atterrit-il ? » ou « montre-moi des photos de Stacy dans son manteau rose de New York ».


C'était vraiment impressionnant sous forme de démo. Cependant, si je lui demande de me montrer une photo de moi portant un t-shirt noir, il montre des photos aléatoires de personnes du Web portant des t-shirts noirs. Je n'exagère pas lorsque je dis que la fonction d'intelligence personnelle de Siri a été un échec colossal.


Pendant ce temps, Gemini a discrètement déployé sa propre fonctionnalité de renseignement personnel. Il exploite votre Gmail, votre calendrier, Google Photos, Drive et bien plus encore pour raisonner sur vos données personnelles et répondre à des questions complexes liées au contexte de la vie. Ce n'est pas parfait, mais au moins ça marche.


C'est presque mot pour mot ce qu'Apple présentait comme une future fonctionnalité Siri, sauf que Gemini le fait aujourd'hui. Si Apple souhaite accélérer la fourniture de ces fonctionnalités aux utilisateurs, Gemini pourrait être le raccourci dont ils ont besoin.
Les Gémeaux font déjà ce que Siri a promis
Apple Intelligence déploie un modèle d'IA compact et performant dans les applications système, combinant le traitement sur l'appareil pour la confidentialité avec l'informatique dans le cloud pour les tâches plus exigeantes. Les aspects de traitement sur l’appareil et de confidentialité sont ce qui distingue Apple de la concurrence. Mais il n'est plus seul désormais.


Gemini Nano le fait déjà sur les appareils Pixel et Samsung Galaxy. Il permet un résumé hors ligne, des réponses intelligentes et des fonctionnalités contextuelles, le tout sans avoir besoin d'une connexion Internet. Sur le Pixel 9 et les versions ultérieures, Gemini Nano est multimodal et peut traiter des images, des textes et des langues directement sur l'appareil.


Apple s'appuie sur ce que Google a déjà livré. Plutôt que de réinventer cette roue, utiliser le déploiement Nano existant de Gemini comme base pour les fonctionnalités Siri sur l'appareil permettrait à Apple d'économiser beaucoup de maux de tête et d'argent.
La boîte à outils créative de Gemini est remplie
C'est ici que cela devient vraiment excitant. Les Gémeaux ne sont pas seulement un modèle de texte. Il est livré avec tout un écosystème créatif dans lequel Apple pourrait exploiter.
Veo gère la génération vidéo jusqu'à 1080p, avec des styles cinématographiques et des clips de plus d'une minute. Lyria, de Google DeepMind, gère la génération de musique et d'audio. Pour les images, Nano Banana (le service de génération d'images de Google) a récemment reçu une mise à niveau majeure, avec un rendu du texte amélioré, une cohérence du sujet et une prise en charge de tous les formats d'image.


Apple a récemment lancé son propre Creator Studio, permettant aux utilisateurs d'accéder à des outils de création moyennant un abonnement mensuel fixe. Si l’entreprise souhaite sérieusement concurrencer Adobe, elle doit offrir des capacités génératives. Devinez quoi, Gemini possède déjà toutes ces capacités, et il serait parfaitement logique de l'intégrer à la suite créative d'Apple.


Le partenariat existe déjà
Ce point n'est pas assez discuté. Google paierait à Apple environ 20 milliards de dollars chaque année pour rester le moteur de recherche par défaut dans Safari. Il s’agit de l’un des accords de distribution les plus précieux de l’histoire de la technologie. La relation entre Apple et Google est profonde, de longue date et financièrement énorme pour les deux sociétés.
Étendre cette relation de « Google alimente la recherche Safari » à « Gemini alimente les fonctionnalités d'IA de Siri » n'est pas un pas spectaculaire. Il s'agit d'une évolution naturelle d'un partenariat qui gère la moitié de ce qui se passe lorsque vous ouvrez un navigateur sur votre iPhone.
Alors, quel modèle devrais-je retenir ?
Claude est excellent pour la lecture de contextes longs et le raisonnement nuancé. ChatGPT dispose d'un écosystème massif et d'outils de codage et d'agent puissants. Les deux fonctionnent très bien en tant que spécialistes choisis par les utilisateurs. J'utilise moi-même Claude sur mon ordinateur.
Mais comme moteur par défaut sous le capot de Siri ? Ce n’est pas le bon choix. Gemini fonctionne au niveau du système d'exploitation sur mobile, comprend les recherches et les contextes personnels, existe dans un format Nano sur l'appareil et se situe au centre de la relation commerciale la plus importante qu'Apple entretient avec toute entreprise technologique.
Les pièces sont toutes là. Il ne s’agit pas de savoir si Gemini pourrait alimenter un Siri plus intelligent. La question est de savoir si Google et Apple peuvent conclure un accord mutuellement avantageux. Et si l’on en croit les rumeurs, les choses pourraient déjà aller dans cette direction.








