Je laisse Gemini transformer des recherches complexes en podcasts. Je n'y retournerai jamais

Je laisse Gemini transformer des recherches complexes en podcasts. Je n'y retournerai jamais

Le décalage de Google Assistant, et dans l'ère des Gémeauxest presque dans ses dernières étapes. On peut se sentir nostalgique à propos de l'assistant virtuel éponyme, mais il est indéniable que l'arrivée des Gémeaux a vraiment changé ce qu'un agent d'IA peut faire pour nous.

Les côtelettes de compréhension du langage sont bien meilleures avec les Gémeaux. Les conversations sont naturellesLes interactions de l'application sont fluides, l'intégration avec d'autres produits Google est enrichissante, et même dans son gratuit État, Gemini prend Siri aux nettoyeurs même sur un iPhone.

Il y a cependant quelques astuces qui mettent les Gémeaux dans une ligue complètement différente. La recherche approfondie est l'une de ces caractéristiques agentiques que j'utilise quotidiennement et que je continue à être étonné. En mars, Google a ajouté une autre fonctionnalité enrichissante au Gemini Arsenal: Présentation audio.

Tourner tout cela, en podcast

Imaginez transformer vos documents ternes, votre document de recherche ouvertement complexe ou votre matériel de lecture académique en un chat de podcast bidirectionnel vivant. C'est essentiellement le sujet des aperçus audio. La fonctionnalité est arrivée pour la première fois sur le Notebooklm profondément sous-estimé de Google et a finalement été porté sur l'expérience de base des Gémeaux sur le mobile et le Web.

Vous n'avez pas à passer par des cerceaux techniques ou à écrire une invite de texte hyper spécifique pour obtenir ces relookings audio. Téléchargez simplement un fichier à partir du sélecteur de pièce jointe, et vous verrez une puce «générer une vue d'ensemble audio» apparaître juste au-dessus de la boîte de chat. Appuyez dessus et la génération de podcast commencera.

Cela peut prendre quelques minutes pour terminer, mais en attendant, vous pouvez passer en toute sécurité à une autre application (ou fenêtre). Une fois le processus terminé, vous obtiendrez une notification sur le fait que le podcast soit prêt pour votre plaisir d'écoute ou partage avec d'autres personnes.

L'aperçu de l'audio est généralement un chat à deux personnes et fluide sur un ton étrangement naturel. J'ai presque l'impression que vous discutez avec Gemini Live, qui se sent lui-même dramatiquement plus naturel que n'importe quel chatbot IA que j'ai utilisé jusqu'à présent en mode conversation vocale.

Ces podcasts générés par l'IA sont généralement assez bien faits, je dirais. Mais je gravite vers eux pour deux raisons. Tout d'abord, je regarde un écran, je lis des articles pour la recherche et j'écris mes propres affaires, à peu près toute la journée.

Création du podcast Gemini en cours.

Cela laisse peu de place pour s'engager avec tout autre matériel textuel, que ce soit académique, lié au travail ou même récréatif. Cependant, si je pouvais simplement changer le mode sensoriel pour m'engager avec ce matériau, ma fatigue de lecture prend un siège arrière.

Les podcasts audio offrent une toute nouvelle façon de s'engager avec du matériel textuel de manière plus immersive. Cela nous amène au deuxième avantage, qui est une stimulation sensorielle ou une variance. Cette formule a été bien documentée et expérimentée, dans le domaine du monde universitaire et du coaching professionnel.

Comment ça m'a aidé?

La fatigue du texte fait des ravages. Cela fait que un travail excitant apparaît même comme une corvée que vous devez passer, simplement parce que vous ne pouvez pas vous permettre de le manquer. Cependant, s'engager avec le même travail ou son essence, à travers un média sensoriel différent supprime que la peur de surcharger sur un matériau plus basé sur le texte. Cela aide en fait de quelques autres manières.

«L'engagement de plusieurs sens renforce la mémoire. Lorsque nous écoutons et interagissons – que ce soit en lecture, en écrivant ou en faisant – le cerveau établit des connexions plus fortes, ce qui facilite le rappel plus tard», explique Yasir Naseem, un expert en linguistique dont le travail de recherche s'est concentré sur la modernisation et la gamification des méthodologies d'enseignement.

Naseem, qui est actuellement un expert du programme d'études dans une entreprise de technologie ED-Tech, me dit que vous ne pouvez pas vous fier uniquement à un seul support pour l'apprentissage. Au lieu de cela, me dit-il, vous devez combiner différentes méthodes pour un avantage maximal, allant de l'effet sentimental à la rétention de la mémoire.

Gémeaux créant une vue d'ensemble audio.

Recherche publiée dans Ordinateurs et éducation Journal a également souligné comment les étudiants ont trouvé que les fichiers audio étaient le matériel d'apprentissage et de révision supérieur. La flexibilité et la polyvalence sensorielle ont joué un rôle majeur dans leur préférence pour les podcasts sur d'autres médias.

«La véritable compréhension et la rétention à long terme se produisent lorsque l'écoute est associée à des visuels, des discussions ou des activités pratiques», ajoute Naseem. Mes propres expériences avec les aperçus audio de Gemini font écho à ses conseils. J'ai un souvenir plus fort des connaissances que j'ai absorbées via les podcasts audio par rapport à la lecture du même matériau.

Vous voyez, ces podcasts audio ne sont pas une simple conversion text-to audio. Au lieu de cela, ils décomposent un mur de texte autrement ennuyeux en une conversation à deux personnes à laquelle vous êtes essentiellement le seul public. C'est une aubaine pour tout matériau textuel qui ne déclenche pas instantanément votre curiosité et vous engage dans une lecture instantanée.

Dans ma dernière expérience, le podcast audio de Gemini m'a aidé à comprendre la signification d'un article discutant «d'un cadre pour l'apprentissage neuronal interprétable basé sur les fonctions locales de l'information-théorique». En termes plus simples, la recherche a expliqué comment les cellules nerveuses s'organisent.

Vous obtenez le point que j'essaie de faire faire ici, non?

Commodité, surtout

Gemini AI créant un podcast audio hors du document de recherche.

La commodité joue un rôle important lorsqu'il s'agit d'absorber des informations. Et il en va de même pour l'enthousiasme et l'excitation pour tout le processus. Selon un article publié dans le Ordinateurs dans le comportement humain Journal, podcasts «Améliorez la commodité, la flexibilité et l'accessibilité aux informations et aux connaissances». Il ne m'a pas fallu longtemps pour le réaliser.

Vivre dans la capitale nationale, passer entre 2 et 3 heures coincé dans un trafic ou un trajet public est une réalité quotidienne pour moi. Mais plus que l'inconfort de tout cela, c'est le temps perdu qui fait le plus mal. Le matériel d'apprentissage audio offre le moyen le plus pratique d'utiliser cette période de manière productive.

Avec les Gémeaux, vous avez un autre avantage crucial. Vous n'avez pas à compter sur la disponibilité audio d'un certain livre, article de presse ou matériel académique. Vous pouvez simplement télécharger tout le matériel à votre disposition, et Gemini le transformera en une conversation de style podcast.

Il existe de nombreuses recherches multidisciplinaires qui soutiennent les avantages d'une approche audio de l'apprentissage. Et il ne s'agit pas uniquement de l'écoute, mais plutôt de décomposer les choses et de les présenter de manière plus accessible.

« Quelques gens ont dit … ils aiment le fait que nous leur donnons des trucs qu'ils ne lisent pas dans le journal. Ils aiment le fait … nous essayons de nous présenter d'une manière différente », explique un document de recherche citant un rédacteur en chef. Le document, gracieuseté de l'Université de Syracuse, a été publié en 2006 au tout début de la tendance du podcast.

Génération du podcast de survie audio dans Gemini.

En 2025, les podcasts sont devenus un véritable phénomène pour consommer des informations, du matériel éducatif aux trucs de divertissement. Selon le Pew Research Centerprès de la moitié des Américains se sont engagés avec des podcasts. Plus de la moitié du public interrogé a écouté des podcasts pour l'apprentissage, pour le divertissement ou pour avoir du matériel audio tout en faisant autre chose.

Près d'un troisième voulait entendre les opinions des autres, et un autre segment tout aussi important était connecté afin qu'ils puissent garder un œil sur les nouvelles et les événements actuels. Mon engagement n'est pas tombé trop loin du schéma susmentionné. Pour les histoires de journalisme long ou les travaux d'investigation, j'ai souvent trouvé leur version de podcast plus agréable.

Plus efficace aussi

Fait intéressant, les podcasts semblaient également conduire des changements pratiques. Environ les deux tiers des auditeurs se sont engagés dans un livre ou un film après avoir entendu un podcast, plus de la moitié du public a commencé à suivre une personne sur les réseaux sociaux, et un tiers d'entre eux ont fait des changements de style de vie tels que la prise de l'exercice ou le changement de régime.

Recherche publiée dans le Journal of Social Media Marketing Des concepts ont mis en évidence des concepts tels que la substitution des médias et la similitude fonctionnelle dans le contexte de l'écoute des médias et de la volonté du public. L'idée globale est que les utilisateurs évaluent le médium et choisissent celui qui leur convient le plus.

«Pour le caractère unique des contenus de podcast, l'influence sur la volonté d'écoute et la substitution des médias est positive, ce qui suggère que le contenu unique, la grande qualité et la diversité de grande envergure donnent envie aux podcasts d'écouter», explique le journal. Je peux également attester personnellement de cette constatation.

pic.twitter.com/mhdugg1zdg

– Nadeémonics (@nsnadeemsarwar) 30 mars 2025

Au cours des derniers jours, j'ai «« irifié »de nombreux documents de recherche discutant de l'impact des fibres, de la viande et de la consommation alimentaire emballée sur les habitudes de sommeil, la santé cognitive et la santé intestinale. Comparé au ton ouvertement technique des articles scientifiques, deux hôtes décomposent les résultats avec un ton «sentimental» et «persuasif» a eu un effet de manière discernable sur moi.

Considérez-le comme un apprentissage sur les étiquettes sociales ou les sensibilités culturelles dans un livre. Et des années plus tard, les voir en action de vos propres yeux. Ou, pensez à apprendre une langue étrangère à partir d'un livre, le tout par vous-même, et la différence que cela fait lorsque vous l'apprenez d'une personne remplissant toutes ces connaissances dans vos oreilles.

Cette dernière approche récolte de meilleurs résultats. Et c'est principalement parce que l'effet composé de l'engagement multisensoriel accélère le processus d'apprentissage, ou le rend plus efficace. Les aperçus audio de Gemini ont créé un effet similaire, et ils m'ont beaucoup aidé.

Quelques accrocs

Aussi productif que tout cela puisse paraître, les aperçus audio de Gemini ne le sont pas. Ils peuvent vider la véritable essence d'une histoire écrite avec goût dans ses efforts de «podcasti-fication», ou manquer quelques petits détails. Il y a aussi quelques bizarreries fonctionnelles. La longueur de la vue d'ensemble audio, qui correspond directement à la profondeur du matériau source, peut être assez aléatoire.

Réponse fournie par Gemini Deep Research.

Par exemple, lorsque je lui ai nourri un livre de 260 pages sur le sujet des conjugaisons et de la morphologie des verbes dans la langue perse, l'aperçu de l'audio généré par les Gémeaux était un peu plus de sept minutes. Qualitativement, il a couvert les pièces les plus cruciales, mais a raté les détails les plus fins.

Dans un autre cas, j'ai transformé un document de recherche en profondeur d'une valeur de quatre pages en podcast audio. La durée de celle-ci était d'environ 13 minutes. Malheureusement, la puce de tâche automatique de Gemini ne vous permettra pas d'ajuster la longueur ou la profondeur conversationnelle de la vue d'ensemble audio.

Si vous utilisez Google NoteBookLM, où la fonctionnalité de vue d'ensemble de l'audio est apparue pour la première fois, vous pouvez écrire une invite qui peut dicter la profondeur de la conversation du podcast. J'ai généré un podcast audio avec un fonctionnement de 59 sur Notebooklm il y a quelques semaines.

Gemini ne vous laissera pas faire ça. Pas encore.

Première étape du traitement des Gémeaux d'un PDF dans des fichiers par Google App.

Ensuite, nous avons la barrière linguistique, car Google est actuellement en train de régler l'ensemble du pipeline au-delà de l'anglais. Un autre problème était la prononciation anglicisée. Par exemple, l'hôte du podcast AI a mal prononcé le monde persan «RAF-mince» comme «RAAF-Tin».

À une oreille non formée qui ne connaît pas les nuances bilingues de la traduction anglaise-personne, ou comment les accents changent la perception auditive des mots dans une langue différente, les hôtes du podcast IA pourraient très bien cracher du charabia total.

La somme totale de mes expériences est que les aperçus audio Gemini ne sont pas une révolution. Ils offrent simplement un support différent et plus captivant, pour s'engager avec le contenu. Cela ne fonctionne pas tout le temps, mais cela prend certainement l'ennui de lire des pages de texte qui vous endormiraient autrement.

Rate this post
Total
0
Shares
Previous Post
Regarder un écran au lit ruine le sommeil pour nous tous

Regarder un écran au lit ruine le sommeil pour nous tous

Next Post
Gemini dans Google Maps vous permet maintenant de planifier des vacances à partir de captures d'écran

Gemini dans Google Maps vous permet maintenant de planifier des vacances à partir de captures d'écran

Related Posts