Cette étude sur la créativité de l'IA montre que vous pouvez toujours la battre, si vous êtes au premier rang

Cette étude sur la créativité de l'IA montre que vous pouvez toujours la battre, si vous êtes au premier rang

L’IA générative vient de franchir une nouvelle barre en matière de créativité, du moins pour la personne moyenne. Cette étude sur la créativité de l'IA a comparé les résultats de plus de 100 000 personnes avec plusieurs grands modèles de langage, notamment ChatGPT, Claude et Gemini, et a révélé que certains modèles peuvent surpasser un humain typique sur une tâche de créativité standardisée.

Mais le plafond a toujours un aspect humain. L'étude révèle que la moitié des participants la plus créative a surpassé tous les modèles d'IA testés, et que les 10 % les plus performants ont encore élargi leur avance.

L'IA s'améliore dans la réalisation des tâches créatives de base, tandis que la production humaine exceptionnelle maintient un écart difficile à combler.

Le test derrière la réclamation

Les chercheurs se sont appuyés sur la tâche d'association divergente, une invite rapide qui demande dix mots aussi éloignés que possible les uns des autres. Les scores augmentent lorsque ces mots sont sémantiquement plus éloignés, et la plupart des gens terminent en quelques minutes.

Cette simplicité est la raison pour laquelle l’équipe a pu effectuer une comparaison aussi vaste. Cela aide également à expliquer le résultat du titre, les modèles peuvent être ajustés pour générer un large choix de mots à la demande, qui correspondent parfaitement aux récompenses DAT.

Pourtant, le DAT mesure une tranche de créativité, la capacité à produire un langage divergent. Il ne mesure pas le goût, l'impact émotionnel ou si une idée est la bonne pour un public spécifique.

Où les humains gardent un avantage

Le signal le plus fort des résultats n’est pas celui d’un seul gagnant, c’est le spread. Certains systèmes d’IA peuvent battre le milieu du peloton, mais les humains ayant des scores élevés se séparent et la séparation s’accroît au sommet.

Au quotidien, les mannequins excellent en volume. Si vous avez besoin de dix directions rapidement, cela peut vous livrer. Ce qu'il ne peut pas faire de manière fiable, c'est la partie sélective, choisir la direction qui mérite d'être poursuivie, la façonner en fonction des contraintes et lui donner l'impression d'être intentionnel plutôt que simplement plausible.

C'est aussi pourquoi ce résultat ne doit pas être interprété comme un verdict sur les carrières créatives. Le benchmark montre la plage d'idéation. Il ne montre pas de jugement sous pression, ni le genre d'originalité qui change ce que le public attend.

Que faire avec ça

L'équipe a également comparé des personnes et des modèles sur des tâches de style d'écriture créative, notamment des haïkus, des résumés d'intrigue et des histoires courtes, qui ressemblent mieux au nombre de personnes qui utilisent ChatGPT. Même là, les meilleurs créateurs humains ont conservé l’avantage.

Si vous utilisez l'IA au travail, considérez-la comme un accélérateur d'idéation. Utilisez-le pour générer de la largeur, puis appliquez la partie qui vous sépare encore, décidez ce qui correspond à votre voix, ce qui correspond au brief et ce qui vaut la peine d'être expédié.

Gardez un œil sur les suivis qui déterminent les versions exactes des modèles et les dates de test, car ce type de classement peut évoluer rapidement à mesure que les modèles changent.

Rate this post
Total
0
Shares
Previous Post
La banque d'alimentation sans fil Qi2 de Samsung offre une capacité de 5 000 mAh à un prix élevé

La banque d'alimentation sans fil Qi2 de Samsung offre une capacité de 5 000 mAh à un prix élevé

Next Post
Vous pouvez enfin acheter le scandaleux moniteur OLED 720 Hz d'ASUS

Vous pouvez enfin acheter le scandaleux moniteur OLED 720 Hz d'ASUS

Related Posts