Deepseek: Tout ce que vous devez savoir sur l'IA qui a détrôné le chatpt

Deepseek: Tout ce que vous devez savoir sur l'IA qui a détrôné le chatpt

Une startup de l'âge d'un an hors de la Chine prend d'assaut l'industrie de l'IA après avoir publié un chatbot qui rivalise avec les performances de Chatgpt Tout en utilisant une fraction de la puissance, du refroidissement et des dépenses de formation de ce que demandent les systèmes OpenAI, Google et Anthropic. Voici tout ce que vous devez savoir sur les modèles V3 et R1 de Deepseek et pourquoi l'entreprise pourrait fondamentalement bouleverser les ambitions de l'IA d'Amérique.

Qu'est-ce que Deepseek?

Deepseek (techniquement, «Hangzhou Deepseek Artificial Intelligence Basic Technology Research Co., Ltd.») est une startup de l'IA chinoise qui a été initialement fondée en tant que laboratoire d'IA pour sa société mère, High-Flyer, en avril 2023. a été transféré dans sa propre entreprise (avec un voleur à hauteur en tant qu'investisseur) et a également publié son modèle Deepseek-V2. V2 a offert des performances à égalité avec les autres principales sociétés d'IA chinois, telles que Bytedance, Tencent et Baidu, mais à un coût d'exploitation beaucoup plus bas.

L'entreprise a suivi la publication de la V3 en décembre 2024. V3 est un modèle de 671 milliards de paramètres qui aurait mis moins de 2 mois à s'entraîner. De plus, selon une analyse récente de Jeffries, le «coût de formation de Deepseek de seulement 5,6 millions de dollars américains (en supposant un coût de location de 2 € / h 800 heures). Cela représente moins de 10% du coût du lama de Meta. » C'est une petite fraction des centaines de millions à des milliards de dollars que les entreprises américaines comme Google, Microsoft, Xai et Openai ont dépensé leurs modèles.

🚀 Présentation de Deepseek-V3!

Le plus grand bond en avant à ce jour:
⚡ 60 jetons / seconde (3x plus vite que V2!)
💪 Capacités améliorées
🛠 Compatibilité de l'API intacte
🌍 Modèles entièrement open source & amp; papiers

🐋 1 / n pic.twitter.com/p1dv9gj2sd

& mdash; Deepseek (@deepseek_ai) 26 décembre 2024

Les tests de référence mettent les performances de V3 à égalité avec GPT-4O et Claude 3.5 Sonnet. Un éditorial de décembre 2024 dans la colline Catégorisé le succès de Deepseek comme le «moment Spoutnik» américain.

Deepseek a publié son modèle R1-Lite-Preview en novembre 2024, affirmant que le nouveau modèle pouvait surpasser la famille O1 d'Openai de modèles de raisonnement (et le faire à une fraction du prix). La société estime que le modèle R1 est compris entre 20 et 50 fois moins cher à exécuter, selon la tâche, que l'O1 d'OpenAI. Deepseek a ensuite publié Deepseek-R1 et Deepseek-R1-Zero en janvier 2025. Le modèle R1, contrairement à son rival O1, est open source, ce qui signifie que tout développeur peut l'utiliser.

En tant que tels, V3 et R1 ont explosé en popularité depuis leur sortie, avec l'assistant AI à V3 de Deepseek déplaçant le chatpt en haut des magasins d'applications. Le capital-risqueur Marc Andreesen, dans un récent article sur les réseaux sociaux, a appelé le chatbot de Deepseek «L'une des percées les plus incroyables et les plus impressionnantes que j'ai jamais vues» et un «cadeau profond au monde».

Que peut faire Deepseek?

En tant que modèle de grande langue open source, les chatbots de Deepseek peuvent faire essentiellement tout ce que le chatppt, les gemini et Claude peuvent. Cela inclut le texte, l'audio, l'image et la génération vidéo. De plus, la famille de modèles multimodales nouvellement publiée de Deepseek, surnommée Janus Prosurpasse aurait Dall-E 3 ainsi que Pixart-Alpha, EU3-Gen et STABLE DIFUSION XL, sur une paire de références de l'industrie. Deepseek-R1, rivalisant avec O1, est spécifiquement conçu pour effectuer des tâches de raisonnement complexes, tout en générant des solutions étape par étape aux problèmes et en établissant des «chaînes de pensée logiques», où il explique son processus de raisonnement étape par étape lors de la résolution d'un problème .

Oh garçon #deepseek

& mdash; Alexios Mantzarlis (@ Mantzarlis.com) 2025-01-27T16: 50: 40.640Z

Ce que les produits de Deepseek ne peuvent pas faire, c'est de parler de Tienanmen Square. Ou les manifestations du parapluie jaune. Ou la ressemblance du président Xi Jinping avec Winnie l'Ourson. Fondamentalement, s'il s'agit d'un sujet considéré comme Verboten par le Parti communiste chinois, les chatbots de Deepseek ne s'adresseront pas ou ne s'engageront pas de manière significative.

Qui peut utiliser Deepseek?

En tant que LLM open-source, le modèle de Deepseek peut être utilisé gratuitement par n'importe quel développeur. OpenAI facture 200 € par mois pour l'abonnement Pro nécessaire pour accéder à l'O1. Les modèles de Deepseek sont disponibles sur le Web, via l'API de l'entreprise et via des applications mobiles. Vous devrez vous inscrire à un compte gratuit sur le site Web Deepseek Afin de l'utiliser, la société a temporairement interrompu de nouvelles inscriptions En réponse aux «attaques malveillantes à grande échelle contre les services de Deepseek». Les utilisateurs existants peuvent se connecter et utiliser la plate-forme comme d'habitude, mais il n'y a pas encore de mot sur le moment où les nouveaux utilisateurs pourront essayer Deepseek pour eux-mêmes.

Pourquoi Deepseek est-il soudainement si important?

Depuis la sortie de Chatgpt en novembre 2023, les sociétés américaines d'IA ont été axées sur le laser sur la création de modèles de langage de grande envergure plus grands, plus puissants, plus vastes, plus de puissance et à forte intensité de ressources. Plutôt que de chercher à construire des LLM plus rentables et économes en énergie, des entreprises comme Openai, Microsoft, Anthropic et Google ont plutôt jugé bon à forcer brutal la progression de la technologie par, dans la tradition américaine, en jetant simplement des quantités absurdes d'argent et de ressources au problème. Rien qu'en 2024, le PDG de XAI, Elon Musk, devait dépenser personnellement plus de 10 milliards de dollars pour les initiatives d'IA. Openai et ses partenaires viennent d'annoncer une initiative de Stargate de 500 milliards de dollars qui accélérerait considérablement la construction de services publics d'énergie verte et de centres de données d'IA aux États-Unis. Google prévoit de hiérarchiser la mise à l'échelle de la plate-forme Gemini tout au long de 2025selon le PDG Sundar Pichai, et devrait dépenser des milliards cette année dans la poursuite de cet objectif. Meta a annoncé à la mi-janvier qu'elle dépenserait jusqu'à 65 milliards de dollars cette année sur le développement de l'IA.

Deepseek vient de montrer au monde que rien de tout cela n'est réellement nécessaire – que le «boom de l'IA» qui a aidé à stimuler l'économie américaine ces derniers mois et qui a rendu les sociétés GPU comme Nvidia exponentiellement plus riches qu'en octobre 2023, pourrait être rien de plus qu'une imposture. Il remet également en question à quel point la tête des États-Unis a réellement en IA, malgré l'interdiction à plusieurs reprises des expéditions de GPU de pointe vers la Chine Au cours de la dernière année.

« L'essentiel est que la surperformance américaine a été motivée par la technologie et l'exemple que les entreprises américaines ont en IA », a déclaré Keith Lerner, analyste chez TRUIST, à CNN. «Le déploiement du modèle Deepseek conduit les investisseurs à remettre en question l'exemple que les entreprises américaines ont et combien est dépensé et si ces dépenses entraîneront des bénéfices (ou des dépenses excessives).»

En bref, Deepseek vient de battre l'industrie américaine de l'IA à son propre jeu, montrant que le mantra actuel de «croissance à tout prix» n'est plus valable. « Deepseek n'a clairement pas accès à autant de calculs que les hyperscaleurs américains et a réussi à développer un modèle qui semble très compétitif », a déclaré à Raymond James Srini Pajuri, analyste semi-conducteur chez Raymond James, CNBC. Si une startup chinoise peut construire un modèle d'IA qui fonctionne aussi bien que les plus récents et les plus grands d'Openai, et le faire en moins de deux mois et pour moins de 6 millions de dollars, alors à quoi sert Sam Altman?

« Le temps nous dira si la menace en profondeur est réelle – la course est sur ce que fonctionne la technologie et comment les grands joueurs occidentaux réagiront et évolueront », a déclaré à CNN Michael Block, stratège de Market. « Les marchés étaient devenus trop complaisants au début de l'ère Trump 2.0 et avaient peut-être cherché une excuse pour reculer – et ils en ont obtenu un excellent ici. »

Rate this post
Total
0
Shares
Previous Post
DLSS 4 de Nvidia vient de venir à votre ancien GPU - voici ce que vous pouvez utiliser

DLSS 4 de Nvidia vient de venir à votre ancien GPU – voici ce que vous pouvez utiliser

Next Post
Cet élégant metroidvania est le premier vrai concurrent du jeu de l'année de 2025

Cet élégant metroidvania est le premier vrai concurrent du jeu de l'année de 2025

Related Posts