DeepSeek R2: un nouveau modèle open source révolutionnaire

La sortie publique de DeepSeek R1 en janvier 2025 a profondément transformé le paysage de l'IA. Aujourd'hui, je vais vous parler de la prochaine étape de l'évolution de DeepSeek, et peut-être de la prochaine avancée majeure de l'IA telle que nous la connaissons : DeepSeek R2 .

Progrès récents de DeepSeek

Ce sujet est certes passé inaperçu, mais l'équipe de recherche de DeepSeek a récemment organisé une Semaine Open Source. À cette occasion, l'équipe a publié cinq dépôts open DeepSeek pour présenter ses récents progrès et avancées en matière d'IA.

Les trois outils les plus remarquables sont :

FlashMLA : Il s'agit d'un noyau de décodage MLA efficace pour les GPU Hopper.
DeepEP : La toute première bibliothèque de communication pour la formation et l'inférence de modèles MoE.
DeepGEMM : une bibliothèque GEMM FP8 qui fonctionne avec les GEMM denses et MoE.

Alors, qu'est-ce que tout cela signifie réellement ?

Eh bien, tous ces outils sont conçus pour faciliter et optimiser le développement et la rationalisation des futurs modèles et produits d'IA. Ce qui m'amène au sujet principal de la discussion : DeepSeek R2.

DeepSeek R2: la prochaine évolution de l'IA

L'événement Open-Source Week de DeepSeek et les produits qui y sont présentés s'inscrivent parfaitement dans la prochaine sortie du très attendu modèle Reasoning 2 ou R2 de la société, qui devrait être une mise à niveau majeure par rapport au précédent modèle DeepSeek R1.

Pour tous ceux qui n'ont pas suivi les actualités et les publications liées à DeepSeek, je vais vous expliquer les bases :

DeepSeek R1 a été développé en Chine et lancé début 2025. Ce fut un événement majeur dans le monde de l'IA, et il a en partie entraîné la vente de plus de 1 000 milliards de dollars sur le marché boursier mondial. Pourquoi ? Parce que R1 était un modèle révolutionnaire et avancé, largement capable de rivaliser avec les meilleurs modèles d'IA des grandes marques occidentales.

Les tests ont montré qu'il était, dans de nombreux domaines, équivalent ou supérieur à des produits comme :

Claude
GPT-4o
OpenAI-o1-mini
Et bien d'autres

Elle a réussi tout cela tout en étant open source et en accès libre. C'était révolutionnaire à l'époque, et j'étais l'un des nombreux passionnés d'IA à travers le monde à être époustouflés par cette histoire : une petite start-up chinoise avait réussi à atteindre le même niveau d'excellence technologique que de grandes marques multimilliardaires comme OpenAI.

Mais il n’a pas fallu longtemps après la sortie de R1 pour que moi et beaucoup d’autres nous demandions : « Quelle est la prochaine étape ? »

Un rapport Reuters a récemment été publié, révélant que l'équipe de développement de DeepSeek est pressée de déployer le modèle R2 d'ici mai. Nous pourrions donc l'obtenir très bientôt, et je peux vous l'assurer : ce nouveau modèle va révolutionner le paysage de l'IA encore plus radicalement que R1.

L'impact de R2

Voici ce que j'attends de R2 :

Ce sera extrêmement bon marché, tout comme R1
Il égalera ou même surpassera les principaux modèles comme o3-full ou o3-high d'OpenAI
Il surpassera presque tous les autres modèles du marché

Et cela arrive très bientôt, si l'on en croit les derniers rapports. L'équipe de Hangzhou qui travaille sur DeepSeek semble impatiente de le sortir, et je prédis personnellement qu'il pourrait sortir juste après les vacances de la fête chinoise de Qingming, le 6 mai. Alors, gardez un œil sur vos agendas.

L'équipe DeepSeek s'attacherait également à produire un code de meilleure qualité et des performances accrues dans diverses langues, et pas seulement en anglais et en chinois, qui étaient les priorités et les options par défaut de la version R1. Cela est logique, car DeepSeek R1 a rencontré un succès mondial et les utilisateurs souhaiteront interagir avec la version R2 en espagnol, français, russe, etc.

Il suffit de se pencher sur l'impact de R1 pour prédire l'impact potentiel de R2 sur les marchés mondiaux. La sortie de R1 a entraîné une chute massive des marchés boursiers, avec des chutes de l'action NVIDIA, des cryptomonnaies et des actions mondiales dans les jours qui ont suivi. J'en étais impressionné à l'époque, car nous n'avions pratiquement jamais rien vu de tel auparavant.

Pourquoi cela s'est-il produit exactement ? En partie parce que R1 a été conçu à partir de puces NVIDIA moins puissantes et plus anciennes, et non des plus récentes. La technologie NVIDIA la plus récente est donc devenue moins intéressante et moins impressionnante de ce point de vue. Elle a également entraîné une forte concurrence pour les grands géants occidentaux de l'IA, entraînant une baisse de leur valorisation et de celle de leurs produits.

Le lancement de R2 pourrait avoir un impact similaire. Il pourrait perturber la domination des grandes entreprises d'IA comme OpenAI et Google, bouleversant une fois de plus le paysage et prouvant qu'il n'est pas forcément nécessaire d'utiliser les puces et autres composants matériels les plus récents et les plus performants pour créer des modèles d'IA exceptionnels.

Le secret du succès de DeepSeek

À ce stade, vous vous demandez peut-être quel est le secret de l'incroyable réussite de DeepSeek ? Eh bien, je crois avoir la réponse. La clé du succès de DeepSeek réside dans sa rapidité d'innovation en matière de développement de l'IA, son audace à sortir des sentiers battus et à se démarquer des grandes entreprises établies.

Innovation technologique

Une grande partie de ce projet a consisté en un investissement massif dans l'informatique. La société mère de DeepSeek a investi massivement dans l'achat de matériel informatique, notamment des clusters de supercalcul de pointe, comme Firefly, qui utilise des milliers de puces NVIDIA 800 à un coût bien inférieur à celui des puces les plus récentes, permettant à DeepSeek de développer une IA exceptionnelle avec un budget relativement limité.

En fait, il y a une histoire assez intéressante derrière tout cela. L'entreprise à l'origine de DeepSeek a investi environ 1,2 milliard de yuans dans deux de ces clusters d'IA de supercalcul en 2020 et 2021. Ces clusters étaient composés d'environ 10 000 puces NVIDIA 800, et ces achats ont attiré l'attention de certains grands organismes de réglementation chinois.

Ces organismes ont demandé à DeepSeek pourquoi ils achetaient autant de puces, et l'équipe a dû expliquer sur quoi elle travaillait. Finalement, les autorités réglementaires ont donné leur feu vert, ce qui leur a permis de poursuivre leurs efforts. Pendant ce temps, les entreprises occidentales d'IA utilisent encore plus de puces NVIDIA haut de gamme – jusqu'à 50 000 – dont l'exportation vers la Chine est littéralement interdite.

DeepSeek a donc dû composer avec des puces de moindre qualité, mais a tout de même réussi à maintenir son efficacité, en privilégiant l'efficacité plutôt que les performances optimales, et en exploitant au maximum les composants disponibles. Cela se traduit également par des coûts de calcul et des frais généraux réduits, qui sont répercutés sur les utilisateurs finaux, comme vous et moi.

Établir la norme

Une fois cette infrastructure initiale établie, DeepSeek a pu poursuivre ses innovations, intensifier ses travaux et développer de manière rentable différents modèles et systèmes d'IA. Leur modèle n'est même plus qu'à 4,5 points des tests de référence pour devenir officiellement le meilleur au monde.

C'est stupéfiant pour moi, et cela m'enthousiasme encore plus pour R2. Car si R1 est si proche d'être le meilleur du secteur, R2 ira certainement bien plus loin et réalisera bien plus. Ce sera passionnant de voir, lors de sa sortie, à quel point R2 sera impressionnant, comment il se comportera par rapport aux autres modèles et comment les autres entreprises devront rattraper DeepSeek.

Prix équitables

Il y a aussi le facteur prix. DeepSeek était disponible et accessible à des prix bien plus bas que n'importe quel autre modèle d'IA majeur du marché. J'ai comparé les tableaux de prix lors de la sortie de R1, et la différence était stupéfiante. De nombreuses personnes ont rapidement abandonné leur abonnement OpenAI pour se tourner vers DeepSeek lorsqu'elles ont constaté sa qualité et son prix abordable.

Nous avons même vu OpenAI devoir réduire rapidement ses plans tarifaires, car DeepSeek était jusqu'à 40 fois moins cher que ce que OpenAI facturait à l'époque, ce qui me stupéfie encore quand j'y repense.

Bien sûr, nous ne savons pas encore grand-chose sur le prix de R2, mais je ne m'attends pas à ce que DeepSeek change radicalement de stratégie avec ce nouveau modèle. Il devrait rester une option abordable, permettant au plus grand nombre d'accéder à une technologie d'IA de pointe sans les obliger à dépenser des sommes exorbitantes en frais mensuels.

De plus, avec la sortie de ces nouveaux outils par DeepSeek lors de son événement Open Source, le coût d'entrée dans le développement d'IA est devenu encore plus bas et plus abordable. Il est donc possible que R2 soit encore moins cher que le modèle R1 original, ce qui aurait un impact considérable sur le monde de l'IA et au-delà.

Préparez-vous pour la sortie de DeepSeek R2

Globalement, je suis très enthousiaste à l'idée de la prochaine version R2 de DeepSeek. Tout est positif, suggérant que ce nouveau modèle open source sera encore meilleur que R1, mais aussi que tous les autres modèles d'IA que nous avons vus jusqu'à présent. Il sera plus rapide, plus intelligent et supérieur à tous les niveaux, et nous pourrions même en bénéficier à un meilleur prix. Restez connectés pour plus d'informations.

DeepSeek R2: un nouveau modèle open source révolutionnaire

Progrès récents de DeepSeek

DeepSeek R2: la prochaine évolution de l'IA

L'impact de R2