L’écosystème de l’IA générative vient de franchir un cap avec l’arrivée de DeepSeek, un modèle basé sur une architecture Mixture of Experts (MoE). Sa promesse ? Des performances comparables, voire supérieures, aux leaders du marché, tout en proposant un modèle économique en rupture avec les approches fermées des grandes entreprises. Un tournant qui redistribue les cartes de l’IA générative.
DeepSeek, un acteur disruptif sur un marché en pleine ébullition
DeepSeek a été fondée en mai 2023 par Liang Wenfeng, alors qu’OpenAI lançait ChatGPT-4. Depuis quelques jours, l’entreprise fait parler d’elle avec DeepSeek-R1, un modèle qui attire l’attention par son efficacité et son coût de développement radicalement inférieur à celui de ses concurrents.
Quelques chiffres marquants :
✔ 94% de réduction des coûts de développement par rapport à ChatGPT-4o d’OpenAI.
✔ Jusqu’à 27 fois moins cher à exécuter, avec des performances comparables voire supérieures.
✔ Un modèle open-source, une alternative inédite dans un marché habitué aux solutions propriétaires.
L’annonce a eu un impact immédiat sur les marchés, provoquant notamment une dévaluation de NVIDIA, Microsoft, Google, Broadcom, AMD ou encore Micron.
Une technologie au service de l’efficacité
L’architecture MoE : l’avenir des modèles IA ?
DeepSeek mise sur une optimisation de l’architecture Mixture of Experts (MoE), un concept datant de 1991 qui connaît un regain d’intérêt dans l’univers des LLM (Large Language Models).
✔ Réduction des coûts : contrairement aux modèles traditionnels (dense), DeepseekMoE permet d’éviter une consommation excessive de ressources.
✔ Performance optimisée : optimisation du routage des experts pour équilibrer la charge entre eux.
✔ Spécialisation accrue : segmentation fine des experts jusqu’à 18 experts (18x37B par token).
DeepSeek rejoint ainsi d’autres acteurs comme Mistral, tout en introduisant des optimisations qui lui permettent d’afficher des performances de pointe.
DeepSeek-R1 : un modèle taillé pour le raisonnement complexe
DeepSeek ne se limite pas à la performance brute. Avec DeepSeek-R1, conçu à partir de la version 3, la société propose un modèle spécialisé dans le raisonnement.
Le positionnant en tant que leader pour les tâches nécessitant un raisonnement approfondi, telles que la recherche académique et les applications scientifiques
Il excelle notamment dans les tâches de programmation et raisonnement mathématique, surpassant certains des principaux modèles d’OpenAI dans des benchmarks tels que AIME 2024 et MATH-500.
Quels impacts pour les organisations ?
DeepSeek ouvre la porte à de nouvelles opportunités pour les entreprises, avec des applications concrètes :
- Tester l’IA facilement : l’open-source permet de créer des prototypes rapidement, sans dépendre des grands fournisseurs d’IA.
- Réduire les coûts : les entreprises peuvent investir dans leurs propres IA sur mesure au lieu de payer des solutions propriétaires.
- Explorer l’IA embarquée : son modèle open source va démocratiser les versions optimisées de Deepseek sur PC, mobiles et objets connectés.
La version web semble remonter les données utilisateurs sur des serveurs chinois. Une correction adaptée à la réglementation devrait sortir dans les prochaines semaines pour soutenir l’engouement rencontré.
Une opportunité pour l’Europe… et un défi stratégique
L’émergence de DeepSeek change la donne dans un marché largement dominé par les géants américains. La montée en puissance de la Chine dans le domaine de l’IA est une réalité : Alibaba vient d’annoncer son IA générative Qwen2.5 qui lui aussi se positionne au niveau des leaders du marché.
La question est désormais : comment les entreprises et organisations européennes vont-elles s’en saisir ?
D’un côté, l’open-source et la réduction des coûts offrent une opportunité unique pour accélérer le développement de modèles souverains et l’adapter aux besoins locaux. De l’autre, la montée en puissance d’acteurs non européens pose la question de l’indépendance technologique et de la régulation.
L’Europe doit faire un choix : saisir ces innovations pour renforcer sa compétitivité ou rester spectatrice de l’évolution menée par d’autres.
Chez Willing, nous aidons les organisations à structurer leur adoption de l’IA
Chez Willing, nous accompagnons les organisations dans l’adoption stratégique de l’IA générative, en intégrant ses impacts sur les processus métiers, la transformation digitale et la cybersécurité.
Avec l’arrivée de nouvelles solutions comme DeepSeek, nous aidons les organisations à :
✔ Tester rapidement ces technologies pour en évaluer la pertinence.
✔ Identifier les cas d’usage les plus adaptés à leur organisation.
✔ Structurer une approche IA alignée avec leur stratégie et leurs enjeux réglementaires.
L’IA se réinvente et s’accélère. Comment votre organisation peut-elle en tirer parti ?