Passer au contenu

5 choses à savoir sur DeepSeek, la startup chinoise qui bouleverse l’industrie de l’IA

Une entreprise chinoise bouleverse actuellement le monde de l’intelligence artificielle. DeepSeek réussit l’exploit de développer des modèles de langage aussi performants que ChatGPT, mais avec des ressources nettement inférieures. Qui est donc ce nouvel acteur ?

L’annonce a eu l’effet d’une bombe dans la Silicon Valley. Le 20 janvier 2024 la startup chinoise DeepSeek dévoile ses nouveaux modèles d’intelligence artificielle. La performance de ses systèmes stupéfie les experts et provoque un séisme sur les marchés financiers. Les géants américains de la tech perdent des milliards en bourse tandis que les investisseurs s’interrogent : comment une entreprise quasi-inconnue peut-elle rivaliser avec OpenAI et Google ?

D’où vient DeepSeek ?

DeepSeek n’est pas née dans les quartiers huppés de Shanghai ou Pékin, mais à Hangzhou, métropole chinoise réputée pour son dynamisme technologique. Son fondateur, Liang Wenfeng, 40 ans, possède un profil atypique. Ce mathématicien de formation crée d’abord en 2015 un fonds d’investissement basé sur l’IA, avant de lancer un fonds caritatif en 2020.

Cette expertise financière combinée à une vision technologique audacieuse forge l’ADN de DeepSeek. Liang Wenfeng comprend que la clé du succès réside dans l’optimisation des ressources plutôt que dans la course à la puissance brute. Une approche qui tranche avec celle des géants américains.

Comment DeepSeek utilise aussi peu de ressources face à ChatGPT ?

La force de DeepSeek réside dans sa capacité à faire plus avec moins. Là où OpenAI utilise plus de 16 000 puces Nvidia pour entraîner ses modèles, la startup chinoise parvient à des performances similaires avec seulement 2 000 GPU. Cette prouesse technique réduit drastiquement les coûts : DeepSeek dépense environ 6 millions de dollars en puissance de calcul seulement.

Cette efficacité repose sur une approche innovante baptisée « mixture of experts ». Les ingénieurs de DeepSeek ont développé une méthode pour répartir l’analyse des données entre plusieurs modèles spécialisés, tout en minimisant les pertes liées aux transferts d’informations. Une optimisation qui révolutionne les paradigmes établis de l’IA.

Le secret réside dans la manière dont DeepSeek organise le dialogue entre ses différents modèles spécialisés. Plutôt que de traiter toutes les informations dans un seul système massif, l’entreprise a créé une architecture distribuée intelligente qui sollicite uniquement les composants nécessaires pour chaque tâche.

Des performances qui rivalisent avec les géants américains

Le modèle de base DeepSeek-V3 égale ChatGPT sur de nombreuses tâches : réponse aux questions, résolution de problèmes logiques et génération de code. L’interface conversationnelle gratuite séduit déjà des millions d’utilisateurs. En France, l’application mobile DeepSeek caracole en tête des téléchargements sur iOS et Android.

Plus impressionnant encore, le modèle DeepSeek R1 dédié au raisonnement fait jeu égal avec GPT-4. Une performance saluée par Sam Altman lui-même, le PDG d’OpenAI, sur les réseaux sociaux. La startup chinoise propose d’ailleurs gratuitement l’accès à ce modèle avancé, contrairement à ses concurrents qui le réservent aux abonnements premium.

Les tests comparatifs menés par des experts indépendants confirment ces performances. Sur les benchmarks standards de l’industrie, DeepSeek obtient des scores remarquablement proches de ceux des meilleurs modèles américains. Une prouesse d’autant plus notable que l’entreprise a atteint ce niveau en moins d’un an de développement.

DeepSeek gratuit pour le public, beaucoup moins cher pour les entreprises

DeepSeek bouleverse également les modèles économiques établis. Son interface grand public reste entièrement gratuite, tandis que ses tarifs pour les entreprises sont 10 à 40 fois inférieurs à ceux d’OpenAI. Cette politique tarifaire agressive s’appuie sur la frugalité de ses modèles en ressources informatiques.

L’entreprise mise aussi sur l’open source, partageant librement le code de ses technologies. Cette stratégie permet à d’autres acteurs de développer leurs propres applications basées sur DeepSeek, créant un écosystème dynamique. Une approche qui tranche avec le secret industriel jalousement gardé par les géants américains.

Des startups aux ressources limitées peuvent désormais exploiter des modèles de pointe sans investissements massifs en infrastructure. Un changement qui pourrait redistribuer les cartes dans l’économie numérique.

Les Etats-Unis en déroute face à DeepSeek ?

Le succès de DeepSeek questionne l’efficacité des restrictions américaines sur l’exportation de puces vers la Chine. Paradoxalement, ces limitations semblent avoir stimulé l’innovation chinoise, poussant les entreprises à optimiser leurs ressources. Le pays développe ainsi une expertise unique dans l’IA frugale.

Cette avancée technologique s’inscrit dans un contexte de course à la suprématie technologique entre la Chine et les États-Unis. La capacité de DeepSeek à développer des modèles performants avec des moyens limités pourrait redistribuer les cartes dans l’industrie de l’IA.

Ce nouveau venu pointe d’ailleurs le bout de son code quelques jours après l’annonce en grande pompe du projet Stargate de 500 milliards de dollars par le président américain Donald Trump.

Vos données sont-elles en sécurité avec DeepSeek ?

Contrairement aux entreprises occidentales qui intègrent des équipes dédiées aux enjeux éthiques, les pratiques de la startup chinoise en la matière restent opaques. Son chatbot applique notamment certaines règles de censure conformes à la réglementation chinoise.

La politique de confidentialité de l’entreprise précise que les données des utilisateurs peuvent être analysées et stockées sur des serveurs chinois pour une durée illimitée.

Le traitement des questions sensibles par DeepSeek illustre ces enjeux. Le système évite systématiquement certains sujets politiques ou historiques, reflétant les contraintes du contexte chinois.

Il faut tout de même savoir qu’il est possible de faire tourner DeepSeek en local, éliminant les risques liés à la transmission des données sur le réseau et les serveurs distants.

Les dernières infos sur DeepSeek

Microsoft dévoile une version locale de DeepSeek pour Windows

Microsoft présente une version de DeepSeek qui a été optimisée pour les NPU des PC Copilot+. Elle sera d’abord compatible avec les machines sous Snapdragon X.

Plus de détails.


DeepSeek disparaît des boutiques d’applications en Italie

DeepSeek n’est plus disponible sur l’App Store et le Play Store en Italie. Cela est peut-être lié à une plainte déposée auprès de l’autorité de protection des données, qui a envoyé une demande d’informations à DeepSeek.

Plus de détails


OpenAI tacle DeepSeek

ChatGPT DeepSeek

Après des déclarations très positives, OpenAI change son fusil d’épaule. Le géant américain de l’IA accuse DeepSeek d’avoir utilisé une partie de son travail pour développer son intelligence artificielle. Une accusation aux accents de coup de pub, la technique utilisée par DeepSeek pour perfectionner son IA étant utilisée par la plupart des entreprises du secteur.

Plus de détails


La French Tech aussi impactée par le phénomène DeepSeek

L’arrivée en trombe de DeepSeek sonne comme une aubaine pour les start-up françaises. Le modèle open-source de l’entreprise chinoise permet en effet aux entreprises de la French Tech de développer ou perfectionner leurs outils de développement plus vite que prévu. Tout cela gratuitement.

Lire l’article complet


Apple, seule marque à résister à l’assaut DeepSeek

Apple Bourse

Alors que toutes les entreprises américaines de l’IA ont connu une dégringolade en Bourse, Apple a résisté. Pourquoi ? Parce que son modèle développé en interne ne requiert pas toute la puissance et tous les investissements colossaux de ses concurrents. Ce choix du home made semble finalement porter ses fruits, même si la vitesse de développement d’Apple Intelligence est plus lente que chez les concurrents.

Plus d’infos


DeepSeek lance Janus, son générateur d’image concurrent de DALL-E

En pleine ascension, DeepSeek annonce son propre générateur d’image. Baptisé Janus et déjà disponible en essai, il se positionne comme un concurrent direct de DALL-E, son homologue utilisé par ChatGPT. Le patron d’OpenAI a salué l’arrivée de DeepSeek, qualifiant son travail d’impressionnant. Il se réjouit de cette concurrence qui poussera OpenAI à s’améliorer des les mois et années à venir.

Plus d’infos


DeepSeek victime d’une cyberattaque

Deepseek Logo

Après le buzz, le coup dur. La start-up IA chinoise DeepSeek a dû suspendre les inscriptions à son service, la faute à une cyberattaque ayant perturbé son fonctionnement. DeepSeek explique que son modèle open-source, bien que moins coûteux, peut être la cause de cette attaque ciblée.

En savoir plus


Mais qui est DeepSeek ?

Deepseek Phone

La start-up chinoise DeepSeek a secoué la planète IA en dévoilant un modèle tout aussi puissant que ChatGPT mais nécessitant moins de puissance de calcul et donc, moins d’investissements. De quoi remettre en question les milliards de dollars distribués depuis quelques années. Les investisseurs ont d’ailleurs plombé les grandes entreprises américaines de l’IA, Nvidia en tête. Mais qui est vraiment DeepSeek ? On a fouillé un peu pour en savoir plus sur cette start-up chinoise.

Lire l’article


📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Newsletter 🍋

Abonnez-vous, et recevez chaque matin un résumé de l’actu tech