Une intelligence artificielle capable de rivaliser avec ChatGPT, mais 27 fois moins chère à produire ? C’est l’exploit revendiqué par DeepSeek, une entreprise chinoise qui bouscule le secteur. Son modèle DeepSeek-R1 impressionne, au point d’être adopté par des plateformes comme Perplexity et Groq. Mais derrière ce succès, une accusation explosive : OpenAI affirme que DeepSeek aurait utilisé ChatGPT pour entraîner illégalement ses propres modèles.
OpenAI parle même d’une « distillation massive », un procédé qui aurait permis à DeepSeek d’économiser des années de recherche. Si ces soupçons se confirment, l’affaire pourrait bien redéfinir les règles du jeu dans la course à l’IA.
DeepSeek : le challenger qui défie OpenAI
DeepSeek-R1 a débarqué sur la scène technologique comme une tornade. Performant, open source, ultra-efficace sur du matériel modeste, il s’impose comme un rival sérieux de ChatGPT.
Mais un détail intrigue : comment DeepSeek a-t-il pu atteindre ce niveau avec seulement 5,6 millions de dollars de financement, alors qu’OpenAI et Google investissent des centaines de millions ?
C’est là qu’OpenAI dévoile son accusation choc : DeepSeek aurait utilisé ChatGPT pour former son propre modèle à moindre coût.
La distillation des connaissances : une technique controversée
Ce procédé, bien connu en IA, permet à un modèle enseignant (ici ChatGPT) de transmettre ses savoirs à un modèle étudiant (DeepSeek). En clair :
- Le modèle étudiant pose des questions au modèle enseignant.
- Il imite ses réponses pour apprendre plus vite.
- Résultat : un modèle entraîné à bas coût, sans passer par des années de calculs énergivores.
C’est un accélérateur de performance utilisé par de nombreuses entreprises. Mais ici, il y a un problème : OpenAI interdit explicitement l’utilisation de ChatGPT pour entraîner des modèles concurrents.
Et selon OpenAI, DeepSeek ne s’est pas gêné.
OpenAI accuse DeepSeek d’un pillage massif
D’après OpenAI, DeepSeek aurait :
- Utilisé massivement l’API de ChatGPT pour poser des milliers de questions.
- Récupéré ces réponses pour alimenter ses propres modèles (DeepSeek-V3 et R1).
- Économisé des millions en évitant de tout entraîner de zéro.
L’entreprise affirme avoir trouvé des preuves concrètes et envisage des actions contre DeepSeek.
Une affaire qui prend une dimension politique
L’histoire ne s’arrête pas là. David Sacks, conseiller de Donald Trump sur l’IA, a réagi sur Fox News :
- Il juge « possible » que DeepSeek ait volé les données d’OpenAI.
- Il évoque des « preuves substantielles » de distillation abusive.
- Il appelle les entreprises américaines à protéger leurs modèles contre le pillage.
Cette déclaration suggère que l’affaire pourrait dépasser le cadre du simple litige technologique. Un renforcement des lois sur l’IA n’est pas à exclure.
Plagiat ou prouesse technique ?
DeepSeek a-t-il seulement copié ChatGPT, ou a-t-il ajouté sa propre innovation ? C’est toute la question.
- Si DeepSeek a bien utilisé ChatGPT pour s’entraîner, alors c’est une violation des règles d’OpenAI.
- Mais DeepSeek affiche aussi une architecture optimisée qui lui permet de tourner sur des ordinateurs classiques.
Même si l’entreprise chinoise a triché, elle aurait aussi trouvé un moyen de rendre l’IA plus accessible, une avancée qui intéresse forcément le marché.
Un séisme dans l’industrie de l’IA
DeepSeek a déjà eu un impact colossal :
- Son annonce a fait chuter la bourse le 27 janvier, avant un rebond.
- Son modèle open source pourrait révolutionner l’IA à bas coût.
- OpenAI pourrait lancer des poursuites pour défendre ses travaux.
Si les accusations se confirment, DeepSeek risque gros. Mais une chose est sûre : la guerre des intelligences artificielles vient de prendre une toute nouvelle dimension.