DeepSeek: all the news about the startup that’s shaking up AI stocks | The Verge

DeepSeek: all the news about the startup that’s shaking up AI stocks | The Verge

Résumé bref

DeepSeek, une startup chinoise, secoue l'industrie de l'IA avec ses modèles de langage de grande taille peu coûteux qui, selon elle, peuvent égaler les performances de ses concurrents de géants comme OpenAI et Meta. DeepSeek affirme que son modèle de raisonnement phare R1 est capable d'atteindre des "performances comparables" à l'équivalent o1 d'OpenAI, tandis que son nouveau modèle d'IA multimodale Janus Pro surpasserait Stable Diffusion et DALL-E 3. Le concurrent de ChatGPT de DeepSeek a rapidement grimpé en tête de l'App Store, et la société perturbe les marchés financiers, les actions de Nvidia ayant chuté de 17 % pour réduire sa capitalisation boursière de près de 600 milliards de dollars le 27 janvier, ce que CNBC a qualifié de plus forte baisse en une seule journée de l'histoire des États-Unis.

  • DeepSeek a développé des modèles d'IA moins chers que ses concurrents.
  • DeepSeek a perturbé les marchés financiers, les actions de Nvidia ayant chuté de 17 %.

DeepSeek : toutes les nouvelles sur la startup qui secoue les actions de l'IA

Cet article présente les dernières nouvelles sur DeepSeek, une startup chinoise qui a développé des modèles d'IA moins chers que ses concurrents. DeepSeek affirme que son modèle de raisonnement phare R1 est capable d'atteindre des "performances comparables" à l'équivalent o1 d'OpenAI, tandis que son nouveau modèle d'IA multimodale Janus Pro surpasserait Stable Diffusion et DALL-E 3. Le concurrent de ChatGPT de DeepSeek a rapidement grimpé en tête de l'App Store, et la société perturbe les marchés financiers, les actions de Nvidia ayant chuté de 17 % pour réduire sa capitalisation boursière de près de 600 milliards de dollars le 27 janvier, ce que CNBC a qualifié de plus forte baisse en une seule journée de l'histoire des États-Unis.

OpenAI a des preuves que ses modèles ont contribué à former DeepSeek en Chine

OpenAI et Microsoft enquêtent pour savoir si le rival chinois a utilisé l'API d'OpenAI pour intégrer les modèles d'IA d'OpenAI dans ses propres modèles. Les sources de Bloomberg ont déclaré que les chercheurs en sécurité de Microsoft ont détecté que de grandes quantités de données étaient exfiltrées via des comptes de développeurs OpenAI à la fin de 2024, que la société croit être affiliées à DeepSeek.

Pourquoi tout le monde s'affole à propos de DeepSeek

DeepSeek a publié deux modèles d'IA en succession rapide, qui la placent au même niveau que les meilleurs modèles disponibles dans les laboratoires américains, selon Alexandr Wang, PDG de Scale AI. Et DeepSeek semble travailler dans des contraintes qui signifient qu'elle a formé ses modèles beaucoup moins cher que ses pairs américains. L'un de ses modèles récents coûterait seulement 5,6 millions de dollars pour la dernière phase de formation, ce qui correspond à peu près au salaire qu'un expert américain en IA peut commander. L'année dernière, Dario Amodei, PDG d'Anthropic, a déclaré que le coût de la formation des modèles variait de 100 millions à 1 milliard de dollars. GPT-4 d'OpenAI a coûté plus de 100 millions de dollars, selon le PDG Sam Altman. DeepSeek semble avoir bouleversé notre idée du coût de l'IA, avec des implications potentiellement énormes pour l'ensemble de l'industrie.

Le PDG d'OpenAI, Sam Altman, sur DeepSeek R1 : "un modèle impressionnant".

Le patron de ChatGPT dit de sa société : "nous allons évidemment livrer des modèles bien meilleurs et c'est aussi vraiment stimulant d'avoir un nouveau concurrent", puis, naturellement, il tourne la conversation vers l'AGI.

Trump dit qu'il imposera des droits de douane sur les puces importées "dans un avenir proche"

Sans entrer dans les détails sur ce qui pourrait arriver aux 52 milliards de dollars de subventions du CHIPS Act sous son administration, Donald Trump a déclaré que des droits de douane sur les puces informatiques, les semi-conducteurs et les produits pharmaceutiques étrangers arriveraient "dans un avenir proche". Il a également mentionné les sorties d'IA de DeepSeek, en disant : "... trouver une méthode d'IA plus rapide et moins chère, c'est bien. Je considère cela comme un positif si c'est un fait et que c'est vrai, et personne ne sait, mais je considère cela comme un positif."

La capitalisation boursière de Nvidia chute de près de 600 milliards de dollars au milieu du battage médiatique autour de DeepSeek R1.

Alors que la startup chinoise d'IA DeepSeek attire l'attention pour ses modèles d'IA open source qu'elle dit être moins chers que la concurrence tout en offrant des performances similaires ou meilleures, le cours de l'action du roi des puces d'IA Nvidia a chuté aujourd'hui. CNBC a déclaré qu'après avoir clôturé à 118,58 dollars, en baisse de 17 %, il s'agissait de "la plus forte baisse jamais enregistrée pour une entreprise américaine".

Nvidia répond au battage médiatique autour de DeepSeek.

Dans une déclaration à Bloomberg, un porte-parole de Nvidia a déclaré que DeepSeek est une "excellente avancée en matière d'IA" et montre comment une entreprise peut créer de nouveaux modèles d'IA en utilisant la méthode de mise à l'échelle au moment du test, tout en "tirant parti de modèles largement disponibles et d'une puissance de calcul entièrement conforme aux contrôles à l'exportation".

DeepSeek affirme que son nouveau modèle d'IA, Janus-Pro, peut surpasser Stable Diffusion et DALL-E 3.

Déjà sur une vague de battage médiatique autour de son IA de "raisonnement" R1 qui est en tête des classements de l'App Store et qui fait bouger le marché boursier, la startup chinoise DeepSeek a publié un autre nouveau modèle d'IA open source : Janus-Pro. L'analyse des images d'entrée est limitée à une résolution de 384x384, mais la société affirme que la plus grande version, Janus-Pro-7b, a battu des modèles comparables sur deux tests de référence de l'IA.

L'application d'IA la mieux classée de DeepSeek restreint les inscriptions en raison d'"attaques malveillantes".

Après avoir grimpé en tête des classements de l'App Store d'Apple aux États-Unis, l'assistant IA de DeepSeek restreint désormais les inscriptions de nouveaux utilisateurs. Selon une page de rapport d'incident, les inscriptions sont temporairement limitées "en raison d'attaques malveillantes à grande échelle sur les services de DeepSeek", bien qu'il ne soit pas clair comment ces limitations sont appliquées. "Les utilisateurs existants peuvent se connecter comme d'habitude", a déclaré DeepSeek dans sa mise à jour. "Merci de votre compréhension et de votre soutien." Une bannière d'alerte sur la page d'inscription Web de DeepSeek indique que "l'inscription peut être occupée", plutôt que d'être entièrement restreinte, et encourage les utilisateurs à attendre et à "réessayer" si leur demande échoue.

L'IA chinoise DeepSeek frappe Nvidia là où ça fait mal

Un chatbot créé par la startup chinoise d'intelligence artificielle DeepSeek a grimpé en tête des classements de l'App Store d'Apple aux États-Unis cette semaine, détrônant ChatGPT d'OpenAI en tant qu'application gratuite la plus téléchargée. L'assistant IA éponyme est alimenté par les modèles open source de DeepSeek, que la société affirme pouvoir être formés à une fraction du coût en utilisant beaucoup moins de puces que les modèles leaders mondiaux. Cette affirmation a secoué les marchés financiers, le cours de l'action de Nvidia ayant chuté de plus de 12 % en pré-marché. Les téléchargements de l'application ont explosé peu après la sortie par DeepSeek de son nouveau modèle de raisonnement R1 le 20 janvier, qui est conçu pour résoudre des problèmes complexes et qui, selon certaines sources, fonctionne aussi bien que l'o1 d'OpenAI sur certains benchmarks.

Share

Summarize Anything ! Download Summ App

Download on the Apple Store
© 2024 Summ