Mixture-of-experts

Publié le
6 mars 202510 min0Commentaires
DeepSeek-R1-Zero et DeepSeek-R1 : Analyse de l'Apprentissage par Renforcement et du Fine-Tuning
Une analyse approfondie de DeepSeek-R1-Zero et DeepSeek-R1, couvrant l'Apprentissage par Renforcement (RL), le Fine-Tuning Supervisé (SFT), l'architecture et les améliorations de performance.
Lire la suite
Publié le
3 mars 202516 min0Commentaires
Démystifier DeepSeek-V3 : Décomposer son architecture IA révolutionnaire
Décomposer l'architecture IA révolutionnaire de DeepSeek-V3—explorer ses innovations clés, le routage expert et les optimisations d'inférence étape par étape. Cet article plonge profondément dans les mathématiques et les mécanismes qui alimentent son efficacité et sa scalabilité.
Lire la suite