- Publié le
Nebius AI Studio a introduit une série de nouvelles fonctionnalités et capacités, améliorant ses fonctionnalités d'IA pour diverses applications.
Portefeuille de Modèles Étendu
Nebius AI Studio propose désormais une sélection plus large de modèles de vision et de langage, répondant à des besoins divers. Ces modèles incluent Qwen-2, LLaVA, Meta's Llama 3.3, Dolphin, Phi, et divers modèles de la série Llama 3. Ils prennent en charge le raisonnement complexe, les scénarios multilingues et des tâches spécialisées comme les applications médicales. Les modèles de vision permettent la génération de légendes d'images, la reconnaissance de produits et d'autres interactions avec le contenu visuel.
Amélioration de la Génération Augmentée par Récupération (RAG)
De nouveaux modèles d'embedding comme BGE-ICL, e5-mistral et bge-multilingual-gemma2 ont été ajoutés pour améliorer les pipelines RAG. Cela facilite la construction de bases de connaissances, de moteurs de recherche sémantique avancés et de chatbots contextuels.
Hébergement LoRA
Un service d'hébergement LoRA basé sur l'utilisation permet aux utilisateurs de télécharger et d'exécuter leurs modèles LoRA pré-entraînés sans coûts fixes ni gestion d'infrastructure. Les utilisateurs ne paient que pour les tokens utilisés lors de l'inférence.
Évolutivité et Performance
La plateforme offre une évolutivité illimitée, gérant le traitement par lots massif et garantissant des performances constantes pour les prototypes et les applications de niveau production. Les options de déploiement flexibles permettent aux utilisateurs d'optimiser pour le coût ou le débit.
Source(s) :
Continuer la lecture
Articles similaires
Nov 23, 2024
0CommentairesContinue, Assistant de Codage Alimenté par l'IA pour VS Code et JetBrains
Découvrez comment Continue, un outil d'IA open-source, améliore le codage dans les IDE de VS Code et JetBrains avec des suggestions en temps réel, une édition fluide et bien plus encore.
Dec 7, 2025
0CommentairesSécurisez Vos Données, Libérez l'IA : Déployez Open WebUI Localement avec un GPU Ollama à Distance
Ce guide technique détaille le déploiement d'Open WebUI dans un conteneur Docker via WSL, configuré pour s'interfacer avec une instance distante d'Ollama accélérée par GPU sur un réseau local. Suivez ces étapes pour une configuration d'interface LLM découplée et performante.
Jun 17, 2025
0CommentairesIntroducing Codestral Embed: Mistral AI's New State-of-the-Art Code Embedding Model
Analysis of Mistral AI's Codestral Embed, a new state-of-the-art embedding model specialized for code, detailing its performance, flexibility, key use cases like RAG and semantic search, and availability.