Publié le
AI

Nouveautés et Capacités de Nebius AI Studio

Nebius AI Studio a introduit une série de nouvelles fonctionnalités et capacités, améliorant ses fonctionnalités d'IA pour diverses applications.

Portefeuille de Modèles Étendu

Nebius AI Studio propose désormais une sélection plus large de modèles de vision et de langage, répondant à des besoins divers. Ces modèles incluent Qwen-2, LLaVA, Meta's Llama 3.3, Dolphin, Phi, et divers modèles de la série Llama 3. Ils prennent en charge le raisonnement complexe, les scénarios multilingues et des tâches spécialisées comme les applications médicales. Les modèles de vision permettent la génération de légendes d'images, la reconnaissance de produits et d'autres interactions avec le contenu visuel.

Amélioration de la Génération Augmentée par Récupération (RAG)

De nouveaux modèles d'embedding comme BGE-ICL, e5-mistral et bge-multilingual-gemma2 ont été ajoutés pour améliorer les pipelines RAG. Cela facilite la construction de bases de connaissances, de moteurs de recherche sémantique avancés et de chatbots contextuels.

Hébergement LoRA

Un service d'hébergement LoRA basé sur l'utilisation permet aux utilisateurs de télécharger et d'exécuter leurs modèles LoRA pré-entraînés sans coûts fixes ni gestion d'infrastructure. Les utilisateurs ne paient que pour les tokens utilisés lors de l'inférence.

Évolutivité et Performance

La plateforme offre une évolutivité illimitée, gérant le traitement par lots massif et garantissant des performances constantes pour les prototypes et les applications de niveau production. Les options de déploiement flexibles permettent aux utilisateurs d'optimiser pour le coût ou le débit.

Source(s) :

Continuer la lecture

Articles similaires