Publié le24 novembre 2024Hymba : Une Nouvelle Architecture pour les Petits Modèles de LangageHymbaattentioncontextkey-valuelanguage modelstate space modeltransformerHymba est une nouvelle architecture pour les petits modèles de langage qui combine les mécanismes d'attention des transformers avec les modèles d'espace d'état (SSMs) dans une structure parallèle à têtes hybrides.