Representational-similarity

  • Publicado el
    2 min0Comentarios
    Este resumen explora el concepto de universalidad de características en modelos de lenguaje grandes (LLMs) utilizando autoencoders dispersos (SAEs), como se presenta en 'Sparse Autoencoders Reveal Universal Feature Spaces Across Large Language Models' (Lan et al., 2024). La investigación tiene como objetivo determinar si diferentes LLMs desarrollan representaciones internas similares de conceptos dentro de sus capas intermedias.
    Leer más