- Publié le
Percée de l'IA d'Anthropic permettant une interaction directe avec les ordinateurs
Anthropic a réalisé une percée en permettant à son modèle d'IA, Claude 3.5 Sonnet, d'interagir directement avec les ordinateurs. Cela implique l'interprétation du contenu de l'écran, le déplacement du curseur, les clics et la saisie via un clavier virtuel.
Points clés
La capacité d'interaction informatique de Claude découle d'une combinaison de reconnaissance d'images, de raisonnement logique et de comptage précis de pixels pour un contrôle précis du curseur. Cela a été réalisé grâce à un entraînement sur des logiciels de base comme les calculatrices et les éditeurs de texte, sans accès à Internet pour des raisons de sécurité.
Généralisation surprenante
Malgré des défis initiaux, Claude a démontré une capacité surprenante à généraliser son entraînement, lui permettant de traduire les instructions des utilisateurs en étapes actionnables dans diverses applications logicielles, tout en faisant preuve d'auto-correction. Cela représente un changement par rapport à l'adaptation des outils pour l'IA à l'adaptation de l'IA pour les outils existants.
Statut actuel et limites
Bien qu'en version bêta publique, les compétences de Claude en matière d'utilisation des ordinateurs sont encore en développement. Bien que considéré comme à la pointe de la technologie par rapport à d'autres modèles, ses performances sont loin d'être au niveau humain et il est confronté à des limites comme la gestion des éléments d'écran dynamiques et des actions complexes. Des mesures de sécurité sont mises en œuvre pour répondre aux utilisations abusives potentielles, y compris les attaques par injection de prompts et les activités liées aux élections.
Conclusion
En conclusion, Anthropic a réalisé une percée en permettant à son modèle d'IA d'utiliser directement les ordinateurs. Bien qu'encore à ses débuts, cette capacité offre un potentiel immense pour diverses applications. Les recherches en cours se concentrent sur l'amélioration de ses performances, l'élargissement de ses fonctionnalités et la garantie d'une utilisation responsable et sûre.