- Publié le
Vous pourrez contrôler n'importe quel site web avec l'IA : J'ai fait piloter Gemini par Claude et c'est époustouflant

Playwright est un puissant framework open-source pour les tests et l'automatisation web. Développé par Microsoft, il permet aux développeurs d'automatiser de manière fiable les interactions sur Chromium, Firefox et WebKit avec une API unique. Sa vitesse, sa fiabilité et sa prise en charge des fonctionnalités web modernes en font un moteur idéal pour les tests automatisés et les tâches complexes d'IA basées sur le navigateur.
Le Model Context Protocol (MCP) devient rapidement la norme pour connecter les modèles d'IA aux outils et données externes. Pour les développeurs et les utilisateurs avancés, le "saint graal" de l'IA locale est de donner au modèle des yeux et des mains : la capacité de voir une page web et d'interagir avec elle.
L'Application de Bureau Claude est une application native qui apporte la puissance des modèles d'IA Claude d'Anthropic directement sur votre bureau. Contrairement à la version web, l'application de bureau est conçue pour s'intégrer profondément à votre environnement local, ce qui en fait l'hôte idéal pour les serveurs MCP nécessitant un accès aux ressources locales, fichiers et outils comme Playwright.
Playwright MCP agit comme ce pont. Contrairement aux outils de scraping standard qui se contentent de récupérer le HTML, le serveur Playwright MCP crée un canal de communication bidirectionnel entre Claude Desktop et un moteur de navigateur Playwright. Cela permet à Claude de naviguer, cliquer, taper et même inspecter l'arbre d'accessibilité des pages web en temps réel.
Dans ce tutoriel, nous nous concentrerons sur la configuration du Pont Playwright MCP sur Windows, en soulignant spécifiquement comment connecter Claude à une session de navigateur existante (via l'extension Bridge) pour contourner les flux d'authentification complexes.
Prérequis
Avant de modifier les fichiers de configuration, assurez-vous que votre environnement Windows permet l'exécution de serveurs locaux.
- Node.js (Version LTS) sous Windows : Le serveur Playwright MCP est une application Node.js. Vous devez avoir Node.js version 18 ou supérieure installée directement sur votre système Windows.
node --version - Application de Bureau Claude : Vous devez utiliser l'application Windows installée, et non la version navigateur web (
claude.ai), car la version web ne peut pas se connecter aux serveurs MCP locaux. - Navigateurs Playwright : Bien que le paquet les télécharge souvent automatiquement, il est recommandé d'installer les dépendances manuellement pour éviter les erreurs de délai d'attente lors de la première exécution.
npx playwright install --with-deps - Abonnement Claude Pro (Recommandé) : Bien que les fonctionnalités MCP soient disponibles pour tous les utilisateurs, un plan payant Claude Pro est fortement recommandé. Les tâches d'automatisation du navigateur impliquent souvent de multiples allers-retours de messages pendant que Claude "réfléchit" à travers la navigation et l'extraction, ce qui peut rapidement consommer les limites d'utilisation du niveau gratuit.
Configuration du Serveur MCP
Le cœur de cette configuration est le fichier claude_desktop_config.json. Ce fichier indique à l'Application de Bureau Claude quels outils locaux elle est autorisée à lancer et avec lesquels elle peut communiquer.
Localiser le Fichier de Configuration : Sous Windows, ce fichier se trouve dans votre dossier AppData. Ouvrez l'Explorateur de fichiers et naviguez vers :
%AppData%\Claude\claude_desktop_config.json(Si le dossier ou le fichier n'existe pas, créez-le manuellement).Définir le Serveur : Ouvrez le fichier dans un éditeur de texte (comme VS Code ou Notepad) et ajoutez la configuration du serveur Playwright MCP. Nous utiliserons le paquet
@playwright/mcpvianpxpour que vous exécutiez toujours la dernière version.claude_desktop_config.json{ "mcpServers": { "playwright": { "command": "npx", "args": [ "-y", "@playwright/mcp@latest" ] } } }command: Nous utilisonsnpxpour exécuter le paquet node.args: Le drapeau-ysupprime l'invite "Êtes-vous sûr de vouloir installer...", ce qui est critique car Claude crée un shell non interactif.
Redémarrer Claude : Quittez complètement l'application de bureau Claude (vérifiez la barre d'état système pour vous assurer qu'elle est fermée) et rouvrez-la.
Le Pont – Connexion à une Session Existante
Les instances Playwright standard sont "incognito" par défaut — elles ne partagent pas vos cookies ou états de connexion. Pour permettre à Claude d'interagir avec des sites où vous êtes déjà connecté (comme GitHub, Jira ou des outils d'entreprise internes), nous utilisons le Pont Playwright MCP.
Installer l'Extension Chrome : L'extension officielle Playwright MCP n'est pas disponible sur le Chrome Web Store. Vous devez la télécharger manuellement depuis le dépôt officiel.
- Télécharger : Allez sur la Page des versions de Playwright MCP et téléchargez le dernier code source ou le zip de l'extension.
- Installer : Décompressez le contenu. Ouvrez Chrome et allez sur
chrome://extensions. Activez le "Mode développeur" en haut à droite, puis cliquez sur "Charger l'extension non empaquetée" et sélectionnez le dossier que vous venez de décompresser.
Configuration du Mode Extension
Pour activer spécifiquement le mode extension, vous devez mettre à jour vos arguments de configuration pour inclure le drapeau
--extension:claude_desktop_config.json"args": [ "-y", "@playwright/mcp@latest", "--extension" ]Lancer via le Pont : Lorsque vous demandez à Claude d'effectuer une tâche maintenant, il cherchera une instance de navigateur connectée via le pont au lieu de lancer une nouvelle fenêtre sans tête. Cela vous permet de vous connecter manuellement, puis de passer le contrôle à Claude.
La première fois que vous initiez une connexion, votre navigateur demandera probablement une permission explicite pour permettre au serveur Playwright MCP de prendre le contrôle de l'onglet.

Vous saurez que la connexion est réussie lorsque vous verrez le navigateur lancé et contrôlé avec succès par le serveur, souvent indiqué par un état de navigateur distinct ou un message dans la console vérifiant la session active.

Rapports Automatisés de Tableau de Bord Personnel
L'une des utilisations les plus pratiques de ce pont est la récupération de données personnelles depuis des "jardins clos" — des sites qui nécessitent une connexion et n'offrent pas d'API facile à utiliser pour vos besoins spécifiques.
Scénario : Vous voulez vérifier votre utilisation de l'API ou votre statut de facturation sans naviguer manuellement à travers des tableaux de bord complexes.
Va sur la plateforme Deepseek et dis-moi combien j'ai consommé ce mois-ci.
Le Processus
- Navigation : Claude navigue vers le tableau de bord Deepseek.
- Authentification : Parce que vous utilisez le Pont connecté à votre session Chrome existante, vous êtes probablement déjà connecté. Sinon, vous pouvez vous connecter manuellement pendant que Claude regarde.
- Extraction : Claude trouve l'élément spécifique affichant les statistiques d'utilisation/facturation et vous en fait rapport.
Avantage Clé
Le plus grand avantage ici est la sécurité et la commodité. Vous n'avez pas besoin de fournir votre nom d'utilisateur, mot de passe ou clés API dans le prompt lui-même. Puisque Claude conduit votre instance de navigateur existante, il "profite" de vos cookies de session actifs. Cela garde vos identifiants en sécurité et hors de l'historique de chat.
Usage Général
Cette approche se généralise à toute plateforme où vous devez récupérer des données en "lecture seule" derrière un mur d'authentification — vérifier les soldes bancaires, vérifier l'utilisation des abonnements SaaS ou surveiller les tableaux de bord de statut — le tout sans écrire une seule ligne de code de scraping.

Collaboration LLM-à-LLM (Validation Agentique)
Et si vous pouviez faire travailler deux puissantes IA ensemble ? Avec Playwright MCP, Claude peut "conduire" d'autres LLM basés sur le web comme Gemini ou ChatGPT.
Scénario : Vous voulez recouper des instructions techniques ou combiner les connaissances de deux modèles.
Va sur gemini.google.com et demande comment installer playwright dans l'Application Windows Claude. Vérifie les instructions que tu obtiens et dis-moi si elles sont correctes.
Le Processus
- Navigation : Claude va sur l'URL de Gemini.
- Interaction : Il tape la requête dans la boîte de chat de Gemini et l'envoie.
- Synthèse : Claude lit la réponse de Gemini à l'écran, la compare avec sa propre base de connaissances interne et valide l'exactitude — créant effectivement un système de "revue par les pairs" pour les sorties d'IA.

Pourquoi cela fonctionne
Cela transforme le navigateur web en une interface universelle pour tout modèle d'IA, vous permettant de construire des flux de travail complexes où un agent agit comme "l'exécuteur" et l'autre comme le "consultant" ou le "vérificateur".

Conclusion
L'intégration de Playwright avec Claude Desktop via MCP transforme l'IA d'un générateur de texte passif en un agent actif capable d'effectuer un travail dans le monde réel.
Cette configuration est un changement de paradigme pour les flux de travail basés sur le navigateur, débloquant des capacités qui nécessitaient auparavant des scripts personnalisés fragiles :
- Recherche Approfondie — Extraire et synthétiser des données à travers des sources disparates
- Collaboration IA — Créer une interface universelle pour l'interaction agent-à-agent
- Automatisation Administrative — Gérer des tâches répétitives au sein de portails authentifiés
- Opérations en Plusieurs Étapes — Exécuter des flux de travail complexes avec une prise de décision intelligente
Peut-être plus important encore, cette configuration permet une nouvelle ère de collaboration IA-à-IA, où un modèle peut examiner par les pairs, valider ou consulter un autre via l'interface universelle du web.
La combinaison du raisonnement de Claude avec l'exécution de Playwright crée un moteur robuste pour l'automatisation intelligente.
En utilisant la configuration Bridge, vous contournez le plus grand obstacle — l'authentification — vous permettant de tirer parti de cette puissance immédiatement.
Note de Sécurité Importante
Bien que cette configuration protège vos identifiants d'authentification (qui restent locaux), soyez conscient des risques de confidentialité des données. Toute information affichée sur une page web que Claude visite — y compris les données personnelles, les détails financiers ou le contenu propriétaire — est effectivement "vue" par le modèle et transmise au fournisseur d'IA pour traitement. Faites toujours preuve de prudence lorsque vous dirigez l'agent vers des pages contenant des informations sensibles.
Références
- Documentation du Model Context Protocol (MCP)
- Dépôt GitHub de Playwright MCP
- Extension Officielle Playwright MCP (Versions GitHub)
Rejoignez la conversation ! Vous avez des questions ou un cas d'utilisation génial pour le Pont Playwright MCP ? Partagez vos pensées dans la section commentaires ci-dessous (compte GitHub requis).
Continuer la lecture
Articles similaires
Dec 7, 2025
0CommentairesSécurisez Vos Données, Libérez l'IA : Déployez Open WebUI Localement avec un GPU Ollama à Distance
Ce guide technique détaille le déploiement d'Open WebUI dans un conteneur Docker via WSL, configuré pour s'interfacer avec une instance distante d'Ollama accélérée par GPU sur un réseau local. Suivez ces étapes pour une configuration d'interface LLM découplée et performante.
Apr 21, 2025
0CommentairesMaîtriser le SDK Python OpenAI Agents : Construisez des flux de travail IA intelligents avec des outils, des garde-fous et la coordination multi-agents
Un tutoriel approfondi et étape par étape sur le SDK Python OpenAI Agents, couvrant l'installation, l'intégration d'outils, la gestion du contexte, les garde-fous, l'orchestration multi-agents et le traçage pour construire des applications robustes d'agents IA.
Mar 28, 2025
0CommentairesLibérer la puissance de l'IA : Une plongée en profondeur dans le Model Context Protocol (MCP)
Découvrez comment le Model Context Protocol (MCP) révolutionne l'IA en standardisant les connexions entre les grands modèles de langage (LLM) et les outils externes, permettant une intégration transparente et des capacités améliorées.