En février 2025, Andrej Karpathy a publié une pensée spontanée qui allait définir toute une année de débat :
« Il y a un nouveau genre de programmation que j'appelle le "vibe coding", où on se laisse complètement porter par les vibes, on embrasse les exponentielles, et on oublie que le code existe. »
Douze mois plus tard, Karpathy lui-même était passé à autre chose. Dans son bilan LLM 2025, il décrivait être passé de « 80 % de codage manuel + 20 % d'agents en novembre à 80 % de codage par agents + 20 % de retouches manuelles en décembre ». Il ne parlait plus de vibe coding. Il parlait d'ingénierie agentique.
Pendant ce temps, le co-PDG de Spotify, Gustav Söderström, déclarait aux investisseurs lors de l'appel résultats Q4 2025 que les meilleurs développeurs de l'entreprise « n'ont pas écrit une seule ligne de code depuis décembre ».
L'industrie évolue si vite que le cadre utilisé pour décrire le développement IA est déjà obsolète. La plupart des gens le voient comme une échelle :
- Vibe Coding — le niveau débutant
- IA assistée — le juste milieu responsable
- Agentique — le niveau avancé
Cette échelle est fausse. Ce ne sont pas des niveaux que l'on gravit. Ce sont des couches que l'on empile — comme un sandwich.
Couche 1 : Vibe Coding — La tranche du dessus
Le tweet original de Karpathy capturait quelque chose de réel. Quand on explore une idée, qu'on prototyper un concept ou qu'on bidouille un projet de week-end, résister à l'IA est contre-productif. Laissez-vous porter par les vibes. Laissez le modèle générer. Voyez ce qui émerge.
Cette couche est puissante pour :
- Le prototypage rapide et les preuves de concept
- L'exploration rapide d'espaces de conception
- Les outils internes que personne d'autre ne maintiendra
- Les hackathons et les expérimentations créatives
Mais les données sont impitoyables sur ses limites.
Une étude CodeRabbit analysant 470 pull requests réelles a révélé que le code généré par l'IA produit 1,7x plus de problèmes que le code écrit par des humains. En matière de sécurité spécifiquement, le code IA était 2,74x plus susceptible d'introduire des vulnérabilités XSS et 1,88x plus susceptible d'introduire une gestion incorrecte des mots de passe.
Le vibe coding fonctionne quand les enjeux sont faibles et que la vitesse d'itération compte plus que la qualité du code. C'est la tranche du dessus — là où les idées naissent, pas là où les produits sont livrés.
Couche 2 : IA assistée — La garniture qui peut tourner
C'est là que vivent la plupart des entreprises aujourd'hui : des développeurs utilisant Copilot, ChatGPT ou Cursor comme un super-autocomplete. Écrire du code, recevoir des suggestions, accepter ou rejeter.
Ça semble être l'approche responsable. Les données disent le contraire.
L'essai contrôlé randomisé de METR — l'étude la plus rigoureuse à ce jour sur le codage assisté par IA — a révélé que les développeurs open source expérimentés étaient en réalité 19 % plus lents en utilisant des outils IA. Le plus frappant ? Ces mêmes développeurs croyaient être 20 % plus rapides. L'écart de perception est presque parfaitement inversé.
Le rapport DORA 2024 de Google, la référence de l'industrie pour les métriques DevOps, a confirmé la tendance : l'adoption accrue de l'IA corrélait avec une réduction de 7,2 % de la stabilité des livraisons et une baisse de 1,5 % du débit. Le coupable ? Les développeurs acceptaient des changements plus volumineux et moins révisés parce que l'IA rendait la génération de code si facile.
Le développement assisté par IA sans discipline ne fait pas gagner du temps — il le redistribue. On gagne du temps à écrire. On le perd à déboguer, réviser et corriger les bugs subtils introduits par l'IA.
C'est la garniture du sandwich — essentielle, mais elle peut gâcher l'ensemble si on n'y prend pas garde.
Couche 3 : Agentique — La fondation
C'est ici que le vrai virage s'opère. Le codage agentique n'est pas de l'autocomplete. C'est de la délégation. Vous définissez la tâche, les contraintes et les critères d'acceptation. L'agent écrit le code, exécute les tests, itère sur les échecs et présente le résultat.
Les preuves s'accumulent rapidement :
- Spotify a construit un système interne appelé « Honk » basé sur Claude Code, permettant le déploiement de code en temps réel à distance. Leurs meilleurs ingénieurs n'écrivent plus de code manuellement depuis décembre 2025.
- Karpathy a décrit la transition : 80 % manuel en novembre, 80 % agent en décembre. Il dit maintenant « vous n'écrivez pas le code directement 99 % du temps ».
- Apple a intégré des agents IA directement dans Xcode, signalant que les workflows agentiques deviennent l'expérience IDE par défaut.
Mais voici ce que les gens manquent : le codage agentique exige plus de compétences en ingénierie, pas moins. Il faut rédiger des spécifications précises. Il faut architecturer des systèmes que l'agent peut comprendre. Il faut réviser les diffs de manière critique. Le rôle du développeur passe de la saisie de code à l'ingénierie de résultats.
C'est la tranche du dessous — la fondation sur laquelle tout le reste repose.
Le sandwich
L'erreur est de traiter ces approches comme concurrentes. Ce sont des couches complémentaires d'un même workflow :
| Couche | Idéal pour | Risque si utilisé seul |
|---|---|---|
| Vibe Coding (dessus) | Idéation, prototypes, exploration | Vulnérabilités de sécurité, ne passe pas à l'échelle |
| IA assistée (milieu) | Boilerplate, docs, tâches routinières | 19 % plus lent sur les tâches complexes, fausse confiance |
| Agentique (dessous) | Code de production, tests, déploiement | Exige des specs solides et une bonne architecture |
Une équipe mature utilise les trois :
- Vibe codez le prototype pour valider l'idée rapidement
- Confiez-le aux agents pour construire la version production avec tests, gestion d'erreurs et sécurité
- Utilisez les outils d'IA assistée pour le travail routinier entre les deux — documentation, boilerplate, revue de code
Le sandwich n'est pas une hiérarchie. C'est un workflow.
Ce que ça signifie pour votre équipe
Les entreprises qui prennent de l'avance ne sont pas celles qui ont choisi un seul niveau. Ce sont celles qui ont appris quand utiliser chaque couche.
Si vous ne faites que du vibe coding, vous construisez sur du sable. Les prototypes semblent magiques, mais le code ne survivra pas au contact avec de vrais utilisateurs, une vraie charge, ou de vraies exigences de sécurité.
Si vous ne faites que de l'IA assistée, vous êtes dans le piège de la productivité. Vous vous sentez plus rapide. Les données disent le contraire. Et vos concurrents qui sont passés à l'agentique vous tournent autour.
Si vous ne faites que de l'agentique, vous sur-ingénieriez la phase d'exploration. Chaque idée n'a pas besoin d'un pipeline d'agents complet. Parfois il faut vibrer d'abord pour savoir si l'idée vaut même la peine d'être construite.
Le coup gagnant, c'est les trois, utilisés délibérément.
Karpathy n'a pas abandonné le vibe coding — il l'a dépassé pour le travail de production tout en le gardant pour l'exploration. Spotify n'est pas passé directement aux agents — ils ont construit l'infrastructure pour supporter les workflows agentiques à grande échelle.
La question n'est pas « à quel niveau êtes-vous ? » C'est « utilisez-vous la bonne couche pour le travail en cours ? »