George Hotz, le hacker qui a brisé en premier l’iPhone à 17 ans et a fait de l’ingénierie inverse de la PlayStation 3, a publié dimanche un billet de blog affirmant que l’adoption massive d’agents de codage par IA entraînera une dégradation significative de la qualité des logiciels. Hotz a écrit : « J’appelle ça maintenant : l’adoption d’agents IA dans le développement logiciel sera l’une des erreurs les plus coûteuses de l’histoire du secteur. » Sa position s’oppose directement à celle d’Andrej Karpathy, l’un des chercheurs les plus en vue sur l’IA, qui a rejoint l’équipe de pré-entraînement d’Anthropic le 19 mai 2026, en déclarant explicitement que les agents IA ont déjà transformé le développement logiciel. Les deux incarnent des pôles opposés d’un débat sectoriel encore instable, avec chacun une crédibilité substantielle pour étayer leurs positions.
L’argument central de Hotz
Hotz a passé six mois à tester des agents IA sur des projets réels : des parties de Tinygrad, son framework open source d’apprentissage profond, et une ingénierie inverse complète du micrologiciel d’une puce USB-PCIe. Fort de cette expérience, il soutient que « les agents ne peuvent pas programmer, et il faut de plus en plus longtemps pour se rendre compte qu’ils n’y arrivent pas ». Il décrit le résultat comme « cassé, mais d’une manière qui devient de plus en plus difficile à détecter. Ce qui correspond exactement à ce qu’on attend d’un modèle statistique de plus en plus précis ».
Son inquiétude centrale est organisationnelle. Les meilleurs éléments disposent de boucles de retour serrées pour repérer les problèmes générés par les agents avant qu’ils ne soient livrés : ils lisent le code, repèrent les erreurs et calibrent le moment où faire confiance à l’outil. « Les moins bons n’auront pas cette vérification interne », écrit Hotz. Le point critique : les moins bons utilisent des agents pour produire 10 fois le volume de sortie qu’ils produisaient auparavant. Dans les grandes entreprises, cela entraîne une dégradation plus rapide de la qualité moyenne du code, masquée par le simple volume. Hotz décrit le résultat comme « un âge d’or pour des seaux et des seaux de médiocrité, et une ère sombre pour les pépites de qualité ». Il pointe des informations selon lesquelles Apple pousse des outils de codage par IA à l’ensemble de son organisation d’ingénierie, et pose la question : « Pensez-vous que macOS sera meilleur ou pire dans les 2 prochaines années ? »
Pas une question d’ego
Hotz anticipe l’objection selon laquelle un programmeur qui définit une partie de son identité à travers son métier résisterait naturellement à des outils de remplacement. Il la prend au sérieux et la balaie sur le fond. « L’AFL de Google a trouvé plus de bugs que les LLM, et personne n’a eu ce sentiment. Les échecs et le Go sont plus populaires que jamais », a-t-il écrit. L’IA des échecs a dominé les humains pendant des décennies tandis que le jeu n’a fait que gagner en popularité.
Hotz exprime aussi du scepticisme sur les motivations du secteur : « Je me dis presque que c’est une sorte de psyop pour vendre des agents. La peur de la perte est l’une des seules façons de faire bouger les grandes entreprises. Même si je pense que, dans cette peur, elles font une grosse erreur. »
Où se situent les camps
Hotz se place désormais dans ce qu’il appelle le « camp LeCun/Marcus » — en référence à Yann LeCun, le principal scientifique de l’IA de Meta, et à Gary Marcus, un sceptique de longue date sur les LLM. Tous deux ont soutenu que les modèles de langage sont fondamentalement de sophistiqués repéreurs de motifs : ils peuvent imiter la distribution du code existant, mais ne peuvent pas raisonner à partir de principes premiers sur de vrais problèmes nouveaux.
Le « vibe coding » — décrire ce que vous voulez en langage simple et laisser l’IA générer l’implémentation — a explosé au cours de la dernière année. Les grands laboratoires d’IA ont positionné le codage par agents comme un produit phare. En 2025, Microsoft a transformé GitHub Copilot en un système agentique complet, le PDG Satya Nadella le décrivant comme un changement au niveau plateforme comparable au passage au cloud.
Karpathy avait été sceptique à propos des agents plus tôt en 2025, mais a inversé sa position après de nouvelles sorties de modèles. Le PDG d’Anthropic, Dario Amodei, a déclaré à Davos que certains ingénieurs d’Anthropic ont déjà cessé d’écrire du code eux-mêmes, laissant les modèles s’en charger pendant qu’ils relisent la sortie. Hotz, ayant essayé la même approche, dit qu’il s’est retrouvé à corriger manuellement à chaque fois.