Anthropic Revisite Ses Tests Face à Claude
Imaginez que vous postulez pour un poste technique dans l’une des entreprises les plus avancées en intelligence artificielle au monde. Vous passez le test, vous donnez le meilleur de vous-même… et une machine vous surclasse largement. C’est exactement ce qui arrive aujourd’hui chez Anthropic, où les recruteurs doivent courir plus vite que leur propre IA pour continuer à identifier les vrais talents humains.
Quand l’IA commence à battre les candidats à son propre jeu
Depuis 2024, l’équipe en charge de l’optimisation des performances chez Anthropic soumettait les candidats à un test à domicile plutôt corsé. L’objectif ? Vérifier leurs compétences réelles en matière de performance hardware et software. Mais à mesure que les versions de Claude progressaient, ce fameux test est devenu de moins en moins discriminant.
Le responsable de cette équipe, Tristan Hume, a récemment raconté cette étonnante course contre sa propre technologie dans un article de blog passionnant. Chaque nouvelle itération du modèle obligeait l’entreprise à revoir entièrement sa copie. Ce qui fonctionnait parfaitement avec Claude 3 ne tenait plus la route avec Claude 4, puis Claude 4.5 a fini par tout balayer.
« Chaque nouveau modèle de Claude nous a forcés à repenser entièrement le test. Quand on donnait le même temps, Claude Opus 4 surpassait la plupart des candidats humains. Puis Claude Opus 4.5 a égalé même nos meilleurs profils. »
– Tristan Hume, lead de l’équipe performance chez Anthropic
Cette situation est paradoxale : une entreprise qui développe l’une des IA les plus puissantes du marché se retrouve piégée par sa propre création au moment de recruter.
Un paradoxe qui n’est pas sans ironie
Dans les universités, les professeurs luttent depuis plusieurs années contre la triche assistée par IA. ChatGPT, Gemini, Claude… tous ces outils permettent de rédiger des dissertations ou de résoudre des exercices en quelques secondes. Et voilà qu’aujourd’hui, ce sont les laboratoires d’IA eux-mêmes qui font face au même problème, mais à un niveau bien supérieur.
Chez Anthropic, la règle est claire : l’utilisation d’outils IA est explicitement autorisée pendant le test. L’idée n’est pas d’interdire Claude, mais de concevoir un exercice suffisamment innovant et spécifique pour que même la meilleure version de l’IA ne puisse pas produire une solution optimale sans véritable compréhension humaine.
Malheureusement, dès que le modèle progresse, il comble rapidement l’écart. Résultat : le test ne mesure plus la compétence du candidat, mais plutôt le modèle d’IA qu’il a choisi d’utiliser.
Comment Anthropic a tenté de reprendre le contrôle
Face à ce constat, l’équipe a dû innover. Plutôt que de renforcer la difficulté des questions d’optimisation pure (ce que Claude maîtrisait de mieux en mieux), ils ont choisi de changer radicalement d’angle.
Le nouveau test s’éloigne des problématiques classiques d’optimisation hardware pour explorer des domaines plus conceptuels, moins bien couverts par les données d’entraînement des grands modèles. L’objectif est double :
- Créer des problèmes suffisamment inédits pour que le modèle ne puisse pas s’appuyer sur des patterns déjà vus
- Valoriser la créativité et la compréhension profonde plutôt que la simple capacité à coder vite
- Maintenir un écart significatif entre les meilleurs humains et l’IA, même la plus avancée
Cette approche montre à quel point le recrutement dans le domaine de l’IA est devenu un défi stratégique majeur pour les entreprises du secteur.
Un appel public lancé aux candidats
Dans une démarche à la fois audacieuse et transparente, Anthropic a publié l’ancienne version du test en ligne. L’invitation est claire : « Si vous arrivez à battre Opus 4.5, contactez-nous ». Une manière de transformer une difficulté en opportunité de recrutement.
Cet appel public est révélateur d’un état d’esprit particulier : même dans une période où l’IA semble tout dominer, l’entreprise continue de chercher des humains capables de la dépasser, ne serait-ce que sur des cas très spécifiques.
Quelles leçons pour le recrutement tech en 2026 ?
Cette histoire dépasse largement le cas d’Anthropic. Elle pose des questions fondamentales sur l’avenir des entretiens techniques dans un monde où les assistants IA deviennent extrêmement performants.
Voici quelques pistes qui émergent déjà dans le secteur :
- Passer d’exercices de pure exécution à des problématiques ouvertes nécessitant créativité et vision stratégique
- Évaluer la capacité à critiquer et améliorer une solution générée par IA plutôt que de la produire de zéro
- Privilégier des discussions approfondies autour du raisonnement plutôt que des QCM ou des leetcodes classiques
- Intégrer des contraintes très inhabituelles ou des contextes métier très spécifiques
- Utiliser des tests collaboratifs où le candidat doit travailler avec l’IA en temps réel
Le recrutement tech entre dans une nouvelle ère où la compétence ne se mesure plus seulement à la capacité à écrire du code, mais à la capacité à diriger, comprendre et dépasser les outils que tout le monde utilise.
Vers une redéfinition complète des compétences
Si Claude 5 ou Claude 6 continuent sur cette lancée, il est probable que même les nouveaux tests conçus aujourd’hui deviendront obsolètes d’ici quelques mois. Cette accélération pose un défi existentiel aux entreprises du secteur : comment continuer à recruter des humains quand l’IA fait mieux que la majorité d’entre eux sur les tâches techniques ?
La réponse pourrait résider dans ce qui reste encore difficile pour les modèles : l’intuition, la créativité disruptive, la vision produit, la capacité à travailler en équipe dans des contextes ambigus, ou encore à défendre ses choix face à des contraintes business contradictoires.
Chez Anthropic, cette crise du recrutement devient paradoxalement une formidable opportunité d’innovation. En étant forcée de repenser ses méthodes d’évaluation, l’entreprise pourrait bien inventer le futur du recrutement technique pour toute l’industrie.
Et si la vraie compétence de demain n’était plus de savoir coder, mais de savoir diriger une IA pour qu’elle produise quelque chose d’exceptionnel ?
Une chose est sûre : dans le monde de l’IA, même les tests d’embauche ne sont plus à l’abri de la disruption. Et c’est peut-être là la plus belle preuve que nous vivons une révolution technologique majeure.