AWS re:Invent 2025 : Les Avancées Majeures en IA
Imaginez un monde où une intelligence artificielle ne se contente plus de répondre à vos questions, mais travaille réellement à votre place pendant des jours entiers, en apprenant vos méthodes, en prenant des initiatives et en livrant des résultats concrets. C’est précisément cette vision que Amazon Web Services a défendue avec force lors de sa grand-messe annuelle re:Invent 2025, qui s’est achevée début décembre à Las Vegas. L’événement a clairement placé l’IA agentique au cœur de la stratégie d’AWS pour les prochaines années.
L’ère des agents IA autonomes s’accélère
Le message était limpide dès le discours d’ouverture de Matt Garman, CEO d’AWS : les assistants IA classiques cèdent progressivement la place à de véritables agents autonomes capables d’exécuter des tâches complexes de bout en bout. Cette transition n’est pas qu’une promesse marketing. Plusieurs annonces concrètes ont démontré que la technologie est désormais suffisamment mature pour passer du stade expérimental à des déploiements en production dans les grandes entreprises.
Swami Sivasubramanian, vice-président en charge de l’Agentic AI chez AWS, n’a pas mâché ses mots lors de son keynote : nous assistons à un changement historique. Pour la première fois, il devient possible de décrire un objectif en langage naturel, et de laisser un agent générer le plan, écrire le code, appeler les outils nécessaires et livrer la solution complète. Cette autonomie marque un saut qualitatif majeur dans l’adoption de l’IA en entreprise.
Les Frontier Agents : des collaborateurs infatigables
AWS a dévoilé une nouvelle génération d’agents nommés Frontier agents. Parmi eux, le plus impressionnant reste sans conteste Kiro autonomous agent. Cet agent est conçu pour apprendre les préférences et le mode de fonctionnement d’une équipe de développement, puis écrire du code de manière autonome pendant des heures, voire des jours entiers, sans supervision humaine constante.
Deux autres agents complètent cette trilogie : l’un dédié à la sécurité logicielle (revues de code automatisées, détection de vulnérabilités), l’autre orienté DevOps avec pour mission d’anticiper et d’éviter les incidents lors des déploiements en production. Ces trois agents sont déjà disponibles en preview, signe que AWS veut accélérer leur adoption par les entreprises.
Les agents donnent la liberté de construire sans limites, accélérant considérablement le passage de l’idée à l’impact concret.
– Swami Sivasubramanian, AWS
AgentCore enrichi : plus de contrôle et de mémoire
La plateforme AgentCore, qui permet de concevoir et de déployer des agents personnalisés, reçoit plusieurs améliorations significatives. La fonctionnalité Policy in AgentCore permet désormais de définir très finement les limites éthiques, réglementaires et opérationnelles de chaque agent, répondant ainsi aux exigences croissantes des directions conformité et sécurité.
Autre avancée majeure : les agents gagnent une forme de mémoire persistante. Ils peuvent désormais enregistrer des informations sur les utilisateurs, leurs habitudes, leurs préférences, et s’en souvenir au fil des interactions. AWS fournit également 13 systèmes d’évaluation préconstruits pour mesurer la performance, la fiabilité et la sécurité des agents déployés.
Nouvelles puces : Trainium3 et Graviton5 en vedette
Sur le plan matériel, AWS n’entend pas se laisser distancer dans la course aux performances. La nouvelle puce Trainium3 promet jusqu’à 4 fois plus de performances que son prédécesseur, tant en entraînement qu’en inférence, tout en réduisant la consommation énergétique de 40 %. Une prouesse qui place AWS en concurrent direct des solutions Nvidia dans de nombreux cas d’usage.
Parallèlement, la cinquième génération de processeurs Graviton arrive avec Graviton5. Doté de 192 cœurs, ce CPU revendique une réduction de la latence inter-cœurs jusqu’à 33 % et une bande passante accrue, grâce à une architecture plus dense. Ces deux annonces matérielles montrent qu’AWS mise gros sur l’intégration verticale : maîtriser à la fois le cloud, les modèles et le silicium.
La famille Nova s’agrandit
AWS continue d’étoffer sa gamme de modèles propriétaires avec quatre nouveaux membres de la famille Nova. Trois modèles orientés texte et un modèle multimodal capable de générer à la fois du texte et des images. Parallèlement, le service Nova Forge permet aux clients de récupérer des modèles pré-entraînés, mid-trained ou post-trained, puis de les finaliser avec leurs propres données propriétaires.
Cette approche modulaire séduit particulièrement les entreprises soucieuses de protéger leurs données tout en bénéficiant des dernières avancées en IA générative.
Des économies très attendues sur les bases de données
Parmi la avalanche d’annonces, l’une a particulièrement fait réagir la communauté cloud : les Database Savings Plans. En s’engageant sur un montant horaire constant pendant un an, les clients peuvent désormais obtenir jusqu’à 35 % de réduction sur l’ensemble des services de bases de données éligibles. Les dépassements restent facturés au tarif on-demand, mais l’essentiel de la consommation bénéficie automatiquement de la ristourne.
Corey Quinn, figure bien connue de la critique cloud, n’a pas caché son enthousiasme : après six ans de revendications, les utilisateurs obtiennent enfin un vrai geste tarifaire sur ce poste de dépense souvent très lourd.
Werner Vogels tire sa révérence… symbolique
La dernière soirée de re:Invent 2025 restera dans les mémoires pour une raison particulière : Werner Vogels, CTO historique d’Amazon, a annoncé que ce serait son dernier keynote à la tribune. Précisant immédiatement qu’il ne quittait pas l’entreprise, il a simplement estimé qu’après 14 éditions, il était temps de laisser la place à de nouvelles voix.
Dans un discours empreint d’émotion et d’humour, Vogels a abordé sans détour la question qui hante bon nombre de développeurs : l’IA va-t-elle me rendre obsolète ? Sa réponse est claire : certains gestes techniques seront automatisés, mais l’humain qui sait évoluer restera irremplaçable.
L’IA ne vous rendra pas obsolète si vous acceptez d’évoluer avec elle.
– Werner Vogels
Des cas d’usage clients déjà très concrets
Lyft a partagé des résultats impressionnants : grâce à un agent construit sur Claude via Amazon Bedrock, le temps moyen de résolution des demandes des chauffeurs et passagers a chuté de 87 %. L’adoption de cet agent par les chauffeurs a progressé de 70 % sur l’année.
Autre annonce notable : les AI Factories, des datacenters privés conçus en partenariat avec Nvidia, permettant aux grandes entreprises et aux gouvernements de déployer des capacités d’IA AWS tout en conservant la souveraineté totale sur leurs données. Une réponse directe aux exigences de souveraineté numérique.
Un tournant stratégique clair pour AWS
Au-delà des annonces techniques, re:Invent 2025 a confirmé une orientation stratégique forte : faire de l’IA agentique le principal moteur de valeur pour les clients enterprise. En combinant agents autonomes ultra-personnalisables, puces maison ultra-performantes, modèles propriétaires flexibles et incitations tarifaires agressives, AWS cherche à verrouiller sa position dominante dans le cloud tout en capturant la vague IA qui redéfinit le secteur.
Pour les entreprises, le message est clair : l’heure n’est plus à expérimenter timidement l’IA, mais à la déployer massivement là où elle crée le plus de valeur : l’automatisation intelligente et autonome des processus métiers et techniques. Reste à voir si les promesses se traduiront rapidement par des ROI mesurables à grande échelle. Mais une chose est sûre : après re:Invent 2025, ignorer la vague agentique devient presque impossible pour qui veut rester compétitif dans le paysage technologique actuel.
Et vous, comment comptez-vous intégrer ces nouvelles capacités d’agents IA dans vos projets ?