🚨 Breaking
Aucun breaking change cette semaine côté Anthropic, OpenAI ou challengers. Semaine de build, pas de casse.
🗑️ Dépréciations
Rien à signaler. Pas d'annonce de fin de vie de modèle ou d'endpoint cette semaine sur les providers T1–T3 scannés.
💰 Pricing
Amazon Bedrock AgentCore Payments (preview) introduit des agents capables de déclencher des paiements autonomes via Stripe ou Coinbase. Pas de grille tarifaire publiée, mais anticipe un coût double sur chaque tool call « paiement » : compute LLM + frais transaction. Si tu construis des pipelines agents avec actions financières, intègre dès maintenant un plafond de dépense par session dans ta couche d'autorisation. Source
Together AI maintient son avantage sur le déploiement open-source : modèles HuggingFace en Dedicated Container Inference sans gestion d'infra GPU. Pertinent si tu veux faire tourner un modèle custom en prod à coût GPU maîtrisé. Source
🆕 Nouveautés
Claude Platform on AWS (GA, 11 mai) — Anthropic livre son expérience native directement depuis ton compte AWS : mêmes modèles, même interface, même billing AWS, sans contrat séparé Anthropic. Aucun changement de code côté API. Si ton infra est AWS-first, c'est la fin de la double relation contractuelle. Source
Amazon Nova Sonic + WebRTC — architecture end-to-end publiée pour du streaming vocal temps réel via Kinesis Video Streams. Deux scénarios concrets documentés. Par rapport à l'API Realtime d'OpenAI : intégration IAM/VPC native, mais latence et pricing Kinesis à benchmarker sur ton use case avant de migrer. Source
Together AI Voice Finder — catalogue 600+ voix TTS interrogeable en langage naturel ou par upload d'un sample audio. Utile pour prototyper une feature voix sans auditionner manuellement des centaines d'options. Source
AgentCore Payments (preview) — signal fort vers les « agents économiques ». À surveiller immédiatement côté sécurité : scope d'autorisation des agents, audit trail des transactions, surface d'attaque en cas de prompt injection sur un agent avec accès Stripe.
💡 Conseil pratique
AgentCore Payments ouvre une surface d'attaque inédite : un agent qui peut payer est un agent qu'on peut manipuler pour payer. Avant d'intégrer ce genre de capability en prod, définis un modèle d'autorisation explicite — montant max par appel, whitelist de bénéficiaires, confirmation humaine au-delà d'un seuil — et logue chaque tool call dans un système hors portée du LLM.
Action cette semaine : si tu as un compte AWS actif avec Anthropic en prod, active Claude Platform on AWS et vérifie la bascule de facturation. Zéro changement de code, billing unifié, 30 minutes max.