Advisory LLM API — 14 mai 2026 : Claude natif sur AWS, agents qui paient, voix WebRTC temps réel

ApiDelta · 2026-05-14 · 412 mots · apidelta.maxiaworld.app

🚨 Breaking

Aucun breaking change cette semaine côté Anthropic, OpenAI ou challengers. Semaine de build, pas de casse.

🗑️ Dépréciations

Rien à signaler. Pas d'annonce de fin de vie de modèle ou d'endpoint cette semaine sur les providers T1–T3 scannés.

💰 Pricing

Amazon Bedrock AgentCore Payments (preview) introduit des agents capables de déclencher des paiements autonomes via Stripe ou Coinbase. Pas de grille tarifaire publiée, mais anticipe un coût double sur chaque tool call « paiement » : compute LLM + frais transaction. Si tu construis des pipelines agents avec actions financières, intègre dès maintenant un plafond de dépense par session dans ta couche d'autorisation. Source

Together AI maintient son avantage sur le déploiement open-source : modèles HuggingFace en Dedicated Container Inference sans gestion d'infra GPU. Pertinent si tu veux faire tourner un modèle custom en prod à coût GPU maîtrisé. Source

🆕 Nouveautés

Claude Platform on AWS (GA, 11 mai) — Anthropic livre son expérience native directement depuis ton compte AWS : mêmes modèles, même interface, même billing AWS, sans contrat séparé Anthropic. Aucun changement de code côté API. Si ton infra est AWS-first, c'est la fin de la double relation contractuelle. Source

Amazon Nova Sonic + WebRTC — architecture end-to-end publiée pour du streaming vocal temps réel via Kinesis Video Streams. Deux scénarios concrets documentés. Par rapport à l'API Realtime d'OpenAI : intégration IAM/VPC native, mais latence et pricing Kinesis à benchmarker sur ton use case avant de migrer. Source

Together AI Voice Finder — catalogue 600+ voix TTS interrogeable en langage naturel ou par upload d'un sample audio. Utile pour prototyper une feature voix sans auditionner manuellement des centaines d'options. Source

AgentCore Payments (preview) — signal fort vers les « agents économiques ». À surveiller immédiatement côté sécurité : scope d'autorisation des agents, audit trail des transactions, surface d'attaque en cas de prompt injection sur un agent avec accès Stripe.

💡 Conseil pratique

AgentCore Payments ouvre une surface d'attaque inédite : un agent qui peut payer est un agent qu'on peut manipuler pour payer. Avant d'intégrer ce genre de capability en prod, définis un modèle d'autorisation explicite — montant max par appel, whitelist de bénéficiaires, confirmation humaine au-delà d'un seuil — et logue chaque tool call dans un système hors portée du LLM.


Action cette semaine : si tu as un compte AWS actif avec Anthropic en prod, active Claude Platform on AWS et vérifie la bascule de facturation. Zéro changement de code, billing unifié, 30 minutes max.

#api#llm#fr#anthropic#aws#bedrock#voice#agents#security