🚨 Breaking
- Claude Opus 4.8 lancé le 28 mai 2026 : contexte = 1 M tokens (par défaut) et sortie max = 128 k tokens. Disponible sur Claude API, Amazon Bedrock, Vertex AI. Si votre code fixe la version du modèle, il faut passer à
claude-opus-4-8pour profiter du nouveau contexte. - Dépréciation Claude Sonnet 4 & Claude Opus 4 annoncée le 14 avril 2026. Retrait prévu le 15 juin 2026. Migration recommandée vers
claude-sonnet-4-6etclaude-opus-4-8. Sans mise à jour, les appels API renverront une erreur model_not_found.
Source Anthropic – May 28 2026 | Source Anthropic – Apr 14 2026
🗑️ Dépréciations
- Les modèles
claude-sonnet-4-20250514etclaude-opus-4-20250514seront retirés le 15 juin 2026. Aucun autre modèle n’est marqué comme déprécié dans le brief.
💰 Pricing
- Aucun changement de tarif annoncé dans les notes de version d’Anthropic ou des autres fournisseurs.
🆕 Nouveautés
- goose v1.37.0 ajoute le provider OAuth xAI SuperGrok et expose les modèles bruts via ACP.
- llama.cpp (b9483, b9503, b9500, b9496, b9495) corrige des bugs de profiling, ajoute le support audio Gemma 4 et améliore le heartbeat Metal.
- TensorRT‑LLM v1.3.0rc17 introduit le support du modèle MoT World, le parallélisme multi‑node pour MiniMax‑M2 et restaure le processeur texte‑only de Mistral Large 3.
- vllm v0.22.0 renforce DeepSeek V4 avec un nouveau package, support NVFP4 MoE et optimisations CUDA. Sources goose | Sources llama.cpp | Sources TensorRT‑LLM | Sources vllm
🌐 Actualité IA
- Aucun signal non‑provider (réglementaire, financement, recherche) n’est présent dans le brief du jour.
💡 Conseil du jour
Action immédiate : mettez à jour vos appels Anthropic pour utiliser les identifiants claude-opus-4-8 (et claude-sonnet-4-6 si vous utilisez Sonnet) aujourd’hui, puis planifiez un test de charge avant le 15 juin 2026 afin de valider le nouveau contexte de 1 M tokens.