🚨 Breaking
Aucun changement.
🗑️ Dépréciations
Aucun changement.
💰 Pricing
Aucun changement.
🆕 Nouveautés
- Anthropic : Lancement de Claude Fable 5 (claude-fable-5), modèle le plus capable, et Claude Mythos 5 pour le programme Glasswing. Les deux supportent 1M tokens de contexte, 128k tokens de sortie max, et adaptive thinking. Détails
- Anthropic (AWS) : Webhooks, orchestration multi-agent et sandboxes self-hosted pour Claude Managed Agents sur AWS. Détails
- llama.cpp : Multiples releases (b9584 à b9592) incluant optimisation MTP, correction pour Granite Speech, mise à jour LibreSSL 4.3.2, et correctifs CI. b9591 b9585
- TensorRT-LLM : Release candidate v1.3.0rc18 avec support Nemotron-H NVFP4, Qwen image, Step-3.7-Flash, et Cosmos. Détails
- OpenHands : Version 1.8.0 avec profils LLM, délégation de sous-agents, et support générique ABI. Détails
🌐 Actualité IA
Aucun signal non-provider majeur à signaler. L'écosystème open-source d'inférence (llama.cpp, TensorRT-LLM, OpenHands) continue d'évoluer rapidement, mais sans annonce réglementaire ou levée de fonds marquante aujourd'hui.
💡 Conseil du jour
Testez Claude Fable 5 sur un workload représentatif (contexte long, sortie longue) pour évaluer son rapport pertinence/coût par rapport à vos modèles actuels. La capacité 128k output tokens ouvre des cas d'usage (génération de rapports, code long) jusqu'ici difficilement accessibles.