🚨 Breaking
Aucun changement.
🗑️ Dépréciations
Aucun changement.
💰 Pricing
Aucun changement.
🆕 Nouveautés
Anthropic a lancé Claude Fable 5 (claude-fable-5) et Claude Mythos 5 (claude-mythos-5), modèles supportant 1M tokens de contexte, 128k tokens de sortie max, et adaptive thinking toujours actif.
Source
Nex AGI propose Nex-N2-Pro (free) : 17B actifs / 397B total, archi Qwen3.5, entrée texte+image. Source
NVIDIA TensorRT-LLM v1.3.0rc18 : support Nemotron-H NVFP4 sur Hopper, Qwen image, Step-3.7-Flash, et Cosmos. Attention : DSV3.2 crashe avec IMA sur GB200/GB300 si backend CuteDSL MoE utilisé (workaround : autre backend). Source
llama.cpp : multiples correctifs (granite speech, gemma-4 E2B/E4B, speculative, serveur slots, plamo2). Versions b9585, b9568, b9587, b9584, b9574, b9573, b9570. Voir les releases
🌐 Actualité IA
Aucun signal.
💡 Conseil du jour
Évaluez Claude Fable 5 pour vos pipelines agentiques nécessitant un long contexte (1M tokens) et de grandes sorties. Pour l'inférence locale, testez Nex-N2-Pro sur des tâches multimodales. Méfiez-vous du backend CuteDSL MoE de TensorRT-LLM sur GB200/GB300 si vous déployez DSV3.2.