Anthropic Fable 5, Nexus N2-Pro, mises à jour llama.cpp

🚨 Breaking

Aucun changement.

🗑️ Dépréciations

Aucun changement.

💰 Pricing

Aucun changement.

🆕 Nouveautés

Anthropic a lancé Claude Fable 5 (claude-fable-5) et Claude Mythos 5 (claude-mythos-5), modèles supportant 1M tokens de contexte, 128k tokens de sortie max, et adaptive thinking toujours actif. Source

Nex AGI propose Nex-N2-Pro (free) : 17B actifs / 397B total, archi Qwen3.5, entrée texte+image. Source

NVIDIA TensorRT-LLM v1.3.0rc18 : support Nemotron-H NVFP4 sur Hopper, Qwen image, Step-3.7-Flash, et Cosmos. Attention : DSV3.2 crashe avec IMA sur GB200/GB300 si backend CuteDSL MoE utilisé (workaround : autre backend). Source

llama.cpp : multiples correctifs (granite speech, gemma-4 E2B/E4B, speculative, serveur slots, plamo2). Versions b9585, b9568, b9587, b9584, b9574, b9573, b9570. Voir les releases

🌐 Actualité IA

Aucun signal.

💡 Conseil du jour

Évaluez Claude Fable 5 pour vos pipelines agentiques nécessitant un long contexte (1M tokens) et de grandes sorties. Pour l'inférence locale, testez Nex-N2-Pro sur des tâches multimodales. Méfiez-vous du backend CuteDSL MoE de TensorRT-LLM sur GB200/GB300 si vous déployez DSV3.2.