Nuevos modelos Anthropic y Nex AGI, actualizaciones en TensorRT-LLM y llama.cpp

🚨 Breaking

Ningún cambio.

🗑️ Dépréciations

Ningún cambio.

💰 Pricing

Ningún cambio.

🆕 Nouveautés

Anthropic lanza Claude Fable 5 y Claude Mythos 5 (este último para participantes de Project Glasswing). Ambos soportan 1M de contexto y 128k tokens de salida, con thinking adaptativo siempre activo. Detalles
Nex AGI presenta Nex-N2-Pro (gratuito), modelo MoE agéntico de 397B total (17B activos) basado en Qwen3.5, acepta texto e imagen. Ver en OpenRouter
NVIDIA TensorRT-LLM v1.3.0rc18: soporte para Nemotron-H NVFP4 en Hopper, Qwen image, Step-3.7-Flash y Cosmos. Aviso: DSV3.2 crashea con IMA en tests de rendimiento en GB200/GB300 si se usa el backend CuteDSL MoE. Workaround: usar otro backend. Release
llama.cpp múltiples actualizaciones (b9585 a b9570): corrección en inferencia de Granite Speech, soporte para asistentes Gemma-4 E2B/E4B, fix en logging de ngram-map, optimización de slots de caché KV, corrección en Plamo2, y mejoras en CI y WebGPU. Ver releases

🌐 Actualité IA

Ninguna señal.

💡 Conseil du jour

Si trabajas con NVIDIA GB200/GB300 y usas el backend CuteDSL MoE en TensorRT-LLM, migra temporalmente a otro backend para evitar crashes. Además, prueba Claude Fable 5 si necesitas contexto largo (1M tokens) y alta capacidad de razonamiento; el modelo gratuito Nex-N2-PRO puede ser una alternativa viable para tareas agénticas sin coste.