🚨 Breaking
Ningún cambio.
🗑️ Dépréciations
Ningún cambio.
💰 Pricing
Ningún cambio.
🆕 Nouveautés
-
Anthropic lanza Claude Fable 5 y Claude Mythos 5 (este último para participantes de Project Glasswing). Ambos soportan 1M de contexto y 128k tokens de salida, con thinking adaptativo siempre activo. Detalles
-
Nex AGI presenta Nex-N2-Pro (gratuito), modelo MoE agéntico de 397B total (17B activos) basado en Qwen3.5, acepta texto e imagen. Ver en OpenRouter
-
NVIDIA TensorRT-LLM v1.3.0rc18: soporte para Nemotron-H NVFP4 en Hopper, Qwen image, Step-3.7-Flash y Cosmos. Aviso: DSV3.2 crashea con IMA en tests de rendimiento en GB200/GB300 si se usa el backend CuteDSL MoE. Workaround: usar otro backend. Release
-
llama.cpp múltiples actualizaciones (b9585 a b9570): corrección en inferencia de Granite Speech, soporte para asistentes Gemma-4 E2B/E4B, fix en logging de ngram-map, optimización de slots de caché KV, corrección en Plamo2, y mejoras en CI y WebGPU. Ver releases
🌐 Actualité IA
Ninguna señal.
💡 Conseil du jour
Si trabajas con NVIDIA GB200/GB300 y usas el backend CuteDSL MoE en TensorRT-LLM, migra temporalmente a otro backend para evitar crashes. Además, prueba Claude Fable 5 si necesitas contexto largo (1M tokens) y alta capacidad de razonamiento; el modelo gratuito Nex-N2-PRO puede ser una alternativa viable para tareas agénticas sin coste.