🚨 Breaking
Sin cambios.
🗑️ Dépréciations
Sin cambios.
💰 Pricing
Sin cambios.
🆕 Nouveautés
- Anthropic: Lanzó Claude Fable 5 y Claude Mythos 5 (éste último para Project Glasswing). Ambos con ventana de contexto de 1M tokens y 128k tokens de salida, con adaptive thinking siempre activo. Detalles
- Mistral: Publicó OCR 4 (
mistral-ocr-4-0). La API ahora incluyeinclude_blocksque devuelve bounding boxes a nivel de párrafo con etiquetas estructurales. Detalles - TensorRT-LLM: Versión 1.3.0rc19 con soporte para checkpoints cuantizados de Wan2.2-T2V, MTP para NVFP4, y backends PyTorch para T5, BART y MiniMax-M3. Atención: Llama 3.1 8B FP8 puede colgarse durante el warmup en GB200. Release
- llama.cpp: Múltiples versiones (b9761 a b9776) que incluyen corrección de overflow en atención Vulkan, mejora de inferencia MTP, adición de IDs a respuestas de tool calls, y descarga de modelos en proceso separado para el router. Ver releases
🌐 Actualité IA
Sin señales.
💡 Conseil del día
Revisa si los nuevos modelos de Anthropic (Fable 5) o Mistral OCR 4 pueden optimizar tus flujos actuales. Si usas TensorRT-LLM, monitorea el issue de Llama 3.1 en GB200 antes de actualizar. Para entornos self-hosted, considera las últimas versiones de llama.cpp que mejoran estabilidad y rendimiento.