Sin breaking changes · DeepSeek V4 Flash/Pro y GPT-5.5 en Cline · llama.cpp CUDA WHT

🚨 Breaking

Sin cambios críticos hoy. El brief registra 0 breaking changes y 0 deprecaciones en los 26 elementos analizados.

🗑️ Deprecaciones

Ninguna. Nada que migrar.

💰 Pricing

Sin movimientos de precios en el brief del día.

🆕 Novedades

Cline v3.85.0 (fuente) — Tres nuevos modelos disponibles: GPT-5.5 para SAP AI Core, DeepSeek V4 Flash y DeepSeek V4 Pro, y Gemini 3.5 Flash en proveedores Gemini y Vertex. Se corrigió además el manejo del endpoint global de Vertex AI para modelos Claude — si tienes Claude en Vertex en producción, actualiza: el bug causaba enrutamiento incorrecto.

llama.cpp b9330 (fuente) — Corrección para modelos nemotron-h: ffn_latent ahora se etiqueta como MUL_MAT. El bug hacía que el sondeo de backend (buft probe) evaluara una operación elementwise sobre pesos q8_0.

llama.cpp b9329 (fuente) — Transformada rápida de Walsh-Hadamard (WHT) para CUDA añadida; mejora de rendimiento en backends GPU NVIDIA.

browser-use 0.12.9 (fuente) — Se pasa el session_id a las llamadas LLM del juez; se corrige omisión de capturas de pantalla en páginas de nueva pestaña.

🌐 Actualidad IA

Investigación — cuatro papers en Hugging Face: - DVAO (2605.25604): optimización de ventaja con varianza dinámica para RL con múltiples recompensas, en el contexto de Group Relative Policy Optimization (GRPO). - WBench (2605.25874): benchmark multi-turno unificado para evaluar modelos de mundo interactivos en vídeo. - Macaron-A2UI (2605.24830): modelo para generación dinámica de interfaz en agentes personales. - ParaVT (2605.20342): uso paralelo de herramientas en RL multimodal para comprensión de vídeo largo.

Comunidad — "Using AI to write better code more slowly" (Hacker News) acumula 295 puntos y 117 comentarios.

💡 Consejo del día

Si usas modelos Claude a través de Vertex AI con Cline, actualiza a v3.85.0 hoy: la corrección del endpoint global previene enrutamiento incorrecto en producción.