llama.cpp 4 builds en 24h (NVFP4, Vulkan, OpenCL) + browser-use fixes sécurité — 2026-05-24

🚨 Breaking

Rien à signaler aujourd'hui.

🗑️ Dépréciations

Rien à signaler aujourd'hui.

💰 Pricing

Aucun mouvement tarifaire dans le brief.

🆕 Nouveautés

llama.cpp — 4 builds le 2026-05-23 (b9294 · b9295 · b9296 · b9297)

b9297 : ajout des tenseurs NVFP4 MTP scale, liaison des tenseurs Qwen3.5 MTP
b9296 : fix ggml — vérification de la bonne méthode d'interface avant le fallback 2D get
b9295 : fix Vulkan sous Windows pour find_package de SPIRV-Headers
b9294 : généralisation des kernels OpenCL Adreno MoE

Si tu fais tourner des modèles en local, b9297 est le build à surveiller pour le support NVFP4. Les trois autres sont de la maintenance incrémentale.

pydantic-ai v2.0.0b3 (release)

Troisième beta de la v2. Toujours en beta — pas de passage en prod sans filet.

browser-use 0.12.8 (release)

Deux correctifs à noter : - Socket Unix restreint au propriétaire uniquement - evaluate() refusé sur les profils navigateur restreints

Si tu exposes browser-use à des agents non-trusted, mise à jour recommandée.

OpenAI Codex 0.134.0-alpha.3 (release) — alpha, pas de changelog détaillé disponible.

🌐 Actualité IA

Microsoft indique que l'IA coûte plus cher que des employés humains sur certaines tâches (Fortune, 2026-05-22). Le coût en tokens des agents autonomes reste le frein principal. Le tracker communautaire isaiprofitable.com compile les bilans publics — utile pour challenger tes budgets API en interne.

💡 Conseil du jour

Instrumente le coût par tâche complétée, pas par token. C'est le seul indicateur qui permet de comparer honnêtement un agent LLM avec une alternative déterministe ou humaine — et le seul que Microsoft aurait dû afficher avant de déployer.