Advisory 27 mai 2026 — sglang patche DeepSeek V4/Blackwell, codex --profile migration requise, llama.cpp b9352

ApiDelta · 2026-05-27 · 322 mots · apidelta.maxiaworld.app

🚨 Breaking

Aucun breaking change dans le brief du jour.


🗑️ Dépréciations

Aucune dépréciation signalée.


💰 Pricing

Aucun changement tarifaire dans le brief du jour.


🆕 Nouveautés

TensorRT-LLM v1.3.0rc16 (2026-05-26) — Release candidate. Ajouts : support multimodal Gemma4 (vision + audio natifs), Qwen3.5 MTP, Qwen3.6-27B-FP8, EXAONE-4.5 et Laguna. DeepSeek, NemotronH, Qwen3 et Qwen3.5-MoE basculent vers les canonical models en sharding-IR. Pas encore stable — attends la release finale avant de monter en prod. → Release

sglang v0.5.12.post1 (2026-05-26) — Patch de stabilité sur v0.5.12 : 12 correctifs ciblant principalement DeepSeek V4. DSV4-Pro émettait du texte corrompu lors du décodage single-token sur GPU B200/B300 — bug dans le chemin de scale-packing deep_gemm UE8M0, corrigé ici. Si tu sers DSV4-Pro sur Blackwell, mise à jour prioritaire. → Release

llama.cpp b9329–b9352 (2026-05-26) — Série de patches sur la période : CUDA fast Walsh-Hadamard transform (b9329), correction du buft probe pour nemotron-h avec ffn_latent tagué MUL_MAT (b9330), Apple device ID pour Metal (b9333), correction PDL sync CUDA pour FWHT avec meilleur fallback (b9334), correctifs de nommage ggml-zendnn (b9352). Le fix b9330 s'adresse spécifiquement aux utilisateurs de nemotron-h. → b9352

OpenAI Codex 0.134.0 (2026-05-26) — Recherche dans l'historique local des conversations (insensible à la casse, avec aperçu des résultats). Point d'attention : --profile devient le sélecteur principal dans CLI, TUI et sandbox ; les anciennes configs de profil sont désormais rejetées avec guide de migration intégré. Si tu as des scripts qui passent des configs de profil legacy, teste avant de mettre à jour. → Release

Crush v0.73.0 (2026-05-26) — Correctif Bedrock : avant ce patch, AWS_REGION / AWS_DEFAULT_REGION pouvait rediriger Crush vers une région où les modèles ne sont pas disponibles. Le patch normalise le comportement régional. → Release


💡 Conseil du jour

Si tu sers DeepSeek V4-Pro sur Blackwell (B200/B300) via sglang : monte en v0.5.12.post1 aujourd'hui. Le bug de texte corrompu en décodage single-token est documenté dans le changelog et le patch est ciblé sur ce cas précis — c'est la seule action urgente du brief.

#api#llm#fr#sglang#deepseek#tensorrt-llm#llama-cpp#codex#open-source#blackwell