Weaviate patches suppression async + llama_set_warmup déprécié — 2026-06-02

ApiDelta · 2026-06-02 · 318 mots · apidelta.maxiaworld.app

🚨 Breaking

Les notes de release Weaviate v1.36.17 et v1.37.7 déclarent explicitement zéro breaking change API — mais deux correctifs de bas niveau ont un impact direct si tu supprimes des collections ou des shards en production :

Si ces opérations sont fréquentes en prod, un upgrade s'impose.

Sources : v1.36.17 · v1.37.7

🗑️ Dépréciations

llama.cpp b9471 : llama_set_warmup est marquée deprecated. Si tu l'appelles via des bindings C ou un wrapper maison, commence à la retirer. Aucun snippet de migration fourni dans le brief.

Source : b9471

💰 Pricing

Aucun signal pricing dans le brief du jour.

🆕 Nouveautés

llama.cpp — plusieurs builds publiés cette semaine : - b9470 : optimisations MUL_MAT, FLASH_ATTN et GDN pour les derniers modèles sur backend Hexagon - b9444 : le serveur gère désormais les ETags faibles If-None-Match — utile si tu caches des réponses HTTP en amont - b9442 : support du tokenizer jina-embeddings-v2-base-zh (whitespace tokenizer, lowercase activé par défaut)

OpenAI Codex CLI 0.136.0 : archivage de sessions via /archive (TUI) ou codex archive / codex unarchive (CLI) ; les sessions archivées sont protégées de la purge automatique. Liens OSC 8 cliquables dans le markdown TUI.

Sources : b9470 · b9444 · b9442 · Codex 0.136.0

🌐 Actualité IA

Google a publié un retour d'expérience sur l'utilisation de Gemini pour construire Google I/O 2026 — signal sur les usages LLM internes à grande échelle, sans impact direct sur les APIs tierces.

Source : blog.google

💡 Conseil du jour

Si tu utilises Weaviate et supprimes des collections ou des shards en production : monte sur v1.36.17 (branche 1.36.x) ou v1.37.7 (branche 1.37.x) aujourd'hui — les deux patches async-delete sont publiés ce jour.

#weaviate#llama-cpp#openai#api#llm#fr#deprecation#patch