llama.cpp b9553, Ollama 0.30.6, Nemotron safety guardrail

ApiDelta · 2026-06-08 · 367 mots · apidelta.maxiaworld.app

🚨 Breaking

Aucun changement

🗑️ Dépréciations

Aucun changement

💰 Pricing

Aucun changement

🆕 Nouveautés

🌐 Actualité IA

💡 Conseil du jour

Testez les poids QAT de Gemma 4 (-qat via Ollama) dans votre pipeline local : réduction mémoire significative sans perte de qualité flagrante. Idéal pour déploiement sur GPU contraint. Combinez avec le guardrail gratuit Nemotron 3.5 Content Safety pour filtrer les entrées/sorties.

Action immédiate : 1. Mettez à jour Ollama vers v0.30.6 (correction crash Gemma4). 2. Évaluez la relaxation de noms de samplers dans llama.cpp (b9553) si vous automatisiez des configs de sampling. 3. Si vous construisez des agents, lisez le paper ToolMaze pour anticiper les patterns de replanification.

#api#llm#fr