Mistral OCR 4, Anthropic Claude Fable 5 et mises à jour llama.cpp

🚨 Breaking Aucun changement.

🗑️ Dépréciations Aucun changement.

💰 Pricing Aucun changement.

🆕 Nouveautés - Mistral a publié OCR 4 (mistral-ocr-4-0). Le pointage mistral-ocr-latest le référence désormais. Nouveau paramètre include_blocks : quand true, chaque page renvoie un tableau blocks avec bounding boxes par paragraphe et label structurel (text, title, list, table, image, equation, caption, code, references, aside_text, header, ...). Doc - Anthropic a lancé Claude Fable 5 (claude-fable-5) et Claude Mythos 5 (claude-mythos-5, réservé aux participants Project Glasswing). Les deux modèles supportent 1M tokens de contexte, 128k tokens de sortie max, et toujours adaptive thinking. Release notes - Anthropic a aussi mis en GA Workload Identity Federation (Mai 4) et en beta les multi-agent sessions et Outcomes (Mai 6). Release notes - NVIDIA TensorRT-LLM v1.3.0rc19 : support de Wan2.2-T2V quantized, T5, BART, MiniMax-M3. Known issue : Llama 3.1 8B FP8 peut hang durant autotuner warmup sur GB200. Release - llama.cpp : builds b9776, b9775, b9767, b9763, b9761 avec améliorations WebGPU, Vulkan, tool calls API, router model downloading, etc. b9776

🌐 Actualité IA Aucun signal.

💡 Conseil du jour Si vous traitez des documents, testez Mistral OCR 4 avec include_blocks pour extraire structure fine. Pour des tâches complexes de long-contexte, évaluez Claude Fable 5 avec ses 1M tokens de contexte et 128k sortie.

Action du jour : Mettez à jour vos appels OCR vers mistral-ocr-4-0 et activez include_blocks pour améliorer l'extraction structurée.