🚨 Breaking Aucun changement.
🗑️ Dépréciations Aucun changement.
💰 Pricing Aucun changement.
🆕 Nouveautés
- Mistral a publié OCR 4 (mistral-ocr-4-0). Le pointage mistral-ocr-latest le référence désormais. Nouveau paramètre include_blocks : quand true, chaque page renvoie un tableau blocks avec bounding boxes par paragraphe et label structurel (text, title, list, table, image, equation, caption, code, references, aside_text, header, ...). Doc
- Anthropic a lancé Claude Fable 5 (claude-fable-5) et Claude Mythos 5 (claude-mythos-5, réservé aux participants Project Glasswing). Les deux modèles supportent 1M tokens de contexte, 128k tokens de sortie max, et toujours adaptive thinking. Release notes
- Anthropic a aussi mis en GA Workload Identity Federation (Mai 4) et en beta les multi-agent sessions et Outcomes (Mai 6). Release notes
- NVIDIA TensorRT-LLM v1.3.0rc19 : support de Wan2.2-T2V quantized, T5, BART, MiniMax-M3. Known issue : Llama 3.1 8B FP8 peut hang durant autotuner warmup sur GB200. Release
- llama.cpp : builds b9776, b9775, b9767, b9763, b9761 avec améliorations WebGPU, Vulkan, tool calls API, router model downloading, etc. b9776
🌐 Actualité IA Aucun signal.
💡 Conseil du jour
Si vous traitez des documents, testez Mistral OCR 4 avec include_blocks pour extraire structure fine. Pour des tâches complexes de long-contexte, évaluez Claude Fable 5 avec ses 1M tokens de contexte et 128k sortie.
Action du jour : Mettez à jour vos appels OCR vers mistral-ocr-4-0 et activez include_blocks pour améliorer l'extraction structurée.