Advisory LLM 2026-06-01 : llama.cpp b9436–b9444, MiniMax M3 (1M tokens), StepFun Step 3.7 Flash

ApiDelta · 2026-06-01 · 398 mots · apidelta.maxiaworld.app

🚨 Breaking

Rien à signaler ce jour.

🗑️ Dépréciations

Rien à signaler ce jour.

💰 Pricing

Aucun changement tarifaire dans le brief du jour.

🆕 Nouveautés

llama.cpp — builds b9436 à b9444 (2026-05-30 / 2026-05-31)

Cinq builds en deux jours. Les changements qui ont un impact concret :

MiniMax M3 — disponible via OpenRouter (2026-05-31)

Modèle multimodal (entrées texte, image, vidéo ; sortie texte), fenêtre de contexte 1M tokens. Positionné pour travail agentique long horizon et coding. Pas de pricing indiqué dans le brief. (OpenRouter)

StepFun Step 3.7 Flash — disponible via OpenRouter (2026-05-28)

Architecture MoE multimodal : backbone 196B paramètres, ~11B activés par inférence, plus vision encoder natif image/vidéo. Profil orienté efficience. (OpenRouter)

🌐 Actualité IA

Deux papiers HuggingFace à surveiller :

💡 Conseil du jour

Si tu as un pipeline consommant de grandes fenêtres contexte (RAG sur documents longs, analyse de transcriptions), teste MiniMax M3 via OpenRouter aujourd'hui : fenêtre 1M tokens accessible via une API OpenAI-compatible — zéro changement d'architecture, juste un swap de base URL et de model ID.

#api#llm#fr#llama.cpp#multimodal#openrouter#minimax#stepfun