📊 Vue d'ensemble
La semaine 20/2026 (7–14 mai) se joue sur deux registres distincts. Côté frameworks d'orchestration, c'est une semaine de douleur : pydantic-ai, langchain-core et crewAI livrent chacun une major ou quasi-major avec des APIs dépréciées qui peuvent casser le code existant sans délai de grâce annoncé. Côté providers API, Anthropic est le seul à bouger sérieusement : fast mode étendu à Opus 4.7 en research preview et ouverture de Claude Platform sur AWS avec IAM natif. Les entries Mistral Small 3.2 présentes dans les données portent des dates en juin 2026 — hors fenêtre, non couvertes ici.
🚨 Breaking & Dépréciations
pydantic-ai v1.95.0 — instrument= déprécié
12 mai 2026 — Release notes
Le paramètre Agent(instrument=...) est déprécié au profit de la nouvelle Instrumentation capability. La feature associée — Tool Search natif pour Anthropic et OpenAI, stratégies custom sur tout provider — est elle bienvenue. Mais la deprecation warning est active dès 1.95.0.
# Avant (déprécié dès 1.95.0)
agent = Agent(model="claude-opus-4-7", instrument=my_tracer)
# Après
from pydantic_ai import Agent, Instrumentation
agent = Agent(model="claude-opus-4-7")
agent.instrument(Instrumentation(my_tracer))
Pas de deadline de suppression annoncée, mais le pattern est figé. Grep instrument= dans votre codebase cette semaine.
langchain-core 1.4.0 — Saut de version trompeur
11 mai 2026 — Release notes
Le bond de 0.3.x à 1.4.0 est surtout administratif : le changelog liste des bugfixes (lazy import pydantic.v1, bumps sécurité urllib3 2.7.0 et mistune 3.2.1). Mais le numéro de version change les règles pip. Si vous avez langchain-core>=0.3,<1.0 dans vos requirements, vous êtes bloqué et ratez les correctifs de sécurité inclus. Ouvrez la contrainte, testez en staging.
crewAI 1.14.5a5 — CrewAgentExecutor déprécié
12 mai 2026 — Release notes
CrewAgentExecutor est remplacé par AgentExecutor comme défaut pour les agents Crew. Release alpha, mais la deprecation warning est déjà active. Les projets qui instancient CrewAgentExecutor directement doivent migrer. Bonus utile dans ce même tag : patches sécurité urllib3 et gitpython.
mistralai/client-python v2.4.5 — Breaking sur les Workflows streaming
7 mai 2026 — Release notes
Deux endpoints cassent (⚠️ marqué explicitement dans le changelog généré par Speakeasy) :
- mistral.workflows.executions.stream() : type du champ payload dans CustomTaskInProgressResponse modifié
- mistral.workflows.events.get_stream_events() : structure de response.[].data.data changée
Si vous n'utilisez pas les Workflows Mistral, vous êtes hors scope. Si vous les utilisez : freeze à ==2.4.4 le temps de tester, puis migrez.
💰 Mouvements pricing
Pas de changement tarifaire direct cette semaine. Claude Opus 4.7 fast mode entre en research preview au même barème que le fast mode Opus 4.6 : premium 6× vs standard. Waitlist requise, header beta obligatoire (fast-mode-2026-02-01). L'équation économique ne change pas — c'est un trade latence/coût, pas une réduction.
🆕 Nouveaux modèles
Claude Opus 4.7 (Fast) — research preview
12 mai 2026 — Anthropic API changelog
Même modèle qu'Opus 4.7, throughput tokens de sortie significativement supérieur. Utile pour les pipelines où la latence de génération est le goulot (streaming UX, agents temps-réel). Accès :
client.messages.create(
model="claude-opus-4-7",
extra_body={"speed": "fast"},
extra_headers={"anthropic-beta": "fast-mode-2026-02-01"},
...
)
llama-stack v1.0.0
12 mai 2026 — ⚠️ Anomalie détectée : l'URL dans les données curator pointe vers ogx-ai/ogx, pas vers le repo officiel Meta. Le passage en v1.0.0 signale théoriquement une stabilisation de l'API publique — mais vérifiez la source officielle (meta-llama/llama-stack) avant toute migration.
⚖️ Comparatif éclair
Qdrant v1.18.0 — TurboQuant vs Weaviate
Si vous auto-hébergez une base vectorielle dans votre stack RAG, Qdrant v1.18.0 apporte TurboQuant : compression 8× des vecteurs sans dégradation mesurée du recall (Release notes). Pendant la même semaine, Weaviate livre deux patches de stabilité (v1.36.13, v1.37.3) sans nouvelle feature. Le delta est net en faveur de Qdrant pour ce cycle.
Claude Platform AWS vs Bedrock
Anthropic ouvre Claude Platform directement sur infrastructure AWS avec IAM et billing natifs (changelog 11 mai). Périmètre complet : Messages API, Files API, Batches, Managed Agents, Agent Skills, code execution. Pour les équipes qui évitaient Bedrock faute de features récentes (Files API, Managed Agents n'étaient pas disponibles via Bedrock), c'est une alternative directe à évaluer sans changer de billing AWS.
🎯 Recommandations stratégiques
-
Migrer
Agent(instrument=...)dans pydantic-ai cette semaine. La deprecation est silencieuse mais active dès 1.95.0. Migrer maintenant coûte 30 minutes ; subir la suppression dans deux releases coûte une nuit de garde. Priorité haute si vous avez du monitoring ou du tracing en prod via pydantic-ai. -
Ouvrir la contrainte
langchain-core<1.0en staging. Le saut de version est majoritairement cosmétique, mais les patches sécurité (urllib3 2.7.0, mistune 3.2.1) valent le test. Planifiez la mise à jour dans le sprint en cours, pas dans deux semaines. -
Benchmarker Claude Platform AWS si vous êtes sur AWS. Avant de migrer aveuglément, faites un test de latence et de feature parity vs votre endpoint actuel (direct API ou Bedrock). Le gain principal est l'accès à Managed Agents et Files API avec le billing AWS existant — vérifiez que vos SLA de latence tiennent sur les endpoints AWS natifs avant de basculer en prod.