Claude Opus 4.8 est disponible : voici les trois nouveautés que les abonnés vont adorer

Aymeric Geoffre-Rouland , le 29 mai 2026

Anthropic vient de déployer Claude Opus 4.8 pour tous ses abonnés Pro, Max, Team et Enterprise, au même tarif que la version précédente. Au-delà des gains de performance sur les benchmarks, cette mise à jour apporte trois changements concrets dans l’usage quotidien : un contrôle sur l’intensité des réponses, un mode rapide trois fois moins cher, et un outil de délégation massive pour les développeurs.

L'application Claude d'Anthropic sur smartphone. Les abonnés Pro, Max, Team et Enterprise peuvent dès maintenant sélectionner Opus 4.8 et ajuster le niveau d'effort du modèle selon leurs besoins. © Stockinq — L’application Claude d’Anthropic sur smartphone. Les abonnés Pro, Max, Team et Enterprise peuvent dès maintenant sélectionner Opus 4.8 et ajuster le niveau d’effort du modèle selon leurs besoins. © Stockinq

Opus 4.8 est disponible depuis le 28 mai sur claude.ai, dans l’application de bureau et via l’API (identifiant : claude-opus-4-8). Le tarif reste identique à Opus 4.7 : 5 dollars par million de tokens en entrée, 25 dollars en sortie. Les abonnés n’ont rien à faire : le modèle est déjà sélectionnable dans l’interface.

Le contrôle d’effort : demander à Claude d’en faire plus, ou moins

C’est la nouveauté la plus visible. Un curseur, placé à côté du sélecteur de modèle sur claude.ai, permet désormais de choisir l’intensité de réflexion de Claude. En mode bas, le modèle répond vite et consomme peu de quota, idéal pour des questions factuelles ou des reformulations. En mode élevé (le réglage par défaut), Claude réfléchit plus longuement et produit des réponses plus fouillées. Deux crans supplémentaires, « extra » et « max », poussent le modèle à mobiliser davantage de tokens pour les tâches complexes : analyses juridiques, révisions de code, rédaction longue.

Le nouveau contrôle d'effort dans l'interface de Claude, accessible à côté du sélecteur de modèle. Cinq niveaux sont disponibles, de « Low » à « Max ». Plus l'effort est élevé, plus les réponses sont fouillées, mais plus le quota est consommé rapidement. © Anthropic / Capture d'écran claude.ai — Le nouveau contrôle d’effort dans l’interface de Claude, accessible à côté du sélecteur de modèle. Cinq niveaux sont disponibles, de « Low » à « Max ». Plus l’effort est élevé, plus les réponses sont fouillées, mais plus le quota est consommé rapidement. © Anthropic / Capture d’écran claude.ai

En pratique, ce curseur donne aux abonnés un levier direct sur leur consommation. Ceux qui atteignaient régulièrement leurs limites de quota pourront baisser l’effort sur les tâches simples et le concentrer là où ça compte.

Le mode rapide : 2,5 fois plus véloce, trois fois moins cher

Le mode rapide (Fast Mode) existait déjà sur les versions précédentes, mais Anthropic en a revu la tarification. Pour Opus 4.8, il fonctionne à 2,5 fois la vitesse du mode standard et coûte désormais trois fois moins cher qu’auparavant (10 dollars par million de tokens en entrée, 50 dollars en sortie via l’API). Pour les développeurs qui traitent de gros volumes de requêtes où la latence prime sur la profondeur de réflexion, c’est un changement significatif.

Dynamic Workflows : Claude Code gère des centaines de sous-agents en parallèle

La troisième nouveauté s’adresse aux développeurs et aux équipes techniques. Dans Claude Code, Opus 4.8 peut désormais planifier une tâche complexe, lancer des centaines de sous-agents en parallèle, puis vérifier leurs résultats avant de rendre la main. Anthropic donne l’exemple d’une migration de code à l’échelle d’un dépôt entier, sur des centaines de milliers de lignes, du lancement jusqu’au merge. La fonctionnalité, baptisée « Dynamic Workflows », est accessible en research preview pour les abonnés Enterprise, Team et Max.

Au-delà de ces trois ajouts, Opus 4.8 progresse aussi sur un point que les habitués remarqueront vite : l’honnêteté. Selon Anthropic, le modèle est environ quatre fois moins susceptible qu’Opus 4.7 de laisser passer une erreur dans son propre code sans la signaler. Il est aussi plus enclin à exprimer ses doutes plutôt que de foncer, un travers régulièrement reproché aux versions précédentes.

Source : Anthropic

Aymeric Geoffre-Rouland

Journaliste indépendant depuis 2012, spécialisé en tech, jeux vidéo, PC, hardware.