Encore un nouveau modèle à suivre ? L’agacement est légitime : Claude Sonnet 5 arrive quatre mois après Sonnet 4.6 et la litanie des annonces finit par lasser même les équipes marketing les plus curieuses. Sauf que celui-ci touche à trois choses très concrètes une fois qu’on regarde au-delà du benchmark de code. Claude Sonnet 5 (identifiant API claude-sonnet-5) succède directement à Sonnet 4.6. Sa fenêtre de contexte grimpe à 1 million de tokens, sa lecture d’image passe en haute résolution et son tarif d’entrée reste fixé à 3 $ par million de tokens (2 $ jusqu’au 31 août 2026, en tarif de lancement).
Avant de dire que ça ne change rien à votre quotidien
Avant de dire que « spoiler, on a compris » face à un énième lancement de modèle, regardons ce qui a concrètement changé. L’objection tient tant qu’on compare des scores de benchmark. Elle tient moins dès qu’on regarde ce qui a réellement bougé pour un marketing manager qui jongle avec des system prompts dispersés dans des Notion et des historiques de campagnes éparpillés, dashboards à relire à la main en prime. Anthropic annonce des gains marqués sur le raisonnement et l’usage d’outils, avec des progrès notables aussi sur le travail de connaissance ; la performance approche celle d’Opus 4.8, pour un prix Sonnet. Pour la partie marketing, deux leviers changent d’échelle et un troisième change surtout le confort d’usage : la taille de ce que le modèle peut lire d’un coup, la qualité de sa vision et, plus discrètement, le comportement par défaut de son raisonnement.
Analyser un an de campagnes en un seul prompt
Un problème revient dans presque toutes les équipes marketing qui utilisent l’IA au quotidien : quatorze prompts différents éparpillés dans des Notion, sans plus savoir lequel utiliser pour quoi. Ce désordre vient souvent d’une contrainte technique aussi bête que ça : l’ancienne fenêtre de contexte forçait à découper un brief de marque et un historique de campagnes en plusieurs envois successifs, sans compter l’étude de marché à caser à part, avec perte d’information à chaque coupure. Avec 1 million de tokens de context window, Claude Sonnet 5 absorbe en un seul prompt l’équivalent de plusieurs centaines de pages : brand guidelines complètes, historique d’un an de newsletters, retranscriptions d’entretiens clients, rapport d’étude sectorielle. Le modèle raisonne sur l’ensemble plutôt que sur des fragments recollés à la main. En pratique, ça réduit le nombre de prompts à maintenir, pas leur complexité.
Sonnet 4.6 contre Sonnet 5 : ce qui compte vraiment pour un marketeur
Les chiffres bruts ne disent rien sans la traduction en usage. Ces écarts touchent directement un workflow de contenu ou de reporting, parfois une analyse concurrentielle entière.
| Critère | Claude Sonnet 4.6 | Claude Sonnet 5 |
|---|---|---|
| Fenêtre de contexte | 200 000 tokens (config étendue à part) | 1 000 000 de tokens |
| Résolution image max | 1568 px sur le grand côté | 2576 px sur le grand côté |
| Niveaux d’effort disponibles | low / medium / high | low / medium / high / max / xhigh |
| Raisonnement (thinking) | activé manuellement | adaptatif, activé par défaut |
| Prix entrée (lancement) | 3,00 $ / 1M tokens | 2,00 $ / 1M tokens jusqu’au 31/08/2026 |
| Prix sortie (lancement) | 15,00 $ / 1M tokens | 10,00 $ / 1M tokens jusqu’au 31/08/2026 |
Le tableau cache un détail que la plupart des annonces passent sous silence : le prix par token n’a pas bougé (3 $/15 $ en tarif standard) mais le volume de tokens consommés par un même texte français augmente.
Le piège du nouveau tokenizer, même prix, plus de tokens
Sonnet 5 partage désormais le tokenizer de la famille Opus 4.7/4.8. Résultat mesuré par Anthropic : un même texte consomme environ 30% de tokens en plus qu’avec Sonnet 4.6. Le calcul « même prix par token donc même facture » ne tient pas au-delà d’un certain volume de contenu source. Sur un prompt de brand guidelines de 50 pages ou un historique de conversations client volumineux, la facture réelle grimpe malgré un tarif affiché inchangé. L’écart se voit surtout sur ce type de charge lourde (contexte étendu, agents qui tournent en continu), pas sur un prompt ponctuel de 200 mots.
Lire un dashboard ou une créa sans deviner les chiffres
Beaucoup d’analyses marketing démarrent par une capture d’écran : un export Google Analytics, un tableau Looker Studio ou, plus rarement, une maquette de publicité à valider avant diffusion. La résolution d’image passe de 1568 à 2576 pixels sur le grand côté. Concrètement, un graphique dense ou un tableau chiffré à petite police devient lisible sans recadrage manuel préalable. Ce gain compte surtout pour deux usages : le contrôle qualité de créas publicitaires multi-formats et l’audit rapide de rapports de performance envoyés par un client ou une agence externe sans export propre en données brutes.
Des agents qui vont au bout de la tâche, pas juste jusqu’au premier obstacle
Le raisonnement adaptatif change une habitude bien ancrée : avec Sonnet 4.6, il fallait activer explicitement le mode réflexion pour les tâches complexes. Sonnet 5 décide seul quand et combien réfléchir et introduit un niveau d’effort xhigh réservé aux tâches agentiques les plus exigeantes. Pour un agent marketing qui orchestre plusieurs étapes (extraction de données de veille concurrentielle, synthèse et parfois mise en forme du rapport final), la différence se voit surtout quand une étape intermédiaire échoue : le modèle vérifie son propre résultat avant de le rendre, au lieu de s’arrêter au premier blocage. C’est ce mécanisme, plus que la vitesse brute, qui rend un tool use multi-étapes fiable sans supervision constante.
Faut-il migrer vos workflows maintenant ?
La bascule ne demande pas de réécrire un système existant construit autour d’un Custom GPT ou d’un agent connecté en MCP (pipeline de prompt engineering compris). Claude Sonnet 5 reste accessible via le même endpoint API, avec le même format de requête que Sonnet 4.6 ; seul l’identifiant de modèle change. Le point qui mérite un vrai test avant généralisation, c’est le budget token sur les workflows les plus lourds (agents tournant en continu, contexte massif), justement à cause du nouveau tokenizer. Sur un simple prompt de génération de contenu, l’écart de coût reste marginal.
Le mouvement plus large va dans le même sens. Selon le rapport McKinsey State of AI (2025), 70% des organisations utilisent la GenAI dans au moins une fonction métier, contre 33% en 2023. En France, l’Observatoire IA dans les PME de Bpifrance Le Lab chiffre à 55% la part des TPE-PME utilisatrices de l’IA générative fin 2025, contre 31% un an plus tôt. Les organisations les plus avancées sur le sujet ne se contentent pas d’expérimenter : IDC mesure un retour de 3,70 $ par dollar investi en IA générative pour les organisations leaders. Ce même écart se retrouve dans les usages français : 72% des marketeurs déclarent utiliser l’IA pour la production de contenu (Hi-Commerce, 2026) et 62% pour la personnalisation d’email.
Anthropic présente ce modèle comme le plus agentique de la gamme Sonnet à ce jour, capable d’établir des plans et d’utiliser des outils comme un navigateur ou un terminal de façon autonome, à un niveau qui nécessitait jusqu’ici des modèles plus grands et plus coûteux.
Reste une limite réelle à ne pas occulter : ces gains d’autonomie s’observent surtout sur des tâches structurées, avec des outils bien définis en amont. Sur un brief flou ou une demande mal cadrée, le modèle réfléchit plus mais il ne devine pas mieux l’intention derrière un prompt bâclé.
Le modèle progresse tous les quatre mois ; le prompt mal écrit, lui, ne se corrige jamais tout seul.