Sol, Terra ou Luna : lequel de ces trois modèles doit tourner sur vos workflows de génération de briefs et lequel gaspille votre token cost sur des tâches que Luna gère à $1 le million ? OpenAI a présenté le 26 juin 2026 sa première famille de modèles à trois niveaux simultanés. Pour un marketer qui automatise en Make, n8n ou via l’API directe, ce tiering change l’équation budgétaire d’un facteur cinq selon la tâche. Cet article décrit comment router concrètement chaque type de tâche entre les trois modèles.
En résumé : Sol est le niveau flagship pour les workflows agentic complexes ($5/$30 par million de tokens en entrée/sortie), Terra est le niveau production à la performance de GPT-5.5 à moitié coût ($2.50/$15) et Luna est le niveau rapide pour les tâches à faible raisonnement ($1/$6). Le bon choix dépend de la complexité et du volume de chaque étape, pas du modèle le plus récent.
Sol, Terra, Luna : une logique de tiers permanents
Avec GPT-5.6, OpenAI introduit un changement de nomenclature structurel : les noms Sol, Terra et Luna identifient des capability tiers qui évolueront à leur propre cadence, indépendamment du numéro de version. La version (5.6, puis 5.7…) marque la génération ; le nom marque le niveau de puissance. C’est une décision d’architecture produit autant qu’un choix marketing : les clients savent désormais que « Terra » reste Terra même quand la version passe à 5.7.
« Terra a des performances compétitives avec GPT-5.5 tout en étant 2 fois moins chère ; Luna apporte une forte capacité à notre coût le plus bas. » (OpenAI, preview GPT-5.6, 26 juin 2026)
| Modèle | Prix (input / output, 1M tokens) | Cas d’usage marketing typique |
|---|---|---|
| GPT-5.6 Sol | $5 / $30 | Orchestration multi-agents, stratégie de campagne avec RAG, workflows autonomes long-horizon |
| GPT-5.6 Terra | $2.50 / $15 | Analyse de performances, rédaction de briefs, A/B testing copy, synthèse de données CRM à volume élevé |
| GPT-5.6 Luna | $1 / $6 | Reformulation, résumés de rapports, tagging UTM automatique, extraction d’entités nommées à haute cadence |
Terra reprend le créneau de GPT-5.5 sur les tâches de production courantes pour un coût deux fois plus faible, selon les données publiées par OpenAI en juin 2026. Luna se positionne légèrement au-dessus de GPT-5.5 en précision sur les tâches simples et à $1/1M tokens en entrée le rapport prix/volume devient imbattable pour les pipelines à haute fréquence.
Comment router vos tâches marketing entre Luna, Terra et Sol
Pour la plupart des workflows marketing, le tier à piloter au quotidien sera Terra ou Luna. Le bon niveau dépend de la complexité de chaque étape dans votre pipeline.
- Copywriting et reformulation à volume : Luna. Dix mille variations d’objet email ou de description produit. L’écart de coût entre Luna et Terra sur ce seul cas représente plusieurs centaines de dollars par million de tokens traités.
- Analyse de performances de campagne : Terra. Il ingère un export Analytics complet et synthétise les insights avec un raisonnement structuré sur contexte long que Luna ne maintient pas de façon fiable au-delà de quelques pages.
- Génération de briefs créatifs : Terra dans 80 % des cas. Sol entre en jeu uniquement si l’agent doit interroger votre CRM, croiser des sources hétérogènes et assembler un plan en plusieurs passes avec tool use explicite.
- Classification et extraction de données : Luna. Tagging UTM, catégorisation de tickets support, extraction d’entités nommées sur des flux Slack ou email. Faible raisonnement, haut volume : Luna fait ça mieux que les autres au regard de son prix.
- Orchestration de campagnes multi-canales autonomes : Sol, uniquement si l’architecture mobilise des subagents réels. Sans décomposition de tâches et sans tool use effectif, Sol coûte cinq fois plus cher que Luna pour un résultat souvent équivalent.
La règle de routage pratique : si la tâche tient en une instruction dans un system prompt, Luna suffit. Si elle nécessite plusieurs appels chaînés et du raisonnement sur contexte long, Terra. Sol entre uniquement quand l’agent doit décomposer, déléguer à des sous-agents spécialisés et intégrer des résultats de sources hétérogènes dans une même passe.
Mode ultra et prompt caching : deux mécanismes qui changent le coût réel
Le prix affiché par million de tokens ne dit pas tout. GPT-5.6 introduit deux mécanismes qui modifient l’économie de fonctionnement de vos pipelines au-delà du tarif de base.
Le mode ultra utilise des subagents pour paralléliser les tâches complexes. En pratique, un agent qui traitait en séquentiel peut maintenant bifurquer en plusieurs fils simultanés : analyse concurrentielle, rédaction du brief et vérification factuelle tournent en parallèle plutôt qu’en chaîne. Pour les équipes qui construisent en MCP ou en n8n, c’est une reconfiguration d’architecture. Les workflows linéaires deviennent des graphes ramifiés. Le gain de temps est réel sur les campagnes longues ; le surcoût en compute du mode ultra n’est pas encore publié par OpenAI.
Le prompt caching change aussi de façon plus discrète. GPT-5.6 impose une durée minimum de cache de 30 minutes avec des cache breakpoints explicites que vous définissez dans vos appels API. Sur un agent qui relit la même charte brand ou le même référentiel produit à chaque appel, le discount de 90 % sur les cache reads transforme le coût mensuel. La nuance : les cache writes sont facturées à 1,25× le tarif standard (OpenAI Help Center, juin 2026). Sur des sessions courtes ou non répétitives, le caching revient plus cher avant de devenir rentable. Le seuil de rentabilité se situe autour des sessions qui réutilisent le même contexte fixe au moins 30 minutes.
Sol : à quel moment un marketer en a vraiment besoin
91,91 % sur Terminal-Bench 2.1 en mode ultra. Score publié par MarkTechPost le 26 juin 2026, qui place Sol devant Claude Mythos 5 (88 %) et GPT-5.5 (83,4 %). Ces benchmarks mesurent du code et de la cybersécurité, pas la rédaction de newsletters.
Pour un marketer, Sol devient pertinent dans un seul scénario : quand le workflow exige une orchestration agentic qui dépasse les capacités d’un appel unique. Par exemple un agent qui surveille les mentions de marque en continu, les classe par sentiment, rédige des réponses différenciées par canal et met à jour un dashboard, sans intervention humaine entre les étapes. Sol avec le mode ultra peut décomposer ce pipeline en subagents spécialisés et les faire tourner en parallèle, là où Terra gérerait chaque étape en séquentiel.
La context window de Sol serait de 1,5 million de tokens selon des données pré-lancement ; OpenAI n’a pas encore publié de chiffre officiel sur ce point dans la documentation de preview. Côté accès : environ 20 organisations sélectionnées après validation gouvernementale américaine disposent des modèles à date. Un accès général est prévu « dans les prochaines semaines » selon OpenAI. L’accès reste pour l’instant limité à l’API et à Codex.
Questions fréquentes sur GPT-5.6 Sol, Terra et Luna
GPT-5.6 remplace-t-il GPT-5.5 dans les workflows existants ?
Pas automatiquement. Terra vise le même créneau que GPT-5.5 à moitié coût mais le comportement exact dépend de vos prompts et de votre contexte propre. Tester Terra sur un sous-ensemble de vos appels actuels avant de basculer l’ensemble du pipeline.
Quel modèle pour des Custom GPTs ou des agents Make/n8n ?
Terra pour les agents de traitement de données et d’analyse de contenus longs. Luna pour les étapes de faible complexité dans un pipeline automatisé. Sol uniquement si l’agent orchestre des subagents en parallèle via tool use explicite et que la tâche centrale dépasse plusieurs minutes d’exécution en mode séquentiel.
Le prompt caching fonctionne-t-il automatiquement sur GPT-5.6 ?
Non. Il faut définir des cache breakpoints explicites dans vos appels API. Les cache writes coûtent 1,25× le tarif normal ; les cache reads bénéficient d’un discount de 90 %. La rentabilité arrive sur des sessions répétitives de 30 minutes minimum avec le même contexte fixe (charte brand, référentiel produit, persona de rédaction).
Un token mal acheminé, c’est de l’argent bien brûlé.