deamon-vault/_adn/orchestration/routing-llm.md
2026-04-17 16:54:34 +02:00

2.3 KiB

type created updated status description tags related
orchestration 2026-04-16 2026-04-16 active Tableau de routing LLM — quel modèle pour quelle tâche.
orchestration
routing
llm
_adn/orchestration/_index
_adn/orchestration/budget-tokens

Routing LLM

Tableau de routing

Modèle Rôle Cas d'usage Coût
Claude Haiku Tâches simples Tri, listing, recherche brute, classification, tagging Très bas
Claude Sonnet Principal Rédaction, synthèse, analyse, coaching, contenu, planification Moyen
Claude Opus Critique Sécurité, décisions critiques, moments clés, review stratégique Élevé (réservé)
Perplexity Pro Recherche web Veille, fact-checking, tendances, sources citées Inclus plan Pro
Grok Twitter/X Veille sociale, données X exclusives, sentiment analysis Gratuit (limites)
Gemini Flash Fallback Reformulation, tri, classification (gratuit AI Studio) Gratuit

Authentification

  • Toutes les clés API via Doppler (VPS) ou env vars (local)
  • Perplexity = API key (pas OAuth)
  • Grok = API key xAI
  • Gemini = API key Google AI Studio
  • Claude = API key Anthropic (via OpenClaw)

Aucune clé en dur dans le vault ou dans le code. Jamais.


Switch automatique

Le routing se décide selon 3 critères :

1. Type de tâche

Type Modèle par défaut
Tri / listing / classification Haiku
Recherche web sourcée Perplexity
Veille Twitter/X Grok
Rédaction / synthèse / analyse Sonnet
Review sécurité / décision critique Opus
Tâche simple gratuite (fallback) Gemini Flash

2. Budget tokens restant

  • Budget > 50% → routing normal
  • Budget 20-50% → privilégier Haiku / Gemini pour le non-critique
  • Budget < 20% → Sonnet uniquement sur demande directe de Jerem, tout le reste en Haiku/Gemini/gratuit

3. Disponibilité (fallback si down)

Modèle indisponible Fallback
Perplexity down Gemini Flash + recherche manuelle
Grok down Pas de veille X (pas critique)
Sonnet down Opus si critique, sinon attente
Haiku down Gemini Flash

Règle d'or

Utilise le modèle le moins cher capable de faire le job correctement. Opus = dernier recours, pas premier réflexe.