78 lines
2.3 KiB
Markdown
78 lines
2.3 KiB
Markdown
---
|
|
type: orchestration
|
|
created: 2026-04-16
|
|
updated: 2026-04-16
|
|
status: active
|
|
description: Tableau de routing LLM — quel modèle pour quelle tâche.
|
|
tags:
|
|
- orchestration
|
|
- routing
|
|
- llm
|
|
related:
|
|
- "[[_adn/orchestration/_index]]"
|
|
- "[[_adn/orchestration/budget-tokens]]"
|
|
---
|
|
|
|
# Routing LLM
|
|
|
|
## Tableau de routing
|
|
|
|
| Modèle | Rôle | Cas d'usage | Coût |
|
|
|---|---|---|---|
|
|
| Claude Haiku | Tâches simples | Tri, listing, recherche brute, classification, tagging | Très bas |
|
|
| Claude Sonnet | Principal | Rédaction, synthèse, analyse, coaching, contenu, planification | Moyen |
|
|
| Claude Opus | Critique | Sécurité, décisions critiques, moments clés, review stratégique | Élevé (réservé) |
|
|
| Perplexity Pro | Recherche web | Veille, fact-checking, tendances, sources citées | Inclus plan Pro |
|
|
| Grok | Twitter/X | Veille sociale, données X exclusives, sentiment analysis | Gratuit (limites) |
|
|
| Gemini Flash | Fallback | Reformulation, tri, classification (gratuit AI Studio) | Gratuit |
|
|
|
|
---
|
|
|
|
## Authentification
|
|
|
|
- Toutes les clés API via **Doppler** (VPS) ou **env vars** (local)
|
|
- Perplexity = API key (pas OAuth)
|
|
- Grok = API key xAI
|
|
- Gemini = API key Google AI Studio
|
|
- Claude = API key Anthropic (via OpenClaw)
|
|
|
|
Aucune clé en dur dans le vault ou dans le code. Jamais.
|
|
|
|
---
|
|
|
|
## Switch automatique
|
|
|
|
Le routing se décide selon 3 critères :
|
|
|
|
### 1. Type de tâche
|
|
|
|
| Type | Modèle par défaut |
|
|
|---|---|
|
|
| Tri / listing / classification | Haiku |
|
|
| Recherche web sourcée | Perplexity |
|
|
| Veille Twitter/X | Grok |
|
|
| Rédaction / synthèse / analyse | Sonnet |
|
|
| Review sécurité / décision critique | Opus |
|
|
| Tâche simple gratuite (fallback) | Gemini Flash |
|
|
|
|
### 2. Budget tokens restant
|
|
|
|
- Budget > 50% → routing normal
|
|
- Budget 20-50% → privilégier Haiku / Gemini pour le non-critique
|
|
- Budget < 20% → Sonnet uniquement sur demande directe de Jerem, tout le reste en Haiku/Gemini/gratuit
|
|
|
|
### 3. Disponibilité (fallback si down)
|
|
|
|
| Modèle indisponible | Fallback |
|
|
|---|---|
|
|
| Perplexity down | Gemini Flash + recherche manuelle |
|
|
| Grok down | Pas de veille X (pas critique) |
|
|
| Sonnet down | Opus si critique, sinon attente |
|
|
| Haiku down | Gemini Flash |
|
|
|
|
---
|
|
|
|
## Règle d'or
|
|
|
|
Utilise le modèle le moins cher capable de faire le job correctement. Opus = dernier recours, pas premier réflexe.
|