110 lines
4.5 KiB
Markdown
110 lines
4.5 KiB
Markdown
---
|
|
title: Matrice de Routing LLM
|
|
type: config
|
|
created: 2026-04-16
|
|
updated: 2026-04-16
|
|
owner: jerem
|
|
agent: DAEMON
|
|
status: active
|
|
summary: Quel LLM pour quel usage, fallbacks, limites budget. Source unique — toute décision de routing passe par ce fichier.
|
|
tags:
|
|
- config
|
|
- routing
|
|
- llm
|
|
related:
|
|
- "[[_adn/soul]]"
|
|
- "[[_adn/brain]]"
|
|
- "[[_adn/context]]"
|
|
---
|
|
|
|
# Matrice de Routing LLM
|
|
|
|
> Qui fait quoi. Chaque tâche a un LLM principal et un fallback. DAEMON route automatiquement selon le type de demande.
|
|
|
|
---
|
|
|
|
## 1. Les modèles disponibles
|
|
|
|
| Modèle | Force principale | Coût relatif | Accès actuel |
|
|
|---|---|---|---|
|
|
| **Claude** (Anthropic) | Raisonnement, écriture, code, coaching, agent principal | €€€ | ✅ Claude Code + API |
|
|
| **Gemini** (Google) | Contexte long, tâches simples, fallback low-cost | € | ⏳ À connecter (Gemini CLI + MCP SSE) |
|
|
| **Grok** (xAI) | Veille Twitter/X, tendances sociales, ton décalé | €€ | ⏳ À connecter (MCP remote) |
|
|
| **Perplexity** | Recherche web, fact-checking, veille temps réel | €€ | ⏳ À connecter (Perpsidian plugin) |
|
|
|
|
---
|
|
|
|
## 2. Routing par type de tâche
|
|
|
|
| Tâche | LLM principal | Fallback | Notes |
|
|
|---|---|---|---|
|
|
| **Agent principal / bras droit** | Claude | — | Cœur de DAEMON. Pas de fallback — si Claude down, on attend. |
|
|
| **Écriture** (notes, scripts, contenus) | Claude | Gemini | Gemini = draft rapide, Claude = version finale |
|
|
| **Code** (dev, debug, infra) | Claude | Gemini | Claude Code = outil principal |
|
|
| **Coaching** (plans, CR, suivi) | Claude | — | Données sensibles → Claude uniquement |
|
|
| **Brainstorm / idéation** | Claude | Grok | Grok pour perspectives inattendues |
|
|
| **Recherche web / fact-check** | Perplexity | Gemini | Perplexity = sources citées, Gemini = fallback grounding |
|
|
| **Veille Twitter/X** | Grok | Perplexity | Grok = accès natif aux données X |
|
|
| **Veille IA / business / tendances** | Perplexity | Grok | Pipeline : Perplexity cherche → Claude synthétise |
|
|
| **Classification / tri / tags** | Gemini Flash | Claude Haiku | Tâches simples, haut volume, low-cost |
|
|
| **Reformulation / résumé** | Gemini Flash | Claude Haiku | Idem — optimiser le budget |
|
|
| **Transcription audio** | Groq Whisper (API) | Whisper local (VPS) | Groq = rapide + pas cher. Local = gros fichiers / offline |
|
|
| **Journaling / introspection** | Claude | — | Données intimes → Claude uniquement |
|
|
|
|
---
|
|
|
|
## 3. Règles de routing
|
|
|
|
1. **Données sensibles** (identité, finances, santé, relations, coaching clients) → **Claude uniquement**. Jamais de fallback vers un autre modèle.
|
|
2. **Budget first** : si la tâche est simple (tri, tags, reformulation), utiliser Gemini Flash en priorité. Claude = overkill pour du tri de tags.
|
|
3. **Pipeline multi-LLM** autorisé : Perplexity cherche → Claude synthétise → Gemini met en forme. Chaque étape utilise le meilleur outil.
|
|
4. **Fallback automatique** : si un LLM est down (timeout > 30s ou erreur 5xx), basculer sur le fallback sans demander confirmation.
|
|
5. **Alerte budget** : si un LLM dépasse 80% de son budget mensuel → alerte. À 95% → switch fallback pour le reste du mois.
|
|
|
|
---
|
|
|
|
## 4. Budget mensuel (cible)
|
|
|
|
| Modèle | Budget max/mois | Priorité coupe |
|
|
|---|---|---|
|
|
| Claude | 80 € | Dernière coupe (agent principal) |
|
|
| Perplexity | 20 € (ou plan Pro inclus) | 2e coupe |
|
|
| Grok | 10 € | 1ère coupe |
|
|
| Gemini | 5 € (ou tier gratuit) | Gratuit tant que possible |
|
|
| **Total cible** | **~100 €/mois** | Ajustable selon revenus |
|
|
|
|
> Note : budget = 0 € de revenus coaching aujourd'hui. Le budget LLM est un investissement. Quand les revenus montent, on scale les budgets proportionnellement.
|
|
|
|
---
|
|
|
|
## 5. Fallback cascade
|
|
|
|
```
|
|
Tâche entrante
|
|
│
|
|
├── Données sensibles ? → Claude (pas de fallback)
|
|
│
|
|
├── Recherche web ? → Perplexity → Gemini
|
|
│
|
|
├── Veille X/Twitter ? → Grok → Perplexity
|
|
│
|
|
├── Tâche simple (tri/tags/résumé) ? → Gemini Flash → Claude Haiku
|
|
│
|
|
└── Tout le reste → Claude → Gemini
|
|
```
|
|
|
|
---
|
|
|
|
## 6. Connexions à établir (roadmap)
|
|
|
|
- [x] Claude Code — MCP Obsidian + MCP Notion ✅ (session 16 avril)
|
|
- [ ] Gemini — Gemini CLI + MCP SSE vers vault (Phase 4.1)
|
|
- [ ] Grok — MCP remote HTTP (Phase 4.1)
|
|
- [ ] Perplexity — Plugin Perpsidian unidirectionnel (Phase 4.1)
|
|
- [ ] Groq Whisper — API key + endpoint (Phase 1.8)
|
|
- [ ] Whisper local — Container Docker sur VPS (Phase 1.8)
|
|
|
|
---
|
|
|
|
*Ce fichier est la source unique pour le routing. Si un nouveau LLM est ajouté, il est documenté ici d'abord.*
|