--- title: Matrice de Routing LLM type: config created: 2026-04-16 updated: 2026-04-16 owner: jerem agent: DAEMON status: active summary: Quel LLM pour quel usage, fallbacks, limites budget. Source unique — toute décision de routing passe par ce fichier. tags: - config - routing - llm related: - "[[_adn/soul]]" - "[[_adn/brain]]" - "[[_adn/context]]" --- # Matrice de Routing LLM > Qui fait quoi. Chaque tâche a un LLM principal et un fallback. DAEMON route automatiquement selon le type de demande. --- ## 1. Les modèles disponibles | Modèle | Force principale | Coût relatif | Accès actuel | |---|---|---|---| | **Claude** (Anthropic) | Raisonnement, écriture, code, coaching, agent principal | €€€ | ✅ Claude Code + API | | **Gemini** (Google) | Contexte long, tâches simples, fallback low-cost | € | ⏳ À connecter (Gemini CLI + MCP SSE) | | **Grok** (xAI) | Veille Twitter/X, tendances sociales, ton décalé | €€ | ⏳ À connecter (MCP remote) | | **Perplexity** | Recherche web, fact-checking, veille temps réel | €€ | ⏳ À connecter (Perpsidian plugin) | --- ## 2. Routing par type de tâche | Tâche | LLM principal | Fallback | Notes | |---|---|---|---| | **Agent principal / bras droit** | Claude | — | Cœur de DAEMON. Pas de fallback — si Claude down, on attend. | | **Écriture** (notes, scripts, contenus) | Claude | Gemini | Gemini = draft rapide, Claude = version finale | | **Code** (dev, debug, infra) | Claude | Gemini | Claude Code = outil principal | | **Coaching** (plans, CR, suivi) | Claude | — | Données sensibles → Claude uniquement | | **Brainstorm / idéation** | Claude | Grok | Grok pour perspectives inattendues | | **Recherche web / fact-check** | Perplexity | Gemini | Perplexity = sources citées, Gemini = fallback grounding | | **Veille Twitter/X** | Grok | Perplexity | Grok = accès natif aux données X | | **Veille IA / business / tendances** | Perplexity | Grok | Pipeline : Perplexity cherche → Claude synthétise | | **Classification / tri / tags** | Gemini Flash | Claude Haiku | Tâches simples, haut volume, low-cost | | **Reformulation / résumé** | Gemini Flash | Claude Haiku | Idem — optimiser le budget | | **Transcription audio** | Groq Whisper (API) | Whisper local (VPS) | Groq = rapide + pas cher. Local = gros fichiers / offline | | **Journaling / introspection** | Claude | — | Données intimes → Claude uniquement | --- ## 3. Règles de routing 1. **Données sensibles** (identité, finances, santé, relations, coaching clients) → **Claude uniquement**. Jamais de fallback vers un autre modèle. 2. **Budget first** : si la tâche est simple (tri, tags, reformulation), utiliser Gemini Flash en priorité. Claude = overkill pour du tri de tags. 3. **Pipeline multi-LLM** autorisé : Perplexity cherche → Claude synthétise → Gemini met en forme. Chaque étape utilise le meilleur outil. 4. **Fallback automatique** : si un LLM est down (timeout > 30s ou erreur 5xx), basculer sur le fallback sans demander confirmation. 5. **Alerte budget** : si un LLM dépasse 80% de son budget mensuel → alerte. À 95% → switch fallback pour le reste du mois. --- ## 4. Budget mensuel (cible) | Modèle | Budget max/mois | Priorité coupe | |---|---|---| | Claude | 80 € | Dernière coupe (agent principal) | | Perplexity | 20 € (ou plan Pro inclus) | 2e coupe | | Grok | 10 € | 1ère coupe | | Gemini | 5 € (ou tier gratuit) | Gratuit tant que possible | | **Total cible** | **~100 €/mois** | Ajustable selon revenus | > Note : budget = 0 € de revenus coaching aujourd'hui. Le budget LLM est un investissement. Quand les revenus montent, on scale les budgets proportionnellement. --- ## 5. Fallback cascade ``` Tâche entrante │ ├── Données sensibles ? → Claude (pas de fallback) │ ├── Recherche web ? → Perplexity → Gemini │ ├── Veille X/Twitter ? → Grok → Perplexity │ ├── Tâche simple (tri/tags/résumé) ? → Gemini Flash → Claude Haiku │ └── Tout le reste → Claude → Gemini ``` --- ## 6. Connexions à établir (roadmap) - [x] Claude Code — MCP Obsidian + MCP Notion ✅ (session 16 avril) - [ ] Gemini — Gemini CLI + MCP SSE vers vault (Phase 4.1) - [ ] Grok — MCP remote HTTP (Phase 4.1) - [ ] Perplexity — Plugin Perpsidian unidirectionnel (Phase 4.1) - [ ] Groq Whisper — API key + endpoint (Phase 1.8) - [ ] Whisper local — Container Docker sur VPS (Phase 1.8) --- *Ce fichier est la source unique pour le routing. Si un nouveau LLM est ajouté, il est documenté ici d'abord.*