--- type: orchestration created: 2026-04-16 updated: 2026-04-16 status: active description: Gestion du budget tokens — cap, alertes, optimisation. tags: - orchestration - budget - tokens related: - "[[_adn/orchestration/_index]]" - "[[_adn/orchestration/routing-llm]]" - "[[_adn/soul]]" --- # Budget tokens ## Cap mensuel **100 €/mois** tous modèles confondus (Claude + Perplexity + Grok + Gemini). --- ## Alertes | Seuil | Niveau | Action | |---|---|---| | 50% (50 €) | Normal | Notif Slack classique. Tu optimises le routing (plus de Haiku/Gemini) | | 80% (80 €) | Urgent | Slack all devices ring. Tu bascules tout le non-critique sur Haiku/Gemini/gratuit | | 100% (100 €) | **Très urgent** | Slack all devices ring + appel. Arrêt de toutes les tâches non-critiques. Seules passent : alertes sécurité + demandes directes de Jerem | --- ## Scaling progressif Plus je gagne, plus tu reçois. Tokens, outils, sous-agents, responsabilités. **Tu grandis avec moi.** | Revenu mensuel Jerem | Budget DAEMON | Accès | |---|---|---| | < 2k€ | 100 €/mois | Modèles de base, routines essentielles | | 2-5k€ | 200 €/mois | + sous-agents Phase 3, + outils payants | | 5-10k€ | 400 €/mois | + Opus régulier, + budget humain prospection | | > 10k€ | À définir | Full autonomie opérationnelle | --- ## Tracking - **Check quotidien 18h** : tu vérifies la conso du jour (cf. [[_adn/routines/quotidiennes]]) - **Log** : `memory/budget-log-YYYY-MM.md` — conso par jour, par modèle, par type de tâche - **Dashboard** : à construire Phase 5 (web app custom avec visu temps réel) --- ## Optimisation ### Principes 1. **Haiku / Gemini Flash** pour tout le tri, listing, classification, veille brute 2. **Sonnet** pour le gros : rédaction, synthèse, analyse, coaching, contenu 3. **Opus** uniquement pour le critique : sécurité, décisions à fort impact, review stratégique 4. **Perplexity** pour la recherche web (inclus dans le plan Pro, pas de surcoût token direct) 5. **Grok** pour la veille X/Twitter (gratuit avec limites) ### Anti-patterns à éviter - Utiliser Sonnet pour un simple tri de mails → Haiku - Utiliser Opus par défaut "pour être sûr" → Sonnet suffit dans 95% des cas - Lancer des recherches Perplexity en boucle sans agrégation → batch les requêtes - Ne pas logger la conso → tu perds la visibilité, tu perds le contrôle