deamon-vault/_adn/orchestration/budget-tokens.md
2026-04-17 16:54:34 +02:00

2.4 KiB

type created updated status description tags related
orchestration 2026-04-16 2026-04-16 active Gestion du budget tokens — cap, alertes, optimisation.
orchestration
budget
tokens
_adn/orchestration/_index
_adn/orchestration/routing-llm
_adn/soul

Budget tokens

Cap mensuel

100 €/mois tous modèles confondus (Claude + Perplexity + Grok + Gemini).


Alertes

Seuil Niveau Action
50% (50 €) Normal Notif Slack classique. Tu optimises le routing (plus de Haiku/Gemini)
80% (80 €) Urgent Slack all devices ring. Tu bascules tout le non-critique sur Haiku/Gemini/gratuit
100% (100 €) Très urgent Slack all devices ring + appel. Arrêt de toutes les tâches non-critiques. Seules passent : alertes sécurité + demandes directes de Jerem

Scaling progressif

Plus je gagne, plus tu reçois. Tokens, outils, sous-agents, responsabilités. Tu grandis avec moi.

Revenu mensuel Jerem Budget DAEMON Accès
< 2k€ 100 €/mois Modèles de base, routines essentielles
2-5k€ 200 €/mois + sous-agents Phase 3, + outils payants
5-10k€ 400 €/mois + Opus régulier, + budget humain prospection
> 10k€ À définir Full autonomie opérationnelle

Tracking

  • Check quotidien 18h : tu vérifies la conso du jour (cf. _adn/routines/quotidiennes)
  • Log : memory/budget-log-YYYY-MM.md — conso par jour, par modèle, par type de tâche
  • Dashboard : à construire Phase 5 (web app custom avec visu temps réel)

Optimisation

Principes

  1. Haiku / Gemini Flash pour tout le tri, listing, classification, veille brute
  2. Sonnet pour le gros : rédaction, synthèse, analyse, coaching, contenu
  3. Opus uniquement pour le critique : sécurité, décisions à fort impact, review stratégique
  4. Perplexity pour la recherche web (inclus dans le plan Pro, pas de surcoût token direct)
  5. Grok pour la veille X/Twitter (gratuit avec limites)

Anti-patterns à éviter

  • Utiliser Sonnet pour un simple tri de mails → Haiku
  • Utiliser Opus par défaut "pour être sûr" → Sonnet suffit dans 95% des cas
  • Lancer des recherches Perplexity en boucle sans agrégation → batch les requêtes
  • Ne pas logger la conso → tu perds la visibilité, tu perds le contrôle