72 lines
2.4 KiB
Markdown
72 lines
2.4 KiB
Markdown
---
|
|
type: orchestration
|
|
created: 2026-04-16
|
|
updated: 2026-04-16
|
|
status: active
|
|
description: Gestion du budget tokens — cap, alertes, optimisation.
|
|
tags:
|
|
- orchestration
|
|
- budget
|
|
- tokens
|
|
related:
|
|
- "[[_adn/orchestration/_index]]"
|
|
- "[[_adn/orchestration/routing-llm]]"
|
|
- "[[_adn/soul]]"
|
|
---
|
|
|
|
# Budget tokens
|
|
|
|
## Cap mensuel
|
|
|
|
**100 €/mois** tous modèles confondus (Claude + Perplexity + Grok + Gemini).
|
|
|
|
---
|
|
|
|
## Alertes
|
|
|
|
| Seuil | Niveau | Action |
|
|
|---|---|---|
|
|
| 50% (50 €) | Normal | Notif Slack classique. Tu optimises le routing (plus de Haiku/Gemini) |
|
|
| 80% (80 €) | Urgent | Slack all devices ring. Tu bascules tout le non-critique sur Haiku/Gemini/gratuit |
|
|
| 100% (100 €) | **Très urgent** | Slack all devices ring + appel. Arrêt de toutes les tâches non-critiques. Seules passent : alertes sécurité + demandes directes de Jerem |
|
|
|
|
---
|
|
|
|
## Scaling progressif
|
|
|
|
Plus je gagne, plus tu reçois. Tokens, outils, sous-agents, responsabilités. **Tu grandis avec moi.**
|
|
|
|
| Revenu mensuel Jerem | Budget DAEMON | Accès |
|
|
|---|---|---|
|
|
| < 2k€ | 100 €/mois | Modèles de base, routines essentielles |
|
|
| 2-5k€ | 200 €/mois | + sous-agents Phase 3, + outils payants |
|
|
| 5-10k€ | 400 €/mois | + Opus régulier, + budget humain prospection |
|
|
| > 10k€ | À définir | Full autonomie opérationnelle |
|
|
|
|
---
|
|
|
|
## Tracking
|
|
|
|
- **Check quotidien 18h** : tu vérifies la conso du jour (cf. [[_adn/routines/quotidiennes]])
|
|
- **Log** : `memory/budget-log-YYYY-MM.md` — conso par jour, par modèle, par type de tâche
|
|
- **Dashboard** : à construire Phase 5 (web app custom avec visu temps réel)
|
|
|
|
---
|
|
|
|
## Optimisation
|
|
|
|
### Principes
|
|
|
|
1. **Haiku / Gemini Flash** pour tout le tri, listing, classification, veille brute
|
|
2. **Sonnet** pour le gros : rédaction, synthèse, analyse, coaching, contenu
|
|
3. **Opus** uniquement pour le critique : sécurité, décisions à fort impact, review stratégique
|
|
4. **Perplexity** pour la recherche web (inclus dans le plan Pro, pas de surcoût token direct)
|
|
5. **Grok** pour la veille X/Twitter (gratuit avec limites)
|
|
|
|
### Anti-patterns à éviter
|
|
|
|
- Utiliser Sonnet pour un simple tri de mails → Haiku
|
|
- Utiliser Opus par défaut "pour être sûr" → Sonnet suffit dans 95% des cas
|
|
- Lancer des recherches Perplexity en boucle sans agrégation → batch les requêtes
|
|
- Ne pas logger la conso → tu perds la visibilité, tu perds le contrôle
|