3.0 KiB
3.0 KiB
| title | type | created | updated | owner | agent | status | priority_read | summary | tags | related | |||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Methode Karpathy — Indexation du vault | config | 2026-04-16 | 2026-04-16 | jerem | DAEMON | stable | low | Explique la strategie d'indexation index-first utilisee dans ce vault. Inspire du pattern Karpathy. |
|
|
Methode Karpathy — Indexation du vault
Principe
Tu navigues dans ce vault en index-first. Ca veut dire : tu lis toujours un index avant de plonger dans les fichiers. Jamais de scan brut de l'arborescence.
Le pattern vient de l'observation d'Andrej Karpathy : un LLM qui recoit un fichier d'index bien structure performe mieux qu'un LLM qui recoit un dump de 50 fichiers en contexte.
Comment ca marche ici
_index.mdest le point d'entree unique — tout LLM qui se connecte au vault commence par la. Il donne la structure, les regles, et les entrypoints vers chaque domaine.- Les
_index.mdlocaux — chaque dossier important a son propre index (ex:_adn/routines/_index.md,_adn/orchestration/_index.md). Tu lis l'index du dossier avant d'ouvrir un fichier dedans. - Les MOC (Maps of Content) — dans
moc/, ce sont des index thematiques transversaux auto-generes. Quand une thematique couvre plusieurs dossiers, le MOC fait le lien. - Le frontmatter YAML — chaque note a des metadonnees exploitables par machine (type, tags, summary, related). Ca te permet de filtrer sans tout lire.
- Les tags hierarchiques —
domaine/coaching,statut/active,projet/enduroman... Tu peux grep par tag pour trouver vite. - Les liens internes
[[...]]— le graphe Obsidian cree un reseau navigable. Tu suis les liens plutot que de scanner.
Pourquoi pas de RAG maintenant
Le vault a moins de 500 notes. A cette taille :
- L'index + tags + liens suffisent largement
- Un RAG ajouterait de la complexite sans gain
- Les embeddings locaux (Smart Connections) ne sont pas encore necessaires
Progression prevue
| Phase | Seuil | Outil | Role |
|---|---|---|---|
| 1 - Index-first | < 500 notes | _index.md + tags + liens |
Navigation manuelle via index |
| 2 - Embeddings locaux | 500-2000 notes | Smart Connections (plugin Obsidian) | Suggestions de notes similaires, recherche semantique locale |
| 3 - RAG complet | > 2000 notes | Qdrant (self-hosted) | Recherche semantique sur tout le vault, retrieval augmente |
Regles pour maintenir la methode
- Chaque dossier structurant a un
_index.md— si tu crees un nouveau dossier avec plus de 3 fichiers, cree un index. - Chaque note a un frontmatter complet —
title,type,tags,summaryau minimum. - Les MOC sont regeneres par le skill
obsidian-dream— pas de maintenance manuelle. - Quand tu ne trouves pas — tu remontes a l'index parent, pas au scan brut.
Ce fichier est meta. Tu n'as pas besoin de le relire a chaque session — il explique le "pourquoi" de l'architecture.