68 lines
3.0 KiB
Markdown
68 lines
3.0 KiB
Markdown
---
|
|
title: "Methode Karpathy — Indexation du vault"
|
|
type: config
|
|
created: 2026-04-16
|
|
updated: 2026-04-16
|
|
owner: jerem
|
|
agent: DAEMON
|
|
status: stable
|
|
priority_read: low
|
|
summary: "Explique la strategie d'indexation index-first utilisee dans ce vault. Inspire du pattern Karpathy."
|
|
tags:
|
|
- meta
|
|
- methode
|
|
- indexation
|
|
related: ["[[_index]]", "[[_adn/karpathy-method]]"]
|
|
---
|
|
|
|
# Methode Karpathy — Indexation du vault
|
|
|
|
## Principe
|
|
|
|
Tu navigues dans ce vault en **index-first**. Ca veut dire : tu lis toujours un index avant de plonger dans les fichiers. Jamais de scan brut de l'arborescence.
|
|
|
|
Le pattern vient de l'observation d'Andrej Karpathy : un LLM qui recoit un fichier d'index bien structure performe mieux qu'un LLM qui recoit un dump de 50 fichiers en contexte.
|
|
|
|
---
|
|
|
|
## Comment ca marche ici
|
|
|
|
1. **`_index.md` est le point d'entree unique** — tout LLM qui se connecte au vault commence par la. Il donne la structure, les regles, et les entrypoints vers chaque domaine.
|
|
2. **Les `_index.md` locaux** — chaque dossier important a son propre index (ex: `_adn/routines/_index.md`, `_adn/orchestration/_index.md`). Tu lis l'index du dossier avant d'ouvrir un fichier dedans.
|
|
3. **Les MOC (Maps of Content)** — dans `moc/`, ce sont des index thematiques transversaux auto-generes. Quand une thematique couvre plusieurs dossiers, le MOC fait le lien.
|
|
4. **Le frontmatter YAML** — chaque note a des metadonnees exploitables par machine (type, tags, summary, related). Ca te permet de filtrer sans tout lire.
|
|
5. **Les tags hierarchiques** — `domaine/coaching`, `statut/active`, `projet/enduroman`... Tu peux grep par tag pour trouver vite.
|
|
6. **Les liens internes `[[...]]`** — le graphe Obsidian cree un reseau navigable. Tu suis les liens plutot que de scanner.
|
|
|
|
---
|
|
|
|
## Pourquoi pas de RAG maintenant
|
|
|
|
Le vault a moins de 500 notes. A cette taille :
|
|
- L'index + tags + liens suffisent largement
|
|
- Un RAG ajouterait de la complexite sans gain
|
|
- Les embeddings locaux (Smart Connections) ne sont pas encore necessaires
|
|
|
|
---
|
|
|
|
## Progression prevue
|
|
|
|
| Phase | Seuil | Outil | Role |
|
|
|---|---|---|---|
|
|
| 1 - Index-first | < 500 notes | `_index.md` + tags + liens | Navigation manuelle via index |
|
|
| 2 - Embeddings locaux | 500-2000 notes | Smart Connections (plugin Obsidian) | Suggestions de notes similaires, recherche semantique locale |
|
|
| 3 - RAG complet | > 2000 notes | Qdrant (self-hosted) | Recherche semantique sur tout le vault, retrieval augmente |
|
|
|
|
---
|
|
|
|
## Regles pour maintenir la methode
|
|
|
|
- **Chaque dossier structurant a un `_index.md`** — si tu crees un nouveau dossier avec plus de 3 fichiers, cree un index.
|
|
- **Chaque note a un frontmatter complet** — `title`, `type`, `tags`, `summary` au minimum.
|
|
- **Les MOC sont regeneres par le skill `obsidian-dream`** — pas de maintenance manuelle.
|
|
- **Quand tu ne trouves pas** — tu remontes a l'index parent, pas au scan brut.
|
|
|
|
---
|
|
|
|
*Ce fichier est meta. Tu n'as pas besoin de le relire a chaque session — il explique le "pourquoi" de l'architecture.*
|