Yoann Sculo

Technologie, généalogie, archivistique et libertés numériques

Djehooty - Reprendre le contrôle de ses archives numériques familiales avec le libre (JdLL 2026)

Contexte

Cette conférence a été donnée dans le cadre des Journées du Logiciel Libre 2026 (JdLL), le samedi 30 mai 2026 à Lyon. Elle a été enregistrée et est disponible en vidéo. Les slides de présentation sont également disponibles au format PDF et ODP, tout comme le verbatim de la conférence.

Résumé

Photos, enregistrements audio et vidéo, emails, documents familiaux, actes d’état civil, notes de recherche… Nos archives numériques s’accumulent et se diversifient. Pour les généalogistes, les chercheurs ou toute personne engagée dans un travail documentaire au long cours, un défi crucial se pose : comment organiser efficacement des dizaines de milliers de documents interconnectés tout en gardant la maîtrise de ses données ? Comment garantir qu’ils restent accessibles, compréhensibles et transmissibles sur plusieurs générations ?

Djehooty s’adresse à celles et ceux qui souhaitent organiser leurs archives localement avec un outil libre et pérenne : généalogistes individuels ou associatifs, chercheurs, ou toute personne ayant besoin d’un gestionnaire documentaire respectueux de leur souveraineté.

Cette conférence est l’occasion de présenter la philosophie du projet, de faire une démonstration interactive, et d’échanger sur les enjeux de pérennité des archives numériques à l’ère des plateformes centralisées.

Première slide de la présentation, mentionnant son titre avec le logo de Djehooty, un Ibis sacré

Vidéo

Verbatim

1. Introduction

Slide 1 - Djehooty - Reprendre le contrôle de ses archives numériques familiales avec le libre

Aujourd’hui je vais vous parler d’archives numériques et de mon logiciel Djehooty. Mais avant de vous le présenter, laissez-moi vous raconter pourquoi j’en suis arrivé à lancer ce projet.

Slide 2 - Qui suis-je et pourquoi je suis là ?

Je m’appelle Yoann Sculo, je suis ingénieur Linux embarqué de formation et surtout généalogiste amateur depuis 6 ans. J’ai peu à peu pris le rôle d’archiviste familial. Je vais à la rencontre de ma famille et de cousins éloignés à la recherche de documents familiaux.

J’ai accumulé à ce jour 45 000 fichiers relatifs à ma généalogie, représentant 330 Go. Cette quantité de données devient de plus en plus complexe à appréhender sans outil pour m’assister.

Lorsque j’ajoute mes propres photos et documents familiaux contemporains, le total dépasse 300 000 fichiers et le téraoctet. Et cela, sans inclure ce qui relève de la musique ou des films.

Et cela devient tout bonnement ingérable, j’ai besoin d’être assisté d’un outil, d’un assistant.

2. Le problème - L’archiviste familial face à ses archives

Slide 3 - Les archives familiales numériques

Avant toute chose, je vais définir ce que j’entends par « archives familiales numériques ».

Je parle donc ici de documents généralement analogiques, numérisés par différents procédés (scanner, photographie, etc.). On va parler ici d’actes d’état civil, de photographies papier, de courriers, de divers documents et publications. La liste n’est pas exhaustive.

Slide 4 - Les documents nés numériques

Pour les documents plus récents « nés numériques », c’est-à-dire ceux qui ont été produits nativement au format numérique, on retrouve des documents nombreux et très variés. Il est question ici de photos et vidéos prises par notre smartphone, de nos emails et discussions diverses, et même de code source pour les développeurs. La liste est très longue et les types de documents et leurs formats sont de plus en plus variés.

Slide 5 - La variété de sources

Ces documents peuvent provenir de nombreuses sources. Ils peuvent être transmis par la famille, ce qui est bien souvent la source principale de documents. Mais ils peuvent aussi venir d’institutions, services et établissements publics ou même privés. On va parler notamment des archives, des musées, des bibliothèques et de fonds divers.

Internet est par ailleurs une source gigantesque de documents. Sites internet, portails de généalogie, bases de données diverses… On peut également mentionner les outils comme Wikipédia et Wikimedia Commons, mais aussi Archive.org et Wayback Machine. Les petites annonces et les ventes aux enchères peuvent être également très précieuses.

On se retrouve ainsi vite submergé de documents et il devient particulièrement important de tracer leur provenance, mais aussi la licence associée et ce que nous sommes autorisés à faire. Notamment si l’on souhaite un jour faire une publication avec.

Slide 6 - Organisation par système de fichiers

J’ai étudié plusieurs approches de classement pratiquées par les généalogistes basées sur le système de fichiers. J’en ai choisi une qui me convenait le mieux.

De façon simplifiée, cela consiste à organiser mes données en quatre dossiers. Ces quatre dossiers correspondant aux quatre branches ascendantes, c’est-à-dire les arrière-grands-parents de mes enfants.

J’organise chacun de ces dossiers de la même façon. On y trouve un dossier ascendant pour les ancêtres et un dossier descendant pour les collatéraux (frères et sœurs d’ancêtres) et cousins.

Dans le dossier de généalogie ascendante je redécoupe en répertoires thématiques. Je vais ainsi stocker tous les actes de naissance au même endroit, tous les actes de mariage au même endroit, tous les courriers et photographies au même endroit, etc.

Au sein de chacun de ces dossiers, je vais créer un dossier par individu ou couple, dans lequel je vais pouvoir déposer mes documents.

Côté généalogie descendante, j’ai un dossier par couple d’ancêtres, préfixé par leur date de mariage, lorsque je la connais. J’y dépose un dossier par enfant collatéral (frères et sœurs) afin d’y stocker les documents relatifs, et ainsi de suite.

Slide 7 - Nomenclature

J’ai établi une nomenclature de noms de fichiers me permettant de plus facilement m’y retrouver. J’y place notamment le type de document (par exemple ANR pour Acte de Naissance Reconstitué, AM pour acte de mariage, etc.) et la source. Je mentionne la source du document, élément très important.

Le nom de fichier peut rapidement devenir très long. Quand ce n’est pas suffisant, je crée un fichier .txt du même nom que le document, pour y stocker des informations complémentaires. Notamment pour y renseigner des URL dont le caractère slash est interdit dans un nom de fichier.

Slide 8 - MediaWiki

J’ai exploré une seconde méthode en installant MediaWiki sur mon serveur. MediaWiki est le moteur wiki de Wikipédia. C’est une solution très intéressante qui permet de faire des fiches sur des ancêtres avec des photos. Cela gère particulièrement bien la partie sources. Cela permet notamment de partager facilement son travail à l’extérieur et même d’accéder à ses recherches de n’importe où.

Slide 9 - Limites rencontrées

Avec cette organisation, en utilisant le système de fichiers, je me suis progressivement heurté à plusieurs limites à mesure que mes archives ont grossi.

Cette méthode requiert un effort de rangement colossal. Lorsque l’on récupère un ou plusieurs documents, il faut tout d’abord bien nommer le fichier en suivant la bonne nomenclature. Je dois bien souvent faire une recherche préalable pour la date en préfixe ou l’arborescence de rangement. Lorsque j’ai trop d’informations à noter, je dois créer un fichier à partir d’un fichier gabarit. Cela se complique lorsque je ne trouve pas sur le moment les informations nécessaires. Cette opération de rangement devient alors fastidieuse et je me retrouve régulièrement à déposer mes documents en vrac, en attente de classement.

Les documents qui concernent plusieurs personnes constituent un vrai problème. Particulièrement lorsqu’ils concernent un ancêtre et un collatéral. Il faut alors faire un choix et s’en souvenir. Je me retrouve alors régulièrement à prendre beaucoup de temps à localiser un document. Il m’arrive même de ne pas en retrouver certains.

Partager et transmettre ses documents à la famille est très compliqué. Tout d’abord car mon organisation est thématique et pas nominative. Les documents associés à une personne se retrouvent éparpillés dans plein de dossiers. Il faut les regrouper pour pouvoir les transmettre. Un élément est également plus problématique sur le long terme, c’est le fait de centrer naturellement son organisation et même sa généalogie sur soi. Lorsque l’on transmet à ses enfants ou à des cousins, le référentiel n’est plus le même.

Les doublons finissent par se multiplier. Tout d’abord car des documents circulent dans la famille et se mêlent aux différents fonds individuels. Je me retrouve à collecter certains fichiers que je possède déjà. Il m’arrive également d’oublier que j’ai déjà téléchargé certains documents, il suffit d’une variation dans le nommage et je me retrouve avec plusieurs fois le même fichier…

Le système de fichiers nous réserve de mauvaises surprises. Tout d’abord en interdisant certains caractères comme le slash, les deux points, les crochets ouvrants et fermants, le point d’interrogation. J’ai pu le mentionner pour les URL, cela pose souvent problème avec les cotes des archives utilisant fréquemment le slash, qu’il faut transformer en tiret. Pire, cela peut également mener à des renommages aléatoires de noms de fichiers lorsque l’on utilise un serveur de stockage en réseau (NAS) comme moi.

Côté MediaWiki, cette solution très séduisante vient tout de même avec des inconvénients.

Les photos que l’on dépose sont dupliquées sur le serveur, et je réduis par ailleurs leur résolution pour gagner de la place de stockage. C’est assez chronophage.

L’installation, la maintenance et les sauvegardes de l’outil restent peu évidentes pour le grand public. C’est assez technique.

Et nativement, cela ne supporte pas tous les formats de fichiers.

Slide 10 - Besoins identifiés

Je suis alors arrivé à la conclusion qu’il me fallait un outil me permettant :

3. Panorama des solutions existantes

Slide 11 - Pourquoi cela ne me convenait pas ?

Il existe plusieurs solutions libres, organisées en trois grosses catégories :

Il y avait un vide à combler pour mon besoin avec un outil hybride de gestion documentaire adapté à la généalogie et servant également d’assistant de recherche.

Alors pourquoi ne pas avoir contribué à des projets existants ?

J’ai cherché à contribuer plutôt qu’à créer. Les projets existants sont d’excellents outils pour leur usage, mais ils avaient des visions parfois fondamentalement différentes de la mienne.

Et puis j’avais envie de lancer mon propre projet open source et d’utiliser et d’apprendre certaines technologies modernes.

4. Djehooty - Les principes et la philosophie

Slide 12

Et c’est ainsi que Djehooty est né il y a 2 ans. C’est un logiciel libre sous licence AGPLv3 de gestion d’archives numériques et de recherche documentaire.

Je reviendrai dessus par la suite, mais la généalogie n’est pas le cas d’usage principal. C’en est un parmi plusieurs possibilités offertes par le logiciel.

Le nom du projet fait référence au dieu Thot 𓁟, aussi appelé /d͡ʒɛhuːti/ (Djehouty) en égyptien ancien. Dieu de la connaissance et de l’écriture, Thot est aussi le scribe et l’archiviste des dieux. Le logo du projet représente un ibis sacré 𓅞

Slide 13

Djehooty est avant tout un logiciel libre qui s’inscrit dans une démarche d’ouverture, de partage mais aussi de pérennité.

Le logiciel est conçu pour fonctionner en local et ne pas dépendre de solutions tierces notamment pour référencer des documents. Le web est très volatile : de nombreux sites disparaissent, notamment certains sites personnels qui peuvent être une mine d’information.

Des bases de données font évoluer leurs URLs comme récemment en septembre 2025 le cas de la visionneuse Arkothèque des archives départementales de Paris qui a cassé le modèle en place en montant de version. Cela a invalidé 15 000 liens sur Wikipédia et dans de nombreux arbres généalogiques. Cela arrive malheureusement très régulièrement. Encore plus récemment avec les archives du Finistère en avril 2026.

Je peux enfin citer le cas de la situation aux États-Unis où des archives publiques sont menacées par l’administration Trump. Des suppressions massives de documents (photos) ont touché les archives numériques de plusieurs agences fédérales. Internet n’est pas immuable !

Djehooty n’envoie pas de données à l’extérieur, vous contrôlez vos données sur votre ordinateur. Pas de cloud, pas de marchandisation.

La spécificité de Djehooty est de partir du document pour y rajouter du contexte. C’est une séparation clé : on stocke d’abord, puis enrichit.

Djehooty privilégie autant que possible des choix techniques sobres. Cette approche garantit la durabilité et l’accessibilité des données sur le long terme.

Djehooty s’engage à respecter les normes d’accessibilité numérique afin de garantir une utilisation optimale par toutes et tous, et notamment les personnes en situation de handicap visuel. Cela part d’une expérience personnelle. J’ai constaté dans ma famille plusieurs situations de personnes âgées, tout à fait à l’aise avec l’outil numérique, mais bloquées par leur handicap visuel.

Alors quel est le public cible de Djehooty ? Ma démarche initiale était de répondre à mon besoin personnel de généalogiste amateur et archiviste familial. J’ai réalisé que l’outil pouvait servir à des cercles ou associations de généalogie, des familles, des chercheurs voire des archivistes amateurs.

5. Djehooty - Comment ça marche ?

Slide 14 - Architecture

Alors comment ça marche ?

Djehooty est organisé en deux composants selon une logique client / serveur.

Un backend, développé en Go, utilise une base de données locale SQLite. Il expose une API REST ouverte à laquelle peuvent se connecter des clients. Notamment le frontend, qui est l’interface graphique de Djehooty, développée en React et TypeScript.

Les données sont toutes stockées sous la forme de fichiers. Que ce soit la base de données ou les documents des utilisateurs. Les métadonnées vont dans SQLite, les fichiers originaux restent sur votre disque. Tout est donc facilement consultable et sauvegardable, indépendamment de Djehooty.

Slide 15 - Distribution & installation

Je propose deux solutions d’installation :

La première est un exécutable autosuffisant sans dépendance C’est la solution la plus simple. Un binaire de 36 Mo qui embarque backend et frontend (30 Mo sans le frontend) et ouvre automatiquement votre navigateur web au démarrage. Cette solution n’est distribuée que pour Linux pour le moment.

La seconde est une image de conteneur Cette solution cible les utilisateurs et utilisatrices plus avancés et offrera la possibilité de faire facilement tourner Djehooty sur un serveur. C’est notamment la solution actuellement utilisée pour faire tourner le serveur de démonstration : demo.djehooty.org.

6. Djehooty - Démo live

Slide 16

Démonstration de l’application.

7. Djehooty - Le projet

Slide 17

Le projet est disponible sur djehooty.org où l’on peut trouver une documentation en français et en anglais, qui explique comment installer et utiliser l’outil.

J’y présente également le projet, sa philosophie, sa feuille de route mais aussi comment contribuer au projet.

Le code est hébergé sur Codeberg, infrastructure européenne (allemande) basée sur Forgejo.

Côté gouvernance, je suis pour le moment seul et je ferai évoluer le modèle lorsque des contributeurs et contributrices me rejoindront.

8. Djehooty - Perspectives et contribution

Slide 18 - État actuel et feuille de route

Ma démarche consiste à me concentrer sur le moteur documentaire pour bénéficier de fondations stables sur lesquelles construire la suite du projet.

Cette feuille de route suit naturellement la philosophie du projet. Je me concentre sur l’import de documents et sur les fonctionnalités importantes de manipulation de fichiers et documents.

Je vais ainsi progressivement rajouter des fonctionnalités d’enrichissement dont des fonctionnalités de généalogie et de filiation. Mais cela repose toutefois sur des fonctionnalités préalables. Djehooty n’est donc pas encore un logiciel de généalogie.

Je me concentre également sur deux aspects :

Slide 19 - Appel à contribution

Si le projet vous intéresse, rejoignez-moi !

Je cherche des retours d’utilisateurs et utilisatrices.

Mais aussi des développeurs ou développeuses Go et React / TypeScript pour m’aider sur le développement.

Je suis également très intéressé par des retours et contributions sur l’UX et l’accessibilité.

J’ai rédigé une documentation sur la manière de contribuer et mis en place un code de conduite, basé sur le Contributor Covenant Code of Conduct.

9. Merci

Slide 19

Djehooty, c’est avant tout la réponse à un problème personnel. J’ai l’intuition que ce problème sera de plus en plus partagé et pas uniquement pour les besoins de la généalogie.

Djehooty est un outil pensé pour durer, pour être transmis, et pour rester sous le contrôle de celui qui l’utilise. Si vous partagez cette vision, venez contribuer !

Je vous laisse quelques liens ici, Djehooty est sur Mastodon et Bluesky. Vous pouvez me joindre par email également.