Avec la généalogie et la gestion d’archives familiales se pose la problématique de la manipulation des documents numériques et de leur classement / rangement.
Choisir une organisation personnelle qui nous convient n’est pas un exercice aisé et relève notamment de préférences personnelles. Chaque solution ayant ses avantages et inconvénients. On peut retrouver différentes approches sur Internet. J’ai longuement réfléchi à la meilleure solution il y a 6 ans en observant les pratiques d’autres généalogistes. J’ai opté pour une méthodologie et un classement qui malheureusement a atteint ses limites et ne me convient plus.
Cet article me permet donc de revenir sur cette organisation, ses avantages et ses limites. Je présente enfin Djehooty, la solution que j’ai trouvée pour palier à ces limitations.
Quels documents ?
Pour reprendre la définition de mon article de mai 2025, il convient de décrire ce que je manipule et cherche à conserver et organiser. Par documents numériques, j’entends des fichiers nés-numériques ou bien issus de la numérisation de documents analogiques. (Image, Vidéo, Audio, Texte, Pdf, Spreadsheet, Email, Archive, Présentation, Web, etc.)
Parmi ces documents, l’essentiel provient de la numérisation de différents fonds d’archives familiales. Une partie est issue d’achats et d’acquisitions personnelles, que je numérise ensuite. Il m’arrive ainsi d’acquérir aux enchères des correspondances, photographies et factures concernant directement des membres de ma famille, mais aussi des ouvrages publiés par eux ou les mentionnant. D’autres documents relèvent de la pure recherche documentaire (sur des personnes, lieux, sociétés, contexte historique, etc.)
Les fichiers issus de la numérisation de document analogiques représentent une quantité importante de fichiers numériques. Mais ce n’est rien comparé à l’explosion des documents nés-numériques depuis les années 2000 avec l’avènement des appareils photo numériques. Leur résolution et leur poids ne faisant que croître, ces archives numériques familiales deviennent gigantesques. Agissant comme l’« archiviste familial », je me retrouve à stocker et documenter l’histoire familiale contemporaine ce qui génère donc une quantité de données très importante.
Quels types ?
J’ai mentionné le type de fichiers, mais de quoi parle-t-on exactement ? En voici une liste non exhaustive :
- Actes d’État Civil (naissance, baptême, mariage, décès)
- Actes notariés
- Faire-parts (naissance, baptême, mariage, décès)
- Journaux et notes personnelles, témoignages
- Registres de cimetières
- Documents religieux (livret de messe, carte de prière / signet)
- Correspondances (lettres, cartes postales)
- Livrets de famille, cartes d’identité, permis de conduire, passeport, cartes de rationnement, carte de combattant, etc.
- Photographies
- Diplômes
- Médailles
- Tableaux, dessins, bustes, statues
- Bâtiment, tombe, plaque
- Publications (livres, journaux, revues, brevets)
- Publicités, catalogues, cartes de visite, vêtements, etc. dans mon cas où la famille était à la tête d’une maison de couture.
Mais il ne faut pas oublier les documents numériques plus récents qui se rajoutent aux documents classiques de généalogie. On parle ici des vidéos, des podcasts, des reportages, des enregistrements audio, des emails. Mais aussi des publications sur les réseaux sociaux, des archives de SMS mais aussi de discussions MSN Messenger, WhatsApp, Signal, Skype, IRC, etc. Sans oublier nos calendriers et nos contacts… Ce sujet des données récentes mériterait un article dédié.
L’organisation
Je conserve ma généalogie sur un NAS en RAID5, accessible sur mon LAN par un partage SMB3 que je n’allume qu’au besoin. C’est mon emplacement de stockage de référence et l’endroit où je dépose mes nouveaux fichiers. Je conserve une copie de mon dossier de généalogie sur mon ordinateur en synchronisant régulièrement depuis le NAS vers mon PC (synchronisation unidirectionnelle). De cette façon, je manipule aussi souvent que possible des copies et non les originaux. Mon objectif étant de limiter au maximum les erreurs de manipulation et les suppressions malencontreuses d’originaux. C’est ma hantise.
Mon organisation repose sur le système de fichiers. Bien que mon ordinateur sous Linux utilise une partition ext4, le protocole SMB / Samba impose les mêmes restrictions de nommage que Windows (interdiction des caractères \ / : * ? " < > |) pour garantir la compatibilité entre systèmes. J’ai beau être sur ext4, je dois donc respecter ces contraintes si je veux éviter les problèmes de name mangling. Ce choix vient donc avec des inconvénients majeurs sur lesquels je reviendrai ensuite.
La racine
J’ai donc un dossier principal Généalogie que j’ai découpé par branches.
Généalogie/
├── 00 - Famille AAAA - EEEE (Ma famille - Ma femme, moi et nos enfants)
├── 01 - Famille AAAA - BBBB (Mes grand-parents paternels)
├── 02 - Famille CCCC - DDDD (Mes grand-parents maternels)
├── 03 - Famille EEEE - FFFF (Les grand-parents paternels de ma femme)
├── 04 - Famille GGGG - HHHH (Les grand-parents maternels de ma femme)
├── 05 - Autres
Les lettres représentent les patronymes.
Le dossier 05 - Autres contient tout ce qui n’est pas spécifique à une branche. J’y dépose donc tout ce qui est documentation, monographies, nobiliaires, revues de cercles généalogiques, informations sur des villes, départements, régions, pays, etc. J’y conserve également toutes mes sauvegardes GEDCOM. Ce dossier n’est pas très gros et ne mérite pas que l’on s’y attarde longtemps.
Les branches
Dans mes cinq premiers dossiers (00 à 04) nous retrouvons à chaque fois la même base d’arborescence :
├── 01 - Généalogie Ascendante
├── 02 - Généalogie Descendante
├── 03 - Livres, articles et publications
├── 04 - Lieux
├── 05 - Fonds et correspondances
├── [...]
J’ai choisi une double approche ascendante et descendante de façon à pouvoir stocker à la fois ce qui concerne mes ancêtres mais aussi les collatéraux (frères et sœurs) ainsi que leurs descendants (les cousins).
1. Généalogie Ascendante
Dans 01 - Généalogie Ascendante, on retrouve un découpage thématique assez générique.
├── 001 - État Civil et Administratif
│ ├── 001 - Naissances et Baptêmes
│ ├── 002 - Mariages
│ ├── 003 - Décès - Funérailles - Successions
│ ├── 004 - Recensements et certificats de vie
│ ├── 005 - Fichiers d'électeurs
│ ├── 006 - Documents d'identité
│ ├── 007 - Livrets de Famille
│ ├── 008 - Naturalisation et non naturalisation
│ └── 010 - Signatures
├── 002 - Scolarité
├── 003 - Militaire
├── 004 - Professionnel & Travail
├── 005 - Quotidien et Vie de Famille
│ └── Courriers et correspondances
│ └── Photos de famille
│ └── Loisirs
│ └── Évènements
│ └── Interactions avec des amis et d'autres familles
│ └── Témoignages
├── 006 - Place dans la société - Notoriété
│ └── Distinctions
├── 007 - Photos - Portraits - Bustes
Au sein de chaque dossier thématique, je crée ensuite un dossier par ancêtre en préfixant par ses années de naissance et décès.
Exemples :
├── [...]
├── 1755-1831 - COQUEBERT Charles-Etienne
├── 1758-1838 - SILVESTRE DE SACY Antoine Isaac
├── 1760-1832 - HAZON Charlotte-Nicole
├── 1770-1847 - BRONGNIART Alexandre
├── 1782-1862 - COQUEBERT DE MONTBRET Cécile Jeanne
├── 1797-1841 - AUDOUIN Jean Victor
├── 1801-1879 - SILVESTRE DE SACY Samuel Ustazade
├── [...]
Pour les fichiers, j’essaie ensuite de suivre toujours la même convention de nommage :
YYYY-MM-DD - {préfixe} - NOM Prénoms - {source}.extension
où
- YYYY-MM-DD indique la date de l’événement au format ISO 8601 (ex: 1830-04-11) - Cette nomenclature a l’avantage de faciliter le listing chronologique par défaut, en comparaison du format 11-04-1830.
- {préfixe} correspond à un l’acronyme du type de document
- AN - Acte de Naissance
- FNR - Fiche de Naissance Reconstituée (Spécifique à la ville de Paris)
- ANR - Acte de Naissance Reconstitué (Spécifique à la ville de Paris)
- AB - Acte de Baptême
- AM - Acte de Mariage
- FMR - Fiche de Mariage Reconstituée (Spécifique à la ville de Paris)
- AMR - Acte de Mariage Reconstitué (Spécifique à la ville de Paris)
- FDM - Faire Part de Mariage
- AD - Acte de Décès
- FDR - Fiche de Décès Reconstituée (Spécifique à la ville de Paris)
- ADR - Acte de Décès Reconstitué (Spécifique à la ville de Paris)
- FPD - Faire Part de Décès
- LE - Liste Électorale
- CPA - Carte Postale Ancienne
- …
- {source} identifie la provenance du document. J’essaie d’y indiquer un maximum de choses.
- AD = Archives Départementales
- AM = Archives Municipales
Exemple
AD 75 - Cote V4E 712 - Acte n°859 - Page 15 sur 31
On peut rapidement arriver à des noms de fichiers très longs
1835-04-02 - ANR - AUDOUIN Paul Marie Eugène - AD 75 - Cote 5Mi1 414 - Page 21 sur 50 - 1 sur 3 - archives_FRAD075AR_5Mi1_0414_02860.jpg
Lorsque le nom de fichier ne suffit plus, j’ai pris l’habitude de créer un fichier du même nom, mais dont l’extension est .txt afin de rajouter contexte et métadonnées.
├── Lithographie Alexandre-Théodore Brongniart Architecture - Scan 2023-07-07.jpg
├── Lithographie Alexandre-Théodore Brongniart Architecture - Scan 2023-07-07.txt
Exemple : Lithographie Alexandre-Théodore Brongniart Architecture - Scan 2023-07-07.txt
Source du document :
Lithographie achetée sur eBay le 31/05/2023 pour 26,99€
Date et auteur de la numérisation :
Numérisé par Yoann SCULO le 07/07/2023 par Yoann SCULO
Document :
Lithographie
2. Généalogie Descendante
Dans 02 - Généalogie Descendante, on retrouve un dossier par couple d’ancêtres, préfixé par leur date de mariage. Si on ouvre le dossier d’un couple d’ancêtres on retrouve tout ce qui concerne le couple et les éventuels frères et sœurs de mon ancêtre. Voici un exemple de dossiers que l’on peut y trouver.
├── [...]
├── 1780-04-04 - COQUEBERT de MONTBRET x HAZON
├── 1792-07-24 - AUDOUIN x ENÉE
├── 17xx-xx-xx - BRONGNIART x de FOURCROY
├── 17xx-xx-xx - DARRAS x ROSELET
├── 1800-02-09 - BRONGNIART x COQUEBERT de MONTBRET
├── 1809-09-05 - DELAGARDE x DELAROCHE DE LAGE
├── 1811-08-24 - AINE x GODAILLIER
├── 1827-12-06 - AUDOUIN x BRONGNIART
├── 1835-01-06 - SILVESTRE de SACY x TROUVÉ
├── 1838-10-03 - DAUTZENBERG x MAILLART
├── 1845-12-20 - AINE x MULLER
├── 1847-09-22 - RANDU x BERTHELEY (1er Mariage)
├── 1853-02-22 - LEGRAND x BERTHELEY
├── 1860-11-24 - AUDOUIN x SILVESTRE de SACY
├── 1872-04-16 - DAUTZENBERG x BRAQUENIÉ
├── 1878-08-22 - AINE x LEGRAND
├── 1888-08-01 - DELAGARDE x AUDOUIN
├── 1912-10-14 - AINE x DAUTZENBERG
├── [...]
Pour chaque couple, j’ai alors un dossier par enfant collatéral (donc tous les enfants sauf mon ancêtre). Par exemple, pour le dossier 1835-01-06 - SILVESTRE de SACY x TROUVÉ, j’ai un dossier pour 4 des 6 enfants du couple.
├── 1834-1917 - Alfred Silvestre de Sacy x Audouin
├── 1836-1908 - Félicité Silvestre de Sacy x Baudrillart
├── 1838-1912 - Ustazade Silvestre de Sacy x Vinit
├── 1842-1917 - Jules Silvestre de Sacy x Vinit
Et je continue comme ça en créant des sous dossiers par enfant / couple pour stocker tout ce qui concerne les cousins.
3. Livres, articles et publications
Lorsque je trouve des publications faites par des ancêtres ou des cousins, ou bien des ouvrages sur eux, je conserve les fichiers associés. Cela me permet de constituer une bibliographie. Je n’ai pas mis en place de méthodologie particulière, c’est un peu un dossier fourre-tout.
4. Fonds et correspondances
La famille proche, ainsi que des cousins éloignés, me partagent de nombreux documents. J’en numérise également beaucoup. J’ai pris le parti de ne pas les ranger dans les dossiers Généalogie Ascendante ou Généalogie Descendante. Et cela afin de conserver une certaine logique de Fonds d’Archive et de garder la notion de provenance et de source. Mais également pour parfois conserver le classement des fichiers reçus, ce qui peut apporter en soi parfois des informations importantes.
J’ai donc un dossier par individu de la famille qui me partage des documents et que je complète à chaque session de numérisation ou de réception de nouveaux documents. Je conserve également ici mes échanges courrier et emails.
Avantages
Cette organisation fonctionne bien pour les recherches ascendantes et pour les recherches générant peu de fichiers. Tout est rangé et trié par thématique à condition de respecter l’organisation et la nomenclature de nommage de fichiers. La navigation visuelle est facilitée par l’usage de l’explorateur de fichiers qui n’implique donc aucune dépendance à un logiciel particulier. Ce qui rend la solution portable (tout système peut lire des fichiers).
Inconvénients et limitations
Je ne me suis donc pas attardé malheureusement sur les avantages de ma solution tellement les inconvénients sont nombreux pour moi aujourd’hui.
1. L’effort nécessaire au bon rangement
Mon arborescence, que j’ai souhaitée rigoureuse, nécessite un effort important de réflexion et bien souvent de recherche préalable afin de déposer un fichier au bon endroit .
Quand je trouve un nouveau document :
- je dois tout d’abord nommer le fichier selon la bonne nomenclature (et ne pas l’oublier) et faire attention aux caractères interdits (voir plus bas). Si je n’ai pas la date de naissance de la personne (dans le cas d’une photo), je dois faire des recherches préalables, et il arrive que je ne la trouve pas.
- compléter avec un fichier .txt si nécessaire pour rajouter des métadonnées complémentaires.
Dans le cas d’un ancêtre, déposer le document au bon endroit est relativement aisé. Par contre, déposer un document associé à un cousin peut devenir très compliqué. Il faut :
- identifier le couple commun
- identifier la date de mariage du couple si on ne l’a pas encore trouvé. Pour les événements avant la révolution française, cela commence être plus compliqué de trouver systématiquement la date. Je préfixe alors avec un 16XX, 17XX, etc. qui ne facilite alors pas les recherches a posteriori. Cette approche ne gère pas non plus les approximations, ce qui est problématique.
- créer le dossier s’il n’existe pas encore.
- créer l’arborescence descendante pour aller jusqu’à la bonne personne et sans doute faire des recherches descendantes complémentaires…
Il me manque souvent le temps de faire les recherches nécessaires, et le document finit alors dans un dossier « À traiter » qui ne fait que grossir…
2. Les documents qui concernent plusieurs personnes
Les actes classiques qui concernent une personne sont faciles à ranger avec mon organisation. La situation se complique dès lors que l’on tombe sur un document qui concerne plusieurs ascendants mais aussi ceux qui concernent ascendants et descendants.
Quelques exemples de document hybrides
- La photographie de famille (couple + tous les enfants)
- La photographie de famille étendue (ancêtres + enfants + cousins)
- Le recensement (couple + enfants + parfois grand-parents ou cousins)
- Correspondance entre un cousin et un ancêtre (range t-on au cousin ou à l’ancêtre ?)
Faire un choix n’est en soi pas le plus difficile, le plus compliqué est de se souvenir de ce choix de rangement a posteriori, lorsque l’on recherche un document hybride et que l’on ne le retrouve pas spontanément. Je me retrouve alors à chercher et tourner en rond ne sachant pas où j’ai pu déposer mon fichier. Ce qui est très frustrant.
3. Partager des documents à la famille
Je fais beaucoup de recherches descendantes, ce qui me permet d’entrer en contact avec des cousins et découvrir de nombreux documents familiaux dont je n’avais pas connaissance. Quand je souhaite leur partager mes recherches, je me heurte aux limites de mon organisation qui est très centrée sur mon SOSA n°1. Partager ce que j’ai trouvé sur un ancêtre ou une branche commune avec un membre de la famille ou un cousin éloigné devient alors très compliqué. Je dois aller chercher individuellement tous les documents. C’est tout bonnement infaisable, et je me contente de partager à ce stade des documents par thématiques ou sur des ancêtres ciblés.
4. Les doublons
Sur les fonds et correspondances
Je ne suis pas le premier à travailler sur la généalogie de la famille. Par conséquent, des travaux plus ou moins anciens circulent déjà entre cousins. Lorsque je récupère des documents numériques (créés dans les 30 à 40 dernières années), je retrouve parfois des fichiers que je possède déjà mais pas toujours avec les mêmes métadonnées. Bien souvent, ces fichiers sont mélangés à d’autres que je n’avais pas encore. Je conserve donc tels quels tous les fichiers que l’on me transmet, même si je les ai déjà. Ce qui fait grossir ma généalogie avec de nombreux doublons, et c’est un problème.
Sur mes publications
Je rédige des documents pour partager mes recherches, pour cela j’utilise LaTeX, Scribus et commence à jouer avec Typst. Ces documents sont généralement destinés à être imprimés et donc la qualité des images est importante. Il convient alors d’utiliser les images en haute définition.
Option 1 - Utiliser l’emplacement des images au sein de l’arborescence de mon dossier Généalogie. Cette approche évite de copier les images, mais est très fragile. En cas de renommage ou déplacement d’un fichier, le lien se retrouve cassé.
Option 2 - Recopier les images nécessaires dans le dossier du document en cours de rédaction. Ça fonctionne mais on duplique les images à plusieurs endroits. Ces dernières sont lourdes, car en haute définition, ce qui est un gros inconvénient. Et on doit garder les fichiers tels quels si l’on souhaite éditer une nouvelle version du document plus tard.
Je suis aujourd’hui sur l’option 2, mais elle ne me convient pas du tout, car je me retrouve à sauvegarder des doublons.
5. Les problèmes inhérents au système de fichiers
Utiliser le système de fichiers de son système d’exploitation est la solution qui s’impose généralement pour organiser ses documents. Cette solution présente néanmoins des inconvénients majeurs. Je ne m’attarderai pas ici sur le choix d’un système de fichiers plutôt qu’un autre avec ses avantages et inconvénients mais plus sur des problématiques liées aux familles de systèmes de fichiers.
5.1. La taille du nom de fichier
La plupart des systèmes de fichiers modernes limitent le nom d’un fichier à 255 octets. Attention, certains caractères peuvent consommer plus qu’un octet. Ainsi, avec la nomemclature que j’utilise, je peux parfois atteindre ce plafond notamment lorsque je souhaite y joindre des métadonnées un peu longues. L’usage d’un fichier texte voisin est alors nécessaire pour y stocker les informations en dehors du nom du fichier. Mais cette solution est assez lourde à l’usage.
5.2. Les caractères spéciaux
Là où ext4, sous Linux, interdit seulement 2 caractères / \0 dans un nom de fichier, NTFS et SMB/Samba interdisent \ / : * ? " < > |
C’est un vrai problème, notamment dans les cas suivants qui utilisent :, ?, < et > :
:Pour les heures. “10:30 - Photo.jpg” est interdit:Pour les cotes d’archives - “AD 75 : Cote V4E 712” est refusé:Pour préciser la source - “Nom de fichier - Source : Arbre de XXXX” ne passera pas.:Dans les noms d’emails qui commencent par Re lorsqu’ils sont sauvegardés dans un fichier - “Re: Bonjour.eml” est également refusé<et>Dans les noms d’emails - “Bonjour <monsieur@martin.fr> - 2026-02-15.eml” ne passera pas?Dans les interrogations - “Photo famille - qui ?.jpg” posera problème
Lorsque l’on est un utilisateur Windows, on obtient tout de suite une erreur. Mais lorsque, comme moi, on est utilisateur Linux sous ext4, le fichier peut être nommé avec ces fameux caractères. Et c’est au moment du stockage sur le NAS (SMB/Samba) que le problème va se poser. Le mécanisme de name mangling va alors transformer automatiquement et de façon silencieuse les noms non conformes en chaînes aléatoires (ex: 1D5L04~7). Dans certains cas, les noms semblent également être tronqués (comportement que je n’ai pas encore totalement élucidé).
Quelques exemples de comportements constatés sur mon NAS :
10:30 - Photo.jpgest tronqué en10une fois copié sur le NAS.Bonjour monsieur@martin.fr - Date : 2026-02-15.emlest renomméB8KPIP~8(name mangling)Bonjour <monsieur@martin.fr> - 2026-02-15.emlest renommé enBonjour monsieur@martin.fr - 2026-02-15.eml
Si l’on ne prend pas garde, on peut alors déposer des dossiers entiers de documents qui vont entièrement perdre toute trace des noms de fichiers s’ils présentent des caractères interdits. Une bombe à retardement si l’on n’y prête pas attention. On peut alors perdre de précieuses informations et se retrouver avec des fichiers très difficilement exploitables.
C’est d’autant plus problématique que les caractères : et ? sont des caractères fréquents en français et peuvent être très facilement utilisés pour nommer un fichier lorsque l’on n’est pas habitué aux limitations de Windows.
Je dois alors m’astreindre à ne surtout pas utiliser de caractères interdits. Malheureusement, cela arrive régulièrement que je me fasse avoir.
5.3. Conclusion
Si je veux partager mes documents à d’autres personnes, je ne peux pas considérer que ces fichiers seront obligatoirement stockés sur un système de fichier de type ext4 sous Linux. Et par ailleurs, si je souhaite également ne pas prendre le risque d’altérer les noms de mes fichiers alors je dois donc malheureusement niveler par le bas. Je dois alors m’adapter aux limitations imposées par Microsoft qui est hélas la solution la plus commune aujourd’hui avec Windows.
D’autres solutions
J’avais exploré d’autres approches de classement : le tri par source (regrouper tous les actes des Archives Départementales du Doubs, de Paris, de Loire-Atlantique, etc. au même endroit), le tri par type de document (toutes les photos ensemble, tous les actes de naissance ensemble), ou encore le tri purement chronologique. Mais en pratique, quelle que soit la façon de ranger ses fichiers, si la solution repose sur un système de fichiers pour le classement, les problèmes fondamentaux restent présents : documents concernant plusieurs personnes, difficulté de partage, limites des noms de fichiers, etc.
Face à ces limitations, j’ai exploré différentes solutions existantes (logiciels de généalogie, systèmes de gestion d’actifs numériques), mais aucune ne correspondait vraiment à mes besoins spécifiques d’archiviste familial.
Ma solution - Djehooty
C’est donc pour répondre à ces limitations que je développe actuellement le logiciel libre Djehooty. Je compte avec celui-ci, m’affranchir des contraintes du système de fichier et utiliser une base de données relationnelle pour les métadonnées et les recherches.
Avec cette solution, tous les inconvénients sont solutionnés. Djehooty sépare l’action de stockage de l’action d’enrichissement avec des métadonnées et l’identification de personnes, lieux, etc.
- Ranger un document ne nécessite donc plus aucun effort. On peut importer un document avec un simple glisser/déposer, ajouter quelques informations de métadonnées rapides et revenir plus tard pour identifier les personnes, des lieux, dater le document, etc.
- Les documents qui concernent plusieurs personnes ne posent plus de souci non plus. On importe un document et on peut identifier autant de personnes et de lieux que l’on souhaite dessus. Une recherche sur une personne permettra alors aisément de remonter sur tous les documents associés.
- Partager des documents à la famille ne sera plus un problème. Grâce à l’identification de personne et à sa filiation, il sera facile d’extraire en une fois tous les documents associés à un ancêtre ou une branche.
- Plus de doublons. Djehooty ne stocke qu’une seule fois le même fichier mais conserve les informations des différentes versions avec leurs métadonnées. De la même façon, pour les publications familiales, on pourra envisager à terme un plugin Typst ou LaTeX pour manipuler les images HD de sa base de données Djehooty.
- Moins de risques liés au système de fichiers. En déportant toutes les métadonnées au sein d’une base de données relationnelle, le nom de fichier ne comporte plus d’information importante au delà de son identifiant. Il devient alors standardisé et portable. Le fichier peut alors être manipulé et copié sans risque, d’un système de fichier à un autre.