From eb7a9f8c1ed76858c0963a9a7fb4bb896c1a7857 Mon Sep 17 00:00:00 2001 From: Étienne Loks Date: Tue, 13 Aug 2019 13:05:48 +0200 Subject: Update database documentation --- docs/database.fr.md | 17 +++++++++++------ 1 file changed, 11 insertions(+), 6 deletions(-) (limited to 'docs/database.fr.md') diff --git a/docs/database.fr.md b/docs/database.fr.md index 7c6b7ca..eec5503 100644 --- a/docs/database.fr.md +++ b/docs/database.fr.md @@ -30,15 +30,20 @@ Ce module permet de stocker les éléments collectés lors des `Sessions d'indexation`. Une `Session d'indexation` est associées à plusieurs `Cibles`. Ainsi il est possible de lancer des `Sessions d'indexation` en ne prenant en compte qu'un -sous-ensemble des `Cibles` définies. +sous-ensemble des `Cibles` définies. Un `Délai maximum` de parcours d'un site +peut être défini pour permettre notament d'identifier des branches de site +non pertinente et affiner le moteur (exemple : agenda). À chaque `Session d'indexation` sont aussi associés des `Résultats d'indexation`. Cette table reprend le décompte des éléments qui nous intéressent pour chaque -`Cible` ainsi que tous les `Liens` rencontrés. - -Cette collecte exhaustive de `Liens` rencontrés permet a posteriori d'établir -les éventuelles `Relations` entre les structures mais permet aussi -éventuellement d'identifier des nouvelles structures à intégrer à l'étude. +`Cible`. Le champ `Résultat d'indexation` collecte les listes d'éléments +pertinents (adresse des images, liens, etc.) permettant de faire a posteriori +le décompte. + +En particulier la collecte exhaustive des liens externes rencontrés permet a +posteriori d'établir les éventuelles `Relations` entre les structures mais +permet aussi éventuellement d'identifier des nouvelles structures à intégrer +à l'étude. La table `Domaine exclu` est à remplir avec les domaines "parking" et domaines des hébergeurs pour identifier rapidement les sites aux domaines non -- cgit v1.2.3