diff options
Diffstat (limited to 'docs/database.fr.md')
-rw-r--r-- | docs/database.fr.md | 17 |
1 files changed, 11 insertions, 6 deletions
diff --git a/docs/database.fr.md b/docs/database.fr.md index 7c6b7ca..eec5503 100644 --- a/docs/database.fr.md +++ b/docs/database.fr.md @@ -30,15 +30,20 @@ Ce module permet de stocker les éléments collectés lors des `Sessions d'indexation`. Une `Session d'indexation` est associées à plusieurs `Cibles`. Ainsi il est possible de lancer des `Sessions d'indexation` en ne prenant en compte qu'un -sous-ensemble des `Cibles` définies. +sous-ensemble des `Cibles` définies. Un `Délai maximum` de parcours d'un site +peut être défini pour permettre notament d'identifier des branches de site +non pertinente et affiner le moteur (exemple : agenda). À chaque `Session d'indexation` sont aussi associés des `Résultats d'indexation`. Cette table reprend le décompte des éléments qui nous intéressent pour chaque -`Cible` ainsi que tous les `Liens` rencontrés. - -Cette collecte exhaustive de `Liens` rencontrés permet a posteriori d'établir -les éventuelles `Relations` entre les structures mais permet aussi -éventuellement d'identifier des nouvelles structures à intégrer à l'étude. +`Cible`. Le champ `Résultat d'indexation` collecte les listes d'éléments +pertinents (adresse des images, liens, etc.) permettant de faire a posteriori +le décompte. + +En particulier la collecte exhaustive des liens externes rencontrés permet a +posteriori d'établir les éventuelles `Relations` entre les structures mais +permet aussi éventuellement d'identifier des nouvelles structures à intégrer +à l'étude. La table `Domaine exclu` est à remplir avec les domaines "parking" et domaines des hébergeurs pour identifier rapidement les sites aux domaines non |