|
| < Sommaire
Taxinomie [Taxonomie] et Gestion du Savoir :
La taxinomie (du grec taxis : rangement et nomos : loi) [et non pas taxonomie] est l'étude théorique de la classification, de ses bases, de ses principes, des méthodes et des règles. A l'origine le terme "taxonomie" (crée par A. P. de Ca ndolle dans sa théorie élémentaire de la botanique, 1813) ne s'intéresse qu'à la classification biologique.
Le knowledge management s'interesse de plus en plus à cet aspect de l'indexation documentaire, en autre pour organiser le fonds documentaire des entreprises.
Verticrawl a élaboré (en 2004) une philosophie de classification simple et efficace. Son principe est le suivant :
- Création d'une arborescence simple et intelligible.
- Consultation des documents de la catégorie.
- filtrage des documents par recherche plein-texte ou filtrée.
Voila pour l'organisation de notre bibliothèque.
En réalité, ce type de classement est destiné à évoluer...au grès de l'arrivé de nouveaux documents et du départ des anciens.
Quand on dispose de peu de documents, le classement manuel est simple à mettre en oeuvre. Mais, quand il s'agit de
plusieurs millions de documents...Cela devient impossible.
LA QUESTION ETAIT : Comment Faire ?
2 Philosophies s'opposent. Celle des moteurs de recherche lexicaux et celle des moteurs full-text.
1) les moteurs lexicaux :
La classification lexicale est obtenue par loi statistique, sur la présence d'un groupe de mots (2 au minimum) dans un maximum de documents.
Cela produit toujours une arborescence contenant plus de 250 niveaux avec un grand volume de données dans le niveau le plus bas de l'arbre.
En effet, l'approche conceptuelle des moteurs lexicaux tend à 100% de fiabilité quand chaque document "ressemble" à son voisin le plus proche.
Et oui puisque 100%=100%, donc le document A est 100% identique à B...
Intuitivement, on remarque les limites de ces classifications par arbre "conçu par l'ordinateur".
2) L'approche linguistique :
Tout d'abord, précisons que l'arbre de classification est construit par l'homme comme n'importe quel explorateur de fichier.
- Etape 1 : affectation de 1 ou plusieurs document à une catégorie de l'arbre
- Etape 2 : Algorithmiquement, Verticrawl affecte tout nouveau document à 1 element de l'arbre
Méthodologiquement, cela permet la classification efficace de millions de documents dans toutes les langues, et dans tous les formats de fichiers.
L'interêt immédiat est de faire qu'un document classé devient un filtre pour les suivants. C'est une classification intuitive comme celle que vous faites naturellement.
| |