Moteur de recherche interne
Logiciel de recherche SaaS,
référencement, trafic, text mining.
search solution
 
 Accueil 
 Enjeux 
 Solutions 
Actualités 
 Espace Client 
 Partenaires 
 Technologie 
 L'entreprise 
 
 
Recherche   | SiteMaps | Search Index  
 

La Revue de Presse & Actualités

moteur de recherche search engine crawler
L'actualité VERTICRAWL
» Moteur de recherche Vidéo sur imineo.com

vidéos à la demande (VOD), choisit la solution de recherche Verticrawl. ..

» module de recherche Pay per Click - Answord

Verticrawl lance son module de recherche Pay per Click baptisé Answord ..

» solution de recherche pour site marchand, e-commerce

..

» Table des Matières [Search Index] V-3.0

Comme dans un livre, l'API SearchIndex affiche la table des matières automatique sur les mot-clefs..


 Etudes de Cas clients
 » Etudes de cas
   - Moteur Emploi
   - Portail BtoB
   - Portail BtoC
   - Site marchand

 Verticrawl-Lab
Tous les jours, nos équipes développent les outils de recherche du futur pour augmenter vos possibilités.

TagCloud
Etudes de Cas Gestion du Savoir Moteur de recherche Search Index V-3.0 Comme Verticrawl-Lab Tous logiciel de recherche millions de documents module de recherche moteurs de recherche moteurs lexicaux nouveau document nouveaux documents site marchand solution de recherche

réalisé avec l'api sitemaps

< Sommaire

Taxinomie [Taxonomie] et Gestion du Savoir :



La taxinomie (du grec taxis : rangement et nomos : loi) [et non pas taxonomie] est l'étude théorique de la classification, de ses bases, de ses principes, des méthodes et des règles. A l'origine le terme "taxonomie" (crée par A. P. de CaTaxinomie [Taxonomie] et Gestion du Savoirndolle dans sa théorie élémentaire de la botanique, 1813) ne s'intéresse qu'à la classification biologique.

Le knowledge management s'interesse de plus en plus à cet aspect de l'indexation documentaire, en autre pour organiser le fonds documentaire des entreprises.

Verticrawl a élaboré (en 2004) une philosophie de classification simple et efficace. Son principe est le suivant :

- Création d'une arborescence simple et intelligible.
- Consultation des documents de la catégorie.
- filtrage des documents par recherche plein-texte ou filtrée.

Voila pour l'organisation de notre bibliothèque.

En réalité, ce type de classement est destiné à évoluer...au grès de l'arrivé de nouveaux documents et du départ des anciens. Quand on dispose de peu de documents, le classement manuel est simple à mettre en oeuvre. Mais, quand il s'agit de plusieurs millions de documents...Cela devient impossible.

LA QUESTION ETAIT : Comment Faire ?

2 Philosophies s'opposent. Celle des moteurs de recherche lexicaux et celle des moteurs full-text.

1) les moteurs lexicaux :
La classification lexicale est obtenue par loi statistique, sur la présence d'un groupe de mots (2 au minimum) dans un maximum de documents. Cela produit toujours une arborescence contenant plus de 250 niveaux avec un grand volume de données dans le niveau le plus bas de l'arbre. En effet, l'approche conceptuelle des moteurs lexicaux tend à 100% de fiabilité quand chaque document "ressemble" à son voisin le plus proche. Et oui puisque 100%=100%, donc le document A est 100% identique à B...

Intuitivement, on remarque les limites de ces classifications par arbre "conçu par l'ordinateur".

2) L'approche linguistique :
Tout d'abord, précisons que l'arbre de classification est construit par l'homme comme n'importe quel explorateur de fichier.
    - Etape 1 : affectation de 1 ou plusieurs document à une catégorie de l'arbre
    - Etape 2 : Algorithmiquement, Verticrawl affecte tout nouveau document à 1 element de l'arbre
Méthodologiquement, cela permet la classification efficace de millions de documents dans toutes les langues, et dans tous les formats de fichiers.

L'interêt immédiat est de faire qu'un document classé devient un filtre pour les suivants. C'est une classification intuitive comme celle que vous faites naturellement.

Dossier de Presse

Dossier de Presse
de Verticrawl.com
(pdf - 100Ko)


RSS Feed

Verticrawl RSS FeedLe flux XML Actualités de Verticrawl.

Vos recherches


Entreprise
Moteur de Recherche enterprise
Site Internet
Moteur de Recherche de Site Internet

moteur 8-1
82
      
© Datamean, 2000-2010
  internet