|
| < Sommaire
Thésaurus, Assistant de Recherche :
Depuis Janvier 2005, Verticrawl accentue son effort de développement et d'intégration lexicale et syntaxique.
Un constat simple :
L'utilisateur d'un Moteur de recherche tape ( en moyenne) 2 mots. Difficile dans ces conditions
d'imaginer un résultat pertinent sur un groupe de documents qui traitent des mêmes domaines.
Aussi, afin d'enrichir les outils de recherches, nous avons développé la recherche thématique et
lexicale.
Buts de la recherche thématique et lexicale :
- Accroître les possibilités de recherches pour l'utilisateur.
- mieux comprendre l'idée de la requête de recherche.
- intégrer des notions "morpho-comportementales" dans les recherches d'un même utilisateur.
Méthodologie :
Sur la base des travaux de recherches sur la catégorisation de texte automatique (Maria Fernanda Caropreso, Stan Matwin
, Fabrizio Sabastiani, Steve Huffman et Massih-Reza Amini -entre autres-), Verticrawl a mis en place un algorithme de reconnaissance
syntaxique permettant l'extrapolation des recherches pour l'utilisateur.
L'analyse des Centroïds, la production de résumés automatiques et la classification automatique de documents font partie des développements.
Prenons un exemple :
une recherche sur le mot "dea" (diplome universitaire) proposera l'aide contextuelle suivant :
doctorales dea
ecoles doctorales
dea doctorat
physiopathologie
dea biologie pathologie
dea differenciation cellulaire
qui sont -évidement- des filtres de recherches.
Pourquoi ne pas chercher sur tous les termes en même temps ?
Il existe plusieurs "philosophies" dans l'indexation documentaire. Nous avons choisi celle qui consiste à faire d'abord une recherche exacte sur un terme
et proposer des solutions complémentaires à l'internaute. Qui plus est, certains termes, au singulier et au pluriel, n'ont pas la même signification
dans différentes langues. Par exemple "network" et "networkS" donnerons des résultats différents...et c'est bien logique puisque le terme peut prendre plusieurs sens.
N'oublions pas que le succès des moteurs de recherche généraliste passe d'abord (et uniquement ?) par cette fonctionnalité.
Perpectives Technologiques :
- Résumé de document
- classification automatique
- Thésaurus personnalisé
- Enrichissement du Dictionnaire.
- Alerte syntaxique
Coté Produit :
en standard dans toutes nos solutions, y compris "hébergée" et dédiées. | |