Le logiciel de data-mining et de collecte de données : utilisations.
|
E-Miner - logiciel de data mining Extraction, enrichissement de contenu, veille marché
Utiliser efficacement VERTICRAWL E-miner©. Que faire avec un logiciel de data mining ? Quels supports de collecte utiliser ?
|
.:Agréger:.
Collecter des informations non structurées :
L'internet est une mine d'information. Pour autant, ces informations, en l'état ne sont pas exploitables dans une base de données ou dans une simple feuille de calcul. Pour rendre ses données exploitables, VERTICRAWL E-miner, collecte, organise, structure et normalise les contenus.
Une fois structurées, ces informations peuvent être transformées puis filtrées pour un export plus aisé. Un prix par exemple, peut nécessiter une conversion de devise par exemple.
Quelles données collecter :
En réalité, toutes les données sont collectables par VERTICRAWL E-miner . Pour autant, certaines sont bien plus pertinentes ou exploitables que d'autres.
-
Extraire des données texte :
VERTICRAWL E-miner est capable d'extraire n'importe quelle donnée texte issue d'un document web. Il peut lui donner un sens en s'appuyant sur le document lui-même ou via votre propre marquage.
Par exemple :
- Une fiche technique produit pourra être collectée ligne par ligne, caractéristique par caractéristique. Les champs et leurs valeurs pouvant être exploités ultérieurement et directement dans le système d'information.
- Une information de prix HT pourra entrer dans un champ nommé PRIXHT, et un prix TTC rentra dans PRIXTTC. Le système est capable de recalculer une donnée texte pour lui assigner un PRIXHT à partir du PRIXTTC.
-
Extraire des url :
Tout lien hypertexte correspond à un type de document. On connait les liens de type cliquable mais les images, les vidéos, les pdf, etc sont autant d'information supplémentaires particulièrement intéressante en Data mining. VERTICRAWL E-miner exploite aussi les données invisibles pour établir des relations entre les documents.
Par exemple :
- Nous pouvons établir des liens entre une fiche produit, les produits associées (cross-selling), les promotions ou les offres contextuelles.
- Un lien image peut devenir une mine d'information si l'on sait exploiter les méta-données qu'elle contient.
- Les liens externes sont autant d'informations sur les partenariats ou les accords commerciaux.
-
Evaluer les changements :
Le net change continuellement. Historiser, analyser les changements (prix, taille, disponibilité, couleur,...) sont autant d'éléments nécessitant une actualisation permanente du mining.
Exemple de domaine d'utilisation :
-
Veille concurrentielle :
VERTICRAWL E-miner permet de pister les démarches actives de concurrents identifiés et de déploiements dans leurs secteurs d'activités. En tant que support de benchmarking (prendre un concurrent ou un autre acteur du marché comme référence), il vous permet de mener des comparaisons rapprochées entre produits, services ou méthodes de vente.
L'observation est nécessairement régulière, toujours réduite à certains acteurs identifiés et évidement discrète.
-
Web feeding :
Le web feeding (littéralement "nourrir le web") est une action de collecte de données provenant de tiers (le plus souvent sur le web) pour enrichir son propre site. A la différence d'un moteur de recherche (qui présente des portions de résultats), le web feeder collecte des données pour les représentation en l'état (ou presque) sur son contenu. C'est en partie le cas des comparateurs de prix par exemple.
-
Database retail :
Les bases de données actualisées (adresses, code produit, caractéristiques techniques) sont autant d'éléments que l'on peut enrichir dans votre système pour valoriser laa commercialisation de vos propres bases d'information. A vous d'imaginer votre VERTICRAWL E-miner !
|