- Solutions
- Features
- Our use cases
- Our use cases
- pdf - Retrieve 100 information from a report
- pdf - Aggregate data from diverse documents
- pdf - Retrieve information from a paper directory
- pdf - Retrieve invoice data
- pdf - Label documents
- web - Building content from an EAN code
- web - Aggregate informations from multiple websites
- web - Create an argus from web data
- mail - Create a pre-ticket from an email
- CRM - Clean data upstream of a CRM
- Blog
- Prices
- About us
Creation of an argus from classified ads
Context
How to create a forklift argus from web data?
A company specializing in material handling equipment is seeking to create an argus from second hand advertisements on specialized sites across the globe. The data of some of the sites are already retrieved, normalized and grouped together in a file. Some attributes are already extracted but the identification of the material requires a business operator because the same model can be designated in several forms: with or without spaces, sometimes with spelling errors or with additional information depending on the editors and site repositories. It is therefore difficult to identify models without a standard repository.
The mission consists in retrieving the content of the advertisements on all the specialized sites then in the standardization and the regrouping of the data around the correctly identified materials according to the repository of the company. The whole will feed into a database which will be used to build the argus.
Examples of source pages
Création d'un argus à partir d'annonces
Contexte
Comment créer un argus de chariots élévateurs à partir de données web ?
Une entreprise spécialisée dans le matériel de manutention cherche à créer un argus à partir des annonces d'occasions des sites spécialisés à travers le globe. Les données d'une partie des sites sont déjà récupérées, normalisées et regroupées dans un fichier.
La mission consiste en la récupération du contenu des annonces sur l'ensemble des sites spécialisés puis en la normalisation et le regroupement des données autour des matériels correctement identifiés selon le référentiel de l'entreprise. L'ensemble viendra alimenter une base de donneés qui servira pour construire l'argus.
Exemple de pages sources |
Exemple de pages sources |
Scénario utilisé
Worker de scraping et connecteurs API
Récupére les informations sur les sites d'annonces
WorkerETL
Nettoie et met en forme les données
Worker Prédiction
Labellise les enregistrements
Worker
Enregistre dans la base de données
Return on investment
Automatisation de la collecte d'informations sur une grande variété de sources | Nettoyage, normalisation, contrôle et consolidation de l'information |
Labellisation automatique des enregistrements via un module de Machine Learning | Réaffectation des collaborateurs à des tâches plus enrichissantes |
And then ?
It would be quite possible to create a data visualization showing the data by model, price, country or any other required filter.
Parlons ensemble de votre projet !
Scénario utilisé
1
Worker de scraping et connecteurs API
Récupére les informations sur les sites d'annonces
2
Worker
ETL
Cleanses and formats data
3
Worker
INSEE
Add the INSEE codes to the municipalities
4
Worker
Database
Save to database
Let's talk about your project together! Let's talk about your project together!
Automate the collection of information from a wide variety of sources
Cleaning, standardization, control and consolidation of information
Automatic labeling of records via a Machine Learning module
A reduction in the risks associated with human intervention.
And then ?
It would be quite possible to create a data visualization showing the data by model, price, country or any other required filter.