Encore assez rares sur le marché français, les logiciels d'analyse de données évaluent l'état de santé des bases relationnelles ou des fichiers structurés. Utilisé notamment avant les migrations de systèmes, Avellino Discovery détecte les doublons ou les mots mal orthographiés, traque les erreurs de jointure entre les tables ou les mauvaises dépendances entre les champs. Cependant, Discovery ne corrige pas les erreurs qu'il découvre. Il faut pour cela recourir à un logiciel d'ETL qui se chargera des modifications nécessaires, avant d'exporter le contenu nettoyé de la base source dans l'application cible. ISoft, le distributeur français de Discovery, le propose d'ailleurs comme logiciel complémentaire de son ETL Amadea.
Configuration : une installation en quelques minutes
Logiciel client-serveur, Avellino Discovery s'installe en quelques minutes à l'aide d'assistants. Les différents types d'analyses qui seront pratiqués sur la base sont tous activés par défaut. Discovery Server nécessite une machine dédiée. En effet, le serveur importe dans son référentiel l'intégralité du contenu de la base, ce qui lui permet, à la différence de certains de ses concurrents, d'offrir un accès constant aux données. La connexion aux bases s'effectue par l'intermédiaire de pilotes ODBC, ou directement, pour les fichiers plats et structurés (CSV, TXT...).
Prise en main : une interface sobre, mais efficace
Lors de notre prise en main, l'import d'une table Oracle de 13 champs comprenant 1 million d'entrées soit 80 Mo , n'a duré que 20 secondes. En cas de base volumineuse (20 ou 30 Go), ces délais peuvent, bien sûr, s'allonger considérablement. Les imports s'effectuent alors en mode batch grâce au planificateur de tâche intégré.
L'interface de Discovery est sans fioriture, mais d'une ergonomie exemplaire. Les menus sont malheureusement en anglais. L'analyse de la base et la création de métadonnées s'effectuent dès les données importées. Les champs contenant des erreurs sont alors affichés en rouge. Un clic suffit à afficher les valeurs, les attributs et les métadonnées des champs concernés. Discovery en déduit un pourcentage de qualité des informations. Lors de notre test, le logiciel a ainsi détecté des clés en surnombre, car attribuées à des champs ayant les mêmes valeurs. Un clic droit suffit alors à générer un fichier des erreurs au format HTML, TXT ou CSV. Ce fichier sert de base à leur correction par un ETL, Amadea dans notre cas.
Les résultats d'analyse sont présentés suivant différents critères, pour affiner l'examen (clés, structures...). La structure des données est notamment décrite selon leur type : entier, caractère, mais aussi jour/mois/année... Mais Discovery n'affranchit pas d'un examen des résultats par une personne physique, pour éliminer les faux positifs. Le logiciel a par exemple attiré l'attention sur une colonne contenant à la fois des nombres et des lettres : il ne s'agissait pas d'une erreur de saisie, mais simplement de l'association de codes postaux anglais et français.
Notre avis : une aide appréciable, mais coûteuse
La vérification des dépendances (relation entre les champs), également pratiquée par Discovery, a permis notamment de découvrir qu'une même ville était en relation avec deux codes postaux différents. Enfin, la découverte de mauvaises jointures entre deux tables s'effectue automatiquement. Discovery affiche sous forme de diagramme de Venn (deux ensembles présentant les informations communes aux deux tables) les valeurs à garder. Il présente également le traditionnel diagramme entité-relation. Celui-ci pourra être modifié de façon à supprimer les mauvais liens, et interprété lui aussi par un ETL.
En résumé, Discovery ne supprime pas le travail fastidieux de nettoyage d'une base, mais il le simplifie nettement. Son prix est en revanche relativement élevé, surtout lorsqu'il faut lui ajouter celui d'un ETL.
Logiciel d'analyse automatique de données ; import complet de la base ; détection de doublons, de clés erronées, de dépendances entre champs et de jointures entre tables inutiles ; création automatique de métadonnées ; le serveur
fonctionne avec Windows 2000 et les principaux Unix du marché et nécessite un disque dur de grande capacité ; le client fonctionne avec Windows 2000, avec au moins 380 Mo de RAM ; distribué par ISoft.
![]()
Prix :
à partir de 80 000 euros ht.
Avellino Discovery est indiqué lors d'une migration de systèmes ou lors de la mise en place d'un progiciel, pour nettoyer bases relationnelles et fichiers plats. Les erreurs détectées doivent être corrigées avec un logiciel d'ETL.
Principaux concurrentsAxio d' Evoke fonctionne selon le même processus. MetaRecon d' Ascential ne travaille, lui, que sur les métadonnées de la base, sans aller jusqu'aux données elles-mêmes.
Points forts
- Accès direct aux données.
![]()
- Création de métadonnées.
![]()
- Exportation des erreurs.
![]()
- Interface claire.
- Logiciel non francisé.
![]()
- Prix.
|
||||||
|
|
![]()
Avec votre Espace 01net. produits, d'un clic sélectionnez-les, comparez-les et trouvez les meilleurs prix.
![]() |
![]()
|
![]()
|
||||||||||||||||||||||||||||||||||

|
|
||||||||||||||||||||||||||||||||||
C'est moi qui le dis !
|
Il faut en finir avec le « jusqu’à » des FAI Il y a des mots qui fâchent. Et si j’osais, j'affirmerais que les opérateurs du câble et de l’ADSL sont avant tout des hypocrites. Juste pour ne pas... |
![]() |
Les derniers pilotes ![]() mise à jour le dimanche 27 juillet 2008
WINDOWS
MAC
LINUX
![]() |

![]() système d'exploitation On a osé installer Mac OS X sur un « vulgaire » PC ! |
![]() vidéo Windows Vista : pilotez l'interface et tapez vos textes sans les mains ! |
![]() vidéo Faites tourner Windows Vista sur Mac |
| > toutes les vidéos |
||
Le blog des Experts
Question conso
![]() |
Est-il facile d'éviter la taxe sur les disques multimédias ? ![]() En achetant séparément un disque dur multimédia et un boîtier, on peut faire l'impasse sur la taxe « copie privée ». Mais l'assemblage ne... |
L'actualité des produits
|
[ 25/07/2008 ] Avez-vous vu passer la mise à jour automatique du SP3 de XP ? > Le 10 juillet dernier, Microsoft annonçait l’arrivée systématique du SP3 sur les PC. A « 01net. », n... [ 23/07/2008 ] Vista ralentirait les futurs disques durs SSD de Sandisk > Le fabricant affirme qu’il doit optimiser la technologie de ses disques SSD de grosse capacité pour ... [ 22/07/2008 ] AMD prépare bien une riposte à l'Atom d'Intel > Le nouveau PDG d'AMD a confirmé que la firme planchait sur un microprocesseur à basse consommation a... [ 22/07/2008 ] Première mise à jour pour Firefox 3 > Le navigateur « open source » de la fondation Mozilla passe à la version 3.0.1. Celle-ci corrige plu... |
![]() | ||
![]() | Panasonic Lumix LX3 | |
![]() | ||
![]() | Alienware Area-51 m17x | |
![]() | ||
![]() | SKPAD MS1 | |
![]() | ||
![]() | MSI GX620-020 | |
![]() | ||
![]() | Packard Bell iPower X2 | |
![]() | ||
| > tout le classement | ||
![]() |
|
| Abonnez-vous gratuitement ! | |
