QualityStage

Auteur: Lewis Jackson
Date De Création: 10 Peut 2021
Date De Mise À Jour: 25 Juin 2024
Anonim
QualityStage - Investigate Stage Introduction
Vidéo: QualityStage - Investigate Stage Introduction

Contenu

Définition - Que signifie QualityStage?

QualityStage est un outil logiciel client serveur utilisé pour améliorer la qualité des données grâce à une séquence de mécanismes de nettoyage des données. QualityStage fait partie d’IBM Information Server et apparaît comme un composant majeur d’IBM Infosphere DataStage. QualityStage peut également être appelé WebSphere QualityStage.

Introduction à Microsoft Azure et au nuage Microsoft | Tout au long de ce guide, vous apprendrez ce qu'est le cloud computing et comment Microsoft Azure peut vous aider à migrer et à exploiter votre entreprise à partir du cloud.

Techopedia explique QualityStage

QualityStage comprend un ensemble d'étapes qui fournissent un environnement de développement pour créer des tâches de nettoyage de données appelées travaux. De grandes quantités de données peuvent être traitées à l'aide des composants et des étapes de la conception QualityStages. Les modules intégrés à QualityStage utilisés pour l’ingénierie de données sont les suivants: Investigation Ce module permet d’examiner des données structurées (telles que celles contenues dans une base de données) afin de rechercher des modèles et de détecter des anomalies dans les données de vente, par exemple pour détecter une fraude. Cela permettrait également d'exposer les habitudes d'achat et de générer des informations marketing à partir de l'exploration de données. Normalisation De nombreuses bases de données contiennent des enregistrements incomplets et d'autres données superflues. QualityStage peut les filtrer et réorganiser les données pour normaliser tous les enregistrements. Correspondance Ce module est une série de filtres de correspondance pour identifier / supprimer les doublons afin d'optimiser un ensemble d'enregistrements. La survie est un système qui détermine quels dossiers seront conservés. Celles-ci peuvent toutes être proposées en temps réel en tant que service Web afin qu'une organisation puisse modérer et normaliser ses données avant leur utilisation, en utilisant l'un des quatre modules répertoriés.