Calidad de Datos

Facebook Twitter
Hola a todos, estoy de vuelta. En esta ocasión vamos a revisar las posibilidades que nos da Integration Services 2008 para hacer data profiling o analizar perfil de nuestros datos. La respuesta la encontramos en el componente del mismo nombre Data Profiling Task que se encuentra dentro de los componentes del Control Flow. Como vamos a ver más adelante, este nuevo componente nos permite de una manera fácil hacer un análisis completo de nuestros datos resumiéndose en su distribución y calidad. Microsoft Business Intelligence y más....: Data Profiling Task en Integration Services 2008 Microsoft Business Intelligence y más....: Data Profiling Task en Integration Services 2008
Tarea de generación de perfiles de datos
Introduction SQL Server Integration Services (SSIS) is a Business Intelligence tool which can be used by database developers or administrators to perform Extract, Transform & Load (ETL) operations. In my previous article entitled Using Web Service and XML Task in SQL Server 2008 Integration Services I discussed how to use the Web Service Task and XML Task which are available in SQL Server 2008 Integration Services. In this article I will examine the use of the Data Profiling Task and FTP Task. Data Preparation Tasks in SSIS Using The Data Profiler Task and FTP Task in SQL Server 2008 Integration Services Using The Data Profiler Task and FTP Task in SQL Server 2008 Integration Services
SSIS New Features in SQL Server 2008 – Part 3 SSIS New Features in SQL Server 2008 – Part 3 One common approach to defining data quality is data profiling. A data profile is a collection of aggregate statistics about data that may include the number of rows in the Customer table, the number of distinct values in the State column, the number of null or missing values in the Zip column, the distribution of values in the City column, the strength of the functional dependency of the State column on the Zip column—that is, the state should always be the same for a given zip value etc. SQL Server 2008 SSIS introduces the Data Profiling task in its toolbox, providing data profiling functionality inside the process of extracting, transforming, and loading data. By using the Data Profiling task, analysis of source data can be conducted more effectively, better understanding of source data and prevention of data quality problems before introduced into the data warehouse.
Data profiling con SQL Server 2008 Una de las múltiples mejoras que aporta SQL Server 2008 en la parte de ETL con Integration Services es su capacidad para realizar perfilado de datos con su nueva Data Profile Task. El data profiling es una de las primeras tareas que se suelen abordar en procesos Calidad de Datos, y consiste en realizar un primer análisis sobre los datos de origen, normalmente sobre tablas, con el objetivo de empezar a conocer su estructura, formato y nivel de calidad. Se hacen consultas a nivel de tabla, columna, relaciones entre columnas, e incluso relaciones entre tablas. Data profiling con SQL Server 2008
¿Le estamos dando la importancia que se merecen a los Procesos de Calidad de Datos? ¿Le estamos dando la importancia que se merecen a los Procesos de Calidad de Datos? Dentro de las actividades de Gestión de los Datos que realiza una organización resultan cada vez más críticos los procesos que supervisan y garantizan la calidad de los datos. El volumen de información crece constantemente en las organizaciones y disponer de almacenes de datos fiables resulta imprescindible para realizar un correcto análisis y explotación de los mismos evitando inconsistencias, conclusiones erróneas y facilitando el desarrollo de futuros sistemas basados en maestros de datos consistentes, depurados, enriquecidos y fiables. Se trata de un pilar básico dentro de las actividades de Gobierno de Dato y tal y como revela el siguiente post: Un estudio de Information Builders revela la poca calidad de los datos en las empresas, un aspecto poco cuidado por las empresas.
Perfilado de datos