Ahorra un 25 % (o incluso más) en tus costes de Kafka | Acepta el reto del ahorro con Kafka de Confluent

White Paper

El manual de la calidad de los datos

Consigue el whitepaper

Descubre las mejores prácticas de gobernanza de streams para proteger a tus aplicaciones y sistemas de los datos de mala calidad con esta guía.

Garantizar una alta calidad de los datos siempre ha sido algo esencial, pero el auge de la IA y el machine learning ha hecho que lo que está en juego ahora sea más importante que nunca. La mala calidad de los datos provoca que «si entra basura, salga basura», y eso tiene efectos muy negativos: desde costosas interrupciones y fallos del sistema hasta graves inexactitudes en los informes que pueden provocar una toma de decisiones desacertadas.

Al utilizar Apache Kafka® y otras tecnologías de streaming de datos, los problemas de calidad de los datos se acentúan, ya que los datos erróneos pueden propagarse más rápido y a más lugares. Y, con sistemas event-driven, esos datos erróneos pueden provocar fácilmente la interrupción de todo un ecosistema de aplicaciones y servicios. Entonces, ¿cómo puede tu empresa aprovechar las ventajas de las arquitecturas de streaming y, al mismo tiempo, proporcionar a sus equipos de datos una forma sostenible y escalable de mantener una alta calidad de los datos?

En «El manual de la calidad de los datos», analizamos las mejores prácticas para el streaming de datos desde el punto de vista de la gobernanza. Descubrirás las categorías más habituales de datos erróneos que debes tener en cuenta y cómo poner en marcha medidas preventivas. Además, la guía incluye consejos prácticos que puedes implementar para garantizar una alta calidad de los datos y repasa temas como el establecimiento de contratos de datos, la creación de productos de datos y la adopción de un enfoque descentralizado de malla de datos para la propiedad de los datos y su gestión en toda la empresa. Tanto si acabas de iniciarte en el streaming de datos como si cuentas con años de experiencia, verás por qué el paquete Stream Governance de Confluent hace que todo resulte mucho más fluido y fácil de implementar.

Aquí tienes un breve resumen de lo que aprenderás:

  • Identificar los problemas de esquema más frecuentes y las causas de los valores no válidos
  • Definir y compartir contratos de datos con Schema Registry
  • Descubrir, entender y confiar en tus streams de datos en un modelo descentralizado