La curación de datos es un término que recientemente se ha convertido en una parte común del vocabulario de gestión de datos, siendo importante en el mundo actual del intercambio, ya que implica mucho más que almacenar datos.

La curación es el trabajo de organizar y gestionar una colección de cosas para atender los requerimientos e intereses de un grupo humano específico. La gestión y la organización son elementos cruciales de la curación de datos: facilita que las cosas sean fáciles de encontrar y comprender. El enfoque aquí son los conglomerados de datos como cuadros, figuras y otros a los que se puede accederr. La distinción entre “colecciones de datos” y “colecciones de conjuntos de datos” es sutil pero significativa. La recopilación de conjuntos de datos es sólo el comienzo, pero organizar y gestionar son la esencia de la curación de datos. Hacer que los conjuntos de datos sean fáciles de encontrar, comprender y acceder es el propósito de la curación de datos, un propósito que exige conjuntos de datos bien descritos. La curación de datos es una actividad de gestión de metadatos y los catálogos de datos son una tecnología de curación de datos esencial. Los inventarios detallados de datos vienen convirtiéndose velozmente en el neo “estándar de oro” para la gestión de metadatos, propiciando que estos sean accesibles para la comunidad investigadora.

La cantidad de datos que se crean diariamente es asombrosa, puesto que a nivel mundial se genera 2,5 quintillones de bytes de datos diariamente, y esa cantidad está aumentando exponencialmente, de tal manera que el 90 por ciento de todos los datos se han creado sólo en los últimos dos años. La mayor parte de estos datos no están estructurados ni organizados, siendo gran parte de ella inexacta o irrelevante y casi imposible para los investigadores, ingenieros y cualquier persona ajena a su organización de datos, obtener la información que necesitan de manera oportuna. La curación de datos es la organización y gestión de datos a lo largo de su ciclo de vida e incluye funcionalidades como gestión de acceso, identificación, descripción, conservación, transformación y uso de datos, implica gestionar, etiquetar y organizar datos para garantizar su calidad y accesibilidad, une fuentes de datos dispares para hacerlas accesibles y utilizables, lo que protege contra los peligros de la sobrecarga de datos y garantiza que los datos sigan siendo un activo valioso en lugar de un pasivo potencial (Yan et al., 2023).

El curador de datos dentro de una organización o empresa suele ser un analista de datos o un científico, por lo que es responsabilidad de los miembros del equipo de datos decidir quién es el responsable final de curar los datos; esto puede ser mejores prácticas diarias para garantizar que se mantengan los datos. A medida que la inteligencia empresarial y el análisis avanzado emergen como facilitadores clave para mejorar la toma de decisiones estratégicas, los datos han pasado de ser un subproducto auxiliar de las operaciones comerciales a convertirse en un poderoso activo estratégico.

Referencias:
  1. Yan, L, Engel, M., Tihelka, E. y Cai, Ch. (2023). Phylogenomics of weevils revisited: data curation and modelling compositional heterogeneity. Biol. Lett.192023030720230307. https://doi.org/10.1098/rsbl.2023.0307

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *