La gestión de datos es la práctica de organizar y mantener procesos de datos para
satisfacer las necesidades de ciclo de vida continuo de la información. El énfasis en la gestión de datos comenzó con la era electrónica del procesamiento de datos, pero los métodos de gestión de datos tienen raíces en contabilidad, estadística, planificación logística y otras disciplinas que son anteriores al surgimiento de la computación corporativa a mediados del siglo XX. Evolución y beneficios de la gestión de datos A partir de la década de 1960, la Asociación de Organizaciones de Servicios de Procesamiento de Datos (ADAPSO) se convirtió en uno de los pocos grupos que enviaron las mejores prácticas para la administración de datos, especialmente en términos de capacitación profesional y métricas de aseguramiento de la calidad de los datos. Con el tiempo, la información se hizo más popular que los datos como un término para describir los objetivos de la computación corporativa, como se ve, por ejemplo, en el cambio de nombre de ADAPSO como la Asociación de Tecnología de la Información de América (ITAA) o la Asociación Nacional de Microfilmes renombrando como la Asociación para la Gestión de la Información e Imágenes (AIIM), pero las prácticas de gestión de datos siguieron evolucionando. En la década de 1970, el sistema de gestión de bases de datos relacionales comenzó a surgir en el centro de los esfuerzos de gestión de datos. Con base en la lógica relacional, la base de datos relacional proporcionó medios mejorados para asegurar el procesamiento de datos consistente y para reducir o administrar datos duplicados. Estos rasgos fueron clave para las aplicaciones transaccionales. Con el aumento de la base de datos relacional, el modelado de datos relacionales, la creación de esquemas, la deduplicación y otras técnicas avanzadas para convertirse en partes más importantes de la práctica común de gestión de datos. La década de 1980 vio la creación de la Asociación Internacional de Gestión de Datos o DAMA International, creada para mejorar la educación relacionada con los datos. Los datos surgieron nuevamente como un término descriptivo principal cuando los profesionales de TI comenzaron a construir almacenes de datos que empleaban técnicas relacionales para el análisis de datos fuera de línea que brindaban a los gerentes comerciales una mejor visión de las tendencias clave de sus organizaciones para la toma de decisiones. El modelado, el esquema y la gestión del cambio requirieron diferentes tratamientos con la llegada del almacenamiento de datos que mejoró las vistas de las operaciones de la organización. Tipos de gestión de datos DAMA International y otros grupos han trabajado para avanzar en la comprensión de varios enfoques para la gestión de datos. Uno de estos enfoques, la gestión de datos maestros (MDM), por ejemplo, es un método integral que permite a una empresa vincular todos sus datos críticos a un archivo, denominado archivo maestro, que proporciona un punto de referencia común. La administración de datos, la gestión de calidad de datos, el gobierno de datos, MDM y la gestión de seguridad de datos se encuentran entre los componentes de las prácticas de gestión de datos de muchos profesionales. DAMA, entre otros grupos que supervisan las certificaciones en competencia de gestión de datos, ha creado la Guía DAMA para el cuerpo de conocimiento de gestión de datos, o DAMA DMBOK, que intenta definir una vista estándar de la industria de las funciones y métodos de gestión de datos. La visión de los datos como un activo corporativo y la preocupación por las responsabilidades relacionadas con los datos han aumentado con el tiempo. Los profesionales de gestión de datos tienen la tarea de encontrar formas de rentabilizar los datos corporativos, ya sea mediante la racionalización del proceso, la mejora de los productos existentes o la venta directa de datos. La gestión efectiva de los datos corporativos ha cobrado importancia a medida que las empresas están sujetas a un número creciente de regulaciones de cumplimiento. Al mismo tiempo, el gran volumen de datos que debe ser gestionado por las organizaciones se ha incrementado de forma tan marcada que a veces se lo denomina big data. Tareas de gestión de datos Muchos administradores de datos son responsables de la seguridad de los datos corporativos y la responsabilidad legal. Los registros financieros más estrictos y los requisitos de protección al consumidor son impulsados por la legislación o las regulaciones que incluyen Basilea III, la Ley Sarbanes-Oxley y las políticas del Estándar de Seguridad de Datos de la Industria de Tarjetas de Pago (PCI-DSS). Las responsabilidades de administración de datos relacionadas con la privacidad de los datos se han expandido en los últimos años, especialmente a la luz de los hackeos de datos de alto perfil que ocurrieron en el minorista Target en 2013 y Equifax en 2017. Un estándar de datos europeo conocido como Regulación General de Protección de Datos (GDPR) también se ha convertido en el foco de la planificación de proyectos de gestión de datos en Europa y más allá. A medida que las tecnologías de datos se han expandido, el ámbito de la administración de datos se ha expandido a su vez. Los crecientes volúmenes de datos y el procesamiento de datos en tiempo real han dado paso a marcos de datos tales como Hadoop y Spark. La variedad de datos también ha crecido. Los tipos de datos no estructurados han complicado los procedimientos de modelado de datos y marcó el comienzo de una variedad de bases de datos que no usan SQL, el lenguaje de consulta estructurado estrechamente asociado con el uso de bases de datos relacionales. Colectivamente, las nuevas tecnologías han caído bajo el estandarte de los grandes datos. El grupo de analistas Gartner ha enumerado el análisis en la base de datos, el procesamiento de flujo de eventos, las bases de datos de gráficos, las tiendas de valores clave y los libros contables distribuidos como algunas de las tecnologías de gestión de datos para ver hacia el futuro. Historial de gestión de datos El primer florecimiento de la disciplina de la gestión de datos fue en gran medida impulsado por profesionales de TI que se centraron en resolver el problema de la basura que entra y la basura que sale (Garbage In, Garbage Out, GIGO). Ese problema se hizo evidente con los mainframes más antiguos, cuando las computadoras excepcionales llegaban a conclusiones falsas porque se les proporcionaban datos inexactos o inadecuados. Entre las figuras notables en la historia de la gestión de datos se encuentran E.F. "Ted" Codd, quien concibió el modelo relacional para la gestión de bases de datos; Ralph Kimball, quien creó la teoría de modelado dimensional para el almacenamiento de datos; Bill Inmon, autor y tecnólogo de almacenamiento de datos; Jim Gray, quien ayudó a promover el bloqueo de bases de datos granulares; y Michael Stonebraker, quien construyó bases de datos relacionales para computadoras de rango medio tempranas antes de participar en el desarrollo de una serie de bases de datos columnares, orientadas a flujo y orientadas a objetos. Los enfoques de la administración de datos eventualmente impregnaban lo que llegó a conocerse como el ciclo de vida de los datos, abarcando la creación, el almacenamiento, el procesamiento, el archivo y, a veces, la destrucción de datos.