Eje 2 (E2) UNAH2024-E2-0031 2024

EL PLAN DE GESTIÓN DE DATOS: PROPUESTA DE BUENA PRÁCTICA PARA ASEGURAR LA INTEGRIDAD, ACCESIBILIDAD Y REUTILIZACIÓN DE DATOS DE INVESTIGACIÓN

Autores: Pablo Yup
Ver libro completo (PDF / página del libro)  |  Descargar DOCX

EL PLAN DE GESTIÓN DE DATOS: PROPUESTA DE BUENA PRÁCTICA PARA ASEGURAR LA INTEGRIDAD, ACCESIBILIDAD Y REUTILIZACIÓN DE DATOS DE INVESTIGACIÓN

Pablo Yup

Universidad Nacional Autónoma de Honduras (Honduras). pablo.yup@unah.edu.hn

ORCID: https://orcid.org/0000-0002-8470-3365

RESUMEN

En la era de la ciencia abierta y de entornos de investigación cada vez más orientados a los datos, los planes de gestión de datos (PGD) se han convertido en un pilar crucial para la integridad y eficiencia en la investigación académica. En los institutos de investigación, la gestión inadecuada de datos puede resultar en la pérdida de información valiosa, dificultar la reproducibilidad de los estudios y limitar la capacidad para realizar análisis y colaboraciones efectivas. La metodología utilizada en este estudio es de tipo documental, descriptivo y exploratorio. La pregunta de investigación se centró en ¿Cuáles son los componentes clave que suelen incluirse en un Plan de Gestión de Datos? Entre los resultados más destacados se identifican las estrategias exitosas para la elaboración de PGD y las áreas de mejora en las prácticas actuales del Instituto. Las principales conclusiones destacan que una gestión de datos bien estructurada no solo optimiza los recursos y procesos de investigación, sino que también refuerza la calidad y la confianza en los resultados científicos.

Palabras Clave: Plan de gestión de datos, datos de investigación, ciencia abierta

ABSTRACT

In the era of open science and increasingly data-driven research environments, data management plans (DMPs) have become a critical pillar for the integrity and efficiency of academic research. In research institutions, inadequate data management can result in the loss of valuable

information, hinder the reproducibility of studies, and limit the ability to conduct effective analyses and collaborations. The methodology used in this study is documentary, descriptive and exploratory. The research question was: What are the key components typically included in a data management plan? Key findings include the identification of successful strategies for developing DMPs and areas for improvement in the Institute's current practices. The main conclusions highlight that well-structured data management not only optimises research resources and processes, but also enhances quality and confidence in scientific results.

Keywords: Data management plan, research data, open science

INTRODUCCIÓN

En los institutos de investigación, la gestión inadecuada de datos puede resultar en la pérdida de información valiosa, dificultar la reproducibilidad de los estudios y limitar la capacidad para realizar análisis y colaboraciones efectivas. La falta de estandarización en los procesos de recolección, almacenamiento, y análisis de datos puede llevar a ineficiencias y a una menor calidad en los resultados de la investigación.

Entre los problemas recurrentes por una ineficaz gestión de datos se incluyen la pérdida y desorganización de datos, la reproducción de resultados y la dificultad de colaboración. Esto se traduce en que los datos se almacenan en formatos o ubicaciones inconsistentes, lo que dificulta su acceso y recuperación. La falta de documentación adecuada impide que otros investigadores puedan replicar los estudios. La integración de datos de múltiples fuentes es problemática, afectando la capacidad para realizar investigaciones colaborativas.

En 16 años de trabajo del Instituto Universitario en Democracia, Paz y Seguridad (IUDPAS) de la Facultad de Ciencias Sociales se han realizado diversos estudios, investigaciones y encuestas en sus diferentes áreas temáticas, esto se traduce en un gran bagaje de conocimiento de la realidad social del país en temas de seguridad ciudadana, estudios de la paz y democracia con importantes “conjuntos de datos” que se deben de gestionar para compartir y reutilizar para cumplir con una de las funciones de vinculación universidad- sociedad así como las pautas de involucramiento de la ciencia abierta no solo de la universidad sino también del gobierno, que actualmente está en la implementación del V Plan de Acción de Estado Abierto de Honduras (Gobierno de Honduras, 2023).

El marco referencial inicia definiendo lo que es a Ciencia Abierta (CA) como un concepto que engloba muchos componentes, incluidos la apertura, la colaboración, la comunicación y el uso de tecnologías para la ciencia. Su esfuerzo está orientado a transparentar y permitir el acceso al conocimiento bajo términos

que permitan la reutilización, redistribución y reproducción de la investigación, tomando en cuenta todos los aspectos involucrados en el ciclo de vida de la investigación (CEPAL, 2022).

El concepto de “abierto” abarca varios aspectos de la ciencia. Open Definition (2022) lo describe como la posibilidad de acceder, usar, modificar y compartir el conocimiento, con la salvedad de estar sujeto a medidas que preserven la procedencia y apertura. Así también, este concepto incluye, no solo los resultados de las investigaciones que se publican, si no también, implica a los datos de investigación, software o códigos, flujos de trabajo, ciencia ciudadana, recursos educativos y métodos de evaluación científica.

Actualmente, la ciencia abierta es fomentada por las academias de investigación e instituciones de financiamiento público con el fin de fomentar el crecimiento y la innovación social y/o económica. Bajo este contexto, generalmente la ciencia abierta aplica licencias de derechos al acceso, las cuales son documentos legales que otorgan derechos a los usuarios relacionados a la reutilización y redistribución de un material bajo ciertas condiciones. Si desean conocer más acerca de la ciencia abierta y de los datos abiertos pueden visitar el portal Foster y el Manual de Capacitación sobre Ciencia Abierta (FOSTER, 2022)

En este marco referencial, ¿qué son los datos abiertos?, el Open Knowledge Foundation (2022) lo define como: “son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen”.

Los datos son productos de investigación heterogéneos y contextualizados dentro de las disciplinas académicas (Coursera, 2022). En términos generales, podemos decir que los datos de investigación son datos que son recolectados, observados o creados para ser analizados y producir resultados de investigación originales.

Por otra parte, hay que considerar los metadatos, que a menudo se definen como datos sobre datos. De manera más específica y precisa, se refieren a información estructurada que describe, explica, localiza o representa otra cosa. Metadatos, que se conserva junto a los datos hace posible recuperar, utilizar o administrar un recurso de información (Coursera, 2022).

Los metadatos se presentan en tres formas: descriptiva, administrativa y estructural. Los metadatos descriptivos representan un trabajo con fines de descubrimiento e identificación. Este tipo de metadatos incluyen información como el título, el autor y el resumen. Estos elementos hacen posible que se encuentren los datos que se están buscando. En este contexto se enmarcan los metadatos de Dublín Core

como metadatos principales o de descripción simple y concisa del recurso (Dublin Core Metadata Initiative, 2012).

Los metadatos administrativos son información estructurada sobre la gestión y seguimiento de los datos durante un período de tiempo. Los metadatos estructurales describen la estructura física o lógica de los objetos digitales. La Iniciativa de Documentación de Datos o DDI, especificación de metadatos, incluye elementos de metadatos estructurales que nos permiten describir datos de ciencias sociales a nivel de variable (DDI Alliance, 2015). También está disponible la guía para adaptar los metadatos para su publicación y citación de datos de investigación (DataCite, 2015).

La Hoja de Ruta de LERU (Learn Project, 2022) dice que los Datos de Investigación, desde el punto de vista de la institución que tiene la responsabilidad de manejar los datos, incluyen:

La gestión de datos de investigación (GDI) de acuerdo con CEPAL (2022) es el proceso activo de manejo de los datos generados en una investigación. La GDI se realiza de forma continua y cubre todas las decisiones relacionadas con la gestión de los datos a lo largo de su ciclo vital, comenzando en la etapa de planificación de la investigación y abarcando su ejecución, la diseminación de sus resultados y la preservación de los conjuntos de datos de forma que estos sean precisos, completos, auténticos y fiables, y se mantengan accesibles y reutilizables a lo largo del tiempo.

La gestión de datos se refiere a actividades, prácticas y procedimientos que apoyan en conjunto la preservación, el acceso y el uso a largo plazo de los datos, pueden incluir planificación, documentación, formatos, almacenamiento y control del acceso a los datos (Coursera, 2022).

Otro concepto de GDI, en específico para las ciencias sociales es "todas aquellas fuentes/materiales y resultados recogidos, escritos, descritos y/o evaluados en el contexto de una investigación y en formato legible por máquina con el fin de archivar, citar y procesar” (Biernacka y otros, 2020).

La gestión de datos de investigación (GDI) es el manejo y la organización cuidadosa de los datos de investigación durante todo el ciclo de investigación, con el objetivo de que el proceso sea lo más eficiente posible y facilitar la cooperación con otros. Más concretamente, la GDI ayuda a proteger los datos, facilita

compartir los datos con otros y garantiza que los datos de la investigación sean localizables, accesibles y (re)utilizables (Ben & Teperek, 2020).

Para que los datos sean accesibles a la comunidad científica y al público en general hay que tener claros los procedimientos para des-identificar o anonimizar información sensible, que pueda causar daño a terceros; en este sentido, es importante cumplir con la protección de datos y derechos de propiedad, cumplir con las obligaciones contraídas con instituciones financiadoras de los proyectos, así como las restricciones de tiempo, entre otros temas.

Una limitante identificada es que no se posee documentación completa de los diferentes procesos que lleva la gestión de datos, o de identificar plenamente a los responsables de las tareas de almacenamiento o preservación por mencionar algunos.

Por lo anterior el objetivo de este trabajo es explicar la elaboración de un plan de gestión de datos para ordenar, gestionar, preservar, compartir y reutilizar los conjuntos de datos disponibles en la Institución.

METODOLOGÍA

Este estudio es de tipo documental, descriptivo y exploratorio. La pregunta de investigación se centró en

¿Cuáles son los componentes clave que suelen incluirse en un Plan de Gestión de Datos? La unidad de análisis es bibliográfica, es decir, son los documentos obtenidos de las revisiones documentales realizadas con el tema de ciencia abierta, datos de investigación y planes de gestión de datos. El procedimiento para la recolección de información se basó en la indagación de los repositorios institucionales, así como de bases de datos especializadas, como Redalyc, Latindex, entre otros.

El método empleado fue el análisis de contenido y los pasos metódicos fueron: 1. Delimitar el tema de estudio; 2. Búsqueda de la información en las bases de datos a partir de palabras clave; 3. Selección de autores; 4. Selección de citas; 5. Clasificación y agrupación de conceptos por sus coincidencias; y 6. Organización del material para el desarrollo de los argumentos, discusión y conclusiones del artículo. Sobre las consideraciones éticas al ser un trabajo de revisión documental se anonimizó cualquier información sensible sobre autores o proyectos.

RESULTADOS Y DISCUSIÓN

Un plan de gestión de datos o un PGD (DMP, por sus siglas en inglés) es un documento formal que describe los datos producidos en el curso de un proyecto de investigación. Y esboza las estrategias de

gestión de datos que se implementarán tanto durante la fase activa del proyecto, así como una vez finalizado el mismo. Hacer planes de gestión de datos permite identificar el cómo se recopilará, documentará, organizará y conservará los datos (Coursera, 2022).

Asimismo, el desarrollo de un plan de gestión de datos de investigación le ayuda a documentar y establecer (University of Western Australia, 2022): los estándares de metadatos que se utilizarán para los formatos de datos, la clasificación y sensibilidad de los datos de investigación, los procedimientos y disposiciones de almacenamiento y copia de seguridad, el acceso futuro a los datos de investigación para compartirlos y/o reutilizarlos, los procedimientos y disposiciones de retención y eliminación, la titularidad y protección de la propiedad intelectual y la documentación que describa todo lo anterior.

De acuerdo con CEPAL (2022) una buena gestión de datos es la base de una investigación exitosa. Se debe considerar el ciclo de vida de los datos. A lo largo del proyecto se pueden producir cambios en la gestión por diversas causas (recopilación de nuevos datos, cambios en los dispositivos de almacenamiento). Por ello se recomienda presentar el plan al inicio, y sus versiones actualizadas en el intermedio y al final de la investigación.

Los PGD difieren de acuerdo con el área de conocimiento, investigación o disciplina. Sin embargo, estos incluyen ciertos componentes básicos que deben ser explicitados en forma clara y sencilla y actualizados regularmente durante el curso de una investigación. Por lo general, el PGD puede incluir los siguientes elementos o componentes.

Contexto de la investigación

Por lo general esta sección del PGD se incluyen los datos administrativos en los cuales se enmarca la investigación, por ejemplo, el nombre e identificación del proyecto, la descripción del proyecto, la institución / agencia de financiamiento, los datos del Investigador Principal e identificador (ID), los datos de contacto, las políticas relacionadas (institucionales y/o externas), fecha de la primera versión y la fecha de la última actualización. Como recomendación se propone agregar a esta sección un párrafo acerca del alcance, limitantes y restricciones de la propia investigación. Además, se debe indicar quien o quienes son

los responsables de implementar el PGD, quién es el responsable de cada actividad de la gestión de datos y cómo se dividirán las responsabilidades si la investigación es colaborativa.

Recolección de datos

En esta sección se debe declarar si los datos son recogidos de forma manual o a través de instrumentos y se almacenan en formato digital. El proceso de recolección de datos seguirá lo estipulado en el PGD. Junto con la recolección, se deberá crear y almacenar información descriptiva que será necesaria para su posterior recuperación.

En esta fase debe de describir los datos, incluyendo el tipo, formato y volumen previstos. Si va a reutilizar algún conjunto de datos preexistentes, los métodos de recolección de la información, así como la estructura, el sistema de nomenclatura y control de versiones para las carpetas y archivos, los procesos de aseguramiento de la calidad y definir el software para procesar los datos.

El sistema de nomenclatura adoptado por el grupo de investigación puede seguir una serie de reglas fáciles al momento de nombrar sus archivos. En primer lugar, debe mantener los nombres de archivo cortos y relevantes. Generalmente, alrededor de 25 caracteres es una longitud suficiente para capturar suficiente información descriptiva.

No debe utilizar caracteres especiales en un nombre de archivo, ya que a menudo se utilizan para tareas especiales en diferentes sistemas operativos. Debe usar guiones bajos en lugar de paradas completas o espacios, y si incluye fechas, debe darles formato de forma coherente.

Para el control de versiones se recomienda: si son cambios mayores utilice números ordinales como 1, 2 y 3, si son cambios menores utilice decimales, por ejemplo, versión 1.1. Se propone la siguiente nomenclatura para identificar archivos: Iniciales sistema_ dependencia_área_correlativo_año_ámbito geográfico_ restricción_versión

Documentación y metadatos

La documentación y los metadatos permiten que sus datos sean comprendidos y descubiertos por otros. Es fundamental capturar detalles contextuales sobre cómo y por qué se crearon los datos. En este apartado puede incluir la información de estime necesaria para que los datos puedan ser leídos e interpretados en un futuro, y responder a las siguientes preguntas ¿cómo planea recopilar o crear esta

documentación y los metadatos (descriptivos, administrativos, estructurales)? ¿qué estándares de metadatos usará?

Asimismo, se recomienda que al momento de diseñar este tipo de sistemas se elaboren conjuntamente los manuales técnicos y de usuarios respectivamente. Los manuales técnicos servirán a los desarrolladores para hacer mejoras técnicas al sistema o actualizaciones. En tanto que los manuales de usuarios permitirán a los usuarios finales utilizar adecuadamente el sistema sin necesidad que los mismos realicen sus propios manuales.

Es importante mencionar que, en el Instituto hay dos ventajas en el diseño de este tipo de sistemas: primero se cuenta con el personal capacitado y en segundo, se cuenta con un servidor exclusivo para el instituto donde se alojan los programas o sistemas.

Por otra parte, los metadatos al momento de disponer que los conjuntos de datos (data sets) se pongan en acceso abierto pueda cumplir con los principios FAIR: localizables, accesibles, interoperables y reusables utilizando metadatos mínimos con la estructura y recomendaciones Dublin Core para los metadatos descriptivos y administrativos. En este caso sugerimos que las bases de datos (data sets) se puedan alojar en el repositorio de Zenodo, el cual asigna un identificador digital persistente (DOI por sus siglas en inglés), esto contribuye a que se tenga mayor visibilidad de los datos y reconocimiento al autor institucional.

Pensando en la publicación de estos conjuntos de datos se pueden disponer en abierto por año concluido. Se genera la base de datos en formato .CSV excluyendo los campos de identificadores directos (nombres, apellidos, identidad) e indirectos (ocupación, colonia, edad simple) para lo cual se debe utilizar técnicas de anonimización y des identificables para compartir. Si el conjunto de datos es muy pesado o demasiado grande se puede utilizar un software para la anonimización como Amnesia. Se recomienda que los conjuntos de datos se trabajen en formato .csv porque es el formato que cualquier programa de análisis de datos puede abrir.

Almacenamiento y seguridad

En esta sección describa las facilidades que le ofrece su institución y los recursos adicionales que necesita para asegurar el almacenamiento y la seguridad de los datos. Si requiere apoyo externo, justifique la selección e indique el presupuesto necesario. Sea claro quién será responsable de las

diferentes tareas en este tema. Describa además los procedimientos aseguramiento de la calidad y de respaldo previstos.

Por ejemplo, en almacenamiento y copia de seguridad indique dónde se almacenarán los datos (físicamente), la provisión de respaldo, la persona responsable de la copia de seguridad, los procedimientos de recuperación de datos. En el tema de seguridad, describa los riesgos existentes y cómo serán manejados, los mecanismos de acceso, la administración de los accesos y de usuarios.

Se recomienda que siga la siguiente regla: el principio básico 3-2-1 de la copia de seguridad es que tiene tres copias de sus archivos en al menos dos medios diferentes con uno fuera del sitio. También debe probar sus copias de seguridad regularmente para asegurarse de que puede restaurar desde ellos si es necesario.

Protección de datos y de derechos

Es imprescindible aclarar la propiedad de los datos de investigación antes de iniciar un proyecto. El almacenamiento y la reutilización futuros se ven directamente afectados por los derechos de propiedad intelectual de los datos de la investigación. Esta sección es de suma importancia en el PGD.

Los derechos de propiedad intelectual pueden definirse como derechos adquiridos sobre cualquier obra creada o inventada con el esfuerzo intelectual de una persona o entidad. En el país se pueden consultar el Decreto 4-99-E Ley del Derecho de Autor y de los Derechos Conexos y el Decreto 12-99-E Ley de Propiedad Industrial. Aquí también se deben considerar los derechos morales y patrimoniales. Sin embargo, esta legislación no hace referencia directa a las actividades académicas de investigación social.

Para nuestro interés, la Política de Investigación de la UNAH en el tercer eje orientador, sobre protección de resultados de investigación, expresa que este “componente tiene por objetivo promover el acceso abierto a los resultados de la investigación, protegiendo, cuando proceda, la propiedad intelectual correspondiente, todo ello enmarcado en la normativa de propiedad intelectual de la UNAH” (UNAH, 2014, p. 18).

Es así como en el Reglamento de Propiedad Industrial de la Universidad en el artículo 5, define lo que es la propiedad intelectual como “el conjunto de derechos subjetivos y prerrogativas que el Estado reconoce a favor del autor sobre todas las creaciones del ingenio humano” (UNAH, 2016 p. 10).

El mismo Reglamento hace referencia al derecho de autor como:

El conjunto de derechos y facultades que la ley concede a favor del creador por sus obras científicas, literarias o artísticas originales, otorgándole protección para que goce de dos prerrogativas, una de carácter moral o personal llamada derechos morales, y la otra de contenido económico, llamada también derechos patrimoniales (UNAH, 2016, p. 10).

Asimismo, el Reglamento hace referencia a los derechos morales (art 7) son los que nacen desde el momento de la creación de la obra. Es personal, inalienable, irrenunciable e imprescriptible. En tanto que el derecho patrimonial, art 8, son prerrogativas del autor para beneficiarse y explotar económicamente la creación.

En este sentido, las bases de datos, el artículo 23 del Reglamento dice que estarán protegidas por el derecho de autor siempre que sean creaciones particulares. Así como el artículo 24 se refiere a la seguridad de la información que se genera, procesa, almacena o intercambia, la Universidad y que sea de su propiedad es un activo que debe protegerse de riesgos que amenacen la confidencialidad, integridad y disponibilidad.

En cuanto a la protección de datos personales el artículo 3.7 de la Ley de Acceso a la Información Pública lo define así:

Datos Personales confidenciales: Los relativos al origen étnico o racial, características físicas, morales o emocionales, domicilio particular, número telefónico particular, dirección electrónica particular, participación, afiliación a una organización política, ideología política, creencias religiosas o filosóficas, estados de salud, físicos o mentales, el patrimonio personal o familiar y cualquier otro relativo al honor, la intimidad personal, familiar o la propia imagen (Congreso Nacional, 2006).

También es aplicable el Código de Conducta Ética del Servidor Público en el artículo 3 incluye a las instituciones autónomas, el numeral 15 del artículo 6, hace referencia a que se debe de mantener reserva administrativa de toda información reservada o confidencial (Congreso Nacional, 2008).

Igualmente, el Manual de Ética de la Universidad Nacional Autónoma de Honduras expresa los principios que rigen la actividad investigativa, entre los que se encuentran, el de protección a las personas. Este principio incluye “el respeto a la dignidad humana, la identidad, la diversidad, la autodeterminación informativa, confidencialidad y privacidad de las personas que se involucran en el proceso de investigación” (UNAH, 2015, p. 22).

Otro principio relacionado es el de la divulgación responsable de la investigación y el respeto a la normativa legal nacional e internacional que regule el campo del saber u objeto de estudio. En este mismo orden de ideas se expone que el mismo Manual en cuanto a las normas de comportamiento hace alusión que toda información obtenida por parte del investigador debe ser tratada como confidencial y no utilizarla para el lucro personal ilícito o con fines ajenos a la investigación (UNAH, 2015, p. 25).

En relación con las buenas prácticas de procedimientos y métodos el Manual hace referencia a que se debe guardar la confidencialidad de los datos personales y garantizar el anonimato durante la investigación, así como en la conservación de los datos (UNAH, 2015, p. 26).

Sobre la confidencialidad de la información es importante señalar que no se necesita firmar acuerdos de confidencialidad entre el personal de la Universidad (docentes, administrativos o estudiantes) sino más bien dar a conocer a todo el personal los reglamentos, directrices, manual y normativa que como servidor público y empleado de la Universidad está comprometido a realizar.

En este sentido el artículo 27 del Reglamento de Propiedad Intelectual de la Universidad literalmente dice:

Confidencialidad de la información. Los funcionarios, docentes e investigadores y personal administrativo que tenga a acceso a los sistemas de información, deben dar tratamiento confidencial a toda información oral o escrita de orden administrativo o académico, de documentos que expongan políticas de desarrollo interno, anteproyectos, investigaciones y, en general, cualquier documentación siempre y cuando sea considerada como tal por la UNAH, en base a lo que dispone La Ley de Acceso a la información Pública en los artículos 3.7, 3.9, 13, 16, 17, 18 y 19. (UNAH, 2016, p. 23).

Para conocer la sensibilidad de los datos se recomienda utilizar la siguiente guía de clasificación (tabla 1) de la información propuesta por la UWA (2022)

Ni vel

Clasificación

Descripción

Ejemplos Quién puede acceder

1

Público

La información que es pública está destinada para su divulgación al público. Esta clasificación incluye información para leer o descargar de sitios web institucionales y datos abiertos.

La información clasificada como pública se puede restringir tanto antes de su ciclo de vida como después de su publicación.

Los datos no son Público en confidenciales y se general pueden publicar

sin modificar o son datos confidenciales que han sido

anonimizados.

La información pública tendrá una consecuencia insignificante para la Universidad, el Instituto, terceros o sujetos de investigación si se produce un acceso no autorizado.

2

Confidencial

La información que es Confidencial está destinada a ser utilizada por un grupo discreto de usuarios y su acceso será por medio de contraseña.

Esta será la clasificación predeterminada para toda la información que se produzca en la Institución.

Datos recopilados de personas, datos internos del Instituto, datos de investigación en proceso.

Solo grupo de investigación/c olaboradores, con protección por contraseña.

El acceso no autorizado tendrá consecuencias o impactos limitados o menores para la Universidad, el Instituto, terceros o sujetos de investigación.

3

Confidencial Restringido

La información confidencial restringida está destinada a un grupo discreto de usuarios con una necesidad con base en su función organizacional.

Ejemplos de esto incluyen cosas tales como detalles de nómina, algunos contratos, licitaciones y acuerdos y, en general, cualquier cosa que contenga información de identificación personal (PII).

Datos identificables, por ejemplo, nombre personal y datos de contacto, coordenadas geoespaciales

Investigadores que recogieron los datos originales

La información que se divulgará fuera de su acceso designado deberá ser aprobada por la dirección del Instituto.

El acceso no autorizado a la información Confidencial Restringida podría tener consecuencias o impactos moderados en la Universidad, el Instituto, terceros o sujetos de investigación.

4

Altamente

La información que está altamente restringida está destinada a un grupo discreto de usuarios con una necesidad específica con base en su rol ejecutivo.

Datos culturalmente sensibles, datos relacionados con participantes menores de edad o en riesgo, por ejemplo, indígenas, niños, personas con discapacidad, personas que

viven bajo regímenes políticamente inestables, zonas de guerra

Solo investigadores o jefes

restringido

La información altamente restringida a menudo contiene información personal confidencial, información legalmente privilegiada, información comercialmente confidencial para UWA y/o un proveedor, o información relacionada con la ética animal/humana para la investigación.

La información que se divulgará fuera de su acceso designado deberá ser aprobada por la dirección del Instituto.

El acceso no autorizado a información altamente restringida por defecto tendrá una consecuencia grave para la Universidad, el Instituto, terceros o sujetos de investigación si se produce un acceso no autorizado.

Tabla 1 Guía de clasificación para datos sensibles

Por otra parte, toda investigación que implique datos o información de humanos está sujeta a una revisión ética formal. Debe proveer detalles del consentimiento necesario para la preservación y compartir datos, los pasos a seguir, si es necesario, para proteger la identidad de los participantes y los pasos a seguir, si es necesario, para garantizar que los datos confidenciales se almacenen y se transfieran con seguridad.

Esto implica proteger la identidad de una persona durante la recopilación, el manejo, el almacenamiento y el intercambio de datos. Un investigador necesita pensar cuidadosamente durante la fase de planificación de la gestión de datos sobre qué información confidencial puede recopilar. ¿Si los

datos serán des identificados y cómo o si compartirán los datos en la conclusión del proyecto de investigación?

Preservación, compartir y licenciar

Para garantizar que los datos sean accesibles y se puedan utilizar en el largo plazo, hay que seleccionar correctamente un repositorio de datos en abierto. Si bien es cierto que se recomienda que sea en repositorios institucionales, el caso de Tz´ibal Naah que es el repositorio de la Universidad y a pesar de que dentro del mismo el IUDPAS tiene una colección y una subcomunidad asignadas, es importante mencionar, que este repositorio no es adecuado para la gestión de datos de investigación. El fin principal es el de salvaguardar material digital de material histórico, no así la preservación de datos como tal.

Por ello se recomienda impulsar desde la Dirección Ejecutiva de Gestión de Tecnología avance en la creación de un repositorio de datos de investigación. Mientras eso ocurre, se sugiere crear un usuario en el repositorio de Zenodo para incluir estos conjuntos de datos. Entre las ventajas es de acceso abierto, tiene estándares de preservación digital y asigna un DOI para el conjunto de datos, con el fin de aumentar la visibilidad de estos. Esta acción no conlleva costos ya que es un repositorio de acceso abierto.

El conjunto de datos se recomienda ponerlo en acceso abierto por año concluido. En un tiempo prudencial de entre tres y seis meses después de concluir el año, periodo en el cual se procede a realizar los procedimientos de curatoría como por ejemplo los controles de calidad, la anonimización de la información, des identificación de identificadores directos e indirectos y geográficos. Esta tarea estaría a cargo del departamento de investigación, así como de ponerlo en acceso abierto.

Finalmente, como parte de las funciones de los observatorios y por ende de los Institutos, de acuerdo al art 57 literal e del Reglamento del Sistema de Investigación de la Universidad se recomienda “mantener una base de información actualizada, tanto física como digital, disponible para la comunidad universitaria y el público en general” (UNAH, 2014, p. 65).

Software para generar Plan de Gestión de datos

En esta búsqueda de información sobre gestión de datos, nos llevó a encontrar que hay sitios web que ofrecen la creación de los planes de gestión de datos. Entre ellos DMPTools desarrollado en 2011 por California Digital Library (CDL). El registro en la plataforma es sin costo. https://dmptool.org

El Centro de Curación Digital (CDC) en Reino Unido, en 2010 desarrolló DMPOnline, plataforma de código abierto, para proporcionar orientación sobre la creación de Planes de gestión de datos de investigación. El registro es libre y hay una variedad de formato y le guían paso a paso para generar un plan de gestión de datos. https://dmponline.dcc.ac.uk/

DMP OPIDoR es una plataforma francesa para crear planes de gestión de datos que inicia pidiendo a los usuarios que respondan a tres preguntas para que se pueda determinar qué plantilla mostrar. https://dmp.opidor.fr/about_us

CONCLUSIONES Y RECOMENDACIONES

El conocimiento y adopción de planes de gestión de datos en institutos de investigación es esencial para maximizar el valor y la integridad de los datos generados en las investigaciones. Estos planes proporcionan un marco estructurado que asegura la organización, almacenamiento, acceso y compartición de datos de manera eficiente y ética. Un buen plan de gestión de datos no solo optimiza la colaboración entre investigadores y facilita la replicación de resultados, sino que también promueve la transparencia y la reproducibilidad científica.

La adopción de estándares y mejores prácticas en la gestión de datos, junto con la capacitación continua del personal, es fundamental para enfrentar los desafíos emergentes en el campo de la investigación. La integración de tecnologías avanzadas y herramientas de análisis también puede mejorar significativamente la capacidad de los institutos para manejar grandes volúmenes de datos y extraer perspectivas valiosas.

En resumen, los planes de gestión de datos son una inversión estratégica que potencia la eficacia y la integridad de los proyectos de investigación. Su desarrollo y ejecución rigurosos son clave para avanzar en el conocimiento científico y mantener la calidad de la investigación en un entorno cada vez más dependiente de datos extensos y complejos.

En este estudio se limita al quehacer del IUDPAS, esperando que se pueda mejorar y ampliar a toda la comunidad investigadora de la Facultad de Ciencias Sociales. Queda por estudiar y profundizar en ¿Cómo se implementan y monitorean estos planes en diferentes tipos de proyectos de investigación académica?,

¿Qué desafíos enfrentan los investigadores al desarrollar y seguir un Plan de Gestión de Datos? ¿Cuál es el impacto de un Plan de Gestión de Datos en la calidad y accesibilidad de los datos de investigación? ¿Existen diferencias significativas en la implementación y efectividad de los Planes de Gestión de Datos entre

distintas disciplinas académicas? Asimismo, identificar los actores de la Gestión de Datos de Investigación y los principios FAIR de ciencia abierta.

REFERENCIAS

Ben, D., & Teperek, M. (2020). Research Data Management for Master’s Students: From Awareness to Action. Data Science Journal, 1-11.

Biernacka, K., Bulchholz, P., Dolzycka, D., Helbig, K., Neumann, J., Odebrecht, C., . . . Wuttke, U. (2020).

Train-the-Trainer Concept on Research Data Management V3.0. FDMentor.

CEPAL. (mayo de 2022). Gestión de datos de investigación. Obtenido de Biblioguías - Biblioteca de la CEPAL: https://biblioguias.cepal.org/gestion-de-datos-de-investigacion/definicion

Congreso Nacional. (2006). Ley de Transparencia y Acceso a la Información Pública, Decreto Legislativo No. 170-2006. Diario Oficial La Gaceta.

Congreso Nacional. (2008). Código de Conducta Ética del Servidor Público Decreto Legislativo No. 36- 2007.

Coursera. (2022). Curso MOOC Research Data Management and Sharing. Universidad de Carolina del Norte en Chapel Hill y la Universidad de Edimburgo.

DataCite. (2015). DataCite Metadata Schema for the Publication and Citation of Research Data. DataCite ‐

International Data Citation.

DDI Alliance. (2015). Welcome to the Data Documentation Initiative. Obtenido de http://www.ddialliance.org/

Dublin Core Metadata Initiative. (2012). DCMI metadata terms. Obtenido de http://dublincore.org/documents/dcmi-terms/

FOSTER. (07 de 2022). Acerca de FOSTER. Obtenido de https://www.fosteropenscience.eu/about#theportal

Gobierno de Honduras. (2023). V plan de acción de Estado Abierto Honduras 2023-2025. Secretaría de Transparencia y Lucha contra la Corrupción.

LEARN. (2022). La Hoja de ruta LERU para Datos de investigación – Una herramienta para instituciones.

Obtenido de https://learn-rdm.eu/es/materiales/

Open Definition. (2022). Open Data Handbook. Obtenido de http://opendatahandbook.org/guide/es/what-is-open-data/

Open Knowledge Foundation. (mayo de 2022). ¿Qué son los datos abiertos? Obtenido de Open data handbook: http://opendatahandbook.org/guide/es/what-is-open-data/

Universidad Nacional Autónoma de Honduras (UNAH). (2014). Política de Investigación Científica, Desarrollo Tecnológico e Innovación. UNAH 2015-2019. Compendios de Investigación Científica. Serie 1. UNAH.

Universidad Nacional Autónoma de Honduras (UNAH). (2015). Manual de ética de la investigación de la UNAH. Compedio de Investigación Científica. Serie 4. Tegucigalpa: DICYP-UNAH.

Universidad Nacional Autónoma de Honduras (UNAH). (2016). Reglamento de Propiedad Intelectual.

DICYP UNAH.

University of Western Australia. (2022). Research Data Management Toolkit: Welcome. Obtenido de https://guides.library.uwa.edu.au/RDMtoolkit/welcome

Cómo citar este trabajo (Vancouver):
Yup P. EL PLAN DE GESTIÓN DE DATOS: PROPUESTA DE BUENA PRÁCTICA PARA ASEGURAR LA INTEGRIDAD, ACCESIBILIDAD Y REUTILIZACIÓN DE DATOS DE INVESTIGACIÓN [resumen]. En: Vispo NS, editor. Memorias del Congreso de Investigación y Posgrado UNAH 2024: Libro de resúmenes. Madrid/Tegucigalpa: Clinical Biotec S.L.; Universidad Nacional Autónoma de Honduras; 2024. doi: 10.70099/cb/unah/2024.mem

ISBN del libro: 978-84-09-76685-7

Cómo citar

APA: Pablo Yup. (2024). EL PLAN DE GESTIÓN DE DATOS: PROPUESTA DE BUENA PRÁCTICA PARA ASEGURAR LA INTEGRIDAD, ACCESIBILIDAD Y REUTILIZACIÓN DE DATOS DE INVESTIGACIÓN (UNAH2024-E2-0031). En Libro de Resúmenes: Congreso de Investigación y Posgrado UNAH 2024. Clinical Biotec S.L.. ISBN 978-84-09-76685-7. https://doi.org/10.70099/cb/unah/2024.mem
Vancouver: Pablo Yup. EL PLAN DE GESTIÓN DE DATOS: PROPUESTA DE BUENA PRÁCTICA PARA ASEGURAR LA INTEGRIDAD, ACCESIBILIDAD Y REUTILIZACIÓN DE DATOS DE INVESTIGACIÓN (UNAH2024-E2-0031). En: Libro de Resúmenes: Congreso de Investigación y Posgrado UNAH 2024. Clinical Biotec S.L.; 2024. ISBN: 978-84-09-76685-7. doi:10.70099/cb/unah/2024.mem.