Paula A. Martinez, Leyla Garcia, Carlos Martinez, Daniel S. Katz, Michelle Barker, Neil Chue Hong, Morane Gruenpeter, Jennifer Harrow, Fotis Psomopoulos Principios FAIR para software de investigación Encuentro de Bioinformática en México 2021 CDSB 2021 09 Agosto 2021 1 Principios y guías para el acceso a datos de investigación procedentes de fondos públicos OECD DOI: 10.1787/9789264034020-en-fr (2007) Objetivo: promover el acceso y el intercambio de datos entre investigadores e instituciones de investigación. 2021. La revisión amplía el alcance para cubrir no solo datos de investigación, sino también metadatos relacionados, algoritmos, flujos de trabajo, modelos y software personalizados (incluido el código), que son esenciales para su interpretación. https://www.oecd.org/sti/recommendation-access-to-research-data-from-public-funding.htm 2 OECD: Organisation for Economic Co-operation and Development En español es la Organización para la Cooperación y el Desarrollo Económicos La OECD da recomendaciones a los organismos gubernamentales de financiación y política científica de los países miembros. México es uno de los miembros signatarios. Estas recomendaciones tienen como objetivo promover el acceso y el intercambio de datos entre investigadores e instituciones de investigación. Estos principios reconocen y tienen en cuenta las diversas leyes, políticas de investigación y estructuras nacionales. Enlaces en Inglés: El resumen de la revisión en el 2021, acompañado por casos de estudio de algunos de los países miembros. https://www.oecd.org/sti/recommendation-access-to-research-data-from-public-funding.htm Para ver la lista de los países miembros de la OECD https://www.oecd.org/acerca/miembros-y-socios/ Un ejemplo de Mexican Open Science Policy como caso de estudio, vigente desde el año 2015 https://community.oecd.org/servlet/JiveServlet/previewBody/149104-102-2-263395/Mexico.pdf The Recommendation concerning Access to Research Data from Public Funding. Documento Legal https://legalinstruments.oecd.org/en/instruments/OECD-LEGAL-0347#backgroundInformation La relevancia de las recomendaciones Apertura Flexibilidad Transparencia Conformidad legal Protección de la propiedad intelectual (PI) Responsabilidad 3 Profesionalismo Interoperabilidad Calidad Seguridad Eficiencia Rendición de cuentas Sostenibilidad https://www.oecd-ilibrary.org/sites/8365c19c-en/index.html?itemId=/content/component/8365c19c-en Relevance of the 2006 OECD Recommendation of the Council concerning Access to Research Data from Public Funding https://www.oecd-ilibrary.org/sites/8365c19c-en/index.html?itemId=/content/component/8365c19c-en Los principios se pueden resumir de la siguiente manera: Apertura: el acceso abierto a los datos de investigación de la financiación pública debe ser fácil, oportuno, y preferiblemente por el Internet. Flexibilidad: la flexibilidad requiere tener en cuenta los cambios rápidos ya menudo impredecibles en las tecnologías de la información y la comunicación (TIC); las características de los diferentes campos de investigación; y la diversidad de sistemas de investigación, marcos legales y culturas en cada país miembro. Transparencia: la información sobre los datos de investigación y las organizaciones productoras de datos, y la documentación sobre los datos y las condiciones vinculadas a su uso, deben estar disponibles internacionalmente de manera transparente, idealmente a través de Internet. Conformidad legal: los acuerdos de acceso a los datos deben respetar los derechos legales y los intereses legítimos de todas las partes interesadas en la empresa pública. El acceso puede estar restringido por razones de seguridad nacional, privacidad y confidencialidad; secretos comerciales y derechos de propiedad intelectual (DPI); protección de especies raras, amenazadas o en peligro de extinción; y procesos legales. Protección de la propiedad intelectual (PI): los acuerdos de acceso a los datos deben considerar la aplicabilidad de los derechos de autor y otras leyes de propiedad intelectual que puedan ser relevantes para las bases de datos de investigación financiadas con fondos públicos (como en el caso de las asociaciones público-privadas). Responsabilidad: los acuerdos de acceso deben promover reglas y regulaciones con respecto a las responsabilidades de las partes involucradas. Deben desarrollarse en consulta con las partes interesadas y considerar factores tales como las características de los datos, p. Ej. su valor potencial para fines de investigación. También deben considerarse los planes de gestión de datos y la sostenibilidad a largo plazo. Profesionalismo: los arreglos institucionales para la gestión de datos de investigación deben basarse en los estándares y valores profesionales relevantes, incorporados en los códigos de conducta de las comunidades científicas involucradas. Interoperabilidad: los acuerdos de acceso deben considerar las normas internacionales de datos pertinentes. Calidad: el valor y la utilidad de los datos dependen de la calidad de los mismos. Se debe prestar especial atención al cumplimiento de estándares de calidad explícitos. Seguridad: se debe prestar atención a apoyar el uso de técnicas e instrumentos que garanticen la integridad y seguridad de los datos de investigación. Eficiencia: un objetivo central de promover el acceso y el intercambio de datos es mejorar la eficiencia de la investigación científica financiada con fondos públicos, para evitar la duplicación de esfuerzos costosa e innecesaria. Esto también implica realizar análisis de costo-beneficio para definir protocolos de retención de datos, involucrar a organizaciones especializadas en administración de datos y desarrollar nuevas estructuras de recompensa para investigadores y productores de bases de datos. Rendición de cuentas: el desempeño de los acuerdos de acceso a los datos debe estar sujeto a una evaluación periódica por parte de los grupos de usuarios, las instituciones responsables y los organismos de financiación de la investigación. Sostenibilidad: se debe prestar la debida atención a la sostenibilidad del acceso a los datos de investigación financiados con fondos públicos como elemento clave de la infraestructura de investigación. Los principios FAIR 2016: “The FAIR guiding principles for scientific data management and stewardship” Wilkinson et al., doi: 10.1038/sdata.2016.18 “Los principios FAIR para la gestión y administración de datos científicos” Findable Accessible Interoperable Reusable 4 Localizable Accesible Interoperable Reutilizable Los principios de FAIR tienen una larga trayectoria antes de su publicación en el 2016. International initiatives promoting enhanced access to publicly funded data for science, technology and innovation https://www.oecd-ilibrary.org/sites/6fa09826-en/index.html?itemId=/content/component/6fa09826-en Iniciativas internacionales que promueven un mejor acceso a datos financiados con fondos públicos para ciencia, tecnología e innovación La OECD a adoptado los FAIR principles como un marco común para establecer acuerdos de acceso a datos de investigación en los países miembros. también La declaración final de la reunión del Grupo de los Veinte (G20) en 2016 “debatió sobre los temas de la ciencia abierta y el acceso a resultados de investigación financiados con fondos públicos. En la declaración se han incluido los principios FAIR para aumentar la colaboración sobre actividades científicas y de investigación” (G20, 2016). Beneficios para los investigadores Replicabilidad en la ciencia y la reproducibilidad de proyectos de investigación con los datos y el código necesarios Visibilidad: mayor reconocimiento y transparencia Es una forma de impulsar la integridad de la investigación Aumentar la colaboración sobre actividades científicas El acceso y el intercambio de información mejora la eficiencia de la investigación científica Evitar la duplicación de esfuerzos costosa e innecesaria 5 Transparencia: Accesibles para examinar una cosa cuidadosamente para conocer todos sus detalles o para descubrir algo Crédito: Los investigadores académicos de todos los niveles, incluidos los estudiantes, los postdoctorados, el profesorado y el personal profesional, deben recibir crédito por los productos de digitales que desarrollan y a los que contribuyen, especialmente cuando esos productos permiten investigaciones adicionales por otros científicos. Eficiencia: un objetivo central de promover el acceso y el intercambio de (información) es mejorar la eficiencia de la investigación científica financiada con fondos públicos, para evitar la duplicación de esfuerzos costosa e innecesaria. Esto también implica realizar análisis de costo-beneficio para definir protocolos de retención de datos, involucrar a organizaciones especializadas en administración de datos y desarrollar nuevas estructuras de recompensa para investigadores y productores de bases de datos. Si puedo construir sobre algo que alguien más ha hecho, para llegar al conocimiento al final, eso me agiliza el camino. Source: OECD (2006), Recommendation of the Council concerning Access to Research Data from Public Funding, https://legalinstruments.oecd.org/en/instruments/159. Introducción: FAIR4RS Un grupo de trabajo conjunto, Research Data Alliance (RDA), FORCE11 y Research Software Alliance (ReSA). Coordinamos un amplio repertorio de actividades lideradas por la comunidad. Cómo definir y aplicar eficazmente los principios FAIR para software de investigación, Cómo lograr la adopción de estos principios. https://www.rd-alliance.org/groups/fair-research-software-fair4rs-wg 6 Avalado por RDA Sep 2020 M6 M12 M18 Definir los principios FAIR para software de investigación Guías de implementación Ejemplos de Adopción FAIR4RS Grupo de Trabajo Miembro del comité directivo Dos objetivos: Coordinamos un amplio repertorio de actividades lideradas por la comunidad. Cómo definir eficazmente los principios FAIR para software de investigación, Cómo lograr la adopción de estos principios. Y 3 Hitos Definir los principios FAIR para software de investigación - consultas integrales con la comunidad Guías de implementación Ejemplos de Adopción Principios FAIR para Software de investigación Localizable: el software y sus metadatos correspondientes deben ser fáciles de encontrar, tanto por humanos como por máquinas. Accesible: el software y sus metadatos deben poder obtenerse mediante protocolos estándar. Interoperable: el software interopera con otro software mediante el intercambio de datos y/o metadatos, y/o mediante la interacción a través de una interfaz para programas de aplicación (API). Reutilizable: el software es utilizable (se puede ejecutar) y reutilizable (se puede entender, modificar, extender o integrar a otro software). Chue Hong, et al (2021) FAIR Principles for Research Software (FAIR4RS Principles). RDA DOI: 10.15497/RDA00065 Unete al Grupo (información en Inglés) 7 Localizable: el software y sus metadatos correspondientes deben ser fáciles de encontrar, tanto por humanos como por máquinas. F1. Al software se le asigna un identificador único, persistente y universal F1.1. A los diferentes componentes del software se les deben asignar distintos identificadores representando diferentes niveles de detalle F1.2. A las diferentes versiones del mismo software se les deben asignar identificadores distintos F2. El software es descrito con metadatos enriquecidos F3. Los metadatos incluyen clara y explícitamente el identificador del software que describen F4. Los metadatos son FAIR y se pueden buscar e indexar Accesible: el software y sus metadatos deben poder obtenerse mediante protocolos estándar. A1. El software se puede obtener mediante su identificador usando un protocolo de comunicaciones estándar A1.1. El protocolo es abierto, gratuito y de implementación universal A1.2. El protocolo permite un procedimiento de autenticación y autorización, cuando sea necesario A2. Los metadatos son accesibles, incluso cuando el software ya no está disponible Interoperable: el software interopera con otro software mediante el intercambio de datos y/o metadatos, y/o mediante la interacción a través de una interfaz para programas de aplicación (API). I1. El software lee, escribe e intercambia datos de una manera que cumple con estándares comunitarios relevantes para el ámbito científico. I2. El software incluye referencias cualificadas a otros objetos Reutilizable: el software es utilizable (se puede ejecutar) y reutilizable (se puede entender, modificar, extender o integrar a otro software). R1. El software se describe con una pluralidad de atributos precisos y relevantes. R1.1. El software debe tener una licencia clara y accesible R1.2. El software se acompaña con una procedencia detallada R2. El software incluye referencias cualificadas a otro software R3. El software cumple con los estándares comunitarios relevantes para el ámbito científico. FAIR4RS WG. (Junio, 2021) Principios FAIR para Software de Investigación Principios FAIR para Software de investigación 8 Spanish translation FAIR4RS en español versión 0.2 Chue Hong, et al (2021) FAIR Principles for Research Software (FAIR4RS Principles). RDA DOI: 10.15497/RDA00065 Paula Andrea Martinez 0000-0002-8990-1985 Irma Martínez-Flores 0000-0001-9350-8978 Nicolas Palopoli ​0000-0001-7925-6436 Heladia Salgado 0000-0002-3166-5801 Wladimir Labeikovsky 0000-0001-6074-3269 Nicolás Guarín-Zapata 0000-0002-9435-1914 Ana Beatriz Villaseñor Altamirano 0000-0002-3940-5617 Eva Méndez 0000-0002-5337-4722 Leyla Jael Castro 0000-0003-3986-0510 Carlos Martinez-Ortiz 0000-0001-5565-7577 Texto original: Chue Hong, et al (2021) FAIR Principles for Research Software (FAIR4RS Principles). RDA DOI: 10.15497/RDA00065 9 Gracias a los Editores y Revisores FAIR4RS-es https://orcid.org/0000-0002-8990-1985 https://orcid.org/0000-0001-9350-8978 https://orcid.org/​0000-0001-7925-6436 https://orcid.org/0000-0002-3166-5801 https://orcid.org/0000-0001-6074-3269 https://orcid.org/0000-0002-9435-1914 https://orcid.org/0000-0002-3940-5617 https://orcid.org/0000-0002-5337-4722 https://orcid.org/0000-0003-3986-0510 https://orcid.org/0000-0001-5565-7577 Primero informar y difundir, lo siguiente es capacitar ¿Por qué citar código o software es importante? 1. Usar software para un artículo 2. Usar software en/con software nuevo 3. Contribuir al software 5. Obtener crédito por el desarrollo de software 7. Encontrar software para implementar una tarea 8. Publicar un artículo de software 10 11. Crear un registro de software de un grupo 12. Mostrar el impacto científico de logros 13. Mostrar cómo se ha utilizado el software financiado 16. Publicar paquetes de software y datos (mixto) Tabla 2 force11.org/software-citation-principles Principios para citar Software. Tabla 2 force11.org/software-citation-principles Estos principios se alinean a los principios FAIR y a los principios de la OECD ¿Cómo empezar? https://fair-software.eu The Netherlands eScience Center 11 Estos recursos mejoran la capacidad de acceso al software de investigación y la transparencia de la investigación, brindan información para las citas de software y fomentan la preservación de los métodos computacionales que de otro modo podrían perderse con el tiempo, lo que respalda la reproducibilidad y replicabilidad de la investigación. Referencias prácticas Repositorios con versión de control: GitHub.com, BitBucket.org, GitLab.com Licencia: choosealicense.com y tldrlegal.com Registro de metadatos Zenodo, or Figshare, Dryad (datos), https://github.com/NLeSC/awesome-research-software-registries Cuando compartir y consideraciones necesarias de confidencialidad y restricciones de acceso. AGU Guía para compartir datos y software https://zenodo.org/record/5047405 https://data.agu.org/resources/agu-data-software-sharing-guidance 12 Orientación para investigadores de carrera temprana: requisitos de la revista AGU ¿Por qué citar sus datos y software? Su investigación es más fácil de evaluar por otros (incluidos los revisores de publicaciones). Su trabajo puede ser descubierto de diferentes maneras que solo a través de su artículo. Tus datos se conservarán como parte del registro científico y se vincularán a ambos al creador y a su publicación. (incluso a la información complementaria). Haz algo como esto https://zenodo.org/record/5047405 https://data.agu.org/resources/agu-data-software-sharing-guidance Más referencias prácticas Making your Code Citable with GitHub https://guides.github.com/activities/citable-code/ Referencing and Citing Content on GitHub thanks to Zenodo https://docs.github.com/en/github/creating-cloning-and-archiving-repositories/archiving-a-github-repository/referencing-and-citing-content 5 Recommendations for FAIR Software https://fair-software.eu Druskat, Stephan, Spaaks, Jurriaan H., Chue Hong, Neil, Haines, Robert, & Baker, James. (2021). Citation File Format (CFF) - Specifications (1.1.0). Zenodo. DOI 10.5281/zenodo.4813122 https://citation-file-format.github.io/ (con soporte de Zenodo y Zotero) 13 Referencias Wilkinson, et al. (2016) The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data. DOI: 10.1038/sdata.2016.18 Lamprecht, et al. (2020) Towards FAIR Principles for Research Software. Data Science. 3:37 – 59. DOI: 10.3233/DS-190026 FAIR 4 Research Software Working Group https://www.rd-alliance.org/groups/fair-research-software-fair4rs-wg Chue Hong, et al (2021) FAIR Principles for Research Software (FAIR4RS Principles). RDA DOI: 10.15497/RDA00065 14 Preguntas para pensar ¿Cómo fomentar el uso de los principios FAIR en el NNB-CCG, la CDSB y la RMB? ¿Cómo recopilar / depositar metadatos (específicamente autoría o procedencia)? ¿Cuáles son los roles de diferentes repositorios, registros, identificadores? ¿Cuál es el rol de los patrocinadores y editores? Necesitamos incentivos, normalización cultural, e inversiones a largo plazo 15 NNB-CCG, la CDSB y la RMB