Se ha denunciado esta presentación.
Se está descargando tu SlideShare. ×

Datos Abiertos en un Mundo de Grandes Datos (Acuerdo ICSU-IAP-ISSC-TWAS)

Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio

Eche un vistazo a continuación

1 de 15 Anuncio

Datos Abiertos en un Mundo de Grandes Datos (Acuerdo ICSU-IAP-ISSC-TWAS)

Descargar para leer sin conexión

Principios de Acuerdo Datos Abiertos en un Mundo de Grandes Datos (Acuerdo ICSU-IAP-ISSC-TWAS)

Principios de Acuerdo Datos Abiertos en un Mundo de Grandes Datos (Acuerdo ICSU-IAP-ISSC-TWAS)

Anuncio
Anuncio

Más Contenido Relacionado

Presentaciones para usted (15)

A los espectadores también les gustó (6)

Anuncio

Similares a Datos Abiertos en un Mundo de Grandes Datos (Acuerdo ICSU-IAP-ISSC-TWAS) (20)

Más de CLACSO-Latin American Council of Social Sciences, Open Access (20)

Anuncio

Más reciente (20)

Datos Abiertos en un Mundo de Grandes Datos (Acuerdo ICSU-IAP-ISSC-TWAS)

  1. 1. Datos abiertos en un mundo de grandes datos . Un acuerdo internacional (2015): ICSU - International Council for Science IAP - The InterAcademy Partnership ISSC - International Social Science Council TWAS - The World Academy of Sciences .
  2. 2. oportunidades científicas en un mundo rico en datos • capacidad de adquirir, almacenar, manipular y transmitir instantáneamente grandes y complejos volúmenes de datos • numerosos conjuntos de datos pueden ser semánticamente vinculados para crear significados más profundos • aprovechar estas oportunidades plantea serios desafíos a la forma en que la ciencia se ejecuta y se organiza Los datos abiertos son el elemento común que lo hace posible • La apertura efectiva de datos solo puede ser realizada si hay acción sistémica a nivel personal y disciplinario, nacional e internacional
  3. 3. definición de datos abiertos Los datos deben ser "inteligentemente abiertos": • Descubribles - una búsqueda en Internet puede revelar fácilmente su existencia • Accesibles - los datos se pueden importar o se puede acceder desde una computadora • Inteligible - información de antecedentes para dejar en claro la relevancia de los datos en relación a la cuestión específica objeto de la investigación • Valorables - los usuarios deben ser capaces de evaluar cuestiones tales como la competencia / intereses de los productores de datos • Utilizable - metadatos adecuados + el código relevante cuando se ha utilizado computación para crear datos derivados
  4. 4. Veremos como la aplicación de los principios de Datos Abiertos es responsabilidad de científicos/as instituciones de investigación y las universidades editores/as organismos de financiación asociaciones profesionales, sociedades científicas y academias bibliotecas, archivos y repositorios  Responsabilidades nacionales  Responsabilidades internacionales
  5. 5. Los principios de Datos Abiertos Responsabilidades de los/las científicos/as financiados con fondos públicos • que los datos de investigación estén abiertos y puedan ser reutilizados • que la lógica de relación entre los datos y las afirmaciones pueda ser rigurosamente analizada y la validez de los datos comprobada por replicación de experimentos u observaciones. • datos depositados en repositorios confiables datos abiertos reutilizables
  6. 6. Deposite sus datos en el repositorio de su institución + busque repositorios en ww.re3data.org (1.400) y en www.opendoar.org (153)
  7. 7. Los principios de Datos Abiertos Responsabilidades de las instituciones de investigación y las universidades • crear un entorno de apoyo para los datos abiertos: capacitación en gestión, preservación y análisis de datos y el soporte técnico pertinente, incluyendo servicios de biblioteca y de gestión de datos. • las instituciones que emplean a los científicos, y los organismos que los financian, deben desarrollar incentivos y criterios de promoción para aquellos involucrados en los procesos de datos abiertos . movilizar las capacidades de uso intensivo de los datos
  8. 8. Los principios de Datos Abiertos Responsabilidades de los editores/as • poner a disposición de los evaluadores los datos durante el proceso de revisión • requerir acceso abierto inteligente a los datos al mismo tiempo que la publicación que los utiliza • exigir las referencias y citas completas de esos datos • poner a disposición el registro científico para su posterior análisis mediante el suministro abierto de los metadatos y el acceso abierto para minería de textos y datos
  9. 9. Los principios de Datos Abiertos Responsabilidades de los organismos de financiación • considerar los costos de los procesos de datos abiertos en los proyectos de investigación como parte intrínseca del costo de su realización • proporcionar recursos y políticas adecuados para la sostenibilidad a largo plazo de la infraestructura y repositorios política nacional de datos abiertos • las instituciones que emplean a los científicos, y los organismos que los financian, deben desarrollar incentivos y criterios de promoción para aquellos involucrados en los procesos de datos abiertos • la evaluación del impacto de la investigación, particularmente los indicadores que involucran métricas de citación, deben tomar en cuenta la contribución de los creadores de datos
  10. 10. Los principios de Datos Abiertos Responsabilidades de las asociaciones profesionales, sociedades científicas y academias deben desarrollar directrices y políticas de datos abiertos y promover las oportunidades que los datos abiertos ofrecen de forma tal que refleje las normas epistémicas y las prácticas de sus miembros.
  11. 11. Los principios de Datos Abiertos Responsabilidades de las bibliotecas, archivos y repositorios desarrollo y prestación de servicios y normas técnicas para los datos, de tal forma que aseguren • su disponibibilidad para quienes deseen utilizarlos y que • los datos sean accesibles en el largo plazo
  12. 12. Los límites de la apertura de datos Los datos abiertos deben ser la posición por defecto para la ciencia financiada con fondos públicos. Las excepciones deben limitarse a cuestiones de:  Privacidad  Seguridad  Uso comercial en el interés público Excepciones justificadas caso por caso, y no como exclusión general
  13. 13. Prácticas habilitantes • Citación y procedencia En publicaciones académicas, cuando los investigadores utilizan datos creados por otros, éstos deben ser citados con referencia a su autor, a su procedencia y a un identificador digital permanente. • Interoperabilidad Tanto los datos de investigación como los metadatos que permiten la evaluación y reutilización de los datos, deben ser interoperables en la mayor medida posible • Reutilización no restrictiva Datos de investigación etiquetados como reutilizables (ej.: licencias no restrictivas) • Capacidad de vinculación Datos abiertos vinculados con otros datos basados en su contenido y contexto, con el fin de maximizar su valor semántico
  14. 14. ICSU-IAP-ISSC-TWAS Accord www.icsu.org/science-international/accord Documento preparado por un grupo de trabajo de ICSU - International Council for Science IAP - The InterAcademy Partnership ISSC - International Social Science Council TWAS - The World Academy of Sciences …………. • Geoffrey Boulton, Universidad de Edimburgo, Presidente de CODATA, Preside el Grupo de Trabajo • Simon Hodson, Director Ejecutivo de CODATA (representante ICSU) • Dominique Babini, CLACSO y Universidad de Buenos Aires (representante ISSC) • Jianhui Li, Academia China de Ciencias-CNIC (representante IAP) • Tshilidzi Marwala, Universidad de Johannesburgo (representante TWAS) • Maria G. N. Musoke, Universidad de Makerere, Uganda (representante IAP) • Paul F. Uhlir, Académico, Academia Nacional de Ciencias de Estados Unidos (representante IAP); consultor independiente en política y gestión de datos. • Sally Wyatt, Universidad de Maastricht, eHumanities-KNAW (representante ISSC) • .

Notas del editor

  • Este acuerdo sobre “datos abiertos en un mundo de grandes datos” agrega la voz distintiva de la comunidad científica internacional a la de los gobiernos y organismos intergubernamentales que han hecho del caso de los datos abiertos un pre-requisito fundamental para mantener el rigor de la investigación científica y la maximización del beneficio público de la revolución de los grandes datos (big data), tanto en los países desarrollados como en aquellos en desarrollo.

    El acuerdo afirma que la investigación financiada con fondos públicos debe llevarse a cabo de manera a crear un máximo beneficio público. Y la liberación de los datos es la ruta óptima para lograrlo.

    El acuerdo identifica las oportunidades y desafíos de la revolución de datos como un tema de actualidad y predominante para la política científica global.

    Propone principios fundamentales que deben ser adoptados para dar respuesta a ellos
  • Hay muchas áreas de investigación donde estas capacidades son profundamente relevantes: en predicción meteorológica y climática; en la comprensión del funcionamiento del cerebro; en el comportamiento de la economía global; en la evaluación de la productividad agrícola; en las previsiones demográficas; en historias a desentrañar; y en muchos de los desafíos globales contemporáneos como los del cambio ambiental, las enfermedades infecciosas y la migración masiva, que requieren combinar conocimientos y datos de muchas disciplinas.

    Es un contexto muy cambiante, por ej. En 2003 los científicos declararon que el mapeo del genoma humano estaba completo. Llevó más de 10 años y costó 1 billón de dólares - hoy se tarda apenas unos días y cuesta una pequeña fracción de dicho monto (USD 1.000).

    Los gobiernos también tienen datos que son de gran importancia para la ciencia, como ej. ciencias sociales

    En ese contexto se ubica este acuerdo de la comunidad científica internacional sobre los principios fundamentales y ej. de buenas prácticas que deben ser adoptados en el tema de datos abiertos de investigación


  • Si los datos, metadatos y el código utilizado en cualquier manipulación no están disponibles no puede ser objeto de una prueba adecuada de replicación

    Un número creciente de investigadores comparten sus datos desde el inicio de sus proyectos de investigación, tanto para recibir los comentarios de otros investigadores como también para para participar en proyectos colaborativos de investigación. Importantes procesos de abierto intercambio de datos se han desarrollado en áreas tales como la lingüística, la bioinformática y cristalografía química. En paleogenética humanos, parece que el intercambio de datos abierta es casi universal (> 97%),
  • Ejs. de responsabilidades internacionales: CODATA y Research Data Alliance (RDA) organizan actividades de capacitación en diversos lugares del mundo
  • Los científicos financiados con fondos públicos tienen la responsabilidad de contribuir al bien público a través de la creación y comunicación de nuevos conocimientos,
    en los cuales los datos asociados son parte intrínseca. Ellos deben hacer que esos datos estén disponibles abiertamente a los demás, después de su producción, tan pronto como sea posible

    Cuando se publica un documento haciendo una afirmación científica, es esencial que los datos probatorios, los metadatos relacionados que permiten re-análisis, y los códigos utilizados en la manipulación por computadora, se abran al mismo tiempo al escrutinio para asegurar que se mantiene el proceso vital de autocorrección. Recientes demostraciones en varias disciplinas de altas tasas de no-reproducibilidad de los resultados de los trabajos publicados, enfatizan la necesidad crucial de revitalizar procesos de datos abiertos para un mundo de grandes datos. La apertura no es sin embargo suficiente. Los datos deben ser inteligentemente abiertos, lo que significa que deben ser: descubribles, accesibles, inteligibles, evaluables y reutilizables

    Los recientes intentos de replicar de forma sistemática los resultados de una serie de artículos publicados en revistas de gran prestigio tuvieron éxito en sólo un bajo porcentaje, por ejemplo, oncología preclínica (53 trabajos, sólo el 11% replicable), la psicología social (100 artículos, sólo el 39% replicable) y la economía (67 documentos, sólo el 33% replicable). Las razones aducidas para estas fallas incluyen la falsificación de datos, razonamiento estadístico inválido y datos o metadatos ausentes o incompletos.

    En la medida de lo posible, los datos deben ser depositados en repositorios bien gestionados y confiables, con bajas barreras de acceso. Depositar sus datos en el repositorio de su institución y/o en repositorios de datos (ww.re3data.org con 1.400 repositorios de datos, en febrero de 2016) y / o repositorios generales (www.opendoar.org con 153 repositorios que informan tener conjuntos de datos, febrero de 2016) .

    Las excepciones a los datos abiertos deben limitarse a cuestiones de privacidad, de seguridad y de uso comercial en el interés público
  • Las instituciones de investigación tienen la responsabilidad de promover y facilitar procesos de datos abiertos financiando infraestructura y servicios, estimulando la investigación sobre los fundamentos de la ciencia de datos; y aceptando que el costo de los datos abiertos es un costo inseparables de hacer investigación.
  • Los editores de revistas que publican afirmaciones científicas deben requerir que los datos probatorios estén disponibles al mismo tiempo en forma interligentemente abierta en un repositorio confiable de datos . Es un principio fundamental de la transparencia y la reproducibilidad en la investigación que los datos subyacentes a una afirmación científica puedan ser accesibles para realizar pruebas

  • Financiadores de la investigación tienen la responsabilidad de promover y facilitar procesos de datos abiertos mediante la financiación de infraestructura; proporcionar líneas de financiación específicos para apoyar la reutilización de los datos abiertos y la investigación sobre los fundamentos de la ciencia de datos; y mediante la creación de incentivos, aceptando que el costo de los datos abiertos es un costo inseparables de hacer investigación.


    prácticas que aseguren un funcionamiento eficiente de un sistema nacional de datos abiertos compatible con las normas internacionales
  • En este acuerdo sobre datos abiertos han participado ICSU, ISSC, The InterAcademy Partnership (IAP) que es la red global de academias de ciencias de países del mundo y The World Academy of Sciences (TWAS), en español La Academia Mundial de Ciencias, es una academia que reúne científicos de 70 países.

    Las Academias Nacionales y Sociedades Científicas se destacan por hablar directamente con los investigadores y expresar principios y prioridades de la investigación en sus campos específicos. Deben desarrollar directrices y políticas de datos abiertos y promover las oportunidades que ofrecen los datos abiertos de manera que reflejen las normas y prácticas de sus miembros
  • Las bibliotecas institucionales tienen el rol de recolectar, organizar, preservar y dar acceso al conocimiento. Se van adaptando al cambio tecnológico del papel a formato digital y a las cuestiones de gestión de datos abiertos destacadas por este acuerdo, pero es una transición que requiere un esfuerzo y apoyo sostenido
  • La apertura debe ser la posición por defecto para los datos científicos aunque hay excepciones

    Privacidad y confidencialidad: Compartir conjuntos de datos que contienen información personal es de importancia crítica para la investigación en muchas áreas de las investigaciones médicas y sociales, pero plantea retos para la gestión de los datos y la protección de la confidencialidad. La anonimización completa de los registros personales en bases de datos es imposible. Una manera de hacer frente a estos problemas es a través de lo que se denomina en ocasiones "refugios seguros", donde los datos se mantienen físicamente seguros, y sólo a disposición de los investigadores de buena fe, con sanciones legales contra la divulgación no autorizada. En algunos casos, el consentimiento para la publicación de los datos puede ser apropiado.

    Un examen cuidadoso de los límites de la apertura es importante cuando una investigación podría ser mal utilizada para amenazar la seguridad individual y la seguridad pública o la salud

    Puede haber un interés público en la comercialización de los descubrimientos científicos, para el mayor beneficio del público en la jurisdicción nacional en la que se hizo el descubrimiento.

    Ya que es difícil trazar límites generales para cada uno de estos casos, deben ser apicados discriminación caso por caso, ya que ha habido muchos descubrimientos importantes en los cuales suprimir la liberación de los datos o privatizar el conocimiento habría sido altamente retrógrado, como en el caso del descubrimiento de la electricidad, del código genético humano, de Internet, etc.
  • citación es un componente importante del sistema de reconocimiento académico y la recompensa. Por lo tanto, la integración de la práctica de la citación de datos debe ser visto como un paso importante en la provisión de incentivos para 'sharing' datos

    Los datos deben ser liberados al dominio público tan pronto como sea posible después de su creación. Los datos en que se basa una afirmación científica deben ser librados en el dominio público al mismo tiempo que la publicación de la afirmación. Algunos financiadores permiten demorar por un período limitado la liberación de los datos.

    Un identificador digital permanente es particularmente importante cuando los subconjuntos de datos son creados de forma dinámica y hay diferentes versiones de los conjuntos de datos

    metadatos adicional es necesaria para determinar la procedencia de la
    de datos y de entender las circunstancias en las que fueron creados y
    de qué manera pueden ser reutilizados. Existen normas en la mayoría de las disciplinas de investigación
    por la forma en que se deben describir los datos y las circunstancias
    de su creación informado.

    define interoperabilidad como la habilidad de dos o más sistemas o componentes para intercambiar información y utilizar la información intercambiada. La interoperabilidad es un atributo que facilita en gran medida el uso de los datos de la investigación

    reutilización:
    Diferentes ministerios u organismos de investigación pueden adoptar una política que Permite que los datos de investigación producidos a través de sus fondos para ser colocados en el
    dominio público
    En ausencia de una ley amplia que permite la reutilización, re-difusión
    y la interoperabilidad jurídica de los datos, una renuncia a los derechos voluntaria o una
    no limitativo, de "uso común" licencia puede ser utilizado por el titular de los derechos
    (Ver: www.creativecommons.org).
    Si los datos de investigación no están ya en el dominio público, deben ser etiquetados como reutilizables por medio de una renuncia a derechos o licencia no restrictiva que deja claro que los datos pueden ser reutilizados sin otro requisito que la de reconocimiento al autor. El Grupo de Interés de CODATA-RDA sobre la interoperabilidad jurídica de los datos de investigación ha producido Principios y Directrices en este tema
  • Estos son los requisitos para un eficiente entorno de datos abierto, donde la tecnología es sólo una parte. Las partes sumergidas, relacionadas con procesos, organización, habilidades personales, la motivación y el carácter distintivo de cada especialidad científica

    Las acciones que promueven la utilización de prácticas apropiadas para datos abiertos de investigación pueden clasificarse en tres categorías: las que alientan a los investigadores a exponer sus datos en abierto, las que fomentan el uso de datos abiertos, y las que desalientan la utilización de datos cerrados. El rol de los actores clave necesitan ser considerados: quienes financian la investigación, las instituciones de investigación, los editores y los mismos investigadores. Estos actores son los elementos clave de la comunidad de investigación. Tienen que trabajar juntos para asegurar que los datos se consideran productos legítimos y citables de la investigación; con citas de datos que se consideren de la misma importancia en la promoción académica que las citas a otros formatos como son los textos publicados.

×