SlideShare una empresa de Scribd logo
Cerrando el círculo: requisitos de los datos
abiertos como recursos para la
investigación abierta
PKP Scholarly Publishing Conference 2013
Universidad Nacional Autónoma de México
20 Agosto 2013

Nancy Diana Gómez
Gema Bueno de La Fuente
Universidad Carlos III de Madrid
Contenido
 Preguntas de investigación

 Objetivos
 Contexto
 Propuesta de metodología
 Datos de los repositorios de Ciencias Sociales
 Observaciones preliminares.

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Preguntas de investigación
Métricas de datos abiertos:
 ¿Cuáles son las condiciones técnico/legales que se
deben cumplir para saber si un dato es abierto?
 ¿Es posible establecer métricas para medir el nivel de
apertura de los datos?

Set de datos en repositorios de Ciencias Sociales:
 ¿Qué datos se están publicando en los repositorios de
Ciencias Sociales como open data?
 ¿Qué nivel de apertura legal y técnico tienen los datos
de los repositorios de Ciencias Sociales?
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Objetivos
 Diseño de la metodología para evaluar el
grado de apertura de datos en repositorios de
Ciencias Sociales de acuerdo a sus
condiciones legales y técnicas.
 Comprobación de la validez de la
metodología con un conjunto seleccionado de
datos abiertos del área de Ciencias Sociales.

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
CONTEXTO
¿Porqué Ciencia Abierta?
(Stodden, 2011)

Facilita
Reproductibilidad
Innovación académica e industria
Acceso al conocimiento

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Razones para compartir datos
(Borgman, 2012)

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Ciclo del dato (ICPSR, 2012)

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Incentivos que influencian la
publicación y difusión de los datos
(Stodden, 2011)

Fondos de investigación (NSF, NIH, etc.)

Editoriales de revistas (PLOSone)
Promociones institucionales
(premios, promociones, etc.)
Integridad científica

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Motivos que disuaden a los científicos
en la publicación de datos abiertos
(Stodden, 2010)

 Tiempo en documentar y limpiar datos para publicar (54%)

 Lidiar con preguntas de los usuarios de los datos (34%)
 No recibir atribución o citación como autores de los datos
(42%)
 Barreras legales –copyright (41%)
 Perdida potencial de futuras publicaciones (35%)
 Ventaja que pueden obtener los competidores en el campo
(33%)
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Las revistas y los datos
(Stodden, 2013)

 Estudio realizado sobre 170 revistas de
computación ISI.





62% no menciona política de datos
79% no menciona política sobre el código/programa
66% tiene política para material suplementario
Las revistas que incrementan demandas a sus
autores, como datos son aquellas que tienen alto
factor de impacto.

 La proporción de revistas de AA con política de datos
abiertos es levemente superior a las de suscripción
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Formas de simplificar la reutilización
de los datos (White et al., 2013)
 Proveer metadatos

 Usar formatos de datos estándar
 Proveer el dato de forma no procesada o
cruda

 Uso de un repositorio establecido
 Uso de una licencia abierta y establecida (usar
la licencia más abierta posible) como CC0
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Recomendaciones
(White et al. 2013)
 Datos bien documentados son más fáciles de
comprender para reutilizar
 Datos con formatos apropiados son más fáciles
de usar en una variedad de software.
 Datos que han sido depositado en repositorios
establecidos, más durables y citables.

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Datos abiertos y procesamiento
 Estándares y buenas prácticas de citación para los
datos (Datacite.org).
 Uso de identificadores únicos de conjuntos de datos
(DOI) y productores (ORCID).
 Metadatos de calidad para la descripción de datasets
en catálogos de datos (DCAT).
 Integración de catálogos Open Data con otras
herramientas (metabúsqueda).
 Dataverse Network – 2006 - IQCSS (Guía para gestión
de los datos-2012 5th edición) Permite a los autores subir
código y datos con sus propios términos de uso.
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
PROPUESTA
METODOLÓGICA
Combinación de métodos
1. Medición del nivel de apertura de datos a
nivel legal y técnico:
 Diseño de matriz de priorización
 Convalidación de los pesos de la matriz:
crowdsourcing. 

2. Recogida y tratamiento de datos abiertos.
3. Caracterización de los datos de repositorios
en CCSS.

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Matriz de evaluación (BETA)
Matriz de priorización

Variables consideradas:
1. Instrumento legal (copyright, licencias, aviso
legal).
 Korn y Oppenheim (2011).

2. Formatos de ficheros de datos:
 Norma ISO 2145/2010.
 Clasificación de cinco estrellas LOD de T. Berners
Lee.
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Asignación de pesos a las variables

¿80%?

4th Int. PKP Conference, México

¿20%?

N. D. Gómez, G. Bueno (2013)
Variable 1: Instrumento legal
(Korn & Oppenheim, 2011)

Quién y bajo que términos se puede utilizar el dato
Cualquiera

10

Restricción para usos comerciales

5

Posibilidad de modificación del dato
Sin restricciones de ningún tipo

10

Sin restricciones pero con atribución

7

Compartir igual

3

No se modifican

0

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Variable 2: Formatos
Escala LOD 5 estrellas (Berners Lee, 2010)

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Formula
Valor licencia

Valor formato

Grado
apertura

(U x 0,3 + M x 0,5) + (pF x 0,2) = 0-1
Términos de uso: U
Posibilidad de modificación del dato: M
Valor promedio de formato: pF
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Selección de la muestra
 Conjuntos de datos en
CCSS.
 Criterios de selección:
 Data Citation
Index:http://wokinfo.com//products
_tools/multidisciplinary/dci/

 Categoría CCSS.
 >100 datasets

Repositorio

Organismo

Archaeological Data Service

University of York

National Archives

U.S. National Archives and
Records Administration

IQSS
The Dataweb
Eurostat
Australian Data Archive
UK Data Archive
Finnish Social Science Data
Archive
Inter University Consortium for
Political and Social Research

Harvard University
US Census Bureau
European Union
Australian National
University
University of Essex
University of Tampere
University of Michigan
Odum Insitute, University of
North Carolina

Office for National Statistics

UK Statistics Authority

Roper Center

 Volumen muestra: 13
repositorios

Odum Institute

Roper Center, University of
Connecticut

National Research
N. D. Gómez, G. Bueno (2013)
Foundation

South African Data Archive

4th Int. PKP Conference, México
Datos en Ciencias Sociales
 Investigación en CCSS: diseño-recolección-análisis. Los
datos son la materia prima.
 Métodos de obtención de datos: observación, encuestas,
documentación, experimentación.
 Tipos de métodos tipos de datos  formatos
 Cuantitativos: paquetes estadísticos, hojas de cálculo y texto tabulado
 Datos estructurados.
 Cualitativos: amplio rango de contenidos y formatos (texto, imagen,
video, audio y otra documentación).

 Retos para su publicación como datos abiertos:
 Normalización, integración, redundancia…

 Aspectos éticos y legales.
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Características de la muestra
 Repositorios de organismos de la administración pública
principalmente.
 Datos estadísticos, censales y otros estudios.
 Dataverse Network.
 Registros metadatos datasets: DDI XML

 Opciones descarga datos: API, FTP y descarga en
lotes, exportar en XLS y otros formatos.
 Niveles de acceso a los datos: abierto, especial y
restringido.  Licencias de descarga, solicitudes
formales.
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
OBSERVACIONES
PRELIMINARES
Variable 1: Instrumento legal
 Escasez de licencias explícitas asociadas a los datasets 
Términos/condiciones generales de acceso y uso.
 Repositorios admin. pública: los más abiertos, dominio
público (Eurostat, US. Census Bureau, US NARA, US NASA…)
 Repositorios de investigación (auto-depósito): condiciones
establecidas por autores/propietarios
datasets, financiadores (Australian Data Archive, UK Data
Archive, ICPSR, IQSS, )
 Licencias en relación con el nivel de acceso a los datasets.
 Limitaciones de uso y reutilización (no comercial, sólo
investigación y académicos), restricciones
(confidencialidad, intimidad), condiciones (citación).
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Variable 2: Formatos
Formatos más comunes de los datos
cuantitativos en CCSS :
★★ SPSS, SAS, Stata…
Sistemas propietarios, posibilidad de exportar en
otros formatos.

★★ .xls (MS Excel)
★★★ R (open source)
★★★ .csv, .tsv, xml
★★★★ .sdmx-ml
4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)
Próximos pasos…
 Reformulación de la matriz teniendo en cuenta otras
variables, como nivel de accesibilidad,
interoperabilidad, documentación adicional o material
explicativo.
 Convalidación de la nueva matriz a través de
crowdsourcing con infomediarios
 Obtención de un grupo de datos en Ciencias Sociales
para aplicar la nueva matriz.
 Dimensiones de los datos: Grado de apertura. Grado de
interoperabilidad. Grado de reutilización.
Bibliografía


Berners-Lee, T. (2009). Putting government data online. Retrieved agosto/5, 2012, from
http://www.w3.org/DesignIssues/GovData.html



Borgman, C. L. (2012). The conundrum of sharing research data. Journal of the
American Society for Information Science and Technology, 63(6), 1059; 1059-1078; 1078.



Inter-university Consortium for Political and Social Research (ICPSR). (2012). Guide to
social science data preparation and archiving: Best practice throughout the data life
cycle (5th ed.). Ann Arbor, M:



Korn, N., & Oppenheim, C. (2011). Licensing open data: A practical guide. Jisc, v. 2.0
Retrieved from
http://discovery.ac.uk/files/pdf/Licensing_Open_Data_A_Practical_Guide.pdf



Stodden, V. C. (2011). Transparency in scientific discovery: Innovation and knowledge
dissemination. Retrieved from http://hdl.handle.net/10022/AC:P:13496



Stodden, V., Guo, P., & Ma, Z. (2013). Toward reproducible computational research: An
empirical analysis of data and code policy adoption by journals. PloS One, 8(6), e67111.



White, E. P., Baldridge, E., Brym, Z. T., Locey, K. J., McGlinn, D. J., & Supp, S. R. (2013). Nine
simple ways to make it easier to (re) use your data. Peerj Preprints, 1, e7. Retrieved from
https://peerj.com/preprints/7/

4th Int. PKP Conference, México

N. D. Gómez, G. Bueno (2013)

Más contenido relacionado

La actualidad más candente

Breve historia de los sistemas de recuperación de información.
Breve historia de los sistemas de recuperación de información.Breve historia de los sistemas de recuperación de información.
Breve historia de los sistemas de recuperación de información.
Universidad de Guadalajara
 
Datos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso MexicoDatos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso Mexico
LEARN Project
 
Modulo 1 d1 actividad de fin de modulo
Modulo 1 d1 actividad de fin de moduloModulo 1 d1 actividad de fin de modulo
Modulo 1 d1 actividad de fin de modulo
UNIVERSIDAD NACIONAL DE PIURA
 
Métricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y BibliotecariosMétricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y Bibliotecarios
SocialBiblio
 
mineria de datos
mineria  de datosmineria  de datos
mineria de datos
Katy Tumpi
 
La difusión de datos de investigación: principales iniciativas
La difusión de datos de investigación: principales iniciativasLa difusión de datos de investigación: principales iniciativas
La difusión de datos de investigación: principales iniciativas
Javier Hernández San Miguel
 

La actualidad más candente (6)

Breve historia de los sistemas de recuperación de información.
Breve historia de los sistemas de recuperación de información.Breve historia de los sistemas de recuperación de información.
Breve historia de los sistemas de recuperación de información.
 
Datos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso MexicoDatos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso Mexico
 
Modulo 1 d1 actividad de fin de modulo
Modulo 1 d1 actividad de fin de moduloModulo 1 d1 actividad de fin de modulo
Modulo 1 d1 actividad de fin de modulo
 
Métricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y BibliotecariosMétricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y Bibliotecarios
 
mineria de datos
mineria  de datosmineria  de datos
mineria de datos
 
La difusión de datos de investigación: principales iniciativas
La difusión de datos de investigación: principales iniciativasLa difusión de datos de investigación: principales iniciativas
La difusión de datos de investigación: principales iniciativas
 

Similar a PKP datos abiertos Gómez - Bueno-De-La-Fuente

Gestión de Datos Científicos
Gestión de Datos CientíficosGestión de Datos Científicos
Gestión de Datos Científicos
Fernando-Ariel Lopez
 
Pre evento iodc2
Pre evento iodc2Pre evento iodc2
Pre evento iodc2
maredata
 
Introducción a la Gestión de Datos de Investigación
Introducción a la Gestión de Datos de Investigación Introducción a la Gestión de Datos de Investigación
Introducción a la Gestión de Datos de Investigación
Biblioteca CRAI de la Universidad Pablo de Olavide
 
Datos abiertos: definiciones, tipología y principios
Datos abiertos: definiciones, tipología y principiosDatos abiertos: definiciones, tipología y principios
Datos abiertos: definiciones, tipología y principios
nancydianagomez
 
Abadal 2016-pre-evento-iodc
Abadal 2016-pre-evento-iodcAbadal 2016-pre-evento-iodc
Abadal 2016-pre-evento-iodc
maredata
 
Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16
datos.ua.es
 
Open Data in a Big World by Fernando Ariel López
Open Data in a Big World by Fernando Ariel López Open Data in a Big World by Fernando Ariel López
Open Data in a Big World by Fernando Ariel López
LEARN Project
 
Información Investigación Digital
Información Investigación DigitalInformación Investigación Digital
Información Investigación Digital
Espacio Público
 
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
http://bvsalud.org/
 
Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...
Pedro Príncipe
 
Mirando al futuro, del acceso abierto a datos abiertos de investigación
Mirando al futuro, del acceso abierto a datos abiertos de investigaciónMirando al futuro, del acceso abierto a datos abiertos de investigación
Mirando al futuro, del acceso abierto a datos abiertos de investigación
Fernando-Ariel Lopez
 
#Aprender3C - Repositorio de datos primarios
#Aprender3C - Repositorio de datos primarios#Aprender3C - Repositorio de datos primarios
#Aprender3C - Repositorio de datos primarios
Aprender 3C
 
Acuerdo internacional "Open Data in a Big Data World"
Acuerdo internacional "Open Data in a Big Data World"Acuerdo internacional "Open Data in a Big Data World"
Acuerdo internacional "Open Data in a Big Data World"
Fernando-Ariel Lopez
 
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
datos.ua.es
 
Taller de investigación en el entorno digital
Taller de investigación en el entorno digitalTaller de investigación en el entorno digital
Taller de investigación en el entorno digital
Espacio Público
 
Dades obertes de recerca, Reme Melero
Dades obertes de recerca, Reme MeleroDades obertes de recerca, Reme Melero
Dades obertes de recerca, Reme Melero
Museu de Ciències Naturals de Barcelona
 
Aleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 octAleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 oct
maredata
 
Aspectos éticos de la Open Science
Aspectos éticos de la Open ScienceAspectos éticos de la Open Science
Aspectos éticos de la Open Science
Universitat Oberta de Catalunya (UOC)
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigación
Fernando-Ariel Lopez
 
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docx
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docxEnsayo sobre las bases de datos cientÃ-ficos hans delgado.docx
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docx
hanssebastiandelgado
 

Similar a PKP datos abiertos Gómez - Bueno-De-La-Fuente (20)

Gestión de Datos Científicos
Gestión de Datos CientíficosGestión de Datos Científicos
Gestión de Datos Científicos
 
Pre evento iodc2
Pre evento iodc2Pre evento iodc2
Pre evento iodc2
 
Introducción a la Gestión de Datos de Investigación
Introducción a la Gestión de Datos de Investigación Introducción a la Gestión de Datos de Investigación
Introducción a la Gestión de Datos de Investigación
 
Datos abiertos: definiciones, tipología y principios
Datos abiertos: definiciones, tipología y principiosDatos abiertos: definiciones, tipología y principios
Datos abiertos: definiciones, tipología y principios
 
Abadal 2016-pre-evento-iodc
Abadal 2016-pre-evento-iodcAbadal 2016-pre-evento-iodc
Abadal 2016-pre-evento-iodc
 
Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16
 
Open Data in a Big World by Fernando Ariel López
Open Data in a Big World by Fernando Ariel López Open Data in a Big World by Fernando Ariel López
Open Data in a Big World by Fernando Ariel López
 
Información Investigación Digital
Información Investigación DigitalInformación Investigación Digital
Información Investigación Digital
 
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
(03|09) Buenas Prácticas Proceso Editorial LILACS 2021 - DATOS DE INVESTIGACIÓN
 
Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...
 
Mirando al futuro, del acceso abierto a datos abiertos de investigación
Mirando al futuro, del acceso abierto a datos abiertos de investigaciónMirando al futuro, del acceso abierto a datos abiertos de investigación
Mirando al futuro, del acceso abierto a datos abiertos de investigación
 
#Aprender3C - Repositorio de datos primarios
#Aprender3C - Repositorio de datos primarios#Aprender3C - Repositorio de datos primarios
#Aprender3C - Repositorio de datos primarios
 
Acuerdo internacional "Open Data in a Big Data World"
Acuerdo internacional "Open Data in a Big Data World"Acuerdo internacional "Open Data in a Big Data World"
Acuerdo internacional "Open Data in a Big Data World"
 
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
Fernanada Peset - ¿Qué hacen los investigadores con sus datos?
 
Taller de investigación en el entorno digital
Taller de investigación en el entorno digitalTaller de investigación en el entorno digital
Taller de investigación en el entorno digital
 
Dades obertes de recerca, Reme Melero
Dades obertes de recerca, Reme MeleroDades obertes de recerca, Reme Melero
Dades obertes de recerca, Reme Melero
 
Aleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 octAleix peset hoja de ruta 5 oct
Aleix peset hoja de ruta 5 oct
 
Aspectos éticos de la Open Science
Aspectos éticos de la Open ScienceAspectos éticos de la Open Science
Aspectos éticos de la Open Science
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigación
 
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docx
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docxEnsayo sobre las bases de datos cientÃ-ficos hans delgado.docx
Ensayo sobre las bases de datos cientÃ-ficos hans delgado.docx
 

Último

Guia Practica de ChatGPT para Docentes Ccesa007.pdf
Guia Practica de ChatGPT para Docentes Ccesa007.pdfGuia Practica de ChatGPT para Docentes Ccesa007.pdf
Guia Practica de ChatGPT para Docentes Ccesa007.pdf
Demetrio Ccesa Rayme
 
Guia para Docentes como usar ChatGPT Mineduc Ccesa007.pdf
Guia para Docentes como usar ChatGPT  Mineduc Ccesa007.pdfGuia para Docentes como usar ChatGPT  Mineduc Ccesa007.pdf
Guia para Docentes como usar ChatGPT Mineduc Ccesa007.pdf
Demetrio Ccesa Rayme
 
Evaluacion del tercer trimestre del 2023-2024
Evaluacion del tercer trimestre del 2023-2024Evaluacion del tercer trimestre del 2023-2024
Evaluacion del tercer trimestre del 2023-2024
israelsouza67
 
Camus, Albert - El Extranjero.pdf
Camus, Albert -        El Extranjero.pdfCamus, Albert -        El Extranjero.pdf
Camus, Albert - El Extranjero.pdf
AlexDeLonghi
 
Planificación Ejemplo con la metodología TPACK
Planificación Ejemplo con la metodología  TPACKPlanificación Ejemplo con la metodología  TPACK
Planificación Ejemplo con la metodología TPACK
ssusera6697f
 
Inteligencia Artificial para Docentes HIA Ccesa007.pdf
Inteligencia Artificial para Docentes  HIA  Ccesa007.pdfInteligencia Artificial para Docentes  HIA  Ccesa007.pdf
Inteligencia Artificial para Docentes HIA Ccesa007.pdf
Demetrio Ccesa Rayme
 
ACERTIJO DESCIFRANDO CÓDIGO DEL CANDADO DE LA TORRE EIFFEL EN PARÍS. Por JAVI...
ACERTIJO DESCIFRANDO CÓDIGO DEL CANDADO DE LA TORRE EIFFEL EN PARÍS. Por JAVI...ACERTIJO DESCIFRANDO CÓDIGO DEL CANDADO DE LA TORRE EIFFEL EN PARÍS. Por JAVI...
ACERTIJO DESCIFRANDO CÓDIGO DEL CANDADO DE LA TORRE EIFFEL EN PARÍS. Por JAVI...
JAVIER SOLIS NOYOLA
 
efemérides del mes de junio 2024 (1).pptx
efemérides del mes de junio 2024 (1).pptxefemérides del mes de junio 2024 (1).pptx
efemérides del mes de junio 2024 (1).pptx
acgtz913
 
PPT_Servicio de Bandeja a Paciente Hospitalizado.pptx
PPT_Servicio de Bandeja a Paciente Hospitalizado.pptxPPT_Servicio de Bandeja a Paciente Hospitalizado.pptx
PPT_Servicio de Bandeja a Paciente Hospitalizado.pptx
gamcoaquera
 
SEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptx
SEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptxSEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptx
SEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptx
Osiris Urbano
 
Power Point: El espiritismo desenmascarado
Power Point: El espiritismo desenmascaradoPower Point: El espiritismo desenmascarado
Power Point: El espiritismo desenmascarado
https://gramadal.wordpress.com/
 
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
20minutos
 
Presentación de proyecto en acuarela moderna verde.pdf
Presentación de proyecto en acuarela moderna verde.pdfPresentación de proyecto en acuarela moderna verde.pdf
Presentación de proyecto en acuarela moderna verde.pdf
LuanaJaime1
 
Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLM
Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLMExamen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLM
Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLM
Juan Martín Martín
 
Soluciones Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinar...
Soluciones Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinar...Soluciones Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinar...
Soluciones Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinar...
Juan Martín Martín
 
La vida de Martin Miguel de Güemes para niños de primaria
La vida de Martin Miguel de Güemes para niños de primariaLa vida de Martin Miguel de Güemes para niños de primaria
La vida de Martin Miguel de Güemes para niños de primaria
EricaCouly1
 
Nuevos espacios,nuevos tiempos,nuevas practica.pptx
Nuevos espacios,nuevos tiempos,nuevas practica.pptxNuevos espacios,nuevos tiempos,nuevas practica.pptx
Nuevos espacios,nuevos tiempos,nuevas practica.pptx
lautyzaracho4
 
Docentes y el uso de chatGPT en el Aula Ccesa007.pdf
Docentes y el uso de chatGPT   en el Aula Ccesa007.pdfDocentes y el uso de chatGPT   en el Aula Ccesa007.pdf
Docentes y el uso de chatGPT en el Aula Ccesa007.pdf
Demetrio Ccesa Rayme
 
Examen de la EvAU 2024 en Navarra Latín.
Examen de la EvAU 2024 en Navarra Latín.Examen de la EvAU 2024 en Navarra Latín.
Examen de la EvAU 2024 en Navarra Latín.
amayaltc18
 

Último (20)

Guia Practica de ChatGPT para Docentes Ccesa007.pdf
Guia Practica de ChatGPT para Docentes Ccesa007.pdfGuia Practica de ChatGPT para Docentes Ccesa007.pdf
Guia Practica de ChatGPT para Docentes Ccesa007.pdf
 
Guia para Docentes como usar ChatGPT Mineduc Ccesa007.pdf
Guia para Docentes como usar ChatGPT  Mineduc Ccesa007.pdfGuia para Docentes como usar ChatGPT  Mineduc Ccesa007.pdf
Guia para Docentes como usar ChatGPT Mineduc Ccesa007.pdf
 
Evaluacion del tercer trimestre del 2023-2024
Evaluacion del tercer trimestre del 2023-2024Evaluacion del tercer trimestre del 2023-2024
Evaluacion del tercer trimestre del 2023-2024
 
Camus, Albert - El Extranjero.pdf
Camus, Albert -        El Extranjero.pdfCamus, Albert -        El Extranjero.pdf
Camus, Albert - El Extranjero.pdf
 
Planificación Ejemplo con la metodología TPACK
Planificación Ejemplo con la metodología  TPACKPlanificación Ejemplo con la metodología  TPACK
Planificación Ejemplo con la metodología TPACK
 
Inteligencia Artificial para Docentes HIA Ccesa007.pdf
Inteligencia Artificial para Docentes  HIA  Ccesa007.pdfInteligencia Artificial para Docentes  HIA  Ccesa007.pdf
Inteligencia Artificial para Docentes HIA Ccesa007.pdf
 
ACERTIJO DESCIFRANDO CÓDIGO DEL CANDADO DE LA TORRE EIFFEL EN PARÍS. Por JAVI...
ACERTIJO DESCIFRANDO CÓDIGO DEL CANDADO DE LA TORRE EIFFEL EN PARÍS. Por JAVI...ACERTIJO DESCIFRANDO CÓDIGO DEL CANDADO DE LA TORRE EIFFEL EN PARÍS. Por JAVI...
ACERTIJO DESCIFRANDO CÓDIGO DEL CANDADO DE LA TORRE EIFFEL EN PARÍS. Por JAVI...
 
efemérides del mes de junio 2024 (1).pptx
efemérides del mes de junio 2024 (1).pptxefemérides del mes de junio 2024 (1).pptx
efemérides del mes de junio 2024 (1).pptx
 
PPT_Servicio de Bandeja a Paciente Hospitalizado.pptx
PPT_Servicio de Bandeja a Paciente Hospitalizado.pptxPPT_Servicio de Bandeja a Paciente Hospitalizado.pptx
PPT_Servicio de Bandeja a Paciente Hospitalizado.pptx
 
SEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptx
SEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptxSEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptx
SEMIOLOGIA DE HEMORRAGIAS DIGESTIVAS.pptx
 
Power Point: El espiritismo desenmascarado
Power Point: El espiritismo desenmascaradoPower Point: El espiritismo desenmascarado
Power Point: El espiritismo desenmascarado
 
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
Examen de Lengua Castellana y Literatura de la EBAU en Castilla-La Mancha 2024.
 
Presentación de proyecto en acuarela moderna verde.pdf
Presentación de proyecto en acuarela moderna verde.pdfPresentación de proyecto en acuarela moderna verde.pdf
Presentación de proyecto en acuarela moderna verde.pdf
 
A VISITA DO SENHOR BISPO .
A VISITA DO SENHOR BISPO                .A VISITA DO SENHOR BISPO                .
A VISITA DO SENHOR BISPO .
 
Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLM
Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLMExamen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLM
Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLM
 
Soluciones Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinar...
Soluciones Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinar...Soluciones Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinar...
Soluciones Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinar...
 
La vida de Martin Miguel de Güemes para niños de primaria
La vida de Martin Miguel de Güemes para niños de primariaLa vida de Martin Miguel de Güemes para niños de primaria
La vida de Martin Miguel de Güemes para niños de primaria
 
Nuevos espacios,nuevos tiempos,nuevas practica.pptx
Nuevos espacios,nuevos tiempos,nuevas practica.pptxNuevos espacios,nuevos tiempos,nuevas practica.pptx
Nuevos espacios,nuevos tiempos,nuevas practica.pptx
 
Docentes y el uso de chatGPT en el Aula Ccesa007.pdf
Docentes y el uso de chatGPT   en el Aula Ccesa007.pdfDocentes y el uso de chatGPT   en el Aula Ccesa007.pdf
Docentes y el uso de chatGPT en el Aula Ccesa007.pdf
 
Examen de la EvAU 2024 en Navarra Latín.
Examen de la EvAU 2024 en Navarra Latín.Examen de la EvAU 2024 en Navarra Latín.
Examen de la EvAU 2024 en Navarra Latín.
 

PKP datos abiertos Gómez - Bueno-De-La-Fuente

  • 1. Cerrando el círculo: requisitos de los datos abiertos como recursos para la investigación abierta PKP Scholarly Publishing Conference 2013 Universidad Nacional Autónoma de México 20 Agosto 2013 Nancy Diana Gómez Gema Bueno de La Fuente Universidad Carlos III de Madrid
  • 2. Contenido  Preguntas de investigación  Objetivos  Contexto  Propuesta de metodología  Datos de los repositorios de Ciencias Sociales  Observaciones preliminares. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 3. Preguntas de investigación Métricas de datos abiertos:  ¿Cuáles son las condiciones técnico/legales que se deben cumplir para saber si un dato es abierto?  ¿Es posible establecer métricas para medir el nivel de apertura de los datos? Set de datos en repositorios de Ciencias Sociales:  ¿Qué datos se están publicando en los repositorios de Ciencias Sociales como open data?  ¿Qué nivel de apertura legal y técnico tienen los datos de los repositorios de Ciencias Sociales? 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 4. Objetivos  Diseño de la metodología para evaluar el grado de apertura de datos en repositorios de Ciencias Sociales de acuerdo a sus condiciones legales y técnicas.  Comprobación de la validez de la metodología con un conjunto seleccionado de datos abiertos del área de Ciencias Sociales. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 6. ¿Porqué Ciencia Abierta? (Stodden, 2011) Facilita Reproductibilidad Innovación académica e industria Acceso al conocimiento 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 7. Razones para compartir datos (Borgman, 2012) 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 8. Ciclo del dato (ICPSR, 2012) 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 9. Incentivos que influencian la publicación y difusión de los datos (Stodden, 2011) Fondos de investigación (NSF, NIH, etc.) Editoriales de revistas (PLOSone) Promociones institucionales (premios, promociones, etc.) Integridad científica 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 10. Motivos que disuaden a los científicos en la publicación de datos abiertos (Stodden, 2010)  Tiempo en documentar y limpiar datos para publicar (54%)  Lidiar con preguntas de los usuarios de los datos (34%)  No recibir atribución o citación como autores de los datos (42%)  Barreras legales –copyright (41%)  Perdida potencial de futuras publicaciones (35%)  Ventaja que pueden obtener los competidores en el campo (33%) 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 11. Las revistas y los datos (Stodden, 2013)  Estudio realizado sobre 170 revistas de computación ISI.     62% no menciona política de datos 79% no menciona política sobre el código/programa 66% tiene política para material suplementario Las revistas que incrementan demandas a sus autores, como datos son aquellas que tienen alto factor de impacto.  La proporción de revistas de AA con política de datos abiertos es levemente superior a las de suscripción 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 12. Formas de simplificar la reutilización de los datos (White et al., 2013)  Proveer metadatos  Usar formatos de datos estándar  Proveer el dato de forma no procesada o cruda  Uso de un repositorio establecido  Uso de una licencia abierta y establecida (usar la licencia más abierta posible) como CC0 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 13. Recomendaciones (White et al. 2013)  Datos bien documentados son más fáciles de comprender para reutilizar  Datos con formatos apropiados son más fáciles de usar en una variedad de software.  Datos que han sido depositado en repositorios establecidos, más durables y citables. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 14. Datos abiertos y procesamiento  Estándares y buenas prácticas de citación para los datos (Datacite.org).  Uso de identificadores únicos de conjuntos de datos (DOI) y productores (ORCID).  Metadatos de calidad para la descripción de datasets en catálogos de datos (DCAT).  Integración de catálogos Open Data con otras herramientas (metabúsqueda).  Dataverse Network – 2006 - IQCSS (Guía para gestión de los datos-2012 5th edición) Permite a los autores subir código y datos con sus propios términos de uso. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 16. Combinación de métodos 1. Medición del nivel de apertura de datos a nivel legal y técnico:  Diseño de matriz de priorización  Convalidación de los pesos de la matriz: crowdsourcing.  2. Recogida y tratamiento de datos abiertos. 3. Caracterización de los datos de repositorios en CCSS. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 17. Matriz de evaluación (BETA) Matriz de priorización Variables consideradas: 1. Instrumento legal (copyright, licencias, aviso legal).  Korn y Oppenheim (2011). 2. Formatos de ficheros de datos:  Norma ISO 2145/2010.  Clasificación de cinco estrellas LOD de T. Berners Lee. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 18. Asignación de pesos a las variables ¿80%? 4th Int. PKP Conference, México ¿20%? N. D. Gómez, G. Bueno (2013)
  • 19. Variable 1: Instrumento legal (Korn & Oppenheim, 2011) Quién y bajo que términos se puede utilizar el dato Cualquiera 10 Restricción para usos comerciales 5 Posibilidad de modificación del dato Sin restricciones de ningún tipo 10 Sin restricciones pero con atribución 7 Compartir igual 3 No se modifican 0 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 20. Variable 2: Formatos Escala LOD 5 estrellas (Berners Lee, 2010) 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 21. Formula Valor licencia Valor formato Grado apertura (U x 0,3 + M x 0,5) + (pF x 0,2) = 0-1 Términos de uso: U Posibilidad de modificación del dato: M Valor promedio de formato: pF 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 22. Selección de la muestra  Conjuntos de datos en CCSS.  Criterios de selección:  Data Citation Index:http://wokinfo.com//products _tools/multidisciplinary/dci/  Categoría CCSS.  >100 datasets Repositorio Organismo Archaeological Data Service University of York National Archives U.S. National Archives and Records Administration IQSS The Dataweb Eurostat Australian Data Archive UK Data Archive Finnish Social Science Data Archive Inter University Consortium for Political and Social Research Harvard University US Census Bureau European Union Australian National University University of Essex University of Tampere University of Michigan Odum Insitute, University of North Carolina Office for National Statistics UK Statistics Authority Roper Center  Volumen muestra: 13 repositorios Odum Institute Roper Center, University of Connecticut National Research N. D. Gómez, G. Bueno (2013) Foundation South African Data Archive 4th Int. PKP Conference, México
  • 23. Datos en Ciencias Sociales  Investigación en CCSS: diseño-recolección-análisis. Los datos son la materia prima.  Métodos de obtención de datos: observación, encuestas, documentación, experimentación.  Tipos de métodos tipos de datos  formatos  Cuantitativos: paquetes estadísticos, hojas de cálculo y texto tabulado  Datos estructurados.  Cualitativos: amplio rango de contenidos y formatos (texto, imagen, video, audio y otra documentación).  Retos para su publicación como datos abiertos:  Normalización, integración, redundancia…  Aspectos éticos y legales. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 24. Características de la muestra  Repositorios de organismos de la administración pública principalmente.  Datos estadísticos, censales y otros estudios.  Dataverse Network.  Registros metadatos datasets: DDI XML  Opciones descarga datos: API, FTP y descarga en lotes, exportar en XLS y otros formatos.  Niveles de acceso a los datos: abierto, especial y restringido.  Licencias de descarga, solicitudes formales. 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 26. Variable 1: Instrumento legal  Escasez de licencias explícitas asociadas a los datasets  Términos/condiciones generales de acceso y uso.  Repositorios admin. pública: los más abiertos, dominio público (Eurostat, US. Census Bureau, US NARA, US NASA…)  Repositorios de investigación (auto-depósito): condiciones establecidas por autores/propietarios datasets, financiadores (Australian Data Archive, UK Data Archive, ICPSR, IQSS, )  Licencias en relación con el nivel de acceso a los datasets.  Limitaciones de uso y reutilización (no comercial, sólo investigación y académicos), restricciones (confidencialidad, intimidad), condiciones (citación). 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 27. Variable 2: Formatos Formatos más comunes de los datos cuantitativos en CCSS : ★★ SPSS, SAS, Stata… Sistemas propietarios, posibilidad de exportar en otros formatos. ★★ .xls (MS Excel) ★★★ R (open source) ★★★ .csv, .tsv, xml ★★★★ .sdmx-ml 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)
  • 28. Próximos pasos…  Reformulación de la matriz teniendo en cuenta otras variables, como nivel de accesibilidad, interoperabilidad, documentación adicional o material explicativo.  Convalidación de la nueva matriz a través de crowdsourcing con infomediarios  Obtención de un grupo de datos en Ciencias Sociales para aplicar la nueva matriz.  Dimensiones de los datos: Grado de apertura. Grado de interoperabilidad. Grado de reutilización.
  • 29. Bibliografía  Berners-Lee, T. (2009). Putting government data online. Retrieved agosto/5, 2012, from http://www.w3.org/DesignIssues/GovData.html  Borgman, C. L. (2012). The conundrum of sharing research data. Journal of the American Society for Information Science and Technology, 63(6), 1059; 1059-1078; 1078.  Inter-university Consortium for Political and Social Research (ICPSR). (2012). Guide to social science data preparation and archiving: Best practice throughout the data life cycle (5th ed.). Ann Arbor, M:  Korn, N., & Oppenheim, C. (2011). Licensing open data: A practical guide. Jisc, v. 2.0 Retrieved from http://discovery.ac.uk/files/pdf/Licensing_Open_Data_A_Practical_Guide.pdf  Stodden, V. C. (2011). Transparency in scientific discovery: Innovation and knowledge dissemination. Retrieved from http://hdl.handle.net/10022/AC:P:13496  Stodden, V., Guo, P., & Ma, Z. (2013). Toward reproducible computational research: An empirical analysis of data and code policy adoption by journals. PloS One, 8(6), e67111.  White, E. P., Baldridge, E., Brym, Z. T., Locey, K. J., McGlinn, D. J., & Supp, S. R. (2013). Nine simple ways to make it easier to (re) use your data. Peerj Preprints, 1, e7. Retrieved from https://peerj.com/preprints/7/ 4th Int. PKP Conference, México N. D. Gómez, G. Bueno (2013)