SlideShare una empresa de Scribd logo
1 de 11
OPEN REFINE PARA LA
PUBLICACIÓN Y VISIBILIDAD
DE DATASETS EN
REPOSITORIOS DE DATOS
Temas: Open Refine
OpenRefine
Software libre Mutiplataforma Autoejecutable
Limpieza de
datos
Estructuración
de datos
Codificación de
datos
Fomenta el
manejo de datos
Amplia
escalabilidad
Granularidad de
datos
OpenRefine
Con un formato tabular simple, puedes:
Obtener una visión general de un conjunto de datos
Resolver inconsistencias en los formatos de un conjunto de datos
Resolver inconsistencias en donde aparecen los datos
Resolver inconsistencias en la terminología utilizada en los datos
Dividir a los datos en partes más granulares.
Hacer coincidir los datos locales con otros conjuntos de datos
Enriquecer a un conjunto de datos con datos de otras fuentes
OpenRefine
Separar datos
combinados, en celdas
particulares
Escenarios comunes
◦ Corregir inconsistencias en el formato de los datos
Datos que tienes Datos deseados
1º enero 2020 2020-01-01
01/01/2020 2020-01-01
2020-01-01 2020-01-01
Ene 1 2020 2020-01-01
Datos que tienes Datos deseados
CDMX Ciudad de México
Ciudad de México] Ciudad de México
Mexico City,] Ciudad de México
mexico Ciudad de México
OpenRefine
◦ Agregar datos de una fuente de datos externa
Datos que tienes Fecha de nacimiento
disponible en VIAF
Fecha de muerte
disponible en VIAF
Borges, Jorge Luis 1899 1986
Monsivais, Carlos 1938 2010
Joyce, James 1882 1941
Morrison, Jim 1943 1971
OpenRefine
Filas de datos
Columnas de
datos
Nombre de
proyecto
Analizar datos
como:
Opciones de
codificación y
arreglo
OpenRefine
◦ Facetas:
◦ Ayudan a obtener una visión
general de los datos
◦ Ayudan a brindar más
consistencia a los datos
◦ Con las facetas
podemos:
◦ Agrupar todos los valores
comunes que aparecen en una
columna
◦ Filtrar los datos por estos
valores
◦ Editar valores en muchos
registros al mismo tiempo
◦ La información de faceta
aparece en el panel izquierdo
OpenRefine
◦ Arreglo de datos
◦ Ordenación
◦ Clasificación
◦ Codificación
OpenRefine
◦ Trabajo con entorno de
datos enlazados
◦ RDF
◦ SPARQL
OpenRefine
◦ Manejo de datos con
Wikidata Schema

Más contenido relacionado

La actualidad más candente (20)

Deber 1
Deber 1Deber 1
Deber 1
 
Trabajo 3225
Trabajo 3225Trabajo 3225
Trabajo 3225
 
Base de datos
Base de datosBase de datos
Base de datos
 
Camila gomez consulta
Camila gomez consultaCamila gomez consulta
Camila gomez consulta
 
Base de datos 11 3
Base de datos 11 3Base de datos 11 3
Base de datos 11 3
 
Gtes
GtesGtes
Gtes
 
2° parcialmarlyn massa
2° parcialmarlyn massa2° parcialmarlyn massa
2° parcialmarlyn massa
 
Trabajo access
Trabajo accessTrabajo access
Trabajo access
 
Access
AccessAccess
Access
 
Base de datos
Base de datosBase de datos
Base de datos
 
Mi Amor
Mi Amor Mi Amor
Mi Amor
 
Combinaciòn de correspondencia
Combinaciòn de correspondenciaCombinaciòn de correspondencia
Combinaciòn de correspondencia
 
TIPOS DE BASE DE DATOS
TIPOS DE BASE DE DATOSTIPOS DE BASE DE DATOS
TIPOS DE BASE DE DATOS
 
Microsoft access
Microsoft accessMicrosoft access
Microsoft access
 
Trabajo access
Trabajo accessTrabajo access
Trabajo access
 
Microsoft access
Microsoft accessMicrosoft access
Microsoft access
 
Base de datos
Base de datosBase de datos
Base de datos
 
Access
AccessAccess
Access
 
Resumen
ResumenResumen
Resumen
 
Base de datos segunda parte
Base de datos segunda parteBase de datos segunda parte
Base de datos segunda parte
 

Similar a T3. open refine

Discoverer Plus Basico
Discoverer Plus BasicoDiscoverer Plus Basico
Discoverer Plus Basico
zoolcito
 
Base de datos "primera parte"
Base de datos "primera parte"Base de datos "primera parte"
Base de datos "primera parte"
paola rincon
 
Plantilla con-normas-icontec 901
Plantilla con-normas-icontec 901Plantilla con-normas-icontec 901
Plantilla con-normas-icontec 901
Diego Maury Orcue
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Titiushko Jazz
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Titiushko Jazz
 
Base de datos-Primera Parte-
Base de datos-Primera Parte-Base de datos-Primera Parte-
Base de datos-Primera Parte-
SilviaRincon4
 
Unidad DidáCtica I Bases De Datos
Unidad DidáCtica I Bases De DatosUnidad DidáCtica I Bases De Datos
Unidad DidáCtica I Bases De Datos
ConfesorAD
 

Similar a T3. open refine (20)

Discoverer Plus Basico
Discoverer Plus BasicoDiscoverer Plus Basico
Discoverer Plus Basico
 
Dependiendo de los requerimientos de la base de datos
Dependiendo de los requerimientos de la base de datosDependiendo de los requerimientos de la base de datos
Dependiendo de los requerimientos de la base de datos
 
Base de datos "primera parte"
Base de datos "primera parte"Base de datos "primera parte"
Base de datos "primera parte"
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Plantilla con-normas-icontec 901
Plantilla con-normas-icontec 901Plantilla con-normas-icontec 901
Plantilla con-normas-icontec 901
 
Plantilla con-normas-icontec 901 recreada
Plantilla con-normas-icontec 901 recreadaPlantilla con-normas-icontec 901 recreada
Plantilla con-normas-icontec 901 recreada
 
Plantilla con-normas-icontec 901
Plantilla con-normas-icontec 901Plantilla con-normas-icontec 901
Plantilla con-normas-icontec 901
 
Clases BASE DE DATOS 2022.pptx
Clases BASE DE DATOS  2022.pptxClases BASE DE DATOS  2022.pptx
Clases BASE DE DATOS 2022.pptx
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
 
Access2019.pptx
Access2019.pptxAccess2019.pptx
Access2019.pptx
 
Base de datos-Primera Parte-
Base de datos-Primera Parte-Base de datos-Primera Parte-
Base de datos-Primera Parte-
 
Conceptos Generales de Bases de Datos
Conceptos Generales de Bases de DatosConceptos Generales de Bases de Datos
Conceptos Generales de Bases de Datos
 
Silvia
SilviaSilvia
Silvia
 
RECURSO DE DATOS
RECURSO DE DATOSRECURSO DE DATOS
RECURSO DE DATOS
 
RECURSO DE DATOS
RECURSO DE DATOSRECURSO DE DATOS
RECURSO DE DATOS
 
TIC I - Bases de datos
TIC I - Bases de datosTIC I - Bases de datos
TIC I - Bases de datos
 
Fundamentos de inteligencia de Negocios / Software Administrativo
Fundamentos de inteligencia de Negocios / Software AdministrativoFundamentos de inteligencia de Negocios / Software Administrativo
Fundamentos de inteligencia de Negocios / Software Administrativo
 
Base de datos yy.
Base de datos yy.Base de datos yy.
Base de datos yy.
 
Unidad DidáCtica I Bases De Datos
Unidad DidáCtica I Bases De DatosUnidad DidáCtica I Bases De Datos
Unidad DidáCtica I Bases De Datos
 

T3. open refine

  • 1. OPEN REFINE PARA LA PUBLICACIÓN Y VISIBILIDAD DE DATASETS EN REPOSITORIOS DE DATOS Temas: Open Refine
  • 2. OpenRefine Software libre Mutiplataforma Autoejecutable Limpieza de datos Estructuración de datos Codificación de datos Fomenta el manejo de datos Amplia escalabilidad Granularidad de datos
  • 3. OpenRefine Con un formato tabular simple, puedes: Obtener una visión general de un conjunto de datos Resolver inconsistencias en los formatos de un conjunto de datos Resolver inconsistencias en donde aparecen los datos Resolver inconsistencias en la terminología utilizada en los datos Dividir a los datos en partes más granulares. Hacer coincidir los datos locales con otros conjuntos de datos Enriquecer a un conjunto de datos con datos de otras fuentes
  • 5. Escenarios comunes ◦ Corregir inconsistencias en el formato de los datos Datos que tienes Datos deseados 1º enero 2020 2020-01-01 01/01/2020 2020-01-01 2020-01-01 2020-01-01 Ene 1 2020 2020-01-01 Datos que tienes Datos deseados CDMX Ciudad de México Ciudad de México] Ciudad de México Mexico City,] Ciudad de México mexico Ciudad de México
  • 6. OpenRefine ◦ Agregar datos de una fuente de datos externa Datos que tienes Fecha de nacimiento disponible en VIAF Fecha de muerte disponible en VIAF Borges, Jorge Luis 1899 1986 Monsivais, Carlos 1938 2010 Joyce, James 1882 1941 Morrison, Jim 1943 1971
  • 7. OpenRefine Filas de datos Columnas de datos Nombre de proyecto Analizar datos como: Opciones de codificación y arreglo
  • 8. OpenRefine ◦ Facetas: ◦ Ayudan a obtener una visión general de los datos ◦ Ayudan a brindar más consistencia a los datos ◦ Con las facetas podemos: ◦ Agrupar todos los valores comunes que aparecen en una columna ◦ Filtrar los datos por estos valores ◦ Editar valores en muchos registros al mismo tiempo ◦ La información de faceta aparece en el panel izquierdo
  • 9. OpenRefine ◦ Arreglo de datos ◦ Ordenación ◦ Clasificación ◦ Codificación
  • 10. OpenRefine ◦ Trabajo con entorno de datos enlazados ◦ RDF ◦ SPARQL
  • 11. OpenRefine ◦ Manejo de datos con Wikidata Schema