SlideShare una empresa de Scribd logo
1 de 7
Descargar para leer sin conexión
UNIVERSIDAD CATÓLICA DE CUENCA
COMUNIDAD EDUCATIVA AL SERVICIO DEL PUEBLO
EXTENSION CAÑAR
CARRERA:
TECNOLOGIAS DE LA INFORMACIÓN
CÁTEDRA:
ARQUITECTURA DE DATOS EMPRESARIALES
TEMA:
RESUMEN OPENREFINE
CATEDRÁTICO:
ING. ANONIO CAJAMARCA
ESTUDIANTE:
CARLOS TENELEMA
CICLO:
SEXTO
CAÑAR – ECUADOR
Open Refine
Open Refine es una herramienta originalmente creada por Google para el manejo de bases
de datos. Nos permite limpiar bases de datos, exportarlas en diferentes formatos,
y arreglar y manejar las bases para un mejor uso. Actualmente el proyecto ya no es
financiado por Google y se encuentra como proyecto abierto
Instalación
Para su instalación, es decir, para descargarlo es muy sencillo; sólo basta con buscar la
página oficial: http://openrefine.org/download.html para posteriormente seguir las
instrucciones. Adjuntar que, funciona en todas las plataformas: Windows, Mac y Linux.
Hay que tomar en cuenta que la aplicación se ejecuta localmente y que sus datos no se
almacenan en línea. Para poder acceder a la aplicación es necesario tener el software
libre de java.
Open Refine se ejecuta localmente en el ordenador que se instala y no cuenta con una
interfaz de usuario, además, de que los datos que se utilizan no son subidos a la red ni
pueden ser vistos por terceros.
Importación de datos con OpenRefine
Es necesario importar los datos para comenzar a utilizar esta aplicación, es decir, subir
el archivo de datos.
Formatos que soporta:
▪ TSV, CSV, o valores separados por un separador personalizado que especifique.
▪ Excel (XLS, XLSX)
▪ XML, RDF como XML
▪ JSON
▪ Google Spreadsheets
▪ RDF N3 triplica
Cuando un archivo se importa con extensión .zip, .tar.gz, .tgz, tar.bz, .gz o .bz2,
OpenRefine detecta la extensión de archivo más común en ella y carga todos los
archivos con esa extensión en un solo proyecto. También puede señalar OpenRefine a
una URL de un archivo de datos o una hoja de cálculo de Google.
Operaciones Básicas
Conversión de mayúsculas/ minúsculas
Para esto se da clic en Edit Cells >Common Transforms >To title case, To upper case,
o To lowercase.
Eliminación espacios en blanco
Se da clic en Edit Cells >Commons transforms >Trim leading and trailing whitespace.
Facet
Es un filtro que muestran algunas inconsistencias, es decir, indica aquellas palabras que
se repiten o que estan mal escritas.
Se da clic en Facet >Text. Esta herramienta de OpenRefina se utiliza manualmente.
En la columna izquierda de OpenRefine muestran unas facetas o filtros con todos los
valores distintos de la columna, así como el número de repeticiones de cada valor. Los
valores también se pueden ordenar por número de repeticiones, se selecciona la opción
count.
Para corregir errores e inconsistencias generados cuando se capturan distintos datos,
existen dos formas. La primera es seleccionando Edit con el botón derecho. La segunda
es seleccionando Edit y solo pasar el cursor por encima del valor de la faceta del lado
izquierdo.
Con cualquiera de los dos métodos se puede corregir el error. Para guardar el cambio,
se selecciona el botón Apply. También es posible buscar y corregir aquellas palabras
repetidas o que contengan algún error y son diferentes de los demás. Sin embargo, si la
palabra se repitiera más de una vez, Refine dará la opción de aplicar el cambio en todos
los casos con la pestaña de Apply to all identical Cells.
Organización de columnas
Para realizarlo de forma más rápida y visualizar todas las columnas, se selecciona en
All y se da clic en Edit columns >Re-Order/Remove.
Es necesario seleccionar la pestaña de cada columna y arrastrarla de tala manera que el
usuario pueda reordenarlas fácilmente.
Eliminación de espacios consecutivos
Se selecciona en cualquiera de las columnas, Edit cells >Commun transforms
>Collapse consecutive whitespace.
Filtrado de valores en blanco
Se utiliza para observar si las celdas contienen registros en blanco. Este procedimiento
se realiza tomando una columna, posteriormente se selecciona Facet >Customized
facets >Facet by blank. Después aparecerá una nueva ventana, la cual mostrará
aquellas celdas que estén en blanco, así como el número de registros en blanco, esta
aparecerá en la parte inferior izquierda
Arquitectura de datos empresariales   resumen openrefine

Más contenido relacionado

La actualidad más candente

Curso basico access
Curso basico accessCurso basico access
Curso basico accessnormita1974
 
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)Karina Lucio
 
Conceptos de terminos bi
Conceptos de terminos biConceptos de terminos bi
Conceptos de terminos biLucia Mendez
 
Proyecto Final Base De Datos
Proyecto Final Base De DatosProyecto Final Base De Datos
Proyecto Final Base De Datosguestcde16b
 
Data Mart de una área de compras
Data Mart de una área de comprasData Mart de una área de compras
Data Mart de una área de comprasroy_vs
 
Base de datos 5
Base de datos 5Base de datos 5
Base de datos 5eduardo503
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Calzada Meza
 
Base de datos
Base de datosBase de datos
Base de datosAguNacho
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningNintendo
 
DATA WAREHOUSE
DATA WAREHOUSEDATA WAREHOUSE
DATA WAREHOUSEGrupo Dos
 
Clase 10-bases de datos
Clase 10-bases de datosClase 10-bases de datos
Clase 10-bases de datosarturo8888
 
Informe v2.1 Base de Datos II - Proyecto TodoAutos : venta de carros del año
Informe v2.1  Base de Datos II - Proyecto TodoAutos : venta de carros del añoInforme v2.1  Base de Datos II - Proyecto TodoAutos : venta de carros del año
Informe v2.1 Base de Datos II - Proyecto TodoAutos : venta de carros del añoJuan Polo Cosme
 

La actualidad más candente (18)

Base de datos
Base de datosBase de datos
Base de datos
 
Curso basico access
Curso basico accessCurso basico access
Curso basico access
 
access
accessaccess
access
 
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
 
Conceptos de terminos bi
Conceptos de terminos biConceptos de terminos bi
Conceptos de terminos bi
 
Proyecto Final Base De Datos
Proyecto Final Base De DatosProyecto Final Base De Datos
Proyecto Final Base De Datos
 
Data Mart de una área de compras
Data Mart de una área de comprasData Mart de una área de compras
Data Mart de una área de compras
 
Guia 1
Guia 1Guia 1
Guia 1
 
Base de datos 5
Base de datos 5Base de datos 5
Base de datos 5
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1
 
Base de datos
Base  de datosBase  de datos
Base de datos
 
Repaso
RepasoRepaso
Repaso
 
Base de datos
Base de datosBase de datos
Base de datos
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
DATA WAREHOUSE
DATA WAREHOUSEDATA WAREHOUSE
DATA WAREHOUSE
 
Clase 10-bases de datos
Clase 10-bases de datosClase 10-bases de datos
Clase 10-bases de datos
 
Pris
PrisPris
Pris
 
Informe v2.1 Base de Datos II - Proyecto TodoAutos : venta de carros del año
Informe v2.1  Base de Datos II - Proyecto TodoAutos : venta de carros del añoInforme v2.1  Base de Datos II - Proyecto TodoAutos : venta de carros del año
Informe v2.1 Base de Datos II - Proyecto TodoAutos : venta de carros del año
 

Similar a Arquitectura de datos empresariales resumen openrefine

Similar a Arquitectura de datos empresariales resumen openrefine (20)

Manual de usuario Regisoft Activos Fijos
Manual de usuario Regisoft Activos FijosManual de usuario Regisoft Activos Fijos
Manual de usuario Regisoft Activos Fijos
 
Manual para visual_c_luis_ocampo
Manual para visual_c_luis_ocampoManual para visual_c_luis_ocampo
Manual para visual_c_luis_ocampo
 
Tutoriales eclipse(2)
Tutoriales eclipse(2)Tutoriales eclipse(2)
Tutoriales eclipse(2)
 
Open office calc
Open office calcOpen office calc
Open office calc
 
Tutorial de code(2)(2)
Tutorial de code(2)(2)Tutorial de code(2)(2)
Tutorial de code(2)(2)
 
Tutorial de Code::Blocks
Tutorial de Code::BlocksTutorial de Code::Blocks
Tutorial de Code::Blocks
 
TAREA 2: LOS SISTEMAS OPERATIVOS
TAREA 2: LOS SISTEMAS OPERATIVOSTAREA 2: LOS SISTEMAS OPERATIVOS
TAREA 2: LOS SISTEMAS OPERATIVOS
 
Selenium ff
Selenium ffSelenium ff
Selenium ff
 
Code bloks tutorial_terminado
Code bloks tutorial_terminadoCode bloks tutorial_terminado
Code bloks tutorial_terminado
 
Code bloks tutorial_terminado
Code bloks tutorial_terminadoCode bloks tutorial_terminado
Code bloks tutorial_terminado
 
Administracion de-sistemas-operativos apuntes-v2-4
Administracion de-sistemas-operativos apuntes-v2-4Administracion de-sistemas-operativos apuntes-v2-4
Administracion de-sistemas-operativos apuntes-v2-4
 
UNIDAD 4
UNIDAD 4UNIDAD 4
UNIDAD 4
 
tutorial de eclipse
tutorial de eclipsetutorial de eclipse
tutorial de eclipse
 
Phpstorm exposicion-villacres-michilena-alisson
Phpstorm exposicion-villacres-michilena-alissonPhpstorm exposicion-villacres-michilena-alisson
Phpstorm exposicion-villacres-michilena-alisson
 
Guia rapida-spss-windows-6704
Guia rapida-spss-windows-6704Guia rapida-spss-windows-6704
Guia rapida-spss-windows-6704
 
Uapa tarea
Uapa tareaUapa tarea
Uapa tarea
 
Unidad 3
Unidad 3Unidad 3
Unidad 3
 
Unidad 3
Unidad 3Unidad 3
Unidad 3
 
7 manual software pseint
7 manual software pseint7 manual software pseint
7 manual software pseint
 
Pseint
PseintPseint
Pseint
 

Último

Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 

Último (16)

Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 

Arquitectura de datos empresariales resumen openrefine

  • 1. UNIVERSIDAD CATÓLICA DE CUENCA COMUNIDAD EDUCATIVA AL SERVICIO DEL PUEBLO EXTENSION CAÑAR CARRERA: TECNOLOGIAS DE LA INFORMACIÓN CÁTEDRA: ARQUITECTURA DE DATOS EMPRESARIALES TEMA: RESUMEN OPENREFINE CATEDRÁTICO: ING. ANONIO CAJAMARCA ESTUDIANTE: CARLOS TENELEMA CICLO: SEXTO CAÑAR – ECUADOR
  • 2. Open Refine Open Refine es una herramienta originalmente creada por Google para el manejo de bases de datos. Nos permite limpiar bases de datos, exportarlas en diferentes formatos, y arreglar y manejar las bases para un mejor uso. Actualmente el proyecto ya no es financiado por Google y se encuentra como proyecto abierto Instalación Para su instalación, es decir, para descargarlo es muy sencillo; sólo basta con buscar la página oficial: http://openrefine.org/download.html para posteriormente seguir las instrucciones. Adjuntar que, funciona en todas las plataformas: Windows, Mac y Linux. Hay que tomar en cuenta que la aplicación se ejecuta localmente y que sus datos no se almacenan en línea. Para poder acceder a la aplicación es necesario tener el software libre de java. Open Refine se ejecuta localmente en el ordenador que se instala y no cuenta con una interfaz de usuario, además, de que los datos que se utilizan no son subidos a la red ni pueden ser vistos por terceros. Importación de datos con OpenRefine Es necesario importar los datos para comenzar a utilizar esta aplicación, es decir, subir el archivo de datos. Formatos que soporta: ▪ TSV, CSV, o valores separados por un separador personalizado que especifique. ▪ Excel (XLS, XLSX) ▪ XML, RDF como XML ▪ JSON ▪ Google Spreadsheets ▪ RDF N3 triplica Cuando un archivo se importa con extensión .zip, .tar.gz, .tgz, tar.bz, .gz o .bz2, OpenRefine detecta la extensión de archivo más común en ella y carga todos los archivos con esa extensión en un solo proyecto. También puede señalar OpenRefine a una URL de un archivo de datos o una hoja de cálculo de Google. Operaciones Básicas Conversión de mayúsculas/ minúsculas Para esto se da clic en Edit Cells >Common Transforms >To title case, To upper case, o To lowercase.
  • 3. Eliminación espacios en blanco Se da clic en Edit Cells >Commons transforms >Trim leading and trailing whitespace. Facet Es un filtro que muestran algunas inconsistencias, es decir, indica aquellas palabras que se repiten o que estan mal escritas. Se da clic en Facet >Text. Esta herramienta de OpenRefina se utiliza manualmente.
  • 4. En la columna izquierda de OpenRefine muestran unas facetas o filtros con todos los valores distintos de la columna, así como el número de repeticiones de cada valor. Los valores también se pueden ordenar por número de repeticiones, se selecciona la opción count. Para corregir errores e inconsistencias generados cuando se capturan distintos datos, existen dos formas. La primera es seleccionando Edit con el botón derecho. La segunda es seleccionando Edit y solo pasar el cursor por encima del valor de la faceta del lado izquierdo.
  • 5. Con cualquiera de los dos métodos se puede corregir el error. Para guardar el cambio, se selecciona el botón Apply. También es posible buscar y corregir aquellas palabras repetidas o que contengan algún error y son diferentes de los demás. Sin embargo, si la palabra se repitiera más de una vez, Refine dará la opción de aplicar el cambio en todos los casos con la pestaña de Apply to all identical Cells. Organización de columnas Para realizarlo de forma más rápida y visualizar todas las columnas, se selecciona en All y se da clic en Edit columns >Re-Order/Remove. Es necesario seleccionar la pestaña de cada columna y arrastrarla de tala manera que el usuario pueda reordenarlas fácilmente.
  • 6. Eliminación de espacios consecutivos Se selecciona en cualquiera de las columnas, Edit cells >Commun transforms >Collapse consecutive whitespace. Filtrado de valores en blanco Se utiliza para observar si las celdas contienen registros en blanco. Este procedimiento se realiza tomando una columna, posteriormente se selecciona Facet >Customized facets >Facet by blank. Después aparecerá una nueva ventana, la cual mostrará aquellas celdas que estén en blanco, así como el número de registros en blanco, esta aparecerá en la parte inferior izquierda