SlideShare una empresa de Scribd logo
1 de 5
Descargar para leer sin conexión
Seminario sobre GeoKettle
Actividad 6
Enunciado del problema.
Se dispone de una URL en la web de la que se puede obtener información de
localización, descripción y datos climáticos de estaciones meteorológicas de aficionados
(Meteoclimatic). El URL del servidor del que se puede descargar la información en formato RSS
(XML) es: http://www.meteoclimatic.net/feed/rss/ESAND. A continuación se muestra la
primera parte del archivo para observar la estructura.
Se desea convertir esta información en un archivo CSV que preserve los atributos
almacenados en el documento RSS (XML) y las coordenadas de las estaciones.
Solución basada en GeoKettle:
Consideramos la creación de un trabajo o job y también de una transformación. El
trabajo consiste en un paso para establecer una conexión HTTP y recuperar el fichero RSS
(XML) de meteoclimatic y posteriormente arranca la trasformación.
La transformación recibe del trabajo dos variables, que contienen el nombre y
dirección del fichero a transformar y el nombre y dirección del fichero que se generará como
resultado de la transformación.
La trasformación abre el fichero XML que se obtiene del servidor HTTP, selecciona los
elementos del árbol XML con el patrón /rss/chanel/item y seleccione los atributos (en este
caso alguno de los atributos del elemento item). Como último elemento de esta
transformación es almacenar los datos en un archivo de texto separado por comas (CSV). Esta
última etapa se podría haber sustituido por una cadena de 4 pasos para generar un archivo
Shapefile en vez del archivo de texto (generar el atributo con la geometría a partir de la
longitud y latitud, adaptar el tipo de dato para la geometría a formato Geometria, asignar el
sistema de coordenadas (SRID de la geometría) y finalmente almacenar el contenido en el
documento shapefile).
A continuación mostramos el trabajo o Job:
El paso de definir variables debe contener la dirección del archivo que almacenará el
XML resultado de la consulta HTTP y la dirección del archivo que se generará como resultado
de la transformación:
El paso de HTTP se define con la siguiente información:
El último paso del trabajo invoca a la transformación:
La transformación invocada es muy simple, su estructura se muestra ne la siguiente figura:
El primer paso procesa el documento XML con los datos de las estaciones meteorológicas. Se
selecciona como fuente de datos la variable definida como ${rssFile}
También hay que indicar en Content el patrón de árbol de etiquetas XML a utilizar
(/rss/chanel/ítem). Como se puede apreciar no se puede usar la herramienta GetXpathNodes
que en otras ocasiones resulta tan útil.
En tercer lugar hay que indicar en la solapa Fields los nodos, atributos y tipos de datos se
pretende recuperar. Tampoco se puede usar la herramienta Get Fields que nos hubiera
ayudado a entender la estructura del documento. Seleccionaremos algunos de los atributos
como se muestra en la siguiente figura.
Finamente la etapa de almacenamiento de los datos en un archivo CSV. Se selecciona un paso
de tipo Salida de Fichero de Texto, y se establece el archivo donde almacenar los datos como la
variable que hemos definido como ${resultFile}.
También los atributos que se incluirán en él, así como el separador entre atributos, si se
incluyen las comillas para texto, si se incluyen cabecera con los nombres de los atributos, etc.

Más contenido relacionado

Similar a Actividad 6 (20)

Kettle. Recuperación y Procesado de datos.2012
Kettle. Recuperación y Procesado de datos.2012Kettle. Recuperación y Procesado de datos.2012
Kettle. Recuperación y Procesado de datos.2012
 
Apache Camel - Parte II
Apache Camel - Parte IIApache Camel - Parte II
Apache Camel - Parte II
 
DCdot
DCdotDCdot
DCdot
 
Desarrollo de Apps Web en Ruby on Rails
Desarrollo de Apps Web en Ruby on RailsDesarrollo de Apps Web en Ruby on Rails
Desarrollo de Apps Web en Ruby on Rails
 
Active x data object ado.net
Active x data object ado.netActive x data object ado.net
Active x data object ado.net
 
Data frame
Data frameData frame
Data frame
 
Resulset
ResulsetResulset
Resulset
 
SQL_ADO.NET.ppt
SQL_ADO.NET.pptSQL_ADO.NET.ppt
SQL_ADO.NET.ppt
 
SQL_ADO.NET.pptx
SQL_ADO.NET.pptxSQL_ADO.NET.pptx
SQL_ADO.NET.pptx
 
Ajax
AjaxAjax
Ajax
 
10. Usando Datos Xml
10.  Usando Datos Xml10.  Usando Datos Xml
10. Usando Datos Xml
 
Almdedat
AlmdedatAlmdedat
Almdedat
 
D cdot
D cdotD cdot
D cdot
 
ADO
ADOADO
ADO
 
Expo
ExpoExpo
Expo
 
Desarrollo de Aplicaciones Web II - Sesión 03 - Formularios y Validaciones
Desarrollo de Aplicaciones Web II - Sesión 03 - Formularios y ValidacionesDesarrollo de Aplicaciones Web II - Sesión 03 - Formularios y Validaciones
Desarrollo de Aplicaciones Web II - Sesión 03 - Formularios y Validaciones
 
Oracle Logminer
Oracle LogminerOracle Logminer
Oracle Logminer
 
AJAX
AJAXAJAX
AJAX
 
Unidad 01 Tema 01 2022 LPI (1891).pdf
Unidad 01 Tema 01 2022 LPI (1891).pdfUnidad 01 Tema 01 2022 LPI (1891).pdf
Unidad 01 Tema 01 2022 LPI (1891).pdf
 
Lectura de un archivo xml de manera local en wp
Lectura de un archivo xml de manera local en wpLectura de un archivo xml de manera local en wp
Lectura de un archivo xml de manera local en wp
 

Último

ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...JAVIER SOLIS NOYOLA
 
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...JAVIER SOLIS NOYOLA
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfNancyLoaa
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxMaritzaRetamozoVera
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptxORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptxnandoapperscabanilla
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMarjorie Burga
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptxdeimerhdz21
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfAngélica Soledad Vega Ramírez
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSYadi Campos
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADauxsoporte
 
Criterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficiosCriterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficiosJonathanCovena1
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñotapirjackluis
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónLourdes Feria
 
PIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonablesPIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonablesYanirisBarcelDelaHoz
 

Último (20)

Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
 
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdf
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docx
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptxORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grande
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
 
Presentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza MultigradoPresentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza Multigrado
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
Criterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficiosCriterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficios
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
PIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonablesPIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonables
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 

Actividad 6

  • 1. Seminario sobre GeoKettle Actividad 6 Enunciado del problema. Se dispone de una URL en la web de la que se puede obtener información de localización, descripción y datos climáticos de estaciones meteorológicas de aficionados (Meteoclimatic). El URL del servidor del que se puede descargar la información en formato RSS (XML) es: http://www.meteoclimatic.net/feed/rss/ESAND. A continuación se muestra la primera parte del archivo para observar la estructura. Se desea convertir esta información en un archivo CSV que preserve los atributos almacenados en el documento RSS (XML) y las coordenadas de las estaciones. Solución basada en GeoKettle: Consideramos la creación de un trabajo o job y también de una transformación. El trabajo consiste en un paso para establecer una conexión HTTP y recuperar el fichero RSS (XML) de meteoclimatic y posteriormente arranca la trasformación. La transformación recibe del trabajo dos variables, que contienen el nombre y dirección del fichero a transformar y el nombre y dirección del fichero que se generará como resultado de la transformación. La trasformación abre el fichero XML que se obtiene del servidor HTTP, selecciona los elementos del árbol XML con el patrón /rss/chanel/item y seleccione los atributos (en este caso alguno de los atributos del elemento item). Como último elemento de esta transformación es almacenar los datos en un archivo de texto separado por comas (CSV). Esta última etapa se podría haber sustituido por una cadena de 4 pasos para generar un archivo
  • 2. Shapefile en vez del archivo de texto (generar el atributo con la geometría a partir de la longitud y latitud, adaptar el tipo de dato para la geometría a formato Geometria, asignar el sistema de coordenadas (SRID de la geometría) y finalmente almacenar el contenido en el documento shapefile). A continuación mostramos el trabajo o Job: El paso de definir variables debe contener la dirección del archivo que almacenará el XML resultado de la consulta HTTP y la dirección del archivo que se generará como resultado de la transformación: El paso de HTTP se define con la siguiente información: El último paso del trabajo invoca a la transformación:
  • 3. La transformación invocada es muy simple, su estructura se muestra ne la siguiente figura: El primer paso procesa el documento XML con los datos de las estaciones meteorológicas. Se selecciona como fuente de datos la variable definida como ${rssFile}
  • 4. También hay que indicar en Content el patrón de árbol de etiquetas XML a utilizar (/rss/chanel/ítem). Como se puede apreciar no se puede usar la herramienta GetXpathNodes que en otras ocasiones resulta tan útil. En tercer lugar hay que indicar en la solapa Fields los nodos, atributos y tipos de datos se pretende recuperar. Tampoco se puede usar la herramienta Get Fields que nos hubiera ayudado a entender la estructura del documento. Seleccionaremos algunos de los atributos como se muestra en la siguiente figura. Finamente la etapa de almacenamiento de los datos en un archivo CSV. Se selecciona un paso de tipo Salida de Fichero de Texto, y se establece el archivo donde almacenar los datos como la variable que hemos definido como ${resultFile}.
  • 5. También los atributos que se incluirán en él, así como el separador entre atributos, si se incluyen las comillas para texto, si se incluyen cabecera con los nombres de los atributos, etc.