Transform
Realizado por:
Valeria Haro
Wilson Pérez
Agenda
Introducción
Elementos
Bibliografía
INTRODUCCIÓN
 Son herramientas que nos permiten
realizar transformaciones de datos.
 Estos ayudan a los ingresos y la carga de
datos información desde los archivos
externos para que puedan ser
procesados.
TRANSFORM
Add checksum
 Este paso calcula las sumas de comprobación
para uno o más campos en el flujo de entrada y
añade esto a la salida como un nuevo campo.
Resultados
configuración
Add Constant
 Este paso añade un campo constante al flujo.
Add sequence
 Este paso sólo agrega un valor de secuencia.
Configuración
Resultados
Add xml
 El paso de la columna XML permite codificar el
contenido de una serie de campos en una fila
en XML. Este XML se añade a la fila en la forma
de un campo de cadena.
Configuración
Resultados
Calculator
 Crea nuevos campos mediante la realización de
cálculos matemáticos.
Configuración
Resultados
Concat files
 Se utiliza para concatenar varios campos en un
solo campo destino.
Configuración
Resultados
Replace in string
 Reemplazar todas las apariciones de una
palabra en una cadena con otra palabra.
Configuración
Resultados
Number range.
 Crea ciertos rangos basados en un
campo numérico
Configuración
Resultados
Select Values
 Selección, cambio de nombre, cambio de
tipos de datos y la configuración de la
longitud y la precisión de los campos.
Select Values
Set field Values
 Remplaza los campos de una columna por
otra.
Set field Values
Sort rows
 Ordena las filas basándose en los campos
especificados y si deben ser ordenados en
orden ascendente o descendente.
Sort rows
Split field to row
 Permite dividir una fila que contiene un
campo delimitado en múltiples filas nuevas.
 La fila original no se entrega de resultado.
Split field to row
String operations
 Aplicar las operaciones, tales como el
recorte, relleno y otros, para el valor de
cadena.
String operations
String cut
 Permite cortar parte de una subcadena. Si
el campo designado está fuera de rango,
se devuelve blanco.
Unique rows
Unique rows
 Elimina las filas duplicadas de las entradas.
Unique rows
Value Mapper
 Mapea de un valor a otro.
Value Mapper
Flow
Dummy
 Permite visualizar la salida de datos.
Filter Rows
 Permite filtrar los datos de un flujo mientras
cumplan alguna condición
Filter Rows
Case
Append streams
Append streams
Stream lookup
Stream lookup
Merge Join
Merge Join
Combination lookup/update
Dimension lookup/update
Dimension lookup/update
Dimension lookup/update
Web services lookup
Web services lookup
Web services lookup
Bibliografía
 Pentaho Kettle Solutions- (Building Open Source ETL
Solutions with Pentaho Data Integration) - Matt
Casters/Roland Bouman/Jos van Dongen
 http://wiki.pentaho.com
 http://rpbouman.blogspot.com/2006/06/pentaho-
data-integration-kettle-turns.html

Elementos ETL - Kettle Pentaho