Este documento describe cómo comprender y mejorar los datos. Explica que es importante comprender plenamente los datos mediante preguntas sobre su tipo, características e impacto. También describe cómo los datos pueden tener información geográfica, temporal o cualitativa. Además, enfatiza la importancia de limpiar los datos para garantizar su coherencia antes del análisis, y cómo los datos pueden enriquecerse dividiendo, agregando o geocodificando campos.
3. COMPRENSIÓN DE LOS DATOS
Los datos de los que
disponéis podrían deciros
muchas cosas sobre el tema
que estáis observando.
4. COMPRENSIÓN DE LOS DATOS
Para que los datos «hablen», intentad comprenderlos
plenamente.
Plantearos estas preguntas:
● ¿De qué tipo de información se trata?
● ¿Cuáles son sus principales características?
● ¿Qué repercusión tienen sobre la situación?
5. COMPRENSIÓN DE LOS DATOS
Es importante:
● entender la naturaleza de los
datos,
● aprender cómo analizarlos
mediante algunas acciones
sencillas.
7. DATOS GEOGRÁFICOS
Los datos que empleáis para
vuestros proyectos podrían contener
información geográfica.
Por ejemplo, qué alcance tiene un
fenómeno en un determinado
territorio.
8. DATOS GEOGRÁFICOS
○ ¿A qué territorio se refieren? ¿Nacional, regional,
provincial o municipal?
○ ¿Qué relación existe entre el territorio y el proyecto
que habéis elegido o lo que estáis estudiando?
○ ¿Qué información adicional podríais recabar
analizando la información geográfica de vuestros
datos?
9. SERIES HISTÓRICAS
Los datos pueden permitir elaborar
análisis de la tendencia de un
fenómeno a lo largo del tiempo y
medir las variaciones (por ejemplo,
entre un mes y el siguiente, o entre un
año y el siguiente).
10. SERIES HISTÓRICAS: EJEMPLOS
¿La recogida selectiva de
residuos ha aumentado, ha
disminuido o ha
permanecido estable?
¿El número de turistas en
un territorio es constante
año tras año o ha habido
cambios?
¿El fenómeno que se
está examinando crece
o decrece (mes a mes,
por ejemplo)?
11. DATOS CUALITATIVOS
Estos son los datos que
definen la calidad
intrínseca y las
características de uno o
más elementos.
12. Por lo tanto, preguntaros:
¿cuáles son las características de los
datos que habéis recopilado o estáis
recopilando?,
¿Cuáles os interesan más?
14. LIMPIEZA DE LOS DATOS
Antes de analizar los datos, deben
realizarse algunos pasos para que sean
coherentes y para aprovechar al máximo
todas las características.
También existen métodos específicos para
esto.
Veamos…
15. LIMPIEZA DE LOS DATOS
Limpiar los datos es fundamental para garantizar
que las filas y columnas estén bien
estructuradas y que los valores introducidos sean
coherentes.
Analizar los datos sin limpiarlos podría provocar
errores graves o problemas imposibles de
gestionar.
Existen algunas herramientas para limpiar los
datos, como Open Refine (http://openrefine.org)
16. LIMPIEZA DE LOS DATOS
1
Comprobación de que los valores se
hayan introducido de la misma
manera.
Por ejemplo, si el valor «Medio
ambiente» también aparece como
«medio ambiente», y como «MEDIO
AMBIENTE», habrá errores. Los valores
deben estar todos escritos de la misma
manera.
17. LIMPIEZA DE LOS DATOS
2
Comprobación de las fechas (si se indican):
las fechas también deben estar escritas en un
formato homogéneo.
Habrá errores si algunas se introducen en
formato numérico (como 01/03/2015) y otras en
formato alfanumérico (como 10 de marzo de
2015). Las fechas deben tener un único formato:
cambiadlo utilizando la opción de Formato de
celdas.
18. LIMPIEZA DE LOS DATOS
3
Comprobación de la numeración.
Comprobad que los números estén representados
correctamente.
Comprobad el sistema de numeración empleando la
Configuración de la hoja de cálculo.
20. DIVISIÓN
Los datos deben ser granulares, como si fueran átomos.
Por ejemplo, si vuestros datos tienen una columna Lugares y existe un valor como:
«Cologno Monzese, provincia de Milán (Lombardía)», podría ser mejor dividir la
columna en otras tres columnas (Municipio + Provincia + Región). Así podréis
analizar por Municipio, Provincia, Región.
21. ADICIÓN
No puede darse por sentado que vuestro conjunto de
datos os proporcionará toda la información necesaria.
En algunos casos, podríais tener que enriquecerlo
añadiendo nuevas columnas con información
específica.
Puede que ya hayáis hecho esto siguiendo las
instrucciones anteriores, pero puede haber otras
formas de enriquecer un conjunto de datos…
22. GEOCODIFICACIÓN
Latitud Longitud
En el mismo ejemplo, después de haber dividido
la columna Lugar en tres columnas (Municipio,
Provincia, Región), puede ser útil introducir
Latitud y Longitud, y crear un mapa.
Para ello, deberemos insertar dos nuevas
columnas (Latitud y Longitud) y dibujar las
coordenadas geográficas del lugar de referencia.
LongitudLatitud
23. GEOCODIFICACIÓN
Las coordenadas se pueden encontrar por internet.
Existen muchas herramientas en la red: ¡buscadlas!
Aseguraos siempre de que los datos puedan reutilizarse (con
OpenStreetMap se puede, con GoogleMaps hay restricciones).