SlideShare una empresa de Scribd logo
Docente: Jessica Cardenas
3183534701
ylcardenas@uniquindio.edu.co
INGENIERÍA DE SISTEMAS Y COMPUTACIÓN
MUNDO DE LOS DATOS
¿Qué es la Estadistica ?
MUNDO DE LOS DATOS
Disciplina que recopila e
interpreta un conjunto
datos.
Es una ciencia y una rama de las matemáticas a
través de la cual se recolecta, analiza, describe y
estudian datos, a fin de establecer comparaciones o
variabilidades que permitan comprender un
fenómeno en particular.
Arte de aprender a partir de los
datos . Esto se logra adquiriendo
nuevos conocimientos.
Generación
Ya estan
MUNDO DE LOS DATOS
Datos
Recolección
Diseño
Experimentos
Estudio
Observacional
Descripción
A través de la
Estadistica Descriptiva
Analisis Inferencial
A través de la
Estadistica Inferencial
Organización
Representación
Resumen
Conclusiones usando
Modelos de Probabilidad
MUNDO DE LOS DATOS
IMPORTANTE
Se analiza un CONJUNTO DE DATOS; el
cual se obtiene de una situación real.
No se analiza BASE DE DATOS.
MUNDO DE LOS DATOS
Estadistica Descriptiva
Cómo estos valores o parametros brinda una
información general sobre un conjunto de datos?
Media
Mediana
Desviación Estandar
Cada uno de ellos reprensenta una caracteristica
especial sobre un conjunto de datos.
MUNDO DE LOS DATOS
Estadistica Inferencial
Enfocada a las estimaciones de la población, basado
en los parametros generados en una muestra.
Realiza aproximaciones de una muestra sobre los
comportamientos poblacional.
CONCEPTOS BASICOS DE ESTADISTICA
MUNDO DE LOS DATOS
Representa conjunto total de individuos de interes
Ej: Estudiantes de la universidad del Quindio
Población
Muestra
Sub conjunto de la población
Estrategia tomar al azar para que que no tenga Sesgo.
Estadistica Paramétrica
MUNDO DE LOS DATOS
PARAMÉTRICAS se basan en las leyes de distribución normal para
analizar los elementos de una muestra. Generalmente, solo se
aplican a variables numéricas y para su análisis debe mantener una
muestra grande, ya que permite que el cálculo sea más exacto
Estadistica Parametrica
MUNDO DE LOS DATOS
La distribución de probabilidad de
una variable aleatoria es una función
que asigna a cada suceso definido
sobre la variable, la probabilidad de
que dicho suceso ocurra
Estadistica No Paramétrica
MUNDO DE LOS DATOS
dos series de observaciones provienen de distintas poblaciones 
son aplicables a los datos jerarquizados
son la única alternativa cuando el tamaño de muestra es pequeño
son útiles a un nivel de significancia previamente especificado
son útiles al analizar valores perdidos 
son útiles al analizar datos categóricos
Se pueden usar cuando:
NO PARAMÉTRICAS son aquellas que se encargan de analizar datos que no tienen una
distribución particular y se basan una hipótesis, pero los datos no están organizados de
forma normal. Aunque tienen algunas limitaciones, cuentan con resultados estadísticos
ordenados que facilita su comprensión.
Estadistica Parametrica y No Parametrica
MUNDO DE LOS DATOS
Si los valores de una muestra afectan los valores de la otra
muestra, entonces las muestras son DEPENDIENTES
(Mismos elementos, momentos diferentes).
Si los valores de una muestra no revelan información sobre
los valores de la otra muestra, entonces las muestras son
INDEPENDIENTES.
Tener en cuenta
MUNDO DE LOS DATOS
MUNDO DE LOS DATOS
Es el conjunto de técnicas estadisticas cuya finalidad
es analizar simultaneamente un conjunto de datos
en el sentido que hay varias variables medidas para
un individuo u objeto estudiado
ESTADISTICA MULTIVARIADA
EJEMPLO DE ESTADISTICA MULTIVARIADA
MUNDO DE LOS DATOS
Radica en un mejor entendimiento del
fenomeno objeto de estudio obteniendo
información que los metodos estadisticos
univariantes y bivariantes NO son capaces de
conseguir
EJEMPLO DE ESTADISTICA MULTIVARIADA
ESTADISTICA MULTIVARIADA
MUNDO DE LOS DATOS
Preferencias de marcas
La Pobreza
Calidad del Servicio
Nivel de Satisfacción
Aprendizaje y percepción
Aptitudes, Perfil del consumidor
Gran parte de las investigaciones son de manera multivariada
debido a que los fenómenos que se desean explicar y estudiar son
complejos tales como:
ESTADISTICA MULTIVARIADA
MUNDO DE LOS DATOS
Métodos de
Dependencia
Técnicas Multivariantes
Métodos de
Interdependencia
Modelos
Estructural
En el Análisis Multivariante podemos encontrar dos tipos de variables: Variables
cuantitativas y las Variables cualitativas.
ESTADISTICA MULTIVARIADA
Métodos de dependencia: Son aquellas cuyo
comportamiento es explicado o pronosticado por una o más
variables independientes; es decir que son variables que para
ser explicadas necesitan de otras variables:
Ejemplo: Explicar las ventas en función de numerosas
variables independientes (número de vendedores, inversión
en publicidad, promoción, pago a los vendedores, viáticos).
ESTADISTICA MULTIVARIADA
Métodos de interdependencia: Son las que servirán para
explicar el fenómeno estudiado y en ocasiones se denominan
como variables explicativas, factores o variables proditorias.
Tratan de dar significado a un conjunto de variables o bien
tratan de agrupar las cosas.
Ejemplo: cuando se realizan estudios de segmentación
de mercados que estudian variables independientes
como: sexo, edad, ingresos etc.
MUESTADISTICA MULTIVARIADA
Modelos estructurales: Suponen que las variables
están divididas en dos grupos: el de las variables
dependientes y el de las independientes. El objetivo de
estos métodos es analizar, no sólo cómo las variables
independientes afectan a las variables dependientes,
sino también cómo están relacionadas las variables de
los dos grupos entre sí.
Cuantitava Cualitativa
ESTADISTICA MULTIVARIADA
Métodos de
Dependencia
Técnicas Multivariantes
Métodos de
Interdependencia Métodos
Estructural
Anaálisis de
Regresión
Analisis de
Supervivenvia
MANOVA
Correlación
Canónica
Anaálisis
Discriminante
Regresión Logística
Análisis Conjoint
Cuantitava Cualitativa
Anaálisis Cluster
Analisis Factorial
Escalas
Anaálisis de
Correspondencias
Modelos Log-
Lineales
MUNDO DE LOS DATOS
MUNDO DE LOS DATOS
KDD (Knowledge Discovery in Databases o
descubrir conocimiento en las bases de
datos): Hace referencia a un proceso,
compuesto de múltiples etapas, cuyo objetivo
principal es la extracción de conocimiento,con
un fin especifico, a partir de los datos a los
que se tiene acceso.
El proceso de KDD está estrechamente
relacionado con el aprendizaje
automático o machine learning (ML) y
también con la minería de datos o data
mining (DM). Son términos que, en
ocasiones, llegan a confundirse y
utilizarse de manera indistinta.
MUNDO DE LOS DATOS
En lo que sí hay coincidencia es en que las técnicas de ML son
posteriores en el tiempo a KDD y DM, y se centran más en la
construcción de los algoritmos que en la preparación de los datos
en sí. La finalidad de un algoritmo de ML es, explorar grandes
bases de datos, de manera automática o semiautomática, con el
objetivo de encontrar patrones repetitivos, tendencias o reglas
que expliquen el comportamiento de los datos en un determinado
contexto tomando como entrada patrones de datos, generar un
modelo que contiene el conocimiento extraído.
MUNDO DE LOS DATOS
En Fases del proceso de KDD
Atendiendo a la visión que fija la minería de datos como parte del KDD, este proceso constaría de las fases que se
observan en el siguiente esquema:
.
MUNDO DE LOS DATOS
Etapas del Procesamiento
.
MUNDO DE LOS DATOS
Descripción
Predicción
Segmentación
Análisis de dependencias
Detección de desviaciones
El proceso de minería involucra ajustar modelos o determinar patrones a
partir de datos. Este ajuste normalmente es de tipo estadístico, en el
sentido que se permite un cierto ruido o error dentro del modelo.
Los algoritmos de minería de datos realizan en general tareas de:
Los Algoritmos de Minería de Datos
MUNDO DE LOS DATOS
MUNDO DE LOS DATOS
BI o la inteligencia de negocios combina análisis de
negocios, minería, visualización, herramientas e
infraestructura de datos, además de prácticas
recomendadas para ayudar a las empresas a tomar
decisiones basadas en los datos. En la práctica,
implementar la inteligencia de negocios moderna
implica contar con una vista integral de todos los
datos de la organización. Además, consiste en usar
estos datos para impulsar el cambio, eliminar las
ineficiencias y adaptarse rápidamente a los
cambios del mercado o la demanda
Business Intelligence
MUNDO DE LOS DATOS
Es la combinación de algoritmos
planteados con el propósito de crear
máquinas que presenten las mismas
capacidades que el ser humanos. El
aprendizaje profundo es un
subconjunto de aprendizaje
automático en Inteligencia Artificial
(AI) que tiene redes capaces de
aprender sin supervisión a partir de
datos que no están estructurados ni
etiquetados. También conocido como
Deep Learning
Inteligencia Artificial
_Mundo de los Datos  (1).pdf

Más contenido relacionado

Similar a _Mundo de los Datos (1).pdf

Data mining
Data miningData mining
Data mining
Data miningData mining
Data mining
Karol Pardo
 
Data mining
Data miningData mining
Data mining
Karol Pardo
 
Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariado
AideeEspinoza3
 
Estadística y probabilidad power final robledo
Estadística y probabilidad power final robledoEstadística y probabilidad power final robledo
Estadística y probabilidad power final robledo
Alberto Christin
 
Documnot escrito tecnologia 2020
Documnot escrito tecnologia 2020Documnot escrito tecnologia 2020
Documnot escrito tecnologia 2020
luz stefany prieto ardila
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
Ana Delgado
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Jhon Danny Castro Condor
 
Análisis multivariante
Análisis multivarianteAnálisis multivariante
Análisis multivariante
Anet Vargas
 
Organizacion de Datos
Organizacion de DatosOrganizacion de Datos
Organizacion de Datos
josegonzalez1606
 
Que es la estadistica
Que es la estadisticaQue es la estadistica
Que es la estadistica
dannacortes5
 
Que es la estadistica
Que es la estadisticaQue es la estadistica
Que es la estadistica
dannacortes5
 
Electiva iii parcial 2 - 02-minería de datos
Electiva iii   parcial 2 - 02-minería de datosElectiva iii   parcial 2 - 02-minería de datos
Electiva iii parcial 2 - 02-minería de datos
Arlin11
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Yolanda Uruchima
 
Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariado
JhonatanAbsalonColqu
 
Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
Bryan Barragan
 
Presentacion jose felix rodriguez 26632429 escalas de medicion
Presentacion jose felix rodriguez 26632429 escalas de medicionPresentacion jose felix rodriguez 26632429 escalas de medicion
Presentacion jose felix rodriguez 26632429 escalas de medicion
JOSEFELIX94
 
Tecnologia luisa fda
Tecnologia luisa fdaTecnologia luisa fda
Tecnologia luisa fda
LuisaCarrillo12
 
Excel avanzado, liceo departamental grado once uno
Excel avanzado, liceo departamental grado once unoExcel avanzado, liceo departamental grado once uno
Excel avanzado, liceo departamental grado once uno
Nombre Apellidos
 
Excel avanzado- 11-1 taller #1 Liceo departamental
Excel avanzado- 11-1 taller #1 Liceo departamentalExcel avanzado- 11-1 taller #1 Liceo departamental
Excel avanzado- 11-1 taller #1 Liceo departamental
SARAMV7
 

Similar a _Mundo de los Datos (1).pdf (20)

Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariado
 
Estadística y probabilidad power final robledo
Estadística y probabilidad power final robledoEstadística y probabilidad power final robledo
Estadística y probabilidad power final robledo
 
Documnot escrito tecnologia 2020
Documnot escrito tecnologia 2020Documnot escrito tecnologia 2020
Documnot escrito tecnologia 2020
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Análisis multivariante
Análisis multivarianteAnálisis multivariante
Análisis multivariante
 
Organizacion de Datos
Organizacion de DatosOrganizacion de Datos
Organizacion de Datos
 
Que es la estadistica
Que es la estadisticaQue es la estadistica
Que es la estadistica
 
Que es la estadistica
Que es la estadisticaQue es la estadistica
Que es la estadistica
 
Electiva iii parcial 2 - 02-minería de datos
Electiva iii   parcial 2 - 02-minería de datosElectiva iii   parcial 2 - 02-minería de datos
Electiva iii parcial 2 - 02-minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariado
 
Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
 
Presentacion jose felix rodriguez 26632429 escalas de medicion
Presentacion jose felix rodriguez 26632429 escalas de medicionPresentacion jose felix rodriguez 26632429 escalas de medicion
Presentacion jose felix rodriguez 26632429 escalas de medicion
 
Tecnologia luisa fda
Tecnologia luisa fdaTecnologia luisa fda
Tecnologia luisa fda
 
Excel avanzado, liceo departamental grado once uno
Excel avanzado, liceo departamental grado once unoExcel avanzado, liceo departamental grado once uno
Excel avanzado, liceo departamental grado once uno
 
Excel avanzado- 11-1 taller #1 Liceo departamental
Excel avanzado- 11-1 taller #1 Liceo departamentalExcel avanzado- 11-1 taller #1 Liceo departamental
Excel avanzado- 11-1 taller #1 Liceo departamental
 

_Mundo de los Datos (1).pdf

  • 2. ¿Qué es la Estadistica ? MUNDO DE LOS DATOS Disciplina que recopila e interpreta un conjunto datos. Es una ciencia y una rama de las matemáticas a través de la cual se recolecta, analiza, describe y estudian datos, a fin de establecer comparaciones o variabilidades que permitan comprender un fenómeno en particular. Arte de aprender a partir de los datos . Esto se logra adquiriendo nuevos conocimientos.
  • 3. Generación Ya estan MUNDO DE LOS DATOS Datos Recolección Diseño Experimentos Estudio Observacional Descripción A través de la Estadistica Descriptiva Analisis Inferencial A través de la Estadistica Inferencial Organización Representación Resumen Conclusiones usando Modelos de Probabilidad
  • 4. MUNDO DE LOS DATOS IMPORTANTE Se analiza un CONJUNTO DE DATOS; el cual se obtiene de una situación real. No se analiza BASE DE DATOS.
  • 5. MUNDO DE LOS DATOS Estadistica Descriptiva Cómo estos valores o parametros brinda una información general sobre un conjunto de datos? Media Mediana Desviación Estandar Cada uno de ellos reprensenta una caracteristica especial sobre un conjunto de datos.
  • 6. MUNDO DE LOS DATOS Estadistica Inferencial Enfocada a las estimaciones de la población, basado en los parametros generados en una muestra. Realiza aproximaciones de una muestra sobre los comportamientos poblacional.
  • 7. CONCEPTOS BASICOS DE ESTADISTICA MUNDO DE LOS DATOS Representa conjunto total de individuos de interes Ej: Estudiantes de la universidad del Quindio Población Muestra Sub conjunto de la población Estrategia tomar al azar para que que no tenga Sesgo.
  • 8. Estadistica Paramétrica MUNDO DE LOS DATOS PARAMÉTRICAS se basan en las leyes de distribución normal para analizar los elementos de una muestra. Generalmente, solo se aplican a variables numéricas y para su análisis debe mantener una muestra grande, ya que permite que el cálculo sea más exacto
  • 9. Estadistica Parametrica MUNDO DE LOS DATOS La distribución de probabilidad de una variable aleatoria es una función que asigna a cada suceso definido sobre la variable, la probabilidad de que dicho suceso ocurra
  • 10. Estadistica No Paramétrica MUNDO DE LOS DATOS dos series de observaciones provienen de distintas poblaciones  son aplicables a los datos jerarquizados son la única alternativa cuando el tamaño de muestra es pequeño son útiles a un nivel de significancia previamente especificado son útiles al analizar valores perdidos  son útiles al analizar datos categóricos Se pueden usar cuando: NO PARAMÉTRICAS son aquellas que se encargan de analizar datos que no tienen una distribución particular y se basan una hipótesis, pero los datos no están organizados de forma normal. Aunque tienen algunas limitaciones, cuentan con resultados estadísticos ordenados que facilita su comprensión.
  • 11. Estadistica Parametrica y No Parametrica MUNDO DE LOS DATOS Si los valores de una muestra afectan los valores de la otra muestra, entonces las muestras son DEPENDIENTES (Mismos elementos, momentos diferentes). Si los valores de una muestra no revelan información sobre los valores de la otra muestra, entonces las muestras son INDEPENDIENTES. Tener en cuenta
  • 12. MUNDO DE LOS DATOS
  • 13. MUNDO DE LOS DATOS Es el conjunto de técnicas estadisticas cuya finalidad es analizar simultaneamente un conjunto de datos en el sentido que hay varias variables medidas para un individuo u objeto estudiado ESTADISTICA MULTIVARIADA EJEMPLO DE ESTADISTICA MULTIVARIADA
  • 14. MUNDO DE LOS DATOS Radica en un mejor entendimiento del fenomeno objeto de estudio obteniendo información que los metodos estadisticos univariantes y bivariantes NO son capaces de conseguir EJEMPLO DE ESTADISTICA MULTIVARIADA ESTADISTICA MULTIVARIADA
  • 15. MUNDO DE LOS DATOS Preferencias de marcas La Pobreza Calidad del Servicio Nivel de Satisfacción Aprendizaje y percepción Aptitudes, Perfil del consumidor Gran parte de las investigaciones son de manera multivariada debido a que los fenómenos que se desean explicar y estudiar son complejos tales como: ESTADISTICA MULTIVARIADA
  • 16. MUNDO DE LOS DATOS Métodos de Dependencia Técnicas Multivariantes Métodos de Interdependencia Modelos Estructural En el Análisis Multivariante podemos encontrar dos tipos de variables: Variables cuantitativas y las Variables cualitativas.
  • 17. ESTADISTICA MULTIVARIADA Métodos de dependencia: Son aquellas cuyo comportamiento es explicado o pronosticado por una o más variables independientes; es decir que son variables que para ser explicadas necesitan de otras variables: Ejemplo: Explicar las ventas en función de numerosas variables independientes (número de vendedores, inversión en publicidad, promoción, pago a los vendedores, viáticos).
  • 18. ESTADISTICA MULTIVARIADA Métodos de interdependencia: Son las que servirán para explicar el fenómeno estudiado y en ocasiones se denominan como variables explicativas, factores o variables proditorias. Tratan de dar significado a un conjunto de variables o bien tratan de agrupar las cosas. Ejemplo: cuando se realizan estudios de segmentación de mercados que estudian variables independientes como: sexo, edad, ingresos etc.
  • 19. MUESTADISTICA MULTIVARIADA Modelos estructurales: Suponen que las variables están divididas en dos grupos: el de las variables dependientes y el de las independientes. El objetivo de estos métodos es analizar, no sólo cómo las variables independientes afectan a las variables dependientes, sino también cómo están relacionadas las variables de los dos grupos entre sí.
  • 20. Cuantitava Cualitativa ESTADISTICA MULTIVARIADA Métodos de Dependencia Técnicas Multivariantes Métodos de Interdependencia Métodos Estructural Anaálisis de Regresión Analisis de Supervivenvia MANOVA Correlación Canónica Anaálisis Discriminante Regresión Logística Análisis Conjoint Cuantitava Cualitativa Anaálisis Cluster Analisis Factorial Escalas Anaálisis de Correspondencias Modelos Log- Lineales
  • 21. MUNDO DE LOS DATOS
  • 22. MUNDO DE LOS DATOS KDD (Knowledge Discovery in Databases o descubrir conocimiento en las bases de datos): Hace referencia a un proceso, compuesto de múltiples etapas, cuyo objetivo principal es la extracción de conocimiento,con un fin especifico, a partir de los datos a los que se tiene acceso. El proceso de KDD está estrechamente relacionado con el aprendizaje automático o machine learning (ML) y también con la minería de datos o data mining (DM). Son términos que, en ocasiones, llegan a confundirse y utilizarse de manera indistinta.
  • 23. MUNDO DE LOS DATOS En lo que sí hay coincidencia es en que las técnicas de ML son posteriores en el tiempo a KDD y DM, y se centran más en la construcción de los algoritmos que en la preparación de los datos en sí. La finalidad de un algoritmo de ML es, explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto tomando como entrada patrones de datos, generar un modelo que contiene el conocimiento extraído.
  • 24. MUNDO DE LOS DATOS En Fases del proceso de KDD Atendiendo a la visión que fija la minería de datos como parte del KDD, este proceso constaría de las fases que se observan en el siguiente esquema: .
  • 25. MUNDO DE LOS DATOS Etapas del Procesamiento .
  • 26. MUNDO DE LOS DATOS Descripción Predicción Segmentación Análisis de dependencias Detección de desviaciones El proceso de minería involucra ajustar modelos o determinar patrones a partir de datos. Este ajuste normalmente es de tipo estadístico, en el sentido que se permite un cierto ruido o error dentro del modelo. Los algoritmos de minería de datos realizan en general tareas de: Los Algoritmos de Minería de Datos
  • 27. MUNDO DE LOS DATOS
  • 28. MUNDO DE LOS DATOS BI o la inteligencia de negocios combina análisis de negocios, minería, visualización, herramientas e infraestructura de datos, además de prácticas recomendadas para ayudar a las empresas a tomar decisiones basadas en los datos. En la práctica, implementar la inteligencia de negocios moderna implica contar con una vista integral de todos los datos de la organización. Además, consiste en usar estos datos para impulsar el cambio, eliminar las ineficiencias y adaptarse rápidamente a los cambios del mercado o la demanda Business Intelligence
  • 29. MUNDO DE LOS DATOS Es la combinación de algoritmos planteados con el propósito de crear máquinas que presenten las mismas capacidades que el ser humanos. El aprendizaje profundo es un subconjunto de aprendizaje automático en Inteligencia Artificial (AI) que tiene redes capaces de aprender sin supervisión a partir de datos que no están estructurados ni etiquetados. También conocido como Deep Learning Inteligencia Artificial