El documento describe la técnica de agrupación o clustering, que permite agrupar datos que comparten características similares en grupos mutuamente excluyentes. El clustering es una técnica de aprendizaje no supervisado que construye una jerarquía de grupos separando los elementos iterativamente en función de su cercanía. La técnica se caracteriza por su alto rendimiento, alta disponibilidad y alta eficiencia. Entre sus aplicaciones se encuentran la minería de datos y la robótica.
Base de Datos: Definición, características, aplicación, tipos, ventajas y desventajas, visión de los datos: independencia lógica y física. Relación entre los Sistemas de información y las Base de datos.
Sistemas de gestión de bases de datos. Definición, Arquitectura, Usuarios.
Los datos masivos (Big Data) están cambiando la forma de acceder, comprender, planificar y también la forma de vivir. Este nuevo paradigma están entrando de lleno en todos los ámbitos sociales. El mundo académico y de aprendizaje no va ser menos. La analítica del aprendizaje y académico está focalizado en la educación. En esta presentación (en beta) presentamos en MoodleMoot 2014 Colombia para dar a conocer todo este ecosistema del dato.
Base de Datos: Definición, características, aplicación, tipos, ventajas y desventajas, visión de los datos: independencia lógica y física. Relación entre los Sistemas de información y las Base de datos.
Sistemas de gestión de bases de datos. Definición, Arquitectura, Usuarios.
Los datos masivos (Big Data) están cambiando la forma de acceder, comprender, planificar y también la forma de vivir. Este nuevo paradigma están entrando de lleno en todos los ámbitos sociales. El mundo académico y de aprendizaje no va ser menos. La analítica del aprendizaje y académico está focalizado en la educación. En esta presentación (en beta) presentamos en MoodleMoot 2014 Colombia para dar a conocer todo este ecosistema del dato.
Las computadoras se utilizan para procesar información (gráficos, sonidos, textos,...). Pero, ¿cómo es capaz la computadora digital de representar a toda esta información con tan solo dos símbolos, el cero (0) y el uno (1)?
Cursillo Básico sobre bigdata y machine learning. Parte 2: ]: Se hace un recorrido por lo que se denomina la plataforma hadoop; posteriormente se muestran temas de visualización. El big data no sería nada si no se pueden explotar las masas de información a ser analizadas, y la estadistica/probabilidad son una parte que fundamenta este tipo de análisis, por lo cual retomamos algunos temas de estas áreas de conocimiento en pro de generar modelos de relevancia para la búsqueda de insights. MinTIC bdguidance arcitura 2016.
1. BASES DE DATOS AVANZADAS
TÉCNICA DE AGRUPACIÓN
BASES DE DATOS AVANZADAS
BASES DE DATOS AVANZADAS
2013
2. QUE ES?
El análisis de clúster o clustering es una
colección de métodos estadísticos que
permiten agrupar datos sobre los cuales miden
diferentes variables o características.
En la minería de datos, se lo considera una
técnica de aprendizaje no supervisado .
3. EN QUE CONSISTE?
Es el Proceso de dividir un conjunto de datos
en grupos mutuamente excluyentes, de tal
manera que cada miembro de un grupo este
lo mas cercano posible al otro.
4. FUNCIONALIDAD
Se
construye una jerarquía de grupos
separándolos iterativamente (repetitivamente).
Los elementos se van asignando a los grupos en
función de su cercanía.
5. CARACTERISTICAS
Alto rendimiento
Se ve reflejado en el procesamiento de los datos.
Alta disponibilidad
Proveer disponibilidad y confiabilidad.
Alta eficiencia
Existe independencia de datos entre los cluster existentes.
6. APLICACIONES
En la Minería de datos
Utiliza la transformación de los datos al formato
requerido, para el algoritmo especifico para la minería
de datos, buscando patrones que puedan expresarse
como modelo.
En la Robótica
Utiliza un conjunto de técnicas y conceptos teóricos
comunes, ejemplo los modelos probabilísticos como
métodos de representación de la información.