En esta plática se dará un breve repaso sobre el enfoque de los modelos de la Minería de Datos, Inteligencia de Negocios y Sistemas de soporte.
Se indicará como utilizar algunos recursos para aprender de manera autodidacta, los recursos que existen en torno a la minería, incluyendo el acceso a bases de datos. El participante podrá aprender algunos atajos para la descarga y lectura de archivos, limpieza básica y extracción de datos, así como algunas técnicas de minería de datos.
Esta presentación le pertenece a Tania Landivar.
Las estructuras de datos lineales (vectores ) obliga afijar por adelantado el espacio a ocupar en memoria, de modo que, cuando se desea añadir un nuevo elemento que rebase el tamaño prefijado del array, no es posible realizar la operación sin que se produzca un error en tiempo de ejecución, para evitar esto se hace uso de las listas enlazadas.
Una lista enlazada es una colección o secuencia de elementos llamados nodos, dispuestos uno detrás de otro, en la que cada elemento se conecta al siguiente elemento por un “enlace” o “referencia”.
Esta presentación es parte del contenido del curso de Programación Avanzada impartido en la Universidad Rafael Landívar durante el año 2015.
Incluye los temas:
• Búsqueda por método secuencial
• Búsqueda por método binario
• Búsqueda por método hashing
Creado por Ing. Alvaro Enrique Ruano
Esta presentación le pertenece a Tania Landivar.
Las estructuras de datos lineales (vectores ) obliga afijar por adelantado el espacio a ocupar en memoria, de modo que, cuando se desea añadir un nuevo elemento que rebase el tamaño prefijado del array, no es posible realizar la operación sin que se produzca un error en tiempo de ejecución, para evitar esto se hace uso de las listas enlazadas.
Una lista enlazada es una colección o secuencia de elementos llamados nodos, dispuestos uno detrás de otro, en la que cada elemento se conecta al siguiente elemento por un “enlace” o “referencia”.
Esta presentación es parte del contenido del curso de Programación Avanzada impartido en la Universidad Rafael Landívar durante el año 2015.
Incluye los temas:
• Búsqueda por método secuencial
• Búsqueda por método binario
• Búsqueda por método hashing
Creado por Ing. Alvaro Enrique Ruano
Diseño Logico de Base de datos Relacionales,Diseño Logico de Base de datos Relacionales,Diseño Logico de Base de datos Relacionales,Diseño Logico de Base de datos Relacionales
La minería de datos en el proceso de KDD donde se desarrollara los temas: Etapas de proceso de KDD,
Integración y recopilación, Selección, limpieza y transformación,
Minería de Datos, Evaluación e Interpretación, Difusión y uso; las cuales impartirán en cuatro horas semanales.los contenidos de la unidad 2.
Diseño Logico de Base de datos Relacionales,Diseño Logico de Base de datos Relacionales,Diseño Logico de Base de datos Relacionales,Diseño Logico de Base de datos Relacionales
La minería de datos en el proceso de KDD donde se desarrollara los temas: Etapas de proceso de KDD,
Integración y recopilación, Selección, limpieza y transformación,
Minería de Datos, Evaluación e Interpretación, Difusión y uso; las cuales impartirán en cuatro horas semanales.los contenidos de la unidad 2.
El fácil almacenamiento de la información en sistemas de cómputo, conocido como generación masiva de datos, a través de la automatización de aplicaciones, el uso de lectores de código de barras y otros métodos de captura, han permitido la creación de almacenes masivos de información, hasta el punto en el que consultas enunciadas con hipótesis concretas en lenguajes de consulta estructurados (SQL) han sido insuficientes para explotar estos almacenes.
Novedades tecnológicas de la información y las comunicaciones, avances, descubrimientos, opiniones, comentarios, ofertas de productos, servicios y mucho más.
Slides de la charla "Machine learning a lo berserker". Una charla que consiste en explicar Machine Learning a lo bruto y con un poco de irresponsabilidad :P Nada de mates y un poco de sentido práctico.
Más información: http://berserker.science
Estructuras de datos avanzadas: Casos de uso realesSoftware Guru
La utilización de estructuras de datos adecuadas para cada problema hace que se simplifiquen en gran medida los tiempos de respuestas y la cantidad de cómputo realizada.
Por Nelson González
Onboarding new members into an engineering team is not easy on anyone. In a short period of time, the new team member is required to be able to bring professional
Por Victoriya Kalmanovich
El secreto para ser un desarrollador SeniorSoftware Guru
En esta charla platicaremos sobre el “secreto” y el camino para llegar a ser un desarrollador Senior, experiencia, consejos y recomendaciones que en estos 8 años
Por René Sandoval
Apache Airflow es una plataforma en la que podemos crear flujos de datos de manera programática, planificarlos y monitorear de manera centralizada.
Por Yesi Díaz
How thick data can improve big data analysis for business:Software Guru
En esta presentación hablaré sobre cómo el Análisis de Datos Gruesos, específicamente el análisis antropológico y semiótico, puede ayudar a mejorar los resultados del Big Data
Por Martin Cuitzeo
CoDi® es la nueva forma de realizar pagos digitales desarrollada por el Banco de México. Por medio de CoDi puedes realizar cobros y pagos desde tu celular, utilizando una cuenta bancaria o de alguna institución financiera, sin comisiones.
Por Cristian Jaramillo
Gestionando la felicidad de los equipos con Management 3.0Software Guru
En las metodologías agiles hablamos de equipos colaborativos, autogestionados y felices. hablamos de lideres serviciales. El management 3.0 nos ayuda a cultivar el mindset correcto, aquel que servirá como el terreno fértil para que la agilidad florezca.
Por Andrea Vélez Cárdenas
Taller: Creación de Componentes Web re-usables con StencilJSSoftware Guru
Hoy por hoy las experiences de usuario pueden ser enriquecidas mediante el uso de Web Components, que son un estándar de la W3C soportado por la mayoría de los navegadores web modernos.
Por Alex Arriaga
Así publicamos las apps de Spotify sin stressSoftware Guru
En Spotify tenemos 1600+ ingenieros, trabajando en 280+ squads. Aún a esta escala, hemos logrado adoptar prácticas que nos han permitido acelerar la forma en que desarrollamos nuestro producto. Presentado por Erick Camacho en SG Virtual Conference 2020
Achieving Your Goals: 5 Tips to successfully achieve your goalsSoftware Guru
he measure of the executive, Peter F. Drucker reminds us, is the ability to "get the right things done." This involves having clarity on what are the right things as well as avoiding what is unproductive. Intelligence, creativity, and knowledge may all be wasted if not put to work on the things that matter.
Presentado por Cristina Nistor en SG Virtual Conference 2020
Acciones de comunidades tech en tiempos del Covid19Software Guru
Acciones de Comunidades Tech en tiempo del COVID-19 es una platica para informar acerca de las acciones que están realizando algunas comunidades de tecnología en México para luchar contra la propagación del COVID-19. Desde análisis de datos, visualizaciones, simulaciones de contagio, etc.
Presentado por Juana Martínez, Adriana Vallejo y Eduardo Ramírez en SG Virtual Conference 2020
De lo operativo a lo estratégico: un modelo de management de diseñoSoftware Guru
La charla presenta un modelo claro, generado por la ponente, para atender los niveles desde lo operativo a lo estratégico.
Presentado por Gabriela Salinas en SG Virtual Conference
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...espinozaernesto427
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta intensidad son un tipo de lámpara eléctrica de descarga de gas que produce luz por medio de un arco eléctrico entre electrodos de tungsteno alojados dentro de un tubo de alúmina o cuarzo moldeado translúcido o transparente.
lámparas más eficientes del mercado, debido a su menor consumo y por la cantidad de luz que emiten. Adquieren una vida útil de hasta 50.000 horas y no generan calor alguna. Si quieres cambiar la iluminación de tu hogar para hacerla mucho más eficiente, ¡esta es tu mejor opción!
Las nuevas lámparas de descarga de alta intensidad producen más luz visible por unidad de energía eléctrica consumida que las lámparas fluorescentes e incandescentes, ya que una mayor proporción de su radiación es luz visible, en contraste con la infrarroja. Sin embargo, la salida de lúmenes de la iluminación HID puede deteriorarse hasta en un 70% durante 10,000 horas de funcionamiento.
Muchos vehículos modernos usan bombillas HID para los principales sistemas de iluminación, aunque algunas aplicaciones ahora están pasando de bombillas HID a tecnología LED y láser.1 Modelos de lámparas van desde las típicas lámparas de 35 a 100 W de los autos, a las de más de 15 kW que se utilizan en los proyectores de cines IMAX.
Esta tecnología HID no es nueva y fue demostrada por primera vez por Francis Hauksbee en 1705. Lámpara de Nernst.
Lámpara incandescente.
Lámpara de descarga. Lámpara fluorescente. Lámpara fluorescente compacta. Lámpara de haluro metálico. Lámpara de vapor de sodio. Lámpara de vapor de mercurio. Lámpara de neón. Lámpara de deuterio. Lámpara xenón.
Lámpara LED.
Lámpara de plasma.
Flash (fotografía) Las lámparas de descarga de alta intensidad (HID) son un tipo de lámparas de descarga de gas muy utilizadas en la industria de la iluminación. Estas lámparas producen luz creando un arco eléctrico entre dos electrodos a través de un gas ionizado. Las lámparas HID son conocidas por su gran eficacia a la hora de convertir la electricidad en luz y por su larga vida útil.
A diferencia de las luces fluorescentes, que necesitan un recubrimiento de fósforo para emitir luz visible, las lámparas HID no necesitan ningún recubrimiento en el interior de sus tubos. El propio arco eléctrico emite luz visible. Sin embargo, algunas lámparas de halogenuros metálicos y muchas lámparas de vapor de mercurio tienen un recubrimiento de fósforo en el interior de la bombilla para mejorar el espectro luminoso y reproducción cromática. Las lámparas HID están disponibles en varias potencias, que van desde los 25 vatios de las lámparas de halogenuros metálicos autobalastradas y los 35 vatios de las lámparas de vapor de sodio de alta intensidad hasta los 1.000 vatios de las lámparas de vapor de mercurio y vapor de sodio de alta intensidad, e incluso hasta los 1.500 vatios de las lámparas de halogenuros metálicos.
Las lámparas HID requieren un equipo de control especial llamado balasto para funcionar
Catalogo Buzones BTV Amado Salvador Distribuidor Oficial ValenciaAMADO SALVADOR
Descubra el catálogo completo de buzones BTV, una marca líder en la fabricación de buzones y cajas fuertes para los sectores de ferretería, bricolaje y seguridad. Como distribuidor oficial de BTV, Amado Salvador se enorgullece de presentar esta amplia selección de productos diseñados para satisfacer las necesidades de seguridad y funcionalidad en cualquier entorno.
Descubra una variedad de buzones residenciales, comerciales y corporativos, cada uno construido con los más altos estándares de calidad y durabilidad. Desde modelos clásicos hasta diseños modernos, los buzones BTV ofrecen una combinación perfecta de estilo y resistencia, garantizando la protección de su correspondencia en todo momento.
Amado Salvador, se compromete a ofrecer productos de primera clase respaldados por un servicio excepcional al cliente. Como distribuidor oficial de BTV, entendemos la importancia de la seguridad y la tranquilidad para nuestros clientes. Por eso, trabajamos en colaboración con BTV para brindarle acceso a los mejores productos del mercado.
Explore el catálogo de buzones ahora y encuentre la solución perfecta para sus necesidades de correo y seguridad. Confíe en Amado Salvador y BTV para proporcionarle buzones de calidad excepcional que cumplan y superen sus expectativas.
2. Temario
1. Minería de Datos
2. Herramientas y requerimientos para Minería de datos
a) R
b) RStudio
c) Shiny
d) Miktex
3. Auto-aprendizaje utilizando el lenguaje R.
4. Modelos, técnicas y funciones.
a) acceso a datos.
b) Descarga
c) lectura de archivos
d) Limpieza básica
e) Extracción de datos
f) Técnicas y minería de datos
5. Conclusiones
6. Referencias
3. Objetivo
El participante conocerá algunos conceptos
fundamentales de la Minería de Datos a partir del uso de
funciones y paquetes del lenguaje R, para facilitar tanto
su comprensión y manejo del lenguaje, como de la
minería de datos, sus modelos y técnicas.
4. Minería de Datos
• Minería de Datos, Inteligencia de Negocios y
Sistemas de soporte.
5. Minería de Datos
En
la
figura,
se
muestra
el
nivel
de
anidación
de
cada
elemento
del
universo,
donde
se
enmarca
la
minería
de
datos:
un
entorno
o
ambiente
general,
en
el
que
se
sitúa
el
Sistema
de
Soporte
para
la
toma
de
Decisiones
(Decision
Support
Systems),
en
cuyo
seno
se
diseñan,
conforman,
administran,
y
dirigen
los
negocios,
mismos
que
crean
las
bases
de
datos
de
las
cuales
se
aplicará
la
Inteligencia
de
Negocios(Bussines
Intelligence),
para
que
emerja
el
KDD
(Knowledge
Discovery
Data),
que
sigue
una
serie
de
pasos
o
procesos
entre
los
que
destaca
el
DM
(Data
Mining),
herramienta
informáMca
del
KDD
en
la
cual
se
aplican
métodos
inteligentes
para
extraer
patrones
de
datos
(Han
&
Kamber,
2006).
Minería de Datos, Inteligencia de Negocios y
Sistemas de soporte.
6. Minería de Datos
Existen
cuatro
metodologías:
1.-‐
SEMMA,
2.-‐
KDD
Roadmap,
3.-‐
RAMSYS,
y
4.-‐
DMIE.
Finalmente,
CRISP-‐DM
es
un
modelo
con
un
fuerte
componente
metodológico
(Marbán,
Mariscal,
&
Segovia,
2009).
Metodologías en Minería de Datos,.
7. Minería de Datos
Tipologías de la Minería de Datos
La
Minería
de
Datos
es:
‘…Extracción
no
trivial
de
información
implícita,
previamente
desconocida
y
potencialmente
úMl
a
parMr
de
datos.”.
Existen
algoritmos
tanto
de
aprendizaje
supervisado,
como
de
aprendizaje
no
supervisado
cuyo
conocimiento
y
opMmización
facilita
el
descubrimiento
o
reconocimiento
de
patrones,
a
través
de
la
clasificación
y
la
predicción.
En
la
MDD,
algunas
variables
son
señaladas
como
el
objeMvo
y
existen
datos
sobre
su
desMno,
mientras
que
en
la
MDI,
no
destaca
ninguna
variable
como
un
objeMvo,
pues
la
meta
es
descubrir
algún
Mpo
de
relación
entre
todas
las
variables.
9. Auto-aprendizaje mediante R.
Requerimientos para el auto-aprendizaje
a) Después de instalas las herramientas R , Rstudio, Shiny, Miktex, deberá continuar
con la instalación de algunos paquetes adicionales, tales como rmarkdown,
laticce, knitr, etc., los cuales podrá ir siguiendo durante la presentación.
b) En esta primera parte les recomiendo el paquete swirl, install.packages(“swirl"),
después d edla instalación deberás escribir library(swirl) para poder utilizarlo.
c) Después de instalarlo deberán abrirlo a fin de poder obtener información básica,
pero podemos empezar a trabajar con él. En este caso, si no sabes mucho sobre
matrices te recomiendo el primer modulo, de otra forma, toma el segundo
modulo sobre modelos de regresión. Un buen repaso a nadie le perjudica
10. Modelos, técnicas y funciones
• R
en
acción
a) acceso a datos.
b) Descarga
c) lectura de archivos
d) Limpieza básica
e) Extracción de datos
f) Técnicas y minería de datos
11. Modelos, técnicas y funciones
• Ejemplos
a) acceso a datos.
library(XML)
url<-‐
'hgp://en.wikipedia.org/wiki/World_populaMon'
tbls
<-‐readHTMLTable
(url)
length(tbls)
tbl
<-‐readHTMLTable
(url,which=4)
tbl[,c(1:3,5)]
12. Modelos, técnicas y funciones
• R
en
acción
Descarga
# fileUrl <- "link?accessType=DOWNLOAD"
if(!file.exists(".UCI_HAR_Dataset")){dir.create("./UCI_HAR_Dataset")}
fileUrl <- "https://d396qusza40orc.cloudfront.net/getdata%2Fprojectfiles%2FUCI%20HAR%20Dataset.zip?accessType=DOWNLOAD"
# download.file(fileUrl, destfile = "directorio/nombre_archivo.csv", method = "curl")
download.file(fileUrl, destfile = "/Users/administrador/Specialization/UCI_HAR_Dataset/UCI_HAR_Dataset.zip", method = "curl”)
list.files("../Specialization")
dateDownloaded <- date()
dateDownloaded
### Step two
# Unzziped the file
# Set working directory setwd()
# Unzipped the data set in 'UCI_HAR_Dataset'
# The dataset directory is same as this script.
setwd("../Specialization/UCI_HAR_Dataset")
13. Modelos, técnicas y funciones
• R
en
acción
lectura de archivos
#
Package
Check
and
Install
library(reshape2)
#
or
pkg
<-‐
"reshape2"
if
(!require(pkg,
character.only
=
TRUE))
{
install.packages(pkg)
if
(!require(pkg,
character.only
=
TRUE))
stop(paste("Load
failure:
",
pkg))
}
#
Read
dataset
acMviMes
<-‐
read.table(paste0(dataBaseDirectory,
"acMvity_labels.txt"),
header=FALSE,
stringsAsFactors=FALSE)
features
<-‐
read.table(paste0(dataBaseDirectory,
"features.txt"),
header=FALSE,
stringsAsFactors=FALSE)
14. Modelos, técnicas y funciones
• R
en
acción
lectura de archivos
# Import and prepare the test Data
subject_test <- read.table(paste0(dataTestDirectory, "subject_test.txt"), header=FALSE)
x_test <- read.table(paste0(dataTestDirectory, "X_test.txt"), header=FALSE)
y_test <- read.table(paste0(dataTestDirectory, "y_test.txt"), header=FALSE)
tmp <- data.frame(Activity = factor(y_test$V1, labels = activities$V2))
testData <- cbind(tmp, subject_test, x_test)
# Import and prepare the train Data
subject_train <- read.table(paste0(dataTrainDirectory, "subject_train.txt"), header=FALSE)
x_train <- read.table(paste0(dataTrainDirectory, "X_train.txt"), header=FALSE)
y_train <- read.table(paste0(dataTrainDirectory, "y_train.txt"), header=FALSE)
tmp <- data.frame(Activity = factor(y_train$V1, labels = activities$V2))
trainData <- cbind(tmp, subject_train, x_train)
# Tidy Data
testTidyData <- rbind(testData, trainData)
names(testTidyData) <- c("Activity", "Subject", features[,2])
select <- features$V2[grep("mean()|std()", features$V2)]
tidyData <- testTidyData[c("Activity", "Subject", select)]
15. Modelos, técnicas y funciones
• R
en
acción
Extracción de datos
# Write Tidy Data to Disk
write.table(tidyData, file="./tidyData.txt", row.names=FALSE)
# Tidy Data Average/Activity. Melt and Cast.
tidyData_Melt <- melt(tidyData, id=c("Activity", "Subject"), measure.vars=select)
tidyData_Mean <- dcast(tidyData_Melt, Activity + Subject ~ variable, mean)
# Write Tidy Average Data
write.table(tidyData_Mean, file="./tidyAverageData.txt", row.names=FALSE)
message(" DONE")
16. Modelos, técnicas y funciones
• R
en
acción
Limpieza básica
microdataSurvey <- read.table("/Users/administrador/Specialization/microdataSurvey.csv", sep = ",", header = TRUE)
head(microdataSurvey)
# Extraer solamente la columna que me interesa
propertyValue <- microdataSurvey[,c(37)]
propertyValue
# Limpiar datos
ld = complete.cases(propertyValue)
propertyValue = propertyValue[ld]
propertyValue
# Utilizo el comando which para saber cuáles índices del vector o columna cumplen con una condición lógica
which(propertyValue >= 24)
# Asigno el resultado a un vector
mayorValue <- which(propertyValue >= 24)
# Extraigo el resultado o la cantidad de casos que cumplen con la condición
length(mayorValue)
17. Conclusiones
Ante
la
pregunta
de
que
herramienta
es
mejor
para
trabajar
con
Minería
de
Datos,tendré
que
responder
que
aquella
que
les
facilite
más
su
propio
trabajo
y
comprensión
sobre
lo
que
están
haciendo,
Matlab
es
una
buena
opción
pero
Mene
un
costo,
Octave,
es
open
source
pero
conlleva
un
poco
más
de
trabajo,
R
es
una
herramienta
formidable,
pero
como
podrán
notar
exige
cierto
dominio
de
programación
y
sobre
todo
mucho
interés,
teniendo
en
cuenta
que
en
Minería
de
datos
lo
importante
no
son
los
datos,
sino
la
pregunta
que
se
quiere
responder.
18. Referencias
1. Paradis, E.: R para Principiantes, The Comprehensive R Archive Networkhttp://cran.rproject.org/doc/
contrib/rdebuts_es.pdf (2003). Accedido el 26 de marzo de 2014.
2. Sauter, V.L.: Decision Support Systems for Business Intelligence. John Wiley & Sons (2010).
3. Gilchrist, M.; Lehmann, D.; Skrubbeltrang, G.;Vachon, F.: Knowledge Discovery in Databases for
Competitive Advantage. Journal of Management and Strategy, Vol. 3, No. 2, pp. 2-15 (2012).
4. Jiawei, H.; Kamber, M.: Data Mining: Concepts and Techniques. Elsevier (2006).
5. Marbán, O.; Mariscal, G.; Segovia, J.: A Data Mining & Knowledge DiscoveryProcess Model. Ponce,
J.; Karahoca, A.: En Data Mining and Knowledge Discovery in Real Life Applications, I-Tech
Education and Publishing, pp. 1-17 (2009).
6. Torgo, L.: Data Mining with R: Learning with case studies. CRC Press Taylor &Francis Group (2011).
7. Chapman, P.; Clinton, J.; Kerber, R.; Khabaza, T.; Reinartz, T.; Thomas, C.; Wirth, R.: CRISP-DM 1.0
Step-by-step data mining guide. CRISP-DM Consortium,
8. ftp://ftp.software.ibm.com/software/analytics/spss/support/Modeler/Documentation/14/User Manual/
CRISP-DM.pdf (2000). Accedido el 17 de Noviembre de 2013.
19. Datos
de
contacto
"
GRACIAS POR SU ATENCIÓN"
"
"
Rafael Reséndiz Ramírez"
Instituto de Ingeniería"
Universidad Autónoma de Baja California"
"
Calle de la Norma s/n y Blvd Benito Juárez, "
Col. Insurgentes Este. C.P. 21280"
Mexicali, Baja California, México"
"
rafael.resendiz@uabc.edu.mx"
rafael.resendiz@educacionbc.edu.mx "
rafaresend@gmail.com