El documento describe las principales técnicas de minería de datos, incluyendo aprendizaje supervisado y no supervisado, redes neuronales, árboles de decisión, algoritmos genéticos, clustering, predicción, análisis de enlaces, patrones secuenciales y Naive Bayes. Explica que estas técnicas crean modelos predictivos y descriptivos para extraer conocimiento e identificar patrones en grandes conjuntos de datos.
MACHINE LEARNING (Aprendizaje Automático) es la ciencia que permite que las computadoras aprendan y actúen como lo hacen los humanos, mejorando su aprendizaje a lo largo del tiempo de una forma autónoma, alimentándolas con datos e información en forma de observaciones e interacciones con el mundo real.
MACHINE LEARNING (Aprendizaje Automático) es la ciencia que permite que las computadoras aprendan y actúen como lo hacen los humanos, mejorando su aprendizaje a lo largo del tiempo de una forma autónoma, alimentándolas con datos e información en forma de observaciones e interacciones con el mundo real.
Se abordará la forma sugerida que debe tener los datos recolectados, posterior a ser analizados, para que sean comprendidos, además de la utilidad que reportan.
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOAaronPleitez
linea de tiempo del antiguo testamento donde se detalla la cronología de todos los eventos, personas, sucesos, etc. Además se incluye una parte del periodo intertestamentario en orden cronológico donde se detalla todo lo que sucede en los 400 años del periodo del silencio. Basicamente es un resumen de todos los sucesos desde Abraham hasta Cristo
Ipsos, empresa de investigación de mercados y opinión pública, divulgó su informe N°29 “Claves Ipsos” correspondiente al mes de abril, que encuestó a 800 personas con el fin de identificar las principales opiniones y comportamientos de las y los ciudadanos respecto de temas de interés para el país. En esta edición se abordó la a Carabineros de Chile, su evaluación, legitimidad en su actuar y el asesinato de tres funcionarios en Cañete. Además, se consultó sobre el Ejército y la opinión respecto de la marcha en Putre.
Este documento ha sido elaborado por el Observatorio Ciudadano de Seguridad Justicia y Legalidad de Irapuato siendo nuestro propósito conocer datos sociodemográficos en conjunto con información de incidencia delictiva de las 10 colonias y/o comunidades que del año 2020 a la fecha han tenido mayor incidencia.
Existen muchas más colonias que presentan cifras y datos en materia de seguridad, sin embargo, en este primer acercamiento lo que se prevées darle al lector una idea de como se encuentran las colonias analizadas, tomando como referencia los datos del INEGI 2020, datos del Secretariado Ejecutivo del Sistema Nacional de Seguridad Pública del 2020 al 2023 y las bases de datos propias que desde el 2017 el Observatorio Ciudadano ha recopilado de manera puntual con datos de las vıć timas de homicidio doloso, accidentes de tránsito, personas lesionadas por arma de fuego, entre otros indicadores.
Reporte homicidio doloso descripción
Reporte que contiene información de las víctimas de homicidio doloso registradas en el municipio de Irapuato Guanajuato durante el periodo señalado, comprende información cualitativa y cuantitativa que hace referencia a las características principales de cada uno de los homicidios.
La información proviene tanto de medios de comunicación digitales e impresos como de los boletines que la propia Fiscalía del Estado de Guanajuato emite de manera diaria a los medios de comunicación quienes publican estas incidencias en sus distintos canales.
Podemos observar cantidad de personas fallecidas, lugar donde se registraron los eventos, colonia y calle así como un comparativo con el mismo periodo pero del año anterior.
Edades y género de las víctimas es parte de la información que incluye el reporte.
3. TÉCNICAS DE MINERÍA DE DATOS
Las técnicas de minería de datos crean modelos que son
predictivos y/ o descriptivos.
Un modelo predictivo responde preguntas sobre datos futuros.
Un modelo descriptivo proporciona información sobre las
relaciones entre los datos y sus características.
5. FORMAS DE APRENDIZAJE
Cuenta con un conocimiento a priori, al momento de clasificar un
objeto dentro de una categoría o clase contamos con modelos ya
clasificados (objetos agrupados que tienen características
comunes).
Podemos diferenciar dos fases dentro de este tipo de clasificación:
1. Tenemos un conjunto de entrenamiento o de aprendizaje
(para el diseño del clasificador) y otro llamado de test o de
validación (para clasificación), estos nos servirán para
construir un modelo o regla general para la clasificación.
2. El proceso en sí de clasificar los objetos o muestras de las
que se desconoce la clase a las que pertenecen.
SUPERVISADA
6. O también llamada de clustering. No se cuenta con
conocimiento a priori, por lo que tendremos un área de
entrenamiento disponible para la tarea de clasificación.
En este tipo de clasificación contamos con “objetos” o
muestras que tiene un conjunto de características, de las que
no sabemos a que clase o categoría pertenece.
NO SUPERVISADA
OBJETIVO:Es el descubrimiento de grupos de “objetos” cuyas
características afines nos permitan separar las diferentes
clases.
7. SUPERVISADAS NO SUPERVISADAS
Árboles de
decisión
Detección de desviaciones
Inducción
neuronal
Segmentación
Regresión Agrupamiento
Series temporales Reglas de asociación
Patrones secuenciales
8. REDES NEURONALES
Esta técnica de inteligencia artificial, en los últimos años se ha
convertido en uno de los instrumentos de uso frecuente para
detectar categorías comunes en los datos, debido a que son
capaces de detectar y aprender complejos patrones, y
características de los datos.
Una de las principales características de las redes neuronales,
es que son capaces de trabajar con datos incompletos e
incluso paradójicos, que dependiendo del problema puede
resultar una ventaja o un inconveniente. Además esta técnica
posee dos formas de aprendizaje: supervisado y no
supervisado.
9. ÁRBOLES DE DECISIÓN
Está técnica se encuentra dentro de una metodología de
aprendizaje supervisado. Su representación es en forma de
árbol en donde cada nodo es una decisión, los cuales a su vez
generan reglas para la clasificación de un conjunto de datos.
Los árboles de decisión son fáciles de usar, admiten atributos
discretos y continuos, tratan bien los atributos no
significativos y los valores faltantes. Su principal ventaja es la
facilidad de interpretación.
10. ALGORITMOS GÉNETICOS
Los algoritmos genéticos imitan la evolución de las especies
mediante la mutación, reproducción y selección, como
también proporcionan programas y optimizaciones que
pueden ser usadas en la construcción y entrenamiento de
otras estructuras como es el caso de las redes neuronales.
Además los algoritmos genéticos son inspirados en el principio
de la supervivencia de los más aptos.
11. CLUSTERING (Agrupamiento)
Agrupan datos dentro de un número de clases preestablecidas
o no, partiendo de criterios de distancia o similitud, de
manera que las clases sean similares entre sí y distintas con las
otras clases.
Su utilización ha proporcionado significativos resultados en lo
que respecta a los clasificadores o reconocedores de patrones,
como en el modelado de sistemas. Este método debido a su
naturaleza flexible se puede combinar fácilmente con otro tipo
de técnica de minería de datos, dando como resultado un
sistema híbrido.
12. Problemas en el análisis de cluster
Un problema relacionado con el análisis de cluster es la
selección de factores en tareas de clasificación, debido a que
no todas las variables tienen la misma importancia a la hora
de agrupar los objetos. Otro problema de gran importancia y
que actualmente despierta un gran interés es la fusión de
conocimiento, ya que existen múltiples fuentes de
información sobre un mismo tema, los cuales no utilizan una
categorización homogénea de los objetos. Para poder
solucionar estos inconvenientes es necesario fusionar la
información a la hora de recopilar, comparar o resumir los
datos.
13. APRENDIZAJE AUTOMÁTICO
Esta técnica de inteligencia artificial es utilizada para inferir
conocimiento del resultado de la aplicación de alguna de las
otras técnicas antes mencionadas.
14. Análisis de Enlace (Link Analysis)
El análisis de enlace es el proceso de crear redes de objetos
interconectados para explorar patrones y tendencias. Es parte
de una rama de la matemática llamada “teoría de graficas” -
Barry and Linoff, 1997 0 Cada objeto recibe el nombre de
nodo y el enlace se llama conexión. Relación entre artículos
comprados
15. Predicción
El análisis de predicción está relacionado con las técnicas de
regresión. La idea de este tipo de análisis es descubrir la
relación entre variables ya sean independientes o
dependientes. Por ejemplo, si las ventas son una variable
independiente, entonces el beneficio puede ser una variable
dependiente. Mediante el uso de datos históricos de ambas
ventas y beneficios, las técnicas lineales o no lineales de
regresión pueden producir una curva que permita la
predicción de beneficios en el futuro.
16. Patrones secuenciales
Estos realizan un análisis que permite encontrar patrones
similares en los datos de transacciones durante un período de
negocio. Los analistas pueden usar estos patrones para
identificar relaciones entre los datos. Los modelos
matemáticos son patrones secuenciales detrás de la lógica
normativa, la lógica difusa u otras. En la fase de minería de
datos, es posible estudiar varias secuencias similares para
identificar las tendencias futuras en el desarrollo de
transacciones. Este enfoque es útil en el tratamiento de bases
de datos con características de series de tiempo.
17. Naive Bayes
Se trata de una técnica que combina la clasificación y
predicción, con el fin de construir modelos para predecir
posibles resultados a partir de asociaciones en los datos
históricos.
18. Series de tiempo
Las series de tiempo en la minería de datos permiten buscar
patrones a partir de grandes cantidades de datos. Algunas de
sus variables están en función del tiempo. Esta técnica se
utiliza a partir del comportamiento histórico de los datos, que
permite modelar los componentes básicos de la serie, y así se
logra hacer predicciones.
19. BIBLIOGRAFÍA:
https://advancedtech.wordpress.com/2008/04/14/clasificacion-supervisada-y-no-supervisada/
Moreno, G. (2007). Técnica más usadas en la minería de datos. Obtenido de:
https://gamoreno.wordpress.com/2007/10/03/tecnicas-mas-usadas-en-la-mineria-de-datos/
Dueñas, M. (2009). Minería de datos espaciales en búsqueda de la verdadera información.
Scielo. Obtenido de: http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0123-
21262009000100007
Sánchez, J. (2011). Breve paseo por la Minería de Datos. SlideShare. Obtenido de:
https://es.slideshare.net/jculacio/brevepaseoporla-mineradedatos
Beltrán, B. Minería de datos. Obtenido de: http://bbeltran.cs.buap.mx/NotasMD.pdf