El documento habla sobre las estadísticas en las bases de datos y su importancia para la optimización de consultas. Explica que las estadísticas representan la distribución de datos en columnas y ayudan al optimizador a determinar la selectividad, cardinalidad y densidad de los datos. También cubre cómo crear estadísticas de forma automática o manual, leer estadísticas existentes y mantenerlas de forma automática u manual para que reflejen los cambios en los datos.
In this opportunity I spoke about the distinct way that we have on azure to manage data pipelines and what are the best practices. I showed to the audience some bid data, stream data and transnational data architecture using Azure services
In this opportunity I spoke about the distinct way that we have on azure to manage data pipelines and what are the best practices. I showed to the audience some bid data, stream data and transnational data architecture using Azure services
Power BI - 3 Estrategias cruciales para crear tus Cuadros de MandoSalvador Ramos
Descubrirás:
- Cuáles son los pilares de Power BI y cómo ensamblarlos a la perfección
- La gran importancia que tienen los Modelos de Datos en Power BI. No cometas el error nº 1
- Cómo responder de forma óptima a las preguntas de Negocio aplicando técnicas de visualización adecuadas
Cuadros de mando el todo es más que la suma de las partesSpanishPASSVC
No es suficiente con hacer tablas, gráficos y/o indicadores de forma individual. Debemos pensar en agregar valor a la visualización y el análisis con un conjunto de estos elementos que se complementen entre sí para enriquecer las respuestas. En esta sesión veremos diversas técnicas de visualización para mejorar los cuadros de mando, incluso algunas de ellas también se pueden aplicar sobre informes. Veremos también diversos ejemplos, en algunos de ellos partiremos de una mala solución que iremos comentando y mejorando.
La receta de la abuela para mejores cargas de datosSpanishPASSVC
En esta sesión veremos mejores prácticas para cargas de datos a ser utilizados en ETLs de alto volumen, veremos técnicas de carga y configuración de la base de datos, uso de particiones, compresión, indexes columnstore y más. Esta receta estará cargada de buenas demos, todas aprobadas por la abuela desde épocas que datan antes del windows 3.1!
Vista 360 grados de DataZen - Juan AlvaradoSpanishPASSVC
En esta charla se vera un vistazo general a DataZen, sus componentes a nivel servidor y cliente, tambien se vera la forma en que se desarrolla en proyectos de inteligencia de negocios con datazen.
La guerra de los proveedores de servicios de computo en la nube continua y esto incluye servicios de bases de datos. Estos servicios proveen una plataforma donde las tareas de administracion son menores a cambio de menos control sobre la plataforma. En esta sesion haremos una comparacion entre las dos plataformas mas populares para SQL Server: Amazon RDS y Azure SQL DB y veremos cuales son las fortalezas y debilidades de cada una.
En esta sesión analizaremos experiencias de la vida real como consultor en trabajos de mejora de rendimiento. Veremos mejores prácticas para la configuración de SQL Server, tips para un mejor T-SQL y un ejercicio de como monitorear mi servidor de base de datos con Performance Counters, un SQL Server Express y un Excel con Power Pivot.
Automatizando la generación de Datawarehouses a través de metadatosSpanishPASSVC
Nos enfrentamos cada vez a retos mas difíciles y complejos en la creación de Datawarehouses con SQL Server. Esto nos hace pensar en como quitarnos el trabajo superfluo, el que no aporta valor de negocio para centrar nuestras energías en resolver las cuestiones propias del negocio. La charla explorará alguna de las posibilidades de automatización de creación de procesos ETL. Para ello hablaremos de BIML, SSIS, JSON y metadatos.
SQL Server 2016 Strech Database desde cada ángulo - Kenneth UreñaSpanishPASSVC
En esta sesión vamos a ver como configurar la nueva funcionalidad de SQL Server 2016 Strech Databases, y los beneficios que podemos obtener de ella en nuestra estrategia de alta disponibilidad
Visualización. mejorando las respuestas a las preguntas de negocioSpanishPASSVC
En esta sesión veremos múltiples ejemplos concretos de respuestas de negocio. En cada una de ellas se estudiarán diversas formas de mostrar la información (tablas, diversos tipos de gráficos, colores), pros y contras de cada una de ellas; partiendo de una mala solución que se irá comentando y mejorando, mediante técnicas y herramientas de visualización, hasta convertirla en una buena respuesta.
En esta sesión aprenderemos sobre la nueva característica Query Store, que consiste en almacenar información de rendimiento para su posterior análisis de comportamiento y mejorar el performace de una base de datos.
Power BI es un servicio en la nube para el manejo de datos y una moderna solución de reportes accesible en todas las plataformas, pero ¿realmente cómo funciona? No importa cuán simple sea su gestión de datos, para tomar ventaja de este servicio deberá diseñar y administrar algunos de sus componentes. En esta sesión aprenderemos de las diferencias entre versiones, seguridad, colaboración y estrategias para refrescar la data tanto en escenarios de uso personal como empresariales.
Sincronizando Azure Search con SQL ServerSpanishPASSVC
En esta sesión vamos a tener la oportunidad de conocer cómo integrar las características de Azure Search con un SQL Server On-Premise con el fin de aprovechar las capacidades de este nuevo servicio.
Procesando XML de estruturas complejas con SSISSpanishPASSVC
En esta sesión vamos aprender como procesar y manejar la carga de XML con estructuras complejas, los cuales dentro del mismo XML contienen información que va a diferentes tablas en la misma base de datos o a diferentes bases de datos.
Prácticas recomendadas para SQL Server en Microsoft AzureSpanishPASSVC
La configuración de máquinas virtuales con SQL Server en Microsoft Azure requiere tener presentes ciertos aspectos para que su desempeño sea adecuado con el escenario y además, una serie de configuraciones y prácticas recomendadas para su gestión y su operación. En esta sesión veremos algunas de éstas y cómo tener en cuenta características de este IaaS para que SQL Server se comporte de manera óptima.
Power BI - 3 Estrategias cruciales para crear tus Cuadros de MandoSalvador Ramos
Descubrirás:
- Cuáles son los pilares de Power BI y cómo ensamblarlos a la perfección
- La gran importancia que tienen los Modelos de Datos en Power BI. No cometas el error nº 1
- Cómo responder de forma óptima a las preguntas de Negocio aplicando técnicas de visualización adecuadas
Cuadros de mando el todo es más que la suma de las partesSpanishPASSVC
No es suficiente con hacer tablas, gráficos y/o indicadores de forma individual. Debemos pensar en agregar valor a la visualización y el análisis con un conjunto de estos elementos que se complementen entre sí para enriquecer las respuestas. En esta sesión veremos diversas técnicas de visualización para mejorar los cuadros de mando, incluso algunas de ellas también se pueden aplicar sobre informes. Veremos también diversos ejemplos, en algunos de ellos partiremos de una mala solución que iremos comentando y mejorando.
La receta de la abuela para mejores cargas de datosSpanishPASSVC
En esta sesión veremos mejores prácticas para cargas de datos a ser utilizados en ETLs de alto volumen, veremos técnicas de carga y configuración de la base de datos, uso de particiones, compresión, indexes columnstore y más. Esta receta estará cargada de buenas demos, todas aprobadas por la abuela desde épocas que datan antes del windows 3.1!
Vista 360 grados de DataZen - Juan AlvaradoSpanishPASSVC
En esta charla se vera un vistazo general a DataZen, sus componentes a nivel servidor y cliente, tambien se vera la forma en que se desarrolla en proyectos de inteligencia de negocios con datazen.
La guerra de los proveedores de servicios de computo en la nube continua y esto incluye servicios de bases de datos. Estos servicios proveen una plataforma donde las tareas de administracion son menores a cambio de menos control sobre la plataforma. En esta sesion haremos una comparacion entre las dos plataformas mas populares para SQL Server: Amazon RDS y Azure SQL DB y veremos cuales son las fortalezas y debilidades de cada una.
En esta sesión analizaremos experiencias de la vida real como consultor en trabajos de mejora de rendimiento. Veremos mejores prácticas para la configuración de SQL Server, tips para un mejor T-SQL y un ejercicio de como monitorear mi servidor de base de datos con Performance Counters, un SQL Server Express y un Excel con Power Pivot.
Automatizando la generación de Datawarehouses a través de metadatosSpanishPASSVC
Nos enfrentamos cada vez a retos mas difíciles y complejos en la creación de Datawarehouses con SQL Server. Esto nos hace pensar en como quitarnos el trabajo superfluo, el que no aporta valor de negocio para centrar nuestras energías en resolver las cuestiones propias del negocio. La charla explorará alguna de las posibilidades de automatización de creación de procesos ETL. Para ello hablaremos de BIML, SSIS, JSON y metadatos.
SQL Server 2016 Strech Database desde cada ángulo - Kenneth UreñaSpanishPASSVC
En esta sesión vamos a ver como configurar la nueva funcionalidad de SQL Server 2016 Strech Databases, y los beneficios que podemos obtener de ella en nuestra estrategia de alta disponibilidad
Visualización. mejorando las respuestas a las preguntas de negocioSpanishPASSVC
En esta sesión veremos múltiples ejemplos concretos de respuestas de negocio. En cada una de ellas se estudiarán diversas formas de mostrar la información (tablas, diversos tipos de gráficos, colores), pros y contras de cada una de ellas; partiendo de una mala solución que se irá comentando y mejorando, mediante técnicas y herramientas de visualización, hasta convertirla en una buena respuesta.
En esta sesión aprenderemos sobre la nueva característica Query Store, que consiste en almacenar información de rendimiento para su posterior análisis de comportamiento y mejorar el performace de una base de datos.
Power BI es un servicio en la nube para el manejo de datos y una moderna solución de reportes accesible en todas las plataformas, pero ¿realmente cómo funciona? No importa cuán simple sea su gestión de datos, para tomar ventaja de este servicio deberá diseñar y administrar algunos de sus componentes. En esta sesión aprenderemos de las diferencias entre versiones, seguridad, colaboración y estrategias para refrescar la data tanto en escenarios de uso personal como empresariales.
Sincronizando Azure Search con SQL ServerSpanishPASSVC
En esta sesión vamos a tener la oportunidad de conocer cómo integrar las características de Azure Search con un SQL Server On-Premise con el fin de aprovechar las capacidades de este nuevo servicio.
Procesando XML de estruturas complejas con SSISSpanishPASSVC
En esta sesión vamos aprender como procesar y manejar la carga de XML con estructuras complejas, los cuales dentro del mismo XML contienen información que va a diferentes tablas en la misma base de datos o a diferentes bases de datos.
Prácticas recomendadas para SQL Server en Microsoft AzureSpanishPASSVC
La configuración de máquinas virtuales con SQL Server en Microsoft Azure requiere tener presentes ciertos aspectos para que su desempeño sea adecuado con el escenario y además, una serie de configuraciones y prácticas recomendadas para su gestión y su operación. En esta sesión veremos algunas de éstas y cómo tener en cuenta características de este IaaS para que SQL Server se comporte de manera óptima.
El término “Data Science” se ha vuelto muy popular recientemente con el aumento de popularidad de las redes sociales, análisis predictivos y el análisis de datos no estructurados como parte del crecimiento del “Big Data”. En esta sesión estaremos viendo que es “Data Science”, que necesitamos saber o aprender para poder convertirnos en un científico de datos y estaremos viendo algunos ejemplos de usos muy comunes usando lenguajes como Python, R y el cómo podemos integrar estos en SQL Server y Azure . Al final de esta charla tendrás un entendimiento más amplio de las técnicas de manejos de datos, modelamiento, visualización y los lenguajes y productos para poner tus proyectos en marcha.
En esta sesión revisamos las nuevas mejoras y funcionalidades que estarán implementadas en la siguiente versión de SQL Server principalmente en Seguridad, Rendimiento y Alta Disponibilidad
Visualizando la actividad de la instancia Deadlocks y errores de SQL utilizando Extended Events SQL Performance Dashboard Missing Indexes desde el query plan Performance Point – Sistema de Captura , Análisis y Alertas
El Aprendizaje Automático (AA), conocido en inglés como Machine Learning, es una rama de la Inteligencia Artificial en la cual su principal objetivo es desarrollar técnicas que permitan a las computadoras aprender, es decir, se considera como un proceso de inducción del conocimiento. Dentro de las aplicaciones de aprendizaje automático están diversas aplicaciones de negocio como motores de búsqueda, diagnósticos médicos, detección de fraude en el uso de tarjetas de crédito, análisis del mercado de valores, clasificación de secuencias de ADN, reconocimiento del habla entre otros. En esta sesión presentaremos alguno de los conceptos fundamentales del AA y mostraremos cómo crear este tipo de soluciones usando Azure Machine Learning, el nuevo servicio de Azure completamente administrado en la nube y que puede ser integrado en nuestras aplicaciones tradicionales de negocio.
Introducción al análisis predictivo con SQL ServerEduardo Castro
En esta presentación vemos los conceptos fundamentales de análisis predictivo con SQL Server.
Saludos,
Eduardo Castro
Microsoft SQL Server MVP
Comunidad Windows
24 HOP edición Español - Machine learning - Cesar OviedoSpanishPASSVC
Microsoft ha lanzado una de las herramientas que tendrán más imparto para el Business Analytics y/o Data Mining. De momento ha pasado desapercibida por muchos a pesar de su gran potencial. En esta charla veremos que es Machine Learning y sus usos.
Carlos González, Hewlett Packard Enterprise, nos habla acerca en la implicación del mercado de Big Data en su negocio y el papel que una solución como Vertica juega en éste de la mano de Qlik.
Big Data - Desarrollando soluciones efectivasJoseph Lopez
Como continuación a la presentación titulada "Introducción al mundo de las Bodegas de datos", esta presentación le explicará qué es Big Data y sus beneficios, incluyendo casos de uso. Así mismo, discutiremos cómo Hadoop, la nube y procesamiento masivamente paralelo (MPP) está cambiando la forma en los almacenes de datos se están construyendo. Hablaremos de arquitecturas híbridas que combinan datos in situ con datos en la nube, así como datos relacionales y no relacionales de datos (no estructurados). Veremos también los beneficios del MPP en SMP y cómo integrar datos desde dispositivos en la Internet (IoT). Aprenderemos también lo que debería verse como un almacén de datos moderno y cómo cuadra su papel de un mar de datos y Hadoop. Al finalizar esta exposición, tendremos una orientación sobre la mejor solución para el almacén de datos en el futuro.
¿Qué es transformación digital?
¿Qué es ciencia de datos?
¿Qué es un científico de datos?
¿Qué es Machine Learning?
“Hola Mundo en Machine Learning”: Algoritmo de Clasificación
Demo: Algoritmo de Clasificación
Explorando Analysis Services: Power Pivot, Tabular y MultidimensionalSpanishPASSVC
El concepto del Unified Dimensional Modeling (UDM) fue introducido en Analysis Services 2005 como una capa semántica para facilitar el desarrollo de cubos OLAP de fuentes diversas. En Analysis Services 2012 se introduce el concepto del Business Intelligence Semantic Model (BISM) como una evolución al UDM ofreciendo dos “sabores”: Multidiemnsional y Tabular. El BISM representa el corazón de la estrategia de Inteligencia de Negocios de Microsoft. Esta sesión explicara los conceptos básicos de Analysis Services 2012 y PowerPivot. Discutiremos los diferentes escenarios que permitirán a desarrolladores y arquitectos de BI a tomar mejores decisiones al momento de desarrollar los cimientos de la estrategia empresarial para el análisis de sus datos.
Cómo construir tu propia data platform. From zero to hero. GustavoMartin46
Esta presentación es el resultado de la ponencia presentada el día 28 de abril de 2023 en la Salmorejo Tech https://salmorejo.tech/2023/.
Con esta ponencia se buscaba explicar a una audiencia con conocimientos básicos de tecnología, las distintas herramientas que se pueden emplear para construir una plataforma de datos.
La ponencia comienza con una configuración sencilla, que prácticamente cualquier persona del mundo de la informática puede entender. Termina con una configuración compleja, donde sin entrar en muchos detalles, sí permite a la audiencia hacerse una idea de qué herramientas se requieren para implementar la solución.
Business Intelligence es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.
Similar a Descubriendo el corazón de la optimización “Estadísticas más que un concepto” (20)
Creación de un modelo de análisis predictivo en la nubeSpanishPASSVC
Microsoft Azure ofrece una solución de análisis predictivo 100% Cloud, donde es posible realizar el proceso analítico de búsqueda de patrones en los datos, y a la vez la explotación de estos modelos en un ambiente de producción altamente disponible y escalable como lo es Microsoft Azure.
Analizando la performance del subsistema de IOSpanishPASSVC
Analizaremos el subsistema de I/O para detectar los posibles cuellos de botella. Para llevar a cabo esto utilizaremos distintas técnicas y herramientas
Mejoras de Rendimiento para Replicación TransaccionalSpanishPASSVC
A pesar de ser una tecnología sin mayores cambios en las últimas versiones del producto de SQL Server, muchos clientes siguen utilizando esta herramienta en sus ambientes productivos, en esta sesión veremos los problemas más comunes relacionados con rendimiento , como identificarlos y sus posibles soluciones.
Todo el mundo que trabaja con base de datos siempre se ha preguntado alguna vez qué son los planes de ejecución y como se leen. Saber leer un plan de ejecución nos va a dar información valiosísima de cara a mejorar el rendimiento de una consulta. En esta sesión vamos a centrarnos en aprender a leer T-SQL para interpretar lo que está haciendo SQL Server para devolvernos la información.
VMs de alto rendimiento para SQL Server en AWS y AzureSpanishPASSVC
Primero todo era puro metal, luego la virtualizacion inicio la revolucion. Ahora la nube va a cambiar el data center de nuevo con su rapidez de provicionamiento y ofrecimiento de recursos bajo demanda. Pero como eligimos las mejores opciones para maquinas virtuales de SQL en estos proveedores de nube? Venga y aprenda sobre las mejores configuraciones, tips y lecciones aprendidas de clientes que han movido sus SQL Servers de alto rendimiento a la nube.
En esta charla estaremos demostrando Tecnicas avanzadas de Monitoreo tales como
- Analizando la actividad de SQL Server
- Utilizando Extended events para realizar monitoreo en SQL Server
- monitoreo proactivo
- Auditoria Utilizando Service Broker
Principios de diseño para procesos de ETLSpanishPASSVC
Aun cuando SSIS es una tecnología robusta para ETL, los procesos de integración de datos son las causa más frecuente por los que los proyectos fracasan. En muchos casos esto se debe a la falta de planeamiento y el uso de cuestionables técnicas de diseño. En esta charla vamos a evaluar los procesos de ETL de una manera general para luego identificar áreas claves que muchas veces son dejadas al azar, y que en un momento determinado pudiesen comprometer la estabilidad del sistema e incrementar su costo de operación.
Planeando e implementando servicios de datos con Microsoft AzureSpanishPASSVC
Analizaremos las diferencias entre bases de datos SQL Server on premise y Azure SQL Database. Como implementar SQL Azure Database, como migrar, monitorear y mantener la continuidad operativa con Self Service Restore y Geo Replicación.
Mejores prácticas para SQL Server en ambientes virtualizadosSpanishPASSVC
Recomendaciones sobre configuraciones en Máquinas Virtuales, Almacenamiento, Redes y otros components al ejecutar SQL-Server en ambientes Virtualizados como Hyper-V y Windows Azure con ejemplos prácticos.
Al empezar a hablar de ciencia de datos se vuelven comunes las palabras minería de datos y machine learning. En esta sesión se presentarán las capacidades de minería de datos en SQL Server y las posibilidades que nos ofrece Azure Machine Learning.
Conociendo los servicios adicionales en big dataSpanishPASSVC
Todos han empezado a usar y a conocer Hadoop y HDInsight, en parte los lenguajes usados para su consumo, pero poco se hablado de los servicios complementarios que pueden enriquecer la experiencia BigData, conozca estos servicios y su aplicación.
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informáticavazquezgarciajesusma
En este proyecto de investigación nos adentraremos en el fascinante mundo de la intersección entre el arte y los medios de comunicación en el campo de la informática.
La rápida evolución de la tecnología ha llevado a una fusión cada vez más estrecha entre el arte y los medios digitales, generando nuevas formas de expresión y comunicación.
Continuando con el desarrollo de nuestro proyecto haremos uso del método inductivo porque organizamos nuestra investigación a la particular a lo general. El diseño metodológico del trabajo es no experimental y transversal ya que no existe manipulación deliberada de las variables ni de la situación, si no que se observa los fundamental y como se dan en su contestó natural para después analizarlos.
El diseño es transversal porque los datos se recolectan en un solo momento y su propósito es describir variables y analizar su interrelación, solo se desea saber la incidencia y el valor de uno o más variables, el diseño será descriptivo porque se requiere establecer relación entre dos o más de estás.
Mediante una encuesta recopilamos la información de este proyecto los alumnos tengan conocimiento de la evolución del arte y los medios de comunicación en la información y su importancia para la institución.
Actualmente, y debido al desarrollo tecnológico de campos como la informática y la electrónica, la mayoría de las bases de datos están en formato digital, siendo este un componente electrónico, por tanto se ha desarrollado y se ofrece un amplio rango de soluciones al problema del almacenamiento de datos.
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...espinozaernesto427
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta intensidad son un tipo de lámpara eléctrica de descarga de gas que produce luz por medio de un arco eléctrico entre electrodos de tungsteno alojados dentro de un tubo de alúmina o cuarzo moldeado translúcido o transparente.
lámparas más eficientes del mercado, debido a su menor consumo y por la cantidad de luz que emiten. Adquieren una vida útil de hasta 50.000 horas y no generan calor alguna. Si quieres cambiar la iluminación de tu hogar para hacerla mucho más eficiente, ¡esta es tu mejor opción!
Las nuevas lámparas de descarga de alta intensidad producen más luz visible por unidad de energía eléctrica consumida que las lámparas fluorescentes e incandescentes, ya que una mayor proporción de su radiación es luz visible, en contraste con la infrarroja. Sin embargo, la salida de lúmenes de la iluminación HID puede deteriorarse hasta en un 70% durante 10,000 horas de funcionamiento.
Muchos vehículos modernos usan bombillas HID para los principales sistemas de iluminación, aunque algunas aplicaciones ahora están pasando de bombillas HID a tecnología LED y láser.1 Modelos de lámparas van desde las típicas lámparas de 35 a 100 W de los autos, a las de más de 15 kW que se utilizan en los proyectores de cines IMAX.
Esta tecnología HID no es nueva y fue demostrada por primera vez por Francis Hauksbee en 1705. Lámpara de Nernst.
Lámpara incandescente.
Lámpara de descarga. Lámpara fluorescente. Lámpara fluorescente compacta. Lámpara de haluro metálico. Lámpara de vapor de sodio. Lámpara de vapor de mercurio. Lámpara de neón. Lámpara de deuterio. Lámpara xenón.
Lámpara LED.
Lámpara de plasma.
Flash (fotografía) Las lámparas de descarga de alta intensidad (HID) son un tipo de lámparas de descarga de gas muy utilizadas en la industria de la iluminación. Estas lámparas producen luz creando un arco eléctrico entre dos electrodos a través de un gas ionizado. Las lámparas HID son conocidas por su gran eficacia a la hora de convertir la electricidad en luz y por su larga vida útil.
A diferencia de las luces fluorescentes, que necesitan un recubrimiento de fósforo para emitir luz visible, las lámparas HID no necesitan ningún recubrimiento en el interior de sus tubos. El propio arco eléctrico emite luz visible. Sin embargo, algunas lámparas de halogenuros metálicos y muchas lámparas de vapor de mercurio tienen un recubrimiento de fósforo en el interior de la bombilla para mejorar el espectro luminoso y reproducción cromática. Las lámparas HID están disponibles en varias potencias, que van desde los 25 vatios de las lámparas de halogenuros metálicos autobalastradas y los 35 vatios de las lámparas de vapor de sodio de alta intensidad hasta los 1.000 vatios de las lámparas de vapor de mercurio y vapor de sodio de alta intensidad, e incluso hasta los 1.500 vatios de las lámparas de halogenuros metálicos.
Las lámparas HID requieren un equipo de control especial llamado balasto para funcionar
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0...Telefónica
Índice del libro "Big Data: Tecnologías para arquitecturas Data-Centric" de 0xWord escrito por Ibón Reinoso ( https://mypublicinbox.com/IBhone ) con Prólogo de Chema Alonso ( https://mypublicinbox.com/ChemaAlonso ). Puedes comprarlo aquí: https://0xword.com/es/libros/233-big-data-tecnologias-para-arquitecturas-data-centric.html
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
1. Descubriendo el corazón de la
optimización “Estadísticas más
que un concepto
Ahias Portillo
MVP en Plataforma de Datos
DPA SolidQ
2. Speaker Bio
2
Soy un profesional del informática con más de 9 años de experiencia en
el desarrollo de soluciones informáticas, actualmente soy un arquitecto
de datos para SolidQ, especializado en el uso de herramientas de
inteligencia de negocios con tecnologías Microsoft, cuento con dos
especialidades enfocadas en base de datos e inteligencia de negocios
cursadas en Cenfotec Costa Tica. He participado en proyectos
regionales (Centro América) y de América del norte (Estados Unidos).
Soy el fundador de la comunidad de base de datos “El Rincón de Sql
Server” y el líder de capitulo oficial de PASS en El Salvador, los cual me
ha permitido recibir el nombramiento de MVP en Plataforma de Datos,
siendo el único profesional de El Salvador con este reconocimiento.
3. 3
Agenda
Que son? y para que se usan?
Creando estadísticas
Leyendo estadísticas
Manteniendo estadísticas
4. 4
¿Qué son?
Elemento base que utiliza el optimizador de consulta.
Representan la distribución de los datos dentro de una columna o columnas.
Sin estadísticas el motor no puede comparar la eficiencia de los diferentes
planes de ejecución.
Sin estadísticas es necesarios escanear
4
5. 5
¿Qué son?
Pueden ser creadas automáticamente (AUTO_CREATE_STATISTICS)
Nos ayuda a determinar:
Selectividad
Cardinalidad
Densidad
5
6. 6
¿Qué son?
• Grado en que puede distinguirse un valor del grupo.
• Sexo es menos selectivo que Documento de Identidad
Selectividad
• Opuesto a Selectividad
• 1.0 / COUNT(DISTINCT <ColumnName>))
Densidad
• Número de Filas que satisface un predicado.
Cardinalidad
18. 18
AUTO_UPDATE_STATISTICS
Caducan
Tabla en Base de Datos Local:
0 a >0
<=500 y cambios (1ra Columna) >500
>500 y cambios (1ra Columna) >500 + 20% filas originales
Temporales
<=6 y cambios (primera fila ) >6
Variables Tabla: sin estadísticas
22. 22
Mejores practicas
• Habilitar Auto Create, Actualización Automática
• Actualizar estadísticas todas las veces que se generar un índice
• Actualizar solo estadísticas de columnas si el índice ha sido reconstruido
• Valida sus estadísticas Estimado vrs Filas Reales
24. Thank You for Attending
Follow @pass24hop
Share your thoughts with hashtags
#pass24hop & #sqlpass
Notas del editor
¿Cuáles son estadísticas?Optimizador de consultas de SQL Server utiliza estadísticas de distribución para determinar cómo va a satisfacer su consulta SQL. Estas estadísticas representan la distribución de los datos dentro de una columna, o columnas. El optimizador de consultas los utiliza para estimar cuántas filas se devolverán a partir de un plan de consulta. Sin estadísticas para mostrar cómo se distribuyen los datos, el optimizador no tiene ninguna manera se puede comparar la eficiencia de los diferentes planes y así se verán obligados con frecuencia a explorar simplemente la tabla o índice. Sin estadísticas, no puede posiblemente saber si la columna tiene los datos que está buscando sin pisar a través de él. Con información sobre la columna, el optimizador puede hacer mucho mejores decisiones acerca de cómo se va a acceder a sus datos y el uso de sus índices.Estadísticas de distribución se crean automáticamente al crear un índice. Si ha habilitado la creación automática de estadísticas (el ajuste predeterminado de la configuración de base de datos AUTO_CREATE_STATISTICS) también obtendrá estadísticas creadas cada vez que una columna se hace referencia en una consulta como parte de una cláusula de filtrado o Únete criterios.Los datos se mide de dos maneras diferentes dentro de un mismo conjunto de estadísticas, por la densidad y distribución
¿Cuáles son estadísticas?Optimizador de consultas de SQL Server utiliza estadísticas de distribución para determinar cómo va a satisfacer su consulta SQL. Estas estadísticas representan la distribución de los datos dentro de una columna, o columnas. El optimizador de consultas los utiliza para estimar cuántas filas se devolverán a partir de un plan de consulta. Sin estadísticas para mostrar cómo se distribuyen los datos, el optimizador no tiene ninguna manera se puede comparar la eficiencia de los diferentes planes y así se verán obligados con frecuencia a explorar simplemente la tabla o índice. Sin estadísticas, no puede posiblemente saber si la columna tiene los datos que está buscando sin pisar a través de él. Con información sobre la columna, el optimizador puede hacer mucho mejores decisiones acerca de cómo se va a acceder a sus datos y el uso de sus índices.Estadísticas de distribución se crean automáticamente al crear un índice. Si ha habilitado la creación automática de estadísticas (el ajuste predeterminado de la configuración de base de datos AUTO_CREATE_STATISTICS) también obtendrá estadísticas creadas cada vez que una columna se hace referencia en una consulta como parte de una cláusula de filtrado o Únete criterios.Los datos se mide de dos maneras diferentes dentro de un mismo conjunto de estadísticas, por la densidad y distribución
•RANGE_HI_KEY - This is also called a key value and represents the upper bound column value for a histogram step.
•RANGE_ROWS - This represents the estimated number of rows whose column value falls within a histogram step, excluding the upper bound.
•DISTINCT_RANGE_ROWS - This represents the estimated number of rows with a distinct column value within a histogram step, excluding the upper bound.
•EQ_ROWS - This represents the estimated number of rows whose column value equals the upper bound of the histogram step.
•AVG_RANGE_ROWS (RANGE_ROWS / DISTINCT_RANGE_ROWS for DISTINCT_RANGE_ROWS > 0) - This represents the average number of rows with duplicate column values within a histogram step, excluding the upper bound.
SAMPLING: Default: 8 MB
FULL SCAN
ALTER INDEX REORGANIZE
(STATISTICS_NORECOMPUTE )