Descubriendo el corazón de la optimización “Estadísticas más que un concepto”

•Descargar como PPTX, PDF•

0 recomendaciones•424 vistas

El documento habla sobre las estadísticas en las bases de datos y su importancia para la optimización de consultas. Explica que las estadísticas representan la distribución de datos en columnas y ayudan al optimizador a determinar la selectividad, cardinalidad y densidad de los datos. También cubre cómo crear estadísticas de forma automática o manual, leer estadísticas existentes y mantenerlas de forma automática u manual para que reflejen los cambios en los datos.

Tecnología

Descubriendo el corazón de la
optimización “Estadísticas más
que un concepto
Ahias Portillo
MVP en Plataforma de Datos
DPA SolidQ

Speaker Bio
2
Soy un profesional del informática con más de 9 años de experiencia en
el desarrollo de soluciones informáticas, actualmente soy un arquitecto
de datos para SolidQ, especializado en el uso de herramientas de
inteligencia de negocios con tecnologías Microsoft, cuento con dos
especialidades enfocadas en base de datos e inteligencia de negocios
cursadas en Cenfotec Costa Tica. He participado en proyectos
regionales (Centro América) y de América del norte (Estados Unidos).
Soy el fundador de la comunidad de base de datos “El Rincón de Sql
Server” y el líder de capitulo oficial de PASS en El Salvador, los cual me
ha permitido recibir el nombramiento de MVP en Plataforma de Datos,
siendo el único profesional de El Salvador con este reconocimiento.

3
Agenda
Que son? y para que se usan?
Creando estadísticas
Leyendo estadísticas
Manteniendo estadísticas

4
¿Qué son?
 Elemento base que utiliza el optimizador de consulta.
 Representan la distribución de los datos dentro de una columna o columnas.
 Sin estadísticas el motor no puede comparar la eficiencia de los diferentes
planes de ejecución.
 Sin estadísticas es necesarios escanear
4

5
¿Qué son?
 Pueden ser creadas automáticamente (AUTO_CREATE_STATISTICS)
 Nos ayuda a determinar:
 Selectividad
 Cardinalidad
 Densidad
5

6
¿Qué son?
• Grado en que puede distinguirse un valor del grupo.
• Sexo es menos selectivo que Documento de Identidad
Selectividad
• Opuesto a Selectividad
• 1.0 / COUNT(DISTINCT <ColumnName>))
Densidad
• Número de Filas que satisface un predicado.
Cardinalidad

10
Creación de Estadísticas (Índices)
10

11
Creación de Estadísticas (Automático)
11

14
Leyendo estadísticas
DBCC SHOW_STATISTICS('[SqlSat].[Customers]',[PK_Customers])
14

15
Leyendo estadísticas
DBCC SHOW_STATISTICS('[SqlSat].[Customers]',[PK_Customers])
15

17
Mantenimiento de Estadísticas
Automáticamente
 ALTER INDEX REBUILD
 CREATE INDEX WITH (DROP_EXISTING=ON)
 AUTO_UPDATE
 ALTER INDEX REORGANIZE
Manualmente
 UPDATE_STATISTICS
 sp_updatestats

18
AUTO_UPDATE_STATISTICS
Caducan
 Tabla en Base de Datos Local:
 0 a >0
 <=500 y cambios (1ra Columna) >500
 >500 y cambios (1ra Columna) >500 + 20% filas originales
 Temporales
 <=6 y cambios (primera fila ) >6
 Variables Tabla: sin estadísticas

19
Flujo de (Re)Compilación
AUTO_UPDATE_STATISTICS_ASYNC

20
Actualización Asincrónica
Sintaxis:
ALTER DATABASE STATDemo
SET AUTO_UPDATE_STATISTICS_ASYNC ON;
Beneficio:
 Consultas más predecibles
 Menos riesgo de «TimeOut»
Contras:
 Planes sub-óptimos

22
Mejores practicas
• Habilitar Auto Create, Actualización Automática
• Actualizar estadísticas todas las veces que se generar un índice
• Actualizar solo estadísticas de columnas si el índice ha sido reconstruido
• Valida sus estadísticas Estimado vrs Filas Reales

Thank You for Attending
Follow @pass24hop
Share your thoughts with hashtags
#pass24hop & #sqlpass

Más contenido relacionado

La actualidad más candente

Trabajo accessLontarrot

Power BI - 3 Estrategias cruciales para crear tus Cuadros de MandoSalvador Ramos

Bases de datos 2018Kengel Inf

Introducción a Power PivotHaaron Gonzalez

Microsoft power BIJuan Frias

Colegio nicolas esguerrafoxperro

Microssoft accesPatricio Sosa

La actualidad más candente (7)

Trabajo access

Power BI - 3 Estrategias cruciales para crear tus Cuadros de Mando

Bases de datos 2018

Introducción a Power Pivot

Microsoft power BI

Colegio nicolas esguerra

Microssoft acces

Destacado

Cuadros de mando el todo es más que la suma de las partesSpanishPASSVC

La receta de la abuela para mejores cargas de datosSpanishPASSVC

Vista 360 grados de DataZen - Juan AlvaradoSpanishPASSVC

SQL como un servicio en la nubeSpanishPASSVC

SQL Server rápido y furiosoSpanishPASSVC

Excel power pivot como herramienta de apoyo para la estrategia de bi self-ser...SpanishPASSVC

Automatizando la generación de Datawarehouses a través de metadatosSpanishPASSVC

SQL Server 2016 Strech Database desde cada ángulo - Kenneth UreñaSpanishPASSVC

Visualización. mejorando las respuestas a las preguntas de negocioSpanishPASSVC

Query Store en SQL 2016SpanishPASSVC

Administrando soluciones de Power BISpanishPASSVC

Sincronizando Azure Search con SQL ServerSpanishPASSVC

Procesando XML de estruturas complejas con SSISSpanishPASSVC

SQL Server 2016 - Row Level SecuritySpanishPASSVC

Prácticas recomendadas para SQL Server en Microsoft AzureSpanishPASSVC

Introduccion a Data ScienceSpanishPASSVC

SQL Server 2016 new featuresSpanishPASSVC

JSON Support en SQL Server 2016SpanishPASSVC

SQL MonitoringSpanishPASSVC

Introducción a Azure Machine LearningSpanishPASSVC

Destacado (20)

Cuadros de mando el todo es más que la suma de las partes

La receta de la abuela para mejores cargas de datos

Vista 360 grados de DataZen - Juan Alvarado

SQL como un servicio en la nube

SQL Server rápido y furioso

Excel power pivot como herramienta de apoyo para la estrategia de bi self-ser...

Automatizando la generación de Datawarehouses a través de metadatos

SQL Server 2016 Strech Database desde cada ángulo - Kenneth Ureña

Visualización. mejorando las respuestas a las preguntas de negocio

Query Store en SQL 2016

Administrando soluciones de Power BI

Sincronizando Azure Search con SQL Server

Procesando XML de estruturas complejas con SSIS

SQL Server 2016 - Row Level Security

Prácticas recomendadas para SQL Server en Microsoft Azure

Introduccion a Data Science

SQL Server 2016 new features

JSON Support en SQL Server 2016

SQL Monitoring

Introducción a Azure Machine Learning

Similar a Descubriendo el corazón de la optimización “Estadísticas más que un concepto”

Taller einstein analyticsGrissell Cabrera Suárez

Introducción al análisis predictivo con SQL ServerEduardo Castro

PBI - Semana 1.pdfIvanTorresAlbino

Tableau.pptxEDDIEALEXANDERTOLOSA

24 HOP edición Español - Machine learning - Cesar OviedoSpanishPASSVC

Minería datos con SQL Server 2012Eduardo Castro

PBI - Semana 1.pptxValeria Marisol Malca Hernandez

PBI - Semana 1.pptxedgarvelasquezoptica

50 claves para conocer PowerBIStratebi

HPE Vertica Chile Desayuno Oct 2016Analytics10

PBI - Semana 1.pptx, enfocado al mantenimientoedward927681

Power bi excel 2019AlexanderCabrera57

Presentacion A10 Big Data_Alteryx_Cloudera Analytics10

Big Data - Desarrollando soluciones efectivasJoseph Lopez

Transformación Digital – Ciencia de datos el siguiente nivelJOSE AHIAS LOPEZ PORTILLO

Actividad 1Dayana Villanueva

Explorando Analysis Services: Power Pivot, Tabular y MultidimensionalSpanishPASSVC

141 Gxplorer Proyectos Bi Factibles Montevideo Gx Xix V1GeneXus

Cómo construir tu propia data platform. From zero to hero. GustavoMartin46

Business Intelligencegrupo nkjr

Similar a Descubriendo el corazón de la optimización “Estadísticas más que un concepto” (20)

Taller einstein analytics

Introducción al análisis predictivo con SQL Server

PBI - Semana 1.pdf

Tableau.pptx

24 HOP edición Español - Machine learning - Cesar Oviedo

Minería datos con SQL Server 2012

PBI - Semana 1.pptx

50 claves para conocer PowerBI

HPE Vertica Chile Desayuno Oct 2016

PBI - Semana 1.pptx, enfocado al mantenimiento

Power bi excel 2019

Presentacion A10 Big Data_Alteryx_Cloudera

Big Data - Desarrollando soluciones efectivas

Transformación Digital – Ciencia de datos el siguiente nivel

Actividad 1

Explorando Analysis Services: Power Pivot, Tabular y Multidimensional

141 Gxplorer Proyectos Bi Factibles Montevideo Gx Xix V1

Cómo construir tu propia data platform. From zero to hero.

Business Intelligence

Más de SpanishPASSVC

Creación de un modelo de análisis predictivo en la nubeSpanishPASSVC

Analizando la performance del subsistema de IOSpanishPASSVC

AlwaysON Lecciones AprendidasSpanishPASSVC

Data Science con Microsoft R Server y SQL Server 2016SpanishPASSVC

Mejoras de Rendimiento para Replicación TransaccionalSpanishPASSVC

Como leer planes de ejecuciónSpanishPASSVC

AlwaysOn en SQL Server 2016SpanishPASSVC

VMs de alto rendimiento para SQL Server en AWS y AzureSpanishPASSVC

Tecnicas avanzadas de monitoreoSpanishPASSVC

Principios de diseño para procesos de ETLSpanishPASSVC

Planeando e implementando servicios de datos con Microsoft AzureSpanishPASSVC

Mejores prácticas para SQL Server en ambientes virtualizadosSpanishPASSVC

Mejores prácticas de Data Warehouse con SQL ServerSpanishPASSVC

Minería de datos / Machine LearningSpanishPASSVC

Conociendo los servicios adicionales en big dataSpanishPASSVC

Más de SpanishPASSVC (15)

Creación de un modelo de análisis predictivo en la nube

Analizando la performance del subsistema de IO

AlwaysON Lecciones Aprendidas

Data Science con Microsoft R Server y SQL Server 2016

Mejoras de Rendimiento para Replicación Transaccional

Como leer planes de ejecución

AlwaysOn en SQL Server 2016

VMs de alto rendimiento para SQL Server en AWS y Azure

Tecnicas avanzadas de monitoreo

Principios de diseño para procesos de ETL

Planeando e implementando servicios de datos con Microsoft Azure

Mejores prácticas para SQL Server en ambientes virtualizados

Mejores prácticas de Data Warehouse con SQL Server

Minería de datos / Machine Learning

Conociendo los servicios adicionales en big data

Último

Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology

PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770

Proyecto integrador. Las TIC en la sociedad S4.pptx241521559

El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...JaquelineJuarez15

Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11

CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega

La era de la educación digital y sus desafiosFundación YOD YOD

Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...AlanCedillo9

Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho

trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill

Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48

Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez

SalmorejoTech 2024 - Spring Boot <3 TestcontainersIván López Martín

guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM

International Women's Day Sucre 2024 (IWD)GDGSucre

Plan de aula informatica segundo periodo.docxpabonheidy28

ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...FacuMeza2

ejercicios pseint para aprogramacion sofJuancarlosHuertasNio1

KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD

Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg

Descubriendo el corazón de la optimización “Estadísticas más que un concepto”

1. Descubriendo el corazón de la optimización “Estadísticas más que un concepto Ahias Portillo MVP en Plataforma de Datos DPA SolidQ

2. Speaker Bio 2 Soy un profesional del informática con más de 9 años de experiencia en el desarrollo de soluciones informáticas, actualmente soy un arquitecto de datos para SolidQ, especializado en el uso de herramientas de inteligencia de negocios con tecnologías Microsoft, cuento con dos especialidades enfocadas en base de datos e inteligencia de negocios cursadas en Cenfotec Costa Tica. He participado en proyectos regionales (Centro América) y de América del norte (Estados Unidos). Soy el fundador de la comunidad de base de datos “El Rincón de Sql Server” y el líder de capitulo oficial de PASS en El Salvador, los cual me ha permitido recibir el nombramiento de MVP en Plataforma de Datos, siendo el único profesional de El Salvador con este reconocimiento.

3. 3 Agenda Que son? y para que se usan? Creando estadísticas Leyendo estadísticas Manteniendo estadísticas

4. 4 ¿Qué son?  Elemento base que utiliza el optimizador de consulta.  Representan la distribución de los datos dentro de una columna o columnas.  Sin estadísticas el motor no puede comparar la eficiencia de los diferentes planes de ejecución.  Sin estadísticas es necesarios escanear 4

5. 5 ¿Qué son?  Pueden ser creadas automáticamente (AUTO_CREATE_STATISTICS)  Nos ayuda a determinar:  Selectividad  Cardinalidad  Densidad 5

6. 6 ¿Qué son? • Grado en que puede distinguirse un valor del grupo. • Sexo es menos selectivo que Documento de Identidad Selectividad • Opuesto a Selectividad • 1.0 / COUNT(DISTINCT <ColumnName>)) Densidad • Número de Filas que satisface un predicado. Cardinalidad

7. 7 ¿ Para que se usan? 7

8. 8 ¿ Para que se usan? 8

9. Demo 9

10. 10 Creación de Estadísticas (Índices) 10

11. 11 Creación de Estadísticas (Automático) 11

12. 12 Creación de Estadísticas (Manual) 12

13. Demo 13

14. 14 Leyendo estadísticas DBCC SHOW_STATISTICS('[SqlSat].[Customers]',[PK_Customers]) 14

15. 15 Leyendo estadísticas DBCC SHOW_STATISTICS('[SqlSat].[Customers]',[PK_Customers]) 15

16. Demo 16

17. 17 Mantenimiento de Estadísticas Automáticamente  ALTER INDEX REBUILD  CREATE INDEX WITH (DROP_EXISTING=ON)  AUTO_UPDATE  ALTER INDEX REORGANIZE Manualmente  UPDATE_STATISTICS  sp_updatestats

18. 18 AUTO_UPDATE_STATISTICS Caducan  Tabla en Base de Datos Local:  0 a >0  <=500 y cambios (1ra Columna) >500  >500 y cambios (1ra Columna) >500 + 20% filas originales  Temporales  <=6 y cambios (primera fila ) >6  Variables Tabla: sin estadísticas

19. 19 Flujo de (Re)Compilación AUTO_UPDATE_STATISTICS_ASYNC

20. 20 Actualización Asincrónica Sintaxis: ALTER DATABASE STATDemo SET AUTO_UPDATE_STATISTICS_ASYNC ON; Beneficio:  Consultas más predecibles  Menos riesgo de «TimeOut» Contras:  Planes sub-óptimos

21. Demo 21

22. 22 Mejores practicas • Habilitar Auto Create, Actualización Automática • Actualizar estadísticas todas las veces que se generar un índice • Actualizar solo estadísticas de columnas si el índice ha sido reconstruido • Valida sus estadísticas Estimado vrs Filas Reales

23. Questions?

24. Thank You for Attending Follow @pass24hop Share your thoughts with hashtags #pass24hop & #sqlpass

Notas del editor

¿Cuáles son estadísticas?Optimizador de consultas de SQL Server utiliza estadísticas de distribución para determinar cómo va a satisfacer su consulta SQL. Estas estadísticas representan la distribución de los datos dentro de una columna, o columnas. El optimizador de consultas los utiliza para estimar cuántas filas se devolverán a partir de un plan de consulta. Sin estadísticas para mostrar cómo se distribuyen los datos, el optimizador no tiene ninguna manera se puede comparar la eficiencia de los diferentes planes y así se verán obligados con frecuencia a explorar simplemente la tabla o índice. Sin estadísticas, no puede posiblemente saber si la columna tiene los datos que está buscando sin pisar a través de él. Con información sobre la columna, el optimizador puede hacer mucho mejores decisiones acerca de cómo se va a acceder a sus datos y el uso de sus índices.Estadísticas de distribución se crean automáticamente al crear un índice. Si ha habilitado la creación automática de estadísticas (el ajuste predeterminado de la configuración de base de datos AUTO_CREATE_STATISTICS) también obtendrá estadísticas creadas cada vez que una columna se hace referencia en una consulta como parte de una cláusula de filtrado o Únete criterios.Los datos se mide de dos maneras diferentes dentro de un mismo conjunto de estadísticas, por la densidad y distribución
¿Cuáles son estadísticas?Optimizador de consultas de SQL Server utiliza estadísticas de distribución para determinar cómo va a satisfacer su consulta SQL. Estas estadísticas representan la distribución de los datos dentro de una columna, o columnas. El optimizador de consultas los utiliza para estimar cuántas filas se devolverán a partir de un plan de consulta. Sin estadísticas para mostrar cómo se distribuyen los datos, el optimizador no tiene ninguna manera se puede comparar la eficiencia de los diferentes planes y así se verán obligados con frecuencia a explorar simplemente la tabla o índice. Sin estadísticas, no puede posiblemente saber si la columna tiene los datos que está buscando sin pisar a través de él. Con información sobre la columna, el optimizador puede hacer mucho mejores decisiones acerca de cómo se va a acceder a sus datos y el uso de sus índices.Estadísticas de distribución se crean automáticamente al crear un índice. Si ha habilitado la creación automática de estadísticas (el ajuste predeterminado de la configuración de base de datos AUTO_CREATE_STATISTICS) también obtendrá estadísticas creadas cada vez que una columna se hace referencia en una consulta como parte de una cláusula de filtrado o Únete criterios.Los datos se mide de dos maneras diferentes dentro de un mismo conjunto de estadísticas, por la densidad y distribución
•RANGE_HI_KEY - This is also called a key value and represents the upper bound column value for a histogram step. •RANGE_ROWS - This represents the estimated number of rows whose column value falls within a histogram step, excluding the upper bound. •DISTINCT_RANGE_ROWS - This represents the estimated number of rows with a distinct column value within a histogram step, excluding the upper bound. •EQ_ROWS - This represents the estimated number of rows whose column value equals the upper bound of the histogram step. •AVG_RANGE_ROWS (RANGE_ROWS / DISTINCT_RANGE_ROWS for DISTINCT_RANGE_ROWS > 0) - This represents the average number of rows with duplicate column values within a histogram step, excluding the upper bound.
SAMPLING: Default: 8 MB FULL SCAN ALTER INDEX REORGANIZE (STATISTICS_NORECOMPUTE )

Descubriendo el corazón de la optimización “Estadísticas más que un concepto”

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (7)

Destacado

Destacado (20)

Similar a Descubriendo el corazón de la optimización “Estadísticas más que un concepto”

Similar a Descubriendo el corazón de la optimización “Estadísticas más que un concepto” (20)

Más de SpanishPASSVC

Más de SpanishPASSVC (15)

Último

Último (20)

Descubriendo el corazón de la optimización “Estadísticas más que un concepto”

Notas del editor