SlideShare una empresa de Scribd logo
1 de 13
Descargar para leer sin conexión
PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU
FACULTAD DE CIENCIAS E INGENIERIA
SIMULACIÓN DE SISTEMAS
Guía de Análisis de Datos con Input Analyzer
Una de las principales partes dentro del desarrollo del Trabajo Integral del curso será la poder determinar
y justificar que distribución siguen la llegada de las entidades al sistema y los tiempos de servicio. Para
ellos debemos emplear la relación de datos tomados vinculados a los tiempos entre llegadas de las
entidades y los tiempos de servicio y analizarlos en el INPUT ANALYZER del Arena. A continuación se
detalla secuencialmente como realizar este procedimiento paso a paso.
LLEGADA SALIDA
Inicio atención Fin atención
Entidad:Personasen cola Recurso:Personaen Counter
Tiempo
entre
llegadas
Tiempo
de
servicio
1. Formato de los datos tomados
Dadas una relación de tiempos entre llegadas y servicios se deben ingresar en una hoja MS Excel
ordenado por columnas. Imaginen que la información fuese la siguiente:
Los números deben emplear punto para la separación de cifras decimales y no emplear separadores de
miles.
3456.6578
sin
separador
de miles
con PUNTO
DECIMAL
Dependiendo de la versión de MS Excel que se maneje puede que éste sea el formato por default para
los números. De lo contrario debe cambiar los números a este formato descrito. Para ello se sigue la
siguiente ruta: Herramientas  Opciones como se muestra en el screenshot inferior.
Se selecciona el tab. Internacional se quita el check del checkbox Usar separadores del sistema. Luego
se procede a definir en el campo separador decimal el símbolo de PUNTO (.)
Tras este cambio los datos se hallarán con puntos decimales. Es posible ahora que sean ingresados al
Input Analizer. Para esto guardamos el archivo con otro nombre. Seguimos la ruta Archivo  Guardar
como… y guardamos el archivo con un nombre que permita identificar las datos que estamos guardado y
el tipo de archivo será
TEXTO DELIMITADO POR TABULACIONES (Extensión .txt)
Luego aparecerán una serie de ventanas de dialogo, se le da aceptar (Sí) a todas. Finalmente salimos
del Excel y volverá a aparecer las mismas ventanas de dialogo, se les da nuevamente aceptar (Sí) a
todas.
Dado que en el Trabajo Integral emplearán más de una serie de datos identifiquen claramente cada
archivo generado para que lo puedan identificar fácilmente al abrirlo con el INPUT ANALIZER y
preferiblemente guarden todos en una misma carpeta o ubicación. En el caso del ejemplo el archivo que
contenía los tiempos entre llegadas se esta guardando como llegadas.txt
2. Abriendo el archivo en Input Analizer de Arena
El INPUT ANALYZER se instala por default en la misma carpeta del Arena. Para abrirlo se sigue la
siguiente ruta
Inicio  Todos los programas  Rockwell Software  Arena 9.0  Input Analizer
Una vez iniciado el programa se mostrara la siguiente pantalla
El primer paso consiste en ir a File  New ó alternativamente darle clic al icono de hoja nueva en la barra
Con lo cual se abre la ventana de la nueve hoja de trabajo
Luego se procede a vincular en esta nueva hoja de trabajo los datos de tiempos entre llegadas/tiempos
de servicio que teníamos guardados en formato txt. Para estos se accede al menú File  Data File Use
Existing ó damos clic en el icono superior de la barra.
Con lo cual se nos muestra la siguiente ventana:
Accedemos a la ubicación donde guardamos el archivo con extensión txt y seleccionados en Tipo Text
files (*.txt) y aparece el archivo que guardamos previamente en MS Excel con tipo texto delimitado por
tabulaciones lo seleccionamos y damos clic en Abrir. Se muestra la siguiente pantalla:
El INPUT ANALYZER automáticamente toma los datos y los agrupa por intervalos mostrando un
histograma de frecuencias observadas en cada intervalo. También presenta en la parte inferior la
siguiente data:
DATA SUMMARY
Number of Data Points
Min Data Value
Max Data Value
Sample Mean
Sample Std Deviation
HISTOGRAM SUMMARY
Histogram range
Number of Intervals
El primer grupo resume el número de datos, el valor mínimo, el valor máximo la media y la desviación
estándar de la data analizada. El segundo grupo proporciona para el histograma los rangos de los
intervalos y el número de intervalos.
El Input Analyzer permite determinar ajustes a una gama de distribuciones estadísticas. Para ajustar la
data a una en particular se sigue la ruta Fit y se selecciona alguna de las posibles
Se puede proceder a seleccionar alguna si se tiene una idea aproximada de a cual distribución estadística
podrían ajustar los datos, sin embargo lo óptimo
es emplear la última opción Fit All que selecciona
entre todas las distribuciones aplicables a la data
aquella que se ajuste mejor. Seleccionamos en
este caso Fit All y se muestra la siguiente
pantalla:
Se obtiene entonces la distribución que mejor ajusta a los datos y en el campo inferior la siguiente
información:
DISTRIBUTION SUMMARY
Distribution
Expression
Square error
CHI SQUARE TEST
Number of intervals
Degrees of freedom
Test statistic
Corresponding p-value
KOLMOGOROV-SMIRNOV TEST
Test Statistic
Corresponding p-value
Para analizar si los datos ajustan a la distribución mostrada podemos revisar los p-values de las pruebas.
Si el valor del p-value es menor o igual al nivel de confianza (0.05) se rechaza la hipótesis nula de la
prueba, caso contrario no existen evidencias de que no siga la distribución dada. La condición para
aceptar es entonces que:
pvalue > 0.05
En el caso del ejemplo la distribución recomendada era la beta que es una distribución continua por lo
tanto deberíamos revisar los resultados de la prueba K-s que reflejan un pvalue superior a 0,15 que
permite no rechazar la hipótesis nula y pasar la prueba.
---------------------------------------------------------------------------------------------------------------------------------------------
OBSERVACIÓN. Tenga en cuenta que el Input Analyzer es una herramienta de procesamiento de datos
y ejecución de pruebas de bondad de ajuste, que si bien le facilita en gran medida el análisis de la
información al poder discernir si los datos ingresados son discretos o no, y en base a ello presentar el
resultado de una o ambas pruebas de bondad de ajuste respectivamente, e incluso brindarle la opción de
presentar la opción de mejor ajuste entre todas las disponibles no llega a ser completamente
independiente del análisis cuidadoso de los resultados por parte del analista.
Existen limitaciones importantes. Una de ellas es que si se ingresan datos discretos si bien el Input es
capaz de reconocerlos y ejecutar solamente la prueba de bondad de ajuste Chi cuadrado, al ser ésta
aplicable tanto a discretos como continuos, permite que se prueben como posibles candidatos de ajuste a
distribuciones continuas, y en muchos casos pueden ser sugeridas como las de mejor ajuste para datos
discretos, lo cual no necesariamente es coherente con los tipos de datos que se generan en la realidad, y
por lo tanto emplear dichas distribuciones para simular datos sería ir en contra de los principios de
representación adecuada del sistema real que se pretende simular. Otra limitante importante que debe
tener en cuenta es el hecho de que el Input Analyzer no requiere un número de datos mínimos y por lo
tanto puede aplicar pruebas de bondad de ajuste y presentar resultados aun cuando el número de datos
ingresados es menor a los mínimos recomendados teóricamente en el caso de la prueba Chi Cuadrado.
Es por ello que debe tener especial cuidado en el análisis de los resultados y no aceptar a priori el
resultado de Best Fit hallado a través del Fit All como la respuesta absoluta inequívoca pues existiría una
probabilidad importante de cometer errores si se automatiza en el uso de la herramienta.
---------------------------------------------------------------------------------------------------------------------------------------------
El Input permite además revisar el orden de ajuste de los datos a las diferentes distribuciones posible en
función del error cuadrado ordenado en forma ascendente. Para ver este resumen se sigue la siguiente
ruta: Window  Fit All Summary
Obteniéndose la siguiente pantalla:
Como se puede ver en este caso la siguiente distribución con menor error cuadrado es la Beta. Se puede
revisar el ajuste con una distribución gamma para observar los p values.
Comparando los resultados de ambas pruebas observamos que en este caso bajo un ajuste a la
distribución gamma el pvalue también es mayor a 0,05 en la prueba KS, e incluso en la prueba Chi
Cuadrado. Sin embargo como tiene un error de 0.004524 es preferible seleccionar la distribución Beta
que pasa ambas pruebas y tiene un menor error de 0.00314 que refleja un mejor ajuste por ser menores
las diferencias entre los valores de la data y la curva de ajuste. Los datos entonces se pueden modelar
con la expresión:
BETA(0.707, 2.74645 )
Alfa= 0.707
Beta=2.74645
Offset=0
OBSERVACION El Offset es un termino constante que se suma a la distribución que no tiene efecto
sorbe la varianza sólo sobre la media. En este caso es cero pero puede tomar valor positivo o negativo
en otros ajustes.
Lo que quiere decir que dada la data histórica ingresada se pueden simular futuros tiempo entre llegadas
generados a partir de dicha distribución con los parámetros proporcionados por el Input Analyzer
En el caso de que los datos ingresados no puedan ajustarse a ninguna distribución se procede a
emplear una distribución empírica. Para generarla se selecciona Fit y luego Empirical con lo cual el
Input Analyzer genera automáticamente una distribución empírica en base a los datos del archivo.
3. Opciones del Input Analyzer
El Input Analyzer ofrece una serie de opciones para
modificar los parámetros que se toman en cuenta al
momento de analizar los datos y también opciones
para modificar la presentación de los gráficos. Para
ingresar a las opciones se selecciona Options en la
barra superior.
a) Data Fit
Permite modificar los siguientes parámetros
Include KS Test
Esta opción determina si ejecuta o no la prueba
Kolmogorov-Smirnov (KS) al ajustar los datos a cada
distribución. Por default, siempre esta activa cuando se
carga un nuevo data file. Debido a que cuando se trabaja
con data files muy grandes la velocidad de procesamiento
puede disminuir, puede ser suprimido en caso de que se
requiera experimentar con diferentes distribuciones de
probabilidad. Esta opción, solo funciona con data files que tienen 8192 datos o menos.
Output Summary Files
Esta opción determina cuando o no un archivo de texto es generado cuando una distribución estadística
es ajustada a la data. Por default siempre esta activa cuando se carga nueva data. Similarmente si se
desea experimentar con ajustes de diferentes distribuciones para data file considerablemente grandes
sería sugerible desactivar esta opción.
Auto Data Translation
Esta opción afecta sólo a las distribuciones Erlang, Exponencial, Gamma, Weibull y Lognormal. Cuando
esta activa, la data original, referido como xi, donde xi >= X0, son automáticamente trasladados a un
nuevo data file, ui, donde ui = xi – xo >= 0. Además la función de distribución es ajustada al ser de los
datos traslados, en lugar de los datos originales, Esta función asegura que estas cinco funciones sean
solo ajustadas a data-no negativa como se requiere
Por default, la opción se encuentra activada al cargar un nuevo data file, y cuando la opción se desactiva
las distribuciones Erlang, Exponencial, Gamma, Weibull y Lognormal se volverán inactivas en caso de
que alguno de los datos del data file sea negativo.
b) Parameters
Histogram command (Options, Parameters menu)
La opción de histograma muestra una ventana que permite
cambiar el número de intervalos, límite inferior (ignorando
toda la data por debajo de este límite), límite superior
(ignorando toda la data por encima del límite). El número
de intervalos debe ser como mínimo 5 y no mayor de 40.
Adicionalmente, el límite inferior del histograma debe ser
igual o inferior al mayor entero que no excede el valor
mínimo en el data file. El límite superior, entonces, debe ser
menor o igual al menor entero que iguala o excede el
máximo valor en el data file.
Si los parámetros del histograma son modificados luego de que una función de distribución ha sido
seleccionada, automáticamente se genera una nueva curva que se ajuste a los parámetros actualizados
del histograma.
Distribution command (Options, Parameters menu)
Esta opción es accesible cuando alguna función de
distribución (diferente a la Empírica) ha sido ajustada a la
data. Si se selecciona esta opción parece una ventana
donde se pueden cambiar los parámetros de dicha
distribución en particular. Cuando un parámetro de la
distribución cambia, una nueva evaluación del ajuste se
efectúa. Por ejemplo si se tuviera un data file con una
distribución normal ajustada la ventana que mostraría la
opción de Parameters/Distributions sería:
c) Colors
Ofrece una serie de opciones para cambiar el esquema de colores empleado en el fondo, barras, líneas y
curvas de ajuste de cada histograma y ajuste efectuado.
Ing. Eduardo Carbajal L.

Más contenido relacionado

La actualidad más candente

simulacion numeros pseudoaleatorios
simulacion numeros pseudoaleatoriossimulacion numeros pseudoaleatorios
simulacion numeros pseudoaleatoriosAnel Sosa
 
OPEX (excelencia operacional)
OPEX (excelencia operacional)OPEX (excelencia operacional)
OPEX (excelencia operacional)Rey Rosendo Mtz
 
Simulación en promodel clase 04
Simulación en promodel clase 04Simulación en promodel clase 04
Simulación en promodel clase 04Tensor
 
Equipo 1 metodo de los factores ponderados
Equipo 1 metodo de los factores ponderadosEquipo 1 metodo de los factores ponderados
Equipo 1 metodo de los factores ponderadosJorge Lujan
 
Tutorial promodel
Tutorial promodelTutorial promodel
Tutorial promodelTensor
 
Diseño de Instalaciones unidad 1
Diseño de Instalaciones unidad 1Diseño de Instalaciones unidad 1
Diseño de Instalaciones unidad 1Rafua Diaz
 
4 sistemas probabilísticos
4 sistemas probabilísticos4 sistemas probabilísticos
4 sistemas probabilísticosEmagister
 
Los sistemas en el contexto de la solución
Los sistemas en el contexto de la soluciónLos sistemas en el contexto de la solución
Los sistemas en el contexto de la soluciónLeonardo Alipazaga
 
Numeros aleatorios & pseudoaleatorios itsz vhhh
Numeros aleatorios & pseudoaleatorios itsz vhhhNumeros aleatorios & pseudoaleatorios itsz vhhh
Numeros aleatorios & pseudoaleatorios itsz vhhhVictor Hugo
 
Cadena de Suministros. Unidad 1: Introducción a la logística y cadenas de sum...
Cadena de Suministros. Unidad 1: Introducción a la logística y cadenas de sum...Cadena de Suministros. Unidad 1: Introducción a la logística y cadenas de sum...
Cadena de Suministros. Unidad 1: Introducción a la logística y cadenas de sum...Genesis Acosta
 
Proceso de nacimiento y muerte poisson
Proceso de nacimiento y muerte poissonProceso de nacimiento y muerte poisson
Proceso de nacimiento y muerte poissonKatia Arrayales Zamora
 
Parámetros Básicos para identificar y Estructurar el Sistema.pptx
Parámetros Básicos para identificar y Estructurar el Sistema.pptxParámetros Básicos para identificar y Estructurar el Sistema.pptx
Parámetros Básicos para identificar y Estructurar el Sistema.pptxRICARDOACOSTAPEREZ1
 
Cómo interpretar un diagrama de causa efecto, diagrama de pareto
Cómo interpretar un diagrama de causa efecto, diagrama de paretoCómo interpretar un diagrama de causa efecto, diagrama de pareto
Cómo interpretar un diagrama de causa efecto, diagrama de paretoCesar Jesus Estrada Escobedo
 
Variables aleatorias
Variables aleatoriasVariables aleatorias
Variables aleatoriasTensor
 

La actualidad más candente (20)

Manual 2 Software Arena
Manual 2 Software ArenaManual 2 Software Arena
Manual 2 Software Arena
 
Taxonomia de Beer
Taxonomia de Beer Taxonomia de Beer
Taxonomia de Beer
 
simulacion numeros pseudoaleatorios
simulacion numeros pseudoaleatoriossimulacion numeros pseudoaleatorios
simulacion numeros pseudoaleatorios
 
OPEX (excelencia operacional)
OPEX (excelencia operacional)OPEX (excelencia operacional)
OPEX (excelencia operacional)
 
Simulación en promodel clase 04
Simulación en promodel clase 04Simulación en promodel clase 04
Simulación en promodel clase 04
 
Equipo 1 metodo de los factores ponderados
Equipo 1 metodo de los factores ponderadosEquipo 1 metodo de los factores ponderados
Equipo 1 metodo de los factores ponderados
 
Tutorial promodel
Tutorial promodelTutorial promodel
Tutorial promodel
 
Diseño de Instalaciones unidad 1
Diseño de Instalaciones unidad 1Diseño de Instalaciones unidad 1
Diseño de Instalaciones unidad 1
 
4 sistemas probabilísticos
4 sistemas probabilísticos4 sistemas probabilísticos
4 sistemas probabilísticos
 
Unidad 5-analisis-de-sensibilidad
Unidad 5-analisis-de-sensibilidadUnidad 5-analisis-de-sensibilidad
Unidad 5-analisis-de-sensibilidad
 
Los sistemas en el contexto de la solución
Los sistemas en el contexto de la soluciónLos sistemas en el contexto de la solución
Los sistemas en el contexto de la solución
 
Numeros aleatorios & pseudoaleatorios itsz vhhh
Numeros aleatorios & pseudoaleatorios itsz vhhhNumeros aleatorios & pseudoaleatorios itsz vhhh
Numeros aleatorios & pseudoaleatorios itsz vhhh
 
Taxonomía de Jordan
Taxonomía de JordanTaxonomía de Jordan
Taxonomía de Jordan
 
Simulacion discreta
Simulacion discretaSimulacion discreta
Simulacion discreta
 
Cadena de Suministros. Unidad 1: Introducción a la logística y cadenas de sum...
Cadena de Suministros. Unidad 1: Introducción a la logística y cadenas de sum...Cadena de Suministros. Unidad 1: Introducción a la logística y cadenas de sum...
Cadena de Suministros. Unidad 1: Introducción a la logística y cadenas de sum...
 
Prueba de corridas arriba y abajo de la media
Prueba de corridas arriba y abajo de la mediaPrueba de corridas arriba y abajo de la media
Prueba de corridas arriba y abajo de la media
 
Proceso de nacimiento y muerte poisson
Proceso de nacimiento y muerte poissonProceso de nacimiento y muerte poisson
Proceso de nacimiento y muerte poisson
 
Parámetros Básicos para identificar y Estructurar el Sistema.pptx
Parámetros Básicos para identificar y Estructurar el Sistema.pptxParámetros Básicos para identificar y Estructurar el Sistema.pptx
Parámetros Básicos para identificar y Estructurar el Sistema.pptx
 
Cómo interpretar un diagrama de causa efecto, diagrama de pareto
Cómo interpretar un diagrama de causa efecto, diagrama de paretoCómo interpretar un diagrama de causa efecto, diagrama de pareto
Cómo interpretar un diagrama de causa efecto, diagrama de pareto
 
Variables aleatorias
Variables aleatoriasVariables aleatorias
Variables aleatorias
 

Similar a análisis de datos

Distribución exponencial y lognormal
Distribución exponencial y lognormalDistribución exponencial y lognormal
Distribución exponencial y lognormalHugo_Franco
 
Práctica nº 1
Práctica nº 1Práctica nº 1
Práctica nº 1Tensor
 
Estadística Distribución de frecuencias y gráficas Estadística 007
Estadística Distribución de frecuencias y gráficas Estadística 007Estadística Distribución de frecuencias y gráficas Estadística 007
Estadística Distribución de frecuencias y gráficas Estadística 007CESAR A. RUIZ C
 
Lenguaje de simulacion
Lenguaje de simulacionLenguaje de simulacion
Lenguaje de simulacionlilijessica
 
SPSS contenido básico
SPSS contenido básicoSPSS contenido básico
SPSS contenido básicoJohn Espa
 
Entregar pruebas de bondad de ajuste
Entregar pruebas de bondad de ajusteEntregar pruebas de bondad de ajuste
Entregar pruebas de bondad de ajuste12345678890
 
Guion controlpor variables
Guion controlpor variablesGuion controlpor variables
Guion controlpor variablesleswil
 
Curso de introducion y manejo basico del spss
Curso de introducion y manejo basico del spssCurso de introducion y manejo basico del spss
Curso de introducion y manejo basico del spsstonhonw
 
Practica 1
Practica 1Practica 1
Practica 1Tensor
 
Uso de excel para predicción
Uso de excel para predicciónUso de excel para predicción
Uso de excel para predicciónACalvo Luthier
 
01c SIMULACIÓN DE SISTEMAS Trabajo final desarrollo 2020 01 Primera Semana.pdf
01c SIMULACIÓN DE SISTEMAS Trabajo final desarrollo 2020 01  Primera Semana.pdf01c SIMULACIÓN DE SISTEMAS Trabajo final desarrollo 2020 01  Primera Semana.pdf
01c SIMULACIÓN DE SISTEMAS Trabajo final desarrollo 2020 01 Primera Semana.pdfssuser81b7a52
 
Mini manual de r commander
Mini manual de r commanderMini manual de r commander
Mini manual de r commanderElvis Paucar
 
Herramientas de control estadístico de la calidad
Herramientas de control estadístico de la calidadHerramientas de control estadístico de la calidad
Herramientas de control estadístico de la calidadutsh
 

Similar a análisis de datos (20)

SPSS versión 22 para ingenieros
SPSS versión 22 para ingenierosSPSS versión 22 para ingenieros
SPSS versión 22 para ingenieros
 
Distribución exponencial y lognormal
Distribución exponencial y lognormalDistribución exponencial y lognormal
Distribución exponencial y lognormal
 
ANOVA
ANOVAANOVA
ANOVA
 
Práctica nº 1
Práctica nº 1Práctica nº 1
Práctica nº 1
 
Estadística Distribución de frecuencias y gráficas Estadística 007
Estadística Distribución de frecuencias y gráficas Estadística 007Estadística Distribución de frecuencias y gráficas Estadística 007
Estadística Distribución de frecuencias y gráficas Estadística 007
 
Lenguaje de simulacion
Lenguaje de simulacionLenguaje de simulacion
Lenguaje de simulacion
 
SPSS contenido básico
SPSS contenido básicoSPSS contenido básico
SPSS contenido básico
 
Entregar pruebas de bondad de ajuste
Entregar pruebas de bondad de ajusteEntregar pruebas de bondad de ajuste
Entregar pruebas de bondad de ajuste
 
Guion controlpor variables
Guion controlpor variablesGuion controlpor variables
Guion controlpor variables
 
Curso de introducion y manejo basico del spss
Curso de introducion y manejo basico del spssCurso de introducion y manejo basico del spss
Curso de introducion y manejo basico del spss
 
Practica 1
Practica 1Practica 1
Practica 1
 
que spss
que spssque spss
que spss
 
Introspss
IntrospssIntrospss
Introspss
 
que es SPSS
que es SPSSque es SPSS
que es SPSS
 
Uso de excel para predicción
Uso de excel para predicciónUso de excel para predicción
Uso de excel para predicción
 
Representaciones graficas
Representaciones graficasRepresentaciones graficas
Representaciones graficas
 
01c SIMULACIÓN DE SISTEMAS Trabajo final desarrollo 2020 01 Primera Semana.pdf
01c SIMULACIÓN DE SISTEMAS Trabajo final desarrollo 2020 01  Primera Semana.pdf01c SIMULACIÓN DE SISTEMAS Trabajo final desarrollo 2020 01  Primera Semana.pdf
01c SIMULACIÓN DE SISTEMAS Trabajo final desarrollo 2020 01 Primera Semana.pdf
 
Mini manual de r commander
Mini manual de r commanderMini manual de r commander
Mini manual de r commander
 
Resolución SEP con APMonitor
Resolución SEP con APMonitorResolución SEP con APMonitor
Resolución SEP con APMonitor
 
Herramientas de control estadístico de la calidad
Herramientas de control estadístico de la calidadHerramientas de control estadístico de la calidad
Herramientas de control estadístico de la calidad
 

Último

EJERCICIOS DE -LEY-DE-OHM aplicaciones prácticas
EJERCICIOS DE -LEY-DE-OHM aplicaciones prácticasEJERCICIOS DE -LEY-DE-OHM aplicaciones prácticas
EJERCICIOS DE -LEY-DE-OHM aplicaciones prácticasEfrain Yungan
 
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdfCONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdfErikNivor
 
4.3 Subestaciones eléctricas componentes principales .pptx
4.3 Subestaciones eléctricas componentes principales .pptx4.3 Subestaciones eléctricas componentes principales .pptx
4.3 Subestaciones eléctricas componentes principales .pptxEfrain Yungan
 
SEMANA 6 MEDIDAS DE TENDENCIA CENTRAL.pdf
SEMANA  6 MEDIDAS DE TENDENCIA CENTRAL.pdfSEMANA  6 MEDIDAS DE TENDENCIA CENTRAL.pdf
SEMANA 6 MEDIDAS DE TENDENCIA CENTRAL.pdffredyflores58
 
JimyPomalaza vivienda rural huancavelica .pdf
JimyPomalaza vivienda rural huancavelica .pdfJimyPomalaza vivienda rural huancavelica .pdf
JimyPomalaza vivienda rural huancavelica .pdfJimyPomalaza
 
FORMACION-INTEGRAL-DE-LINIEROS modelo de curso.pdf
FORMACION-INTEGRAL-DE-LINIEROS modelo de curso.pdfFORMACION-INTEGRAL-DE-LINIEROS modelo de curso.pdf
FORMACION-INTEGRAL-DE-LINIEROS modelo de curso.pdfEfrain Yungan
 
Descubrimiento de la penicilina en la segunda guerra mundial
Descubrimiento de la penicilina en la segunda guerra mundialDescubrimiento de la penicilina en la segunda guerra mundial
Descubrimiento de la penicilina en la segunda guerra mundialyajhairatapia
 
METROLOGÍA ÓPTICA E INSTRUMENTACIÓN BÁSICA.pdf
METROLOGÍA ÓPTICA E INSTRUMENTACIÓN BÁSICA.pdfMETROLOGÍA ÓPTICA E INSTRUMENTACIÓN BÁSICA.pdf
METROLOGÍA ÓPTICA E INSTRUMENTACIÓN BÁSICA.pdfesparzadaniela548
 
Sistema de Base de Datos para renta de trajes
Sistema de Base de Datos para renta de trajesSistema de Base de Datos para renta de trajes
Sistema de Base de Datos para renta de trajesjohannyrmnatejeda
 
S454444444444444444_CONTROL_SET_A_GEOMN1204.pdf
S454444444444444444_CONTROL_SET_A_GEOMN1204.pdfS454444444444444444_CONTROL_SET_A_GEOMN1204.pdf
S454444444444444444_CONTROL_SET_A_GEOMN1204.pdffredyflores58
 
Revista estudiantil, trabajo final Materia ingeniería de Proyectos
Revista estudiantil, trabajo final Materia ingeniería de ProyectosRevista estudiantil, trabajo final Materia ingeniería de Proyectos
Revista estudiantil, trabajo final Materia ingeniería de ProyectosJeanCarlosLorenzo1
 
LICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptx
LICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptxLICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptx
LICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptxLucindaMy
 
Tema 7 Plantas Industriales (2).pptx ingenieria
Tema 7 Plantas Industriales (2).pptx ingenieriaTema 7 Plantas Industriales (2).pptx ingenieria
Tema 7 Plantas Industriales (2).pptx ingenieriaLissetteMorejonLeon
 
INSTRUCTIVO_NNNNNNNNNNNNNNSART2 iess.pdf
INSTRUCTIVO_NNNNNNNNNNNNNNSART2 iess.pdfINSTRUCTIVO_NNNNNNNNNNNNNNSART2 iess.pdf
INSTRUCTIVO_NNNNNNNNNNNNNNSART2 iess.pdfautomatechcv
 
PRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdf
PRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdfPRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdf
PRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdfAuraGabriela2
 
MUROS Y CONEXIONES NTC 2017 CONCRETO REFORZADO.pptx
MUROS Y CONEXIONES NTC 2017 CONCRETO REFORZADO.pptxMUROS Y CONEXIONES NTC 2017 CONCRETO REFORZADO.pptx
MUROS Y CONEXIONES NTC 2017 CONCRETO REFORZADO.pptxIcelaMartnezVictorin
 
Proyecto de Base de Datos de César Guzmán
Proyecto de Base de Datos de César GuzmánProyecto de Base de Datos de César Guzmán
Proyecto de Base de Datos de César Guzmáncesarguzmansierra751
 
Introduccion-a-los-tipos-de-cemento (1).pdf
Introduccion-a-los-tipos-de-cemento (1).pdfIntroduccion-a-los-tipos-de-cemento (1).pdf
Introduccion-a-los-tipos-de-cemento (1).pdfjhorbycoralsanchez
 
POBLACIONES CICLICAS Y NO CICLICAS ......
POBLACIONES CICLICAS Y NO CICLICAS ......POBLACIONES CICLICAS Y NO CICLICAS ......
POBLACIONES CICLICAS Y NO CICLICAS ......dianamontserratmayor
 

Último (20)

EJERCICIOS DE -LEY-DE-OHM aplicaciones prácticas
EJERCICIOS DE -LEY-DE-OHM aplicaciones prácticasEJERCICIOS DE -LEY-DE-OHM aplicaciones prácticas
EJERCICIOS DE -LEY-DE-OHM aplicaciones prácticas
 
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdfCONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
 
presentación manipulación manual de cargas sunafil
presentación manipulación manual de cargas sunafilpresentación manipulación manual de cargas sunafil
presentación manipulación manual de cargas sunafil
 
4.3 Subestaciones eléctricas componentes principales .pptx
4.3 Subestaciones eléctricas componentes principales .pptx4.3 Subestaciones eléctricas componentes principales .pptx
4.3 Subestaciones eléctricas componentes principales .pptx
 
SEMANA 6 MEDIDAS DE TENDENCIA CENTRAL.pdf
SEMANA  6 MEDIDAS DE TENDENCIA CENTRAL.pdfSEMANA  6 MEDIDAS DE TENDENCIA CENTRAL.pdf
SEMANA 6 MEDIDAS DE TENDENCIA CENTRAL.pdf
 
JimyPomalaza vivienda rural huancavelica .pdf
JimyPomalaza vivienda rural huancavelica .pdfJimyPomalaza vivienda rural huancavelica .pdf
JimyPomalaza vivienda rural huancavelica .pdf
 
FORMACION-INTEGRAL-DE-LINIEROS modelo de curso.pdf
FORMACION-INTEGRAL-DE-LINIEROS modelo de curso.pdfFORMACION-INTEGRAL-DE-LINIEROS modelo de curso.pdf
FORMACION-INTEGRAL-DE-LINIEROS modelo de curso.pdf
 
Descubrimiento de la penicilina en la segunda guerra mundial
Descubrimiento de la penicilina en la segunda guerra mundialDescubrimiento de la penicilina en la segunda guerra mundial
Descubrimiento de la penicilina en la segunda guerra mundial
 
METROLOGÍA ÓPTICA E INSTRUMENTACIÓN BÁSICA.pdf
METROLOGÍA ÓPTICA E INSTRUMENTACIÓN BÁSICA.pdfMETROLOGÍA ÓPTICA E INSTRUMENTACIÓN BÁSICA.pdf
METROLOGÍA ÓPTICA E INSTRUMENTACIÓN BÁSICA.pdf
 
Sistema de Base de Datos para renta de trajes
Sistema de Base de Datos para renta de trajesSistema de Base de Datos para renta de trajes
Sistema de Base de Datos para renta de trajes
 
S454444444444444444_CONTROL_SET_A_GEOMN1204.pdf
S454444444444444444_CONTROL_SET_A_GEOMN1204.pdfS454444444444444444_CONTROL_SET_A_GEOMN1204.pdf
S454444444444444444_CONTROL_SET_A_GEOMN1204.pdf
 
Revista estudiantil, trabajo final Materia ingeniería de Proyectos
Revista estudiantil, trabajo final Materia ingeniería de ProyectosRevista estudiantil, trabajo final Materia ingeniería de Proyectos
Revista estudiantil, trabajo final Materia ingeniería de Proyectos
 
LICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptx
LICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptxLICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptx
LICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptx
 
Tema 7 Plantas Industriales (2).pptx ingenieria
Tema 7 Plantas Industriales (2).pptx ingenieriaTema 7 Plantas Industriales (2).pptx ingenieria
Tema 7 Plantas Industriales (2).pptx ingenieria
 
INSTRUCTIVO_NNNNNNNNNNNNNNSART2 iess.pdf
INSTRUCTIVO_NNNNNNNNNNNNNNSART2 iess.pdfINSTRUCTIVO_NNNNNNNNNNNNNNSART2 iess.pdf
INSTRUCTIVO_NNNNNNNNNNNNNNSART2 iess.pdf
 
PRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdf
PRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdfPRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdf
PRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdf
 
MUROS Y CONEXIONES NTC 2017 CONCRETO REFORZADO.pptx
MUROS Y CONEXIONES NTC 2017 CONCRETO REFORZADO.pptxMUROS Y CONEXIONES NTC 2017 CONCRETO REFORZADO.pptx
MUROS Y CONEXIONES NTC 2017 CONCRETO REFORZADO.pptx
 
Proyecto de Base de Datos de César Guzmán
Proyecto de Base de Datos de César GuzmánProyecto de Base de Datos de César Guzmán
Proyecto de Base de Datos de César Guzmán
 
Introduccion-a-los-tipos-de-cemento (1).pdf
Introduccion-a-los-tipos-de-cemento (1).pdfIntroduccion-a-los-tipos-de-cemento (1).pdf
Introduccion-a-los-tipos-de-cemento (1).pdf
 
POBLACIONES CICLICAS Y NO CICLICAS ......
POBLACIONES CICLICAS Y NO CICLICAS ......POBLACIONES CICLICAS Y NO CICLICAS ......
POBLACIONES CICLICAS Y NO CICLICAS ......
 

análisis de datos

  • 1. PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU FACULTAD DE CIENCIAS E INGENIERIA SIMULACIÓN DE SISTEMAS Guía de Análisis de Datos con Input Analyzer Una de las principales partes dentro del desarrollo del Trabajo Integral del curso será la poder determinar y justificar que distribución siguen la llegada de las entidades al sistema y los tiempos de servicio. Para ellos debemos emplear la relación de datos tomados vinculados a los tiempos entre llegadas de las entidades y los tiempos de servicio y analizarlos en el INPUT ANALYZER del Arena. A continuación se detalla secuencialmente como realizar este procedimiento paso a paso. LLEGADA SALIDA Inicio atención Fin atención Entidad:Personasen cola Recurso:Personaen Counter Tiempo entre llegadas Tiempo de servicio 1. Formato de los datos tomados Dadas una relación de tiempos entre llegadas y servicios se deben ingresar en una hoja MS Excel ordenado por columnas. Imaginen que la información fuese la siguiente:
  • 2. Los números deben emplear punto para la separación de cifras decimales y no emplear separadores de miles. 3456.6578 sin separador de miles con PUNTO DECIMAL Dependiendo de la versión de MS Excel que se maneje puede que éste sea el formato por default para los números. De lo contrario debe cambiar los números a este formato descrito. Para ello se sigue la siguiente ruta: Herramientas Opciones como se muestra en el screenshot inferior. Se selecciona el tab. Internacional se quita el check del checkbox Usar separadores del sistema. Luego se procede a definir en el campo separador decimal el símbolo de PUNTO (.)
  • 3. Tras este cambio los datos se hallarán con puntos decimales. Es posible ahora que sean ingresados al Input Analizer. Para esto guardamos el archivo con otro nombre. Seguimos la ruta Archivo Guardar como… y guardamos el archivo con un nombre que permita identificar las datos que estamos guardado y el tipo de archivo será TEXTO DELIMITADO POR TABULACIONES (Extensión .txt) Luego aparecerán una serie de ventanas de dialogo, se le da aceptar (Sí) a todas. Finalmente salimos del Excel y volverá a aparecer las mismas ventanas de dialogo, se les da nuevamente aceptar (Sí) a todas. Dado que en el Trabajo Integral emplearán más de una serie de datos identifiquen claramente cada archivo generado para que lo puedan identificar fácilmente al abrirlo con el INPUT ANALIZER y preferiblemente guarden todos en una misma carpeta o ubicación. En el caso del ejemplo el archivo que contenía los tiempos entre llegadas se esta guardando como llegadas.txt 2. Abriendo el archivo en Input Analizer de Arena El INPUT ANALYZER se instala por default en la misma carpeta del Arena. Para abrirlo se sigue la siguiente ruta Inicio Todos los programas Rockwell Software Arena 9.0 Input Analizer
  • 4. Una vez iniciado el programa se mostrara la siguiente pantalla
  • 5. El primer paso consiste en ir a File New ó alternativamente darle clic al icono de hoja nueva en la barra Con lo cual se abre la ventana de la nueve hoja de trabajo Luego se procede a vincular en esta nueva hoja de trabajo los datos de tiempos entre llegadas/tiempos de servicio que teníamos guardados en formato txt. Para estos se accede al menú File Data File Use Existing ó damos clic en el icono superior de la barra.
  • 6. Con lo cual se nos muestra la siguiente ventana: Accedemos a la ubicación donde guardamos el archivo con extensión txt y seleccionados en Tipo Text files (*.txt) y aparece el archivo que guardamos previamente en MS Excel con tipo texto delimitado por tabulaciones lo seleccionamos y damos clic en Abrir. Se muestra la siguiente pantalla:
  • 7. El INPUT ANALYZER automáticamente toma los datos y los agrupa por intervalos mostrando un histograma de frecuencias observadas en cada intervalo. También presenta en la parte inferior la siguiente data: DATA SUMMARY Number of Data Points Min Data Value Max Data Value Sample Mean Sample Std Deviation HISTOGRAM SUMMARY Histogram range Number of Intervals El primer grupo resume el número de datos, el valor mínimo, el valor máximo la media y la desviación estándar de la data analizada. El segundo grupo proporciona para el histograma los rangos de los intervalos y el número de intervalos. El Input Analyzer permite determinar ajustes a una gama de distribuciones estadísticas. Para ajustar la data a una en particular se sigue la ruta Fit y se selecciona alguna de las posibles Se puede proceder a seleccionar alguna si se tiene una idea aproximada de a cual distribución estadística podrían ajustar los datos, sin embargo lo óptimo es emplear la última opción Fit All que selecciona entre todas las distribuciones aplicables a la data aquella que se ajuste mejor. Seleccionamos en este caso Fit All y se muestra la siguiente pantalla:
  • 8. Se obtiene entonces la distribución que mejor ajusta a los datos y en el campo inferior la siguiente información: DISTRIBUTION SUMMARY Distribution Expression Square error CHI SQUARE TEST Number of intervals Degrees of freedom Test statistic Corresponding p-value KOLMOGOROV-SMIRNOV TEST Test Statistic Corresponding p-value Para analizar si los datos ajustan a la distribución mostrada podemos revisar los p-values de las pruebas. Si el valor del p-value es menor o igual al nivel de confianza (0.05) se rechaza la hipótesis nula de la prueba, caso contrario no existen evidencias de que no siga la distribución dada. La condición para aceptar es entonces que: pvalue > 0.05 En el caso del ejemplo la distribución recomendada era la beta que es una distribución continua por lo tanto deberíamos revisar los resultados de la prueba K-s que reflejan un pvalue superior a 0,15 que permite no rechazar la hipótesis nula y pasar la prueba.
  • 9. --------------------------------------------------------------------------------------------------------------------------------------------- OBSERVACIÓN. Tenga en cuenta que el Input Analyzer es una herramienta de procesamiento de datos y ejecución de pruebas de bondad de ajuste, que si bien le facilita en gran medida el análisis de la información al poder discernir si los datos ingresados son discretos o no, y en base a ello presentar el resultado de una o ambas pruebas de bondad de ajuste respectivamente, e incluso brindarle la opción de presentar la opción de mejor ajuste entre todas las disponibles no llega a ser completamente independiente del análisis cuidadoso de los resultados por parte del analista. Existen limitaciones importantes. Una de ellas es que si se ingresan datos discretos si bien el Input es capaz de reconocerlos y ejecutar solamente la prueba de bondad de ajuste Chi cuadrado, al ser ésta aplicable tanto a discretos como continuos, permite que se prueben como posibles candidatos de ajuste a distribuciones continuas, y en muchos casos pueden ser sugeridas como las de mejor ajuste para datos discretos, lo cual no necesariamente es coherente con los tipos de datos que se generan en la realidad, y por lo tanto emplear dichas distribuciones para simular datos sería ir en contra de los principios de representación adecuada del sistema real que se pretende simular. Otra limitante importante que debe tener en cuenta es el hecho de que el Input Analyzer no requiere un número de datos mínimos y por lo tanto puede aplicar pruebas de bondad de ajuste y presentar resultados aun cuando el número de datos ingresados es menor a los mínimos recomendados teóricamente en el caso de la prueba Chi Cuadrado. Es por ello que debe tener especial cuidado en el análisis de los resultados y no aceptar a priori el resultado de Best Fit hallado a través del Fit All como la respuesta absoluta inequívoca pues existiría una probabilidad importante de cometer errores si se automatiza en el uso de la herramienta. --------------------------------------------------------------------------------------------------------------------------------------------- El Input permite además revisar el orden de ajuste de los datos a las diferentes distribuciones posible en función del error cuadrado ordenado en forma ascendente. Para ver este resumen se sigue la siguiente ruta: Window Fit All Summary
  • 10. Obteniéndose la siguiente pantalla: Como se puede ver en este caso la siguiente distribución con menor error cuadrado es la Beta. Se puede revisar el ajuste con una distribución gamma para observar los p values.
  • 11. Comparando los resultados de ambas pruebas observamos que en este caso bajo un ajuste a la distribución gamma el pvalue también es mayor a 0,05 en la prueba KS, e incluso en la prueba Chi Cuadrado. Sin embargo como tiene un error de 0.004524 es preferible seleccionar la distribución Beta que pasa ambas pruebas y tiene un menor error de 0.00314 que refleja un mejor ajuste por ser menores las diferencias entre los valores de la data y la curva de ajuste. Los datos entonces se pueden modelar con la expresión: BETA(0.707, 2.74645 ) Alfa= 0.707 Beta=2.74645 Offset=0 OBSERVACION El Offset es un termino constante que se suma a la distribución que no tiene efecto sorbe la varianza sólo sobre la media. En este caso es cero pero puede tomar valor positivo o negativo en otros ajustes. Lo que quiere decir que dada la data histórica ingresada se pueden simular futuros tiempo entre llegadas generados a partir de dicha distribución con los parámetros proporcionados por el Input Analyzer En el caso de que los datos ingresados no puedan ajustarse a ninguna distribución se procede a emplear una distribución empírica. Para generarla se selecciona Fit y luego Empirical con lo cual el Input Analyzer genera automáticamente una distribución empírica en base a los datos del archivo.
  • 12. 3. Opciones del Input Analyzer El Input Analyzer ofrece una serie de opciones para modificar los parámetros que se toman en cuenta al momento de analizar los datos y también opciones para modificar la presentación de los gráficos. Para ingresar a las opciones se selecciona Options en la barra superior. a) Data Fit Permite modificar los siguientes parámetros Include KS Test Esta opción determina si ejecuta o no la prueba Kolmogorov-Smirnov (KS) al ajustar los datos a cada distribución. Por default, siempre esta activa cuando se carga un nuevo data file. Debido a que cuando se trabaja con data files muy grandes la velocidad de procesamiento puede disminuir, puede ser suprimido en caso de que se requiera experimentar con diferentes distribuciones de probabilidad. Esta opción, solo funciona con data files que tienen 8192 datos o menos. Output Summary Files Esta opción determina cuando o no un archivo de texto es generado cuando una distribución estadística es ajustada a la data. Por default siempre esta activa cuando se carga nueva data. Similarmente si se desea experimentar con ajustes de diferentes distribuciones para data file considerablemente grandes sería sugerible desactivar esta opción. Auto Data Translation Esta opción afecta sólo a las distribuciones Erlang, Exponencial, Gamma, Weibull y Lognormal. Cuando esta activa, la data original, referido como xi, donde xi >= X0, son automáticamente trasladados a un nuevo data file, ui, donde ui = xi – xo >= 0. Además la función de distribución es ajustada al ser de los datos traslados, en lugar de los datos originales, Esta función asegura que estas cinco funciones sean solo ajustadas a data-no negativa como se requiere Por default, la opción se encuentra activada al cargar un nuevo data file, y cuando la opción se desactiva las distribuciones Erlang, Exponencial, Gamma, Weibull y Lognormal se volverán inactivas en caso de que alguno de los datos del data file sea negativo. b) Parameters Histogram command (Options, Parameters menu) La opción de histograma muestra una ventana que permite cambiar el número de intervalos, límite inferior (ignorando toda la data por debajo de este límite), límite superior (ignorando toda la data por encima del límite). El número de intervalos debe ser como mínimo 5 y no mayor de 40. Adicionalmente, el límite inferior del histograma debe ser igual o inferior al mayor entero que no excede el valor mínimo en el data file. El límite superior, entonces, debe ser menor o igual al menor entero que iguala o excede el máximo valor en el data file.
  • 13. Si los parámetros del histograma son modificados luego de que una función de distribución ha sido seleccionada, automáticamente se genera una nueva curva que se ajuste a los parámetros actualizados del histograma. Distribution command (Options, Parameters menu) Esta opción es accesible cuando alguna función de distribución (diferente a la Empírica) ha sido ajustada a la data. Si se selecciona esta opción parece una ventana donde se pueden cambiar los parámetros de dicha distribución en particular. Cuando un parámetro de la distribución cambia, una nueva evaluación del ajuste se efectúa. Por ejemplo si se tuviera un data file con una distribución normal ajustada la ventana que mostraría la opción de Parameters/Distributions sería: c) Colors Ofrece una serie de opciones para cambiar el esquema de colores empleado en el fondo, barras, líneas y curvas de ajuste de cada histograma y ajuste efectuado. Ing. Eduardo Carbajal L.