SlideShare una empresa de Scribd logo
1 de 15
Descargar para leer sin conexión
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
91
Comparación de predicción basada en redes neuronales contra
métodos estadísticos en el pronóstico de ventas
Predictive comparison based in neural network versus statistical methods to forecast sales
Edgar Augusto Ruelas Santoyo; José Antonio Laguna González
Palabras Clave: Pronóstico de ventas, redes neuronales artificiales (RNA)
Key words: Sales Forecast, artificial neural networks (ANN)
RESUMEN
La intención del presente artículo es realizar la
comparación y selección de un método para pronosticar
las ventas de forma eficiente y que beneficie a
organizaciones que ofrecen sus productos al mercado ya
que los pronósticos de ventas son datos de entrada a
diferentes áreas de la empresa y de ser imprecisos
pueden generar gastos para la organización. El caso de
estudio en este artículo fue llevado a cabo dentro de la
empresa Productos Frugo S.A. de C.V., dedicada a la
comercialización de productos alimenticios. Los
métodos y metodologías utilizados y posteriormente
comparados al pronosticar las ventas de la empresa
antes mencionada son: Método de Hold, Winters, la
metodología Box Jenkins (ARIMA) y una Red Neuronal
Artificial. Los resultados muestran que la red neuronal
artificial obtuvo un mejor desempeño logrando el menor
error cuadrático medio, de esta forma es posible
establecer un panorama adecuado para el uso de la
inteligencia artificial dentro de la industria.
ABSTRACT
The intention of this paper is to compare and select a
method to forecast sales efficiently, and provide benefits
to organizations offering their products to market
because sales forecasts are an input to the company
different areas and being inaccurate may cost for the
organization. The study case in this paper was carried
out within the company Frugo Products SA de C.V.;
dedicated to the marketing of food products. The
methods and methodologies used and then compared to
forecast sales of the aforementioned company are: Hold
Method, Winters, Box Jenkins methodology (ARIMA)
and Artificial Neural Network. The results show that the
artificial neural network achieved better performance
scored the lowest mean square error, in this way it is
possible to establish an appropriate scenario for the use
of artificial intelligence in the industry.
INTRODUCCIÓN
Los pronósticos de ventas son indicadores de
realidades económico-empresariales, básicamente
en la situación de la industria en el mercado y en la
participación de la empresa en ese mercado. El
pronóstico determina qué puede venderse con
base en la realidad, y el plan de ventas permite que
esa realidad hipotética se materialice, guiando al
resto de los planes operativos de la empresa. La
elección e implementación de un método adecuado
de pronósticos siempre ha sido un tema de gran
importancia para las empresas. Se utilizan los
pronósticos en el área de compras, marketing,
ventas, etc. Un error significante en el pronóstico
de ventas podría dejar a una empresa sin la
materia prima o insumos necesarios para su
producción, o podría generarle un inventario
demasiado grande. En ambos casos, el pronóstico
erróneo disminuye las utilidades de la empresa.
El uso óptimo de los recursos y la creciente
demanda de una mayor variedad de productos,
entre otros, obliga a los fabricantes a realizar
programas de producción más estrictos y flexibles
para poder maximizar el uso de los costosos
equipos de producción, mano de obra, inversiones
en materias primas, de forma que se cumplan las
fechas de entrega a los clientes finales
minimizando los costos.
El objetivo principal de los pronósticos se
transforma entonces en convertirse en la entrada
para el resto de los planes operativos. Para realizar
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
92
eficientes programas de producción que atiendan
la demanda sin incurrir en excesivos costos de
capital, es deseable un adecuado manejo de la
información de ventas con el fin de realizar
pronósticos con buen nivel de confianza para
todos los departamentos de la empresa.
Debido al comportamiento no lineal que presenta
un pronóstico de ventas, las redes neuronales
artificiales, ANNs, por sus siglas en ingles
(Artificial Neural Networks) son un excelente
candidato para la predicción de esta estimación.
Las ANNs son usadas en modelos y sistemas
altamente no lineales (Azadeh, 2008). En general
las ANNs son técnicas matemáticas simples
diseñadas para cumplir una gran variedad de
tareas. Hoy en día las ANNs pueden ser
configuradas en varios arreglos para desarrollar
diversas tareas, tales como, el reconocimiento de
patrones, minería de datos, clasificación y
predicción, entre otras (Vahidinasab, 2008). Las
ANNs están compuestas de atributos que
aprenden soluciones en aplicaciones donde se
necesita un mapeo lineal o no lineal. Algunos de
estos atributos son: capacidad de aprender,
generalización y procesamiento en paralelo, estos
atributos hacen que las ANNs puedan resolver
problemas complejos haciendo de esta técnica un
método preciso y flexible (Balestrassi, 2009),
(Freeman, 1991) y (Rabuñal, 2006). El objetivo del
presente artículo, se enfoca al uso de redes
neuronales para realizar pronósticos de ventas y
contrastar los resultados obtenidos contra
pronósticos de métodos estadísticos clásicos en
función de un error cuadrático medio. Suponiendo
que la utilización de un método de pronóstico no
tradicional, como las redes neuronales, podrá
brindar un pronóstico de ventas más acertado en
comparación a los resultados obtenidos utilizando
un método de pronóstico estadístico tradicional.
Trabajo relacionado
Desde la primera mitad del siglo XX se han
empezado a desarrollar modelos computacionales
que han intentado emular el comportamiento del
cerebro humano (McCulloch y Pitts, 1943). Aunque
se han propuesto una gran cantidad de ellos, todos
usan una estructura en red en la cual los nodos o
neuronas son procesos numéricos que involucran
estados de otros nodos según sus uniones. Una
clase de estos modelos computacionales son las
redes de neuronas artificiales (HayKin, 2008). Las
redes neuronales artificiales se han hecho muy
populares debido a la facilidad en su uso e
implementación y la habilidad para aproximar
cualquier función matemática, además con su
marcada habilidad para obtener resultados de
datos complicados e imprecisos, pueden utilizarse
para extraer patrones y detectar tramas que son
muy difíciles de apreciar por humanos u otras
técnicas computacionales.
Una de las definiciones que se estima más certera
de Red Neuronal Artificial es la siguiente: ``Las
redes neuronales artificiales son conjuntos de
elementos de cálculo simples, usualmente
adaptativos, interconectados masivamente en
paralelo y con una organización jerárquica que le
permite interactuar con algún sistema del mismo
modo que lo hace el sistema nervioso biológico''
(Kohonen, 1989). Su aprendizaje adaptativo, auto-
organización, tolerancia a fallos, operación en
tiempo real y fácil inserción dentro de la tecnología
existente, han hecho que su utilización se haya
extendido en áreas como la biológica, financiera,
industrial, medio ambiental, militar, salud, etc.
(Hilera y Martinez, 1995). Están funcionando en
aplicaciones que incluyen identificación de
procesos (Gonzalez y Martinez, 1998), detección de
fallos en sistemas de control (Aldrich y Van
Deventer, 1995), modelación de dinámicas no
lineales (Meert y Rijckaert, 1998), control de
sistemas no lineales (Rivals and Personnaz, 2000) y
optimización de procesos (Nacimiento y Guardani,
2000).
Investigaciones proponen el uso de redes
neuronales artificiales como herramienta eficiente
de pronósticos, ya que no presentan un análisis
lineal (Toro et al; 2004) y (Saldaña, 2010). Otra
parte importante de la investigación que se ha
realizado es la caracterización de los métodos para
pronósticos ya que la estimación del
comportamiento futuro de algunas variables
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
93
puede realizarse utilizando diversos métodos de pronósticos. Cada uno de los métodos de
proyección tiene una aplicación de carácter
especial que hace de su selección un problema de
decisión influido por diversos factores, como son,
la validez y disponibilidad de los datos históricos,
la precisión deseada del pronóstico, el costo del
procedimiento, los beneficios del resultado, los
periodos futuros que se desee pronosticar y el
tiempo disponible para hacer el estudio entre otros
(SapagChain, 2000). Dentro de los métodos de
pronósticos se pueden clasificar en función de su
carácter, esto es, aplicando métodos de carácter
cualitativo, modelos causales y modelos de series
de tiempo (Nojek et al., 2003).
De acuerdo con Toro et al., en 2004, es posible
entrenar a una red neuronal por medio de los
niveles de ventas partiendo del siguiente
algoritmo. Si V (t) es el nivel de ventas del mes t y
k el número de períodos (meses) anteriores a usar
en la predicción, se puede decir que el conjunto de
datos V (t − k), V (t − k +1),…, V (t −1) son los datos
de ventas de los k meses anteriores. Por lo tanto, el
objetivo que debe cumplir la red neuronal es que
su salida V’ (t), dada por la ecuación
V (t) = F [V(t −k),V(t −k +1),…,V(t −1), t] (1)
Sea lo más cercana posible a V (t). Por lo tanto, se
puede decir que V’ (t) es la estimación de las
ventas para el período t.
En (Koulouriotis, 2012), se analiza la importancia
de reducir el nivel de inventario en una
organización a través del pronóstico de ventas,
comparando diferentes técnicas entre ellas la
inteligencia artificial en un ambiente industrial.
Los resultados obtenidos muestran que es posible
establecer buenos niveles de inventario a través de
los pronósticos realizados por una red neuronal de
propagación hacia adelante. Bajo ese mismo
enfoque en (Azadeh, 2012), se presenta una red
neuronal difusa para estimar el precio del gas
natural a partir de parámetros con un cierto nivel
de incertidumbre. En (Chang, 2012) establecen un
mecanismo de prevención sobre el costo de
fabricación basado en redes neurona
les artificiales. Dentro de la investigación
propuesta en (Nazemi, 2013), se determina que la
inteligencia computación a través de una red
neuronal resuelve de mejor forma problemas de
optimización de cartera con comparación con otros
modelos. En (Zhai, 2013) y (Sadeghi, 2013), se
propone el uso de tecnologías de la inteligencia
artificial como los sistemas difusos para la
predicción de costos y establecer una planeación
agregada, respectivamente. Ambas
implementaciones de la inteligencia artificial
dentro del sector industrial demuestran las
ventajas de su uso en comparación con métodos
tradicionales, propiciando una ventaja competitiva
en las organizaciones
Después de una breve introducción y análisis del
trabajo relacionado al tema a tratar dentro de la
sección 1, el artículo se organiza como sigue: en la
sección 2, se da una explicación de la metodología
a la que se dio seguimiento durante la
investigación abordando aspectos como: La
recolección de los datos, Autocorrelación y la
descripción de cada método propuesto.
Consecutivamente se muestran los resultados
obtenidos durante la implementación de cada uno
de los métodos seleccionados, así como la
discusión de los resultados obtenidos dentro de las
secciones 3 y 4 respectivamente. Finalmente, las
conclusiones se mencionan en la sección 5.
Para definir la metodología a emplearse se debe
considerar que una serie de datos describe su
propio comportamiento, por lo que es importante
entender que con los métodos y los pasos
resultantes de este trabajo se obtendrá una
metodología para elegir los mejores modelos para
pronosticar las ventas dentro de la empresa donde
se llevó el caso de estudio, se debe estar consciente
de que el modelo no será único para todas las
situaciones dentro de la misma rama industrial, ya
que el tratamiento de los datos se debe realizar
bajo diferentes factores. Es decir la metodología
propuesta está dedicada a la elección del mejor
METODOLOGÍA
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
94
modelo de pronóstico y no a encontrar un modelo
universal. En la figura 1, se describen los pasos
básicos a seguir en la metodología para obtener los
pronósticos de ventas:
Figura 1. Esquema básico de la metodología
empleada en la investigación
La primera etapa para realizar pronósticos, es la
recolección de datos válidos y confiables. Un
pronóstico no puede ser más preciso que los datos en
que se basa. Cuando se mide una variable a lo largo
del tiempo, las observaciones en diferentes periodos
con frecuencia están relacionadas o correlacionadas.
Esta correlación se mide mediante el uso del
coeficiente de autocorrelación. Posteriormente se
selecciona el método de pronóstico adecuado en
función del patrón que presenten los datos, el tipo de
serie y la facilidad de aplicación (Makradakis, 1986).
Además se deben de establecer los parámetros
adecuados para el tipo de pronóstico, este paso fue
resuelto mediante experimentación exhaustiva
tomando como variable de respuesta un error
cuadrático medio mínimo.
Recolección de datos
En la recolección de datos para pronósticos, se deben de
identificar dos claras categorías, de entrada y prueba. La
primera es vital para diseñar y construir el modelo que
permita la realización del pronóstico, la segunda igual
de importante, sirve como punto de referencia para
validar el resultado obtenido por el pronóstico, ya que se
está probando la estimación contra la realidad.
Los datos de entrada fueron obtenidos de los registros
históricos de los años 2010 y 2011, los cuales se
convirtieron en los datos de entrada para cada uno de
los métodos de pronósticos, ya construidos dichos
modelos, se procede a la prueba de cada uno de ellos y
se verifica su eficiencia. Los datos o históricos de prueba
fueron las ventas de los años 2012 y 2013, la
concentración de los datos fue realizada mensualmente.
En la tabla 1, se muestra de forma detallada la
información de las ventas necesaria para la evaluación
de los modelos elegidos para el desarrollo de los
pronósticos.
Año Mes Tiemp
o (X)
Ventas en libras
(Y)
2012 Enero 1 1,715,363
Febrero 2 2,338,955
Marzo 3 1,206,298
Abril 4 1,201,767
Mayo 5 1,046,660
Junio 6 1,884,477
Julio 7 1,282,274
Agosto 8 413,025
Septiembre 9 970,179
Octubre 10 1,324,767
Noviembre 11 1,221,979
Diciembre 12
1,106,086
2013 Enero 13 1,784,131
Febrero 14 2,836,453
Marzo 15 3,283,337
Abril 16 2,362,562
Mayo 17 2,802,633
Junio 18 1,751,905
Julio 19 2,496,522
Agosto 20 1,881,808
Si
No
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
95
Tabla 1. Histórico de ventas 2012 y 2013. Empresa Productos Frugo S.A. de C.V
En la figura 2, se muestra un diagrama de dispersión para visualizar la relación que existe entre las ventas
de mes a mes, de esta forma es sencillo observar el comportamiento de los datos.
Figura 2. Representación gráfica de ventas. Microsoft Excel 2010.
Análisis de autocorrelación
Para evitar crear ambigüedades a la hora de tomar
una decisión sobre el método más conveniente a la
hora de realizar los pronósticos, es necesario
utilizar una herramienta que permita evaluar el
comportamiento de la serie y que además
considere a los elementos que la componen, es
decir, que muestre si la serie es aleatoria, tiene
tendencia o un patrón estacional. Una herramienta
viable y que fue utilizada para el análisis de
autocorrelación es el autocorrelograma, con él es
posible establecer un análisis del patrón de la serie
de datos además de obtener el coeficiente de
autocorrelación, que sin duda permitirá identificar
qué elementos de la serie se encuentran presentes
en ésta. La autocorrelación es la correlación que
existe entre una variable retrasada con uno o más
periodos. Los patrones de datos que incluyen
componentes como tendencia, estacionalidad e
irregularidad se pueden estudiar usando el
enfoque del análisis de autocorrelación. Los
coeficientes de autocorrelación para diferentes
desfases de tiempo de una variable se emplean
para identificar patrones en las series de tiempo de
datos. La ecuación siguiente contiene la fórmula
para calcular el coeficiente de autocorrelación (rk)
entre las observaciones Yt y Yt-k, las causales se
encuentran a k periodos de distancia.
Septiembre 21 1,975,181
Octubre 22 2,649,544
Noviembre 23 2,945,026
Diciembre 24 2,329,979
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
96
(2)
Donde
r = coeficiente de autocorrelación para un retraso de k
periodos.
= media de los valores de la serie.
Yt = observaciones en el periodo t.
Yt-k =observaciones de k periodos anteriores o durante
un periodo t-k.
Aplicando la ecuación 2, se obtiene el coeficiente de
autocorrelación y de esta forma es posible verificar el
comportamiento de la serie de tiempo tabla 2. En la
figura 3, se muestra gráficamente que el valor obtenido
para el retraso 1, r1 es de 0.61082, el cual indica que
existe una autocorrelación significativa entre las ventas
del primer mes con las ventas del mes siguiente. En
general conforme aumente el número de retrasos de
tiempo, k, disminuyen los coeficientes de
autocorrelación. De acuerdo a los resultados obtenidos
autocorrelograma se observa que los datos tienden a
caer paulatinamente hacia cero, además que los
primeros retrasos son bastante diferentes de cero, como
resultado del análisis de los datos se concluye que está
presente un patrón tendencial en la serie de tiempo.
Tabla 2. Función de Autocorrelación
para cada periodo.
22
20
18
16
14
12
10
8
6
4
2
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
Autocorrelation
Autocorrelación de laventas de brocóli
Figura 3. Función de Autocorrelación.
Software estadístico Minitab versión 15.
Selección del método de pronóstico
La selección de la técnica empleada para pronosticar, es
definida en base al análisis de los factores que
intervienen en la selección del modelo, en este caso se
buscan modelos adecuados que se ajusten a patrones
con tendencia. De acuerdo con Hanke y Reistch, en 2006,
los modelos sugeridos a emplearse para realizar los
pronósticos son: Suavización exponencial ajustado a la
tendencia, Método de Holt y Suavización exponencial
ajustado para variaciones de tendencia y
estacionalidades, Método de Winters además de la
metodología Box-Jenkins (ARIMA). Estos métodos y
metodologías estadísticas serán comparados contra una
red neuronal artificial la cual no requiere probar un
supuesto de tendencia o estacionalidad en la serie de
tiempo previo a la realización del pronóstico.
Retrasos
en cada
periodo
Función de
Autocorrelación
1 0.610829
2 0.402748
3 0.243364
4 0.261904
5 0.093726
6 -0.084612
7 -0.046443
8 0.051484
9 -0.060716
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
97
Método de Holt
El nivel de la serie de tiempo puede cambiar
ocasionalmente y cuando se usa el suavizamiento
exponencial simple es requerido actualizaciones de
nivel. En algunas ocasiones los datos observados
tendrán una tendencia clara en la información que
permita anticipar movimientos futuros hacia arriba.
Cuando este sea el caso, será necesaria una función de
pronóstico de tendencia lineal. Dado que las series
económicas y de negocios rara vez exhiben una
tendencia lineal fija que evolucione con el tiempo. Una
aportación de Holt, en 1957, es el desarrollo de un
método de suavizamiento exponencial lineal, el cual
toma en cuenta las tendencias lineales locales en
evolución dentro de una serie de tiempo y puede usarse
para generar pronósticos. Cuando se anticipa la
tendencia en la serie de tiempo, se requiere un estimado
de la pendiente y de nivel actual. La técnica de Holt
suaviza el nivel y la pendiente de manera directa al usar
diferentes constantes de suavizamiento para cada una.
Éstas proporcionan estimados de nivel y de la pendiente
que se adapta a lo largo del tiempo conforme aparecen
nuevas observaciones. Una de las ventajas de Holt es su
flexibilidad al seleccionar los coeficientes que controlan
el nivel y la tendencia. Los parámetros requeridos son
Alfa (α) y Beta (β). Alfa se usa para suavizar los datos a
fin de eliminar la aleatoriedad. La constante de
suavizamiento β es como α, a excepción de que se usa
para suavizar la tendencia en los datos. Ambas
constantes de suavizamiento se usan para promediar los
valores anteriores y, de esta forma, eliminar el fenómeno
aleatorio presente en la serie de tiempo. Las constantes
de suavizamiento α y β pueden seleccionarse de manera
subjetiva o mediante la minimización de una medida de
error de pronósticos como el error cuadrático medio
(MSE) (Hanke y Reistch 2006). En la tabla 3, se muestran
los resultados de la experimentación realizada para
definir los parámetros α y β necesarios para el método
Holt.
Las tres ecuaciones que se utilizan para el método de
Holt son:
1.La serie suavizada exponencialmente, o estimado del nivel
actual:
(3)
2.El estimado de la tendencia:
(4)
Pronósticos del periodo p en el futuro:
(5)
Dónde:
Lt = nuevo valor suavizado (estimado del nivel actual)
α = constante de suavización para el nivel (0 < α <1)
Yt = observación nueva o valor real de la serie en el
periodo t
β = constante de suavización para el estimado de
tendencia (0 < β < 1)
Tt = estimado de tendencia
p = periodo a pronosticar en el futuro
= pronóstico para periodo p en el futuro
Método de Winters
El método Winters con tres parámetros de
suavizamiento exponencial lineal y estacional, es una
extensión del método de Holt, tiene el potencial de
describir mejor los datos y reducir el error del
pronóstico. En el método de Winters se usa una ecuación
adicional para estimar la estacionalidad. En la versión
multiplicativa del método de Winters, el estimado de la
estacionalidad será como un índice estacional y se
calcula mediante la ecuación del estimado de la
estacionalidad. En la tabla 4, se muestran los resultados
de la experimentación realizada para definir los
parámetros alfa , beta y gama necesarios
para el método Winters. Las cuatro ecuaciones utilizadas
en el suavizamiento (multiplicativo) de Winters son:
1.El nivel de la serie estimado por suavizamiento exponencial:
(6)
2.El estimado de la tendencia:
(7)
3.El estimado de la estacionalidad:
(8)
4.Pronóstico del periodo p en el futuro:
(9)
Donde
Lt = nuevo valor suavizado o nivel actual estimado
α = constante de suavizamiento para el nivel
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
98
Yt = nueva observación o valor real en el periodo t
β = constante de suavizamiento para el estimado de
tendencia
Tt = estimado de tendencia
= constante de suavizamiento para el estimado de
estacinalidad
St = estimado de estacionalidad
p = número de periodo a pronosticarse
s = longitud de estacionalidad
= pronóstico para el periodo p en el futuro
Tabla 3. Resultados de la experimentación para definir los
parámetros en el método Holt. Tabla 4. Resultados de la experimentación para definir los
parámetros en el método Winters.
Error
Cuadrático
Medio
0.6 0.1 3938.6882
0.5 0.1 3969.30554
0.7 0.1 3977.204
0.8 0.1 4076.29505
0.4 0.1 4080.6369
0.6 0.2 4218.96766
0.9 0.1 4233.51164
0.5 0.2 4262.09318
0.7 0.2 4265.64826
0.3 0.1 4287.028504
0.8 0.2 4389.00711
0.4 0.2 4410.060095
0.6 0.3 4473.05642
0.5 0.3 4521.391724
0.7 0.3 4538.82546
0.9 0.2 4584.23129
0.2 0.1 4627.653574
0.3 0.2 4670.158746
0.8 0.3 4698.33332
0.4 0.3 4704.997091
0.5 0.5 4941.154883
0.9 0.3 4943.49782
0.4 0.4 4957.868414
0.2 0.2 5001.967229
0.3 0.3 5041.491025
0.6 0.6 5145.462445
0.1 0.1 5306.60193
0.3 0.4 5355.263543
0.2 0.3 5470.3474
0.1 0.2 5526.450276
Error
Cuadrático
Medio
0.7 0.1 0.4 4034.77
0.8 0.1 0.4 4057.31
0.7 0.2 0.5 4076.02
0.7 0.2 0.4 4076.54
0.6 0.2 0.4 4109.06
0.6 0.2 0.5 4110.78
0.6 0.1 0.5 4122.04
0.7 0.1 0.2 4137.4
0.6 0.1 0.4 4142.26
0.8 0.1 0.2 4159.72
0.7 0.2 0.2 4178.85
0.7 0.1 0.1 4187.19
0.6 0.2 0.2 4190.14
0.8 0.1 0.1 4203.67
0.7 0.2 0.1 4227.35
0.5 0.2 0.4 4229.18
0.5 0.2 0.5 4231.91
0.9 0.1 0.4 4232.56
0.6 0.2 0.1 4236.58
0.6 0.1 0.2 4240.99
0.6 0.3 0.4 4273.83
0.8 0.2 0.2 4277.29
0.7 0.3 0.4 4287.82
0.7 0.3 0.5 4288.82
0.6 0.3 0.5 4291.12
0.6 0.1 0.1 4292.48
0.8 0.2 0.1 4324.57
0.9 0.1 0.1 4325.9
0.6 0.3 0.2 4342.26
0.5 0.3 0.4 4349.34
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
99
Método ARIMA
Los Modelos de Promedio Móvil Autorregresivo
Integrado, (ARIMA), por sus siglas en inglés, son
una clase de modelos que tienen la capacidad de
operar sobre series de tiempo estacionarias o no
estacionarias. El primer paso en la identificación
del modelo consiste en determinar si la serie es
estacionaria, es decir, si la serie de tiempo aparenta
variar alrededor de un nivel fijo. Una serie no
estacionaria se indica si la serie parece crecer o
decrecer con relación del tiempo y las
autocorrelaciones no pueden desvanecerse con
rapidez. Si la serie no es estacionaria, con
frecuencia puede convertir a una serie estacionaria
al tomar sus diferencias, es decir, la serie es
remplazada por una serie de diferencias. Entonces,
se especifica un modelo ARIMA para la serie de las
diferencias. Se debe especificar el grado de
diferenciación y el algoritmo de Box-Jenkins
convierte los datos en una serie estacionaria y
realizar los cálculos subsecuentes utilizando los
datos convertidos. Una vez obtenida una serie
estacionaria, se debe identificar la forma del
modelo a utilizar. Este paso se logra mediante la
comparación de los coeficientes de autocorrelación
y de autocorrelación parcial se calcularon a partir
de los datos para las autocorrelaciones y
autocorrelaciones parciales teóricas de los diversos
modelos ARIMA (Hanke y Reistch, 2006), por lo
tanto de acuerdo a la figura 3 y 4, el modelo
correspondiente es el modelo AR (2).
6
5
4
3
2
1
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
Partial
A
utocorrelation
Partial Autocorrelation Function for VENTAS BROCOLI
(with 5% significance limits for the partial autocorrelations)
Figura 4. Autocorrelación parcial de la serie de tiempo.
Software estadístico Minitab versión 15.
Red Neuronal Artificial
Una red neuronal artificial es un procesador
masivo paralelo formado por unidades simples de
procesamiento que tienen una propensión natural
para almacenar conocimiento experimental,
haciéndolo viable para su uso. La red neuronal se
asemeja al cerebro en dos aspectos:
i. El conocimiento es adquirido por la red desde su
entorno a través de un proceso de aprendizaje.
ii.Las fuerzas de las conexiones entre neuronas,
conocidas como pesos sinápticos, son usadas para
almacenar el conocimiento (Haykin, 2009).
La arquitectura de una red neuronal consiste en la
organización y disposición de las neuronas en la
red formando capas o agrupaciones de neuronas.
Los parámetros fundamentales son: número de
capas, número de neuronas por capa, grado de
conectividad y tipo de conexión entre neuronas
(Villanueva, 2002).
Redes multicapa: Las redes neuronales artificiales
multicapa se forman con un grupo de capas
simples en cascada. La salida de una capa es la
entrada de la siguiente capa. Se ha demostrado que
las redes multicapa presentan cualidades y
aspectos por encima de las redes de una capa
simple. Dado que este tipo de redes disponen de
varias capas, las conexiones entre neuronas
pueden ser del tipo feedforward (conexión hacia
adelante) o del tipo feedback (conexión hacia
atrás). Las redes feedforward son especialmente
útiles en aplicaciones de reconocimiento o
clasificación de patrones. En la figura 5, se muestra
la estructura general de una red de este tipo. La
figura y nomenclatura se adoptan de (Hagan,
2002).
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
100
Figura 5. Estructura general de una red neuronal multicapa.
La entrada a la red es el vector p cuya longitud es igual a
R, W es la matriz de pesos con dimensiones SxR, a y b
son vectores de longitud S el cual, representa el número
de neuronas de la red.
La habilidad de la red perceptrón multicapa para
aprender a partir de un conjunto de ejemplos, al
aproximar relaciones no lineales, filtrar ruido en los
datos, etc. hace que sea un modelo adecuado para
abordar problemas reales, sin que esto indique que son
las mejores herramientas como aproximadores
universales. En la tabla 5, se muestra el esquema de la
red neuronal artificial construida para la realización de
los pronósticos de ventas, cabe destacar que no existe un
método específico para llegar a la arquitectura de la red,
el parámetro que definió esta arquitectura fue el error
cuadrático medio mínimo al momento de realizar los
pronósticos. La red de neuronas almacena información
en una cadena de interconexiones neuronales por medio
de los pesos. La función de transferencia utilizada es la
tangente hiperbólica.
La arquitectura de diferentes tipos de redes de neuronas
artificiales fue explorada, con el objetivo de encontrar el
diseño idóneo al problema que debemos resolver. Una
etapa de aprendizaje debe ser considerada para la
creación de un modelo neuronal, en esta parte es donde
se introducen los datos de entrada a la red neuronal
artificial. La fase de aprendizaje se utiliza para ajustar
los pesos, los cuales inicialmente son valores aleatorios.
El valor del error cuadrático medio sirve para evaluar la
corrección de pesos en cada iteración. Finalmente, la red
neuronal artificial aprende el comportamiento de la base
de datos generada por medio de datos introducidos en
su capa de entrada.
Una vez definidos los parámetros y arquitecturas de
los métodos para pronosticar se prueban los métodos
seleccionados, para el método de Holt se determina
que los mejores valores de acuerdo a un error
cuadrático medio mínimo son: alfa de 0.6 y beta de
0.1 (Ver tabla 3). Prosiguiendo con la misma lógica se
determina que los mejores parámetros para el método
de Winters son: alfa de 0.7, beta de 0.1 y gama 0.4
(Ver tabla 4). La metodología ARIMA queda definida
como un modelo AR (2) después de comparar las
autocorrelaciones parciales, y por último la red
neuronal artificial empleada para la realización de los
pronósticos descrita en la tabla 5. Los resultados de la
aplicación del método Holt, Winters, metodología
ARIMA y la red neuronal trabajando con sus
parámetros adecuados para realizar los pronósticos
se encuentran en la tabla 6 y figuras 6, 7, 8 y 9
Topología de la Red Neuronal Artificial
Numero de Neuronas en la capa
oculta
19
Tasa de aprendizaje 0.01
Numero de Iteraciones 4000
Error objetivo 1x10-5
RESULTADOS
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
101
respectivamente, las figuras fueron generadas a partir
de Microsoft Excel 2010. Los resultados de los
pronósticos se encuentran codificados, lo que consiste
en dividir el dato real entre diez mil para un mejor
manejo de la información, así que solo es necesario
realizar la operación inversa para obtener el valor real
arrojado por el método seleccionado.
Tabla 6. Resultados de cada técnica de pronóstico.
Año Mes Tie
mpo
(X)
Resultados
en libras (Y)
Pronóstico
con Método de
Holt
Pronóstico
con Método de
Winters
Valor
pronosticado
ARIMA
Valor
pronosticado
ANN
2010
Enero 1 1,715,363 171.5363 178.839179 181.98444 171.5467
Febrero 2 2,338,955 171.5363 211.109168 177.975959 233.8767
Marzo 3 1,206,298 212.6934 141.548676 216.792561 120.6265
Abril 4 1,201,767 155.673 115.525686 146.288296 120.1961
Mayo 5 1,046,660 130.4632 104.682685 146.006255 112.0354
Junio 6 1,884,477 109.525 150.920626 136.351342 188.4516
Julio 7 1,282,274 156.1541 133.040549 188.502763 128.2219
Agosto 8 413,025 136.998 60.1473986 151.017558 112.0207
Septiembre 9 970,179 71.4389 81.4201135 96.9095954 112.021
Octubre 10 1,324,767 80.1792 116.46938 131.590645 132.4692
Noviembre 11 1,221,979 108.0885 111.896028 153.662611 122.1821
Diciembre 12 1,106,086 113.9314 105.309848 147.264387 112.0911
2011
Enero 13 1,784,131 109.1157 144.671885 140.05042 178.3963
Febrero 14 2,836,453 152.0299 233.219576 182.256547 261.4035
Marzo 15 3,283,337 240.2319 273.193935 247.760216 261.4037
Abril 16 2,362,562 307.6118 233.188298 275.577312 261.4037
Mayo 17 2,802,633 275.0359 239.29389 218.262021 261.4037
Junio 18 1,751,905 288.7235 187.047837 245.65503 175.1843
Julio 19 2,496,522 224.3429 205.024267 180.250581 249.6467
Agosto 20 1,881,808 244.7862 190.72641 226.600602 188.1843
Septiembre 21 1,975,181 212.6843 172.981014 188.336627 197.5163
Octubre 22 2,649,544 204.536 235.303969 194.148796 261.4019
Noviembre 23 2,945,026 245.3636 247.765508 236.12573 261.4032
Diciembre 24 2,329,979 282.3719 230.263633 254.518537 233
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
102
Figura 6. Ventas reales vs pronóstico con el Método de Holt.
Figura 7. Ventas reales vs pronósticos con el Método de Winter.
Figura 8. Ventas reales vs pronóstico con el Método de ARIMA.
Figura 9. Ventas reales vs pronósticos con la Red neuronal artificial.
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
103
Finalmente se llevó a cabo el comparativo y
evaluación de cada una de la los métodos,
considerando el error cuadrático medio para su
evaluación. La finalidad es saber cuál de los
métodos alcanzaría el menor error cuadrático
medio y de esta forma poder probar la hipótesis
planteada sobre la promoción de la inteligencia
artificial como método de pronósticos en las
organizaciones, como resultado se obtuvo que la
red neuronal alcanzó el menor error cuadrático
versus la técnica del método de Hold, método de
Winters y la metodología Box Jenkin (ARIMA). En
la figura 10, se muestran los resultados de la
evaluación mediante el MSE.
Figura 10. Resultados de la evaluación por el MSE.
Microsoft Excel 2010.
Como se ha mencionado, las empresas requieren
de planes de producción que proporcionen una
mejor programación de las actividades en cada una
de las áreas, para eso requieren de saber con
anticipación cuales pueden ser sus posibles ventas
en el futuro de forma precisa, ya que dependiendo
de esta información, es posible incurrir en graves
errores como son: materia prima insuficiente, falta
de personal, exceso de materia prima e
incumplimiento en fechas de entrega lo que genera
un incremento de costos de producción. La
intención de este artículo es encontrar una
metodología para pronosticar las ventas de la
forma más precisa posible y de esta forma hacer
más competitiva a la organización.
Algunos investigadores de los pronósticos han
notado similitud entre los métodos de inteligencia
artificial como lo son las redes neuronales
artificiales y los métodos convencionales de
pronósticos, esa similitud es la forma en que
intentan encontrar con éxito los parámetros de
operación necesarios en su arquitectura para
predecir la variable dependiente que en este caso
son las ventas. Por otro lado, existen diferencias
que propician ventajas de una técnica a otra, las
redes neuronales no requieren ninguna suposición
sobre las distribuciones de probabilidad de los
datos, solo los aprenden, al contrario de muchos
métodos convencionales de pronósticos, pueden
operar con datos incompletos y analizar datos con
alta o nula correlación. Una característica
importante en las redes neuronales artificiales
empleadas en los pronósticos, es que los datos no
deben de ser analizados para probar el supuesto
de tendencia o estacionalidad en la serie de tiempo
previo a la realización del pronóstico.
CONCLUSIONES
Los resultados observados en esta investigación
muestran que los métodos estadísticos para
pronosticar utilizados parten del comportamiento
de los datos históricos, en estos modelos se supone
que el futuro será igual que el pasado, excepto por
las variables reconocidas por el modelo. Pero si
alguna variable cambia, se hacen ineficientes para
seguir pronosticando, por que parten del supuesto
de que la población siempre tendrán una
distribución normal.
En la red neuronal artificial no se requieren
especificar supuestos como la distribución de
probabilidad o patrón de comportamiento en la
serie de tiempo para la realización de pronósticos
de forma eficiente, pues el método involucra el
aprendizaje de las relaciones mediante los
DISCUSIÓN
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
104
ejemplos proporcionados, que es al contrario de
los métodos convencionales para pronósticos
donde se tiene que especificar el patrón de
comportamiento de los datos históricos. De
acuerdo al error cuadrático medio (MSE) como
métrica de desempeño, la red neuronal artificial
presento una mejor práctica a la hora de realizar
pronósticos.
En la fase de prueba llevada a cabo durante
veinticuatro periodos descritos es la tabla 1, se
puede observar que las ventas totales durante ese
periodo de tiempo equivalen a: 44, 810, 911 libras.
Las ventas pronosticadas mediante la red neuronal
artificial son: 44, 560, 866 libras. Lo cual refleja un
99.442% de exactitud de las ventas reales vs
pronóstico con la ANN, lo cual propicia un
escenario adecuado para el uso de las redes
neuronales artificiales a la hora de pronosticar
ventas dentro la industria.
REFERENCIAS
1.Aldrich C. and van Deventer J. S. J., (1995). Comparison of
different artificial neural nets for the detection and location of
gross errors in process systems. Industrial & Engineering
Chemistry Research. 34(1):216-224.
2.Azadeh, A., Sheikhalishahi, M., Shahmiri S. (2012) A
hybrid neuro-fuzzy simulation approach for improvement of
natural gas price forecasting in industrial sectors with vague
indicators. The International Journal of Advanced
Manufacturing Technology. Springer Link. Volume 62, Issue 1-
4, pp 15-33.
3.Azadeh, A.; Ghaderi, S. F.; Sohrabkhani S., (2008). Annual
Electricity Consumption Forecasting by Neural Network in
high Energy Consuming Industrial sectors. Energy Conversion
and Management. Volumen 49, Issue 8, p. 2272-2278.
4.Balestrassi, P.P.; Popova, E.; Paiva, A.P.; Marangon, J.W.,
(2009). Design of experiments on Neural Network’s training for
nonlinear time series. Forecasting Neurocomputing.
Volumen72, Issues 4-6, p. 1160-1178.
5.Chang, P., Lin, J., Dzan, W. (2012) Forecasting of
manufacturing cost in mobile phone products by case-based
reasoning and artificial neural network models. Journal of
Intelligent Manufacturing. Springer Link. Volume 23, Issue 3,
pp 517-531.
6.Freeman, J.; Skapura, D., (1991). Neural Networks
Algorithms, Applications, and Programming Techniques.
Addison-Wesley, New York.
7.González-García R.; Martínez-Rico R,; and Kevrekidis I.
G., (1998). Identification of distributed parameter systems: A
neural net based approach. Computers and Chemical
Engineering, 22:965-968.
8.Hagan M. T., Demuth H. B., Beale H. M., (2002). Neural
Network Design, Volumen 10. Campus Pub. Service, University
of Colorado Bookstore.
9.Hanke J.; Reitsch A., (2006). Pronósticos en los Negocios,
Octava Edición, Prentice Hall, México.
10.Haykin S., (2008). Neural Networks: A Comprehensive
Foundation. Prentice Hall, NJ, USA.
11.Haykin, Simon (2009). Neural Networks and Learning
Machines. New Jersey; Editorial Pearson Prentice Hall.
12.Hilera J. R.; and Martinez V. J.; Addison-Wesley, (1995).
Redes neuronales artificiales Fundamentos, modelos y
aplicaciones. Iberoamericana S.A, Madrid.
13.Holt, C.C. (1957). Forecasting trends and seasonals by
exponentially weighted averages, Carnegie. Institute of
Technology, Pittsburgh ONR memorandum No. 52.
14.Kohonen T., (1989). Self-organization and associative
memory. Springer Verlag. New York.
15.Koulouriotis, D., Mantas, G. (2012) Health products sales
forecasting using computational intelligence and adaptive
neuro fuzzy inference systems. Operational Research. Springer
Link. Volume 12, Issue 1, pp 29-43.
16.Makridakis S., (1986). The Art and Science of
Forecasting. International Journal of Forecasting 2.
17.McCulloch W. S. and W. Pitts (1943). A logical calculus
of the ideas immanent in nervous activity. Bulletin of
Mathematical Biology, 5(4):115-133.
18.Meert K. and Rijckaert M., (1998). Intelligent modelling
in the chemical process industry with neural networks: a case
study. Computers and Chemical Engineering. 22:587-593.
19.Nascimento C. A. O.; Giudici R., and Guardani R., (1996).
Neural network based approach for optimization of industrial
chemical processes. Redes de neuronas artificiales y algoritmos
genéticos. Servicio de Publicaciones Universidad de la Coruña.
20.Nazemi, A., Tahmasbi, N., (2013) A computational
intelligence method for solving a class of portfolio optimization
problems. Soft Computing. Springer Link. Recuperado de
http://link.springer.com/article/10.1007/s00500-013-1186-4.
21.Nojek, S.1.; Britos, P. (2003). Pronosticos de ventas:
Comparacion de predicción basada en redes neuronales versus
estadístico. Departamento de Ingeniería Industrial. Instituto
Tecnológico de Buenos Aires.
22.Rabuñal, J. R.; Dorrado, J., (2006). Artificial neural
networks in real-life applications. Idea GroupPublishing, USA.
23.Rivals and Personnaz L., (2000). Nonlinear internal
model control using neural networks: application to processes
with delay and design issues. IEEE Transactions on Neural
Networks. 11(1):80-90.
24.Sadeghi, M., Razavi S., Sadat, S. (2013) A fuzzy grey goal
programming approach for aggregate production planning. The
International Journal of Advanced Manufacturing Technology.
Springer Link. Volume 64, Issue 9-12, pp 1715-1727.
Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
105
25.Saldaña, A; Jöns, S. (2010). Pronósticos para el
Rendimiento Del Trigo Usando Redes Neuronales Artificiales
26.SapagChain (2000). Preparación y evaluación de
proyectos. Mc-Graw Hill.
27.Toro, E; Mejía, D. (2004). Pronóstico de ventas usando
redes neuronales. Universidad Tecnológica de Pereira.
28.Vahidinasab, V.; Jadid, S.; Kazemi, A., (2008). Day-ahead
price Forecasting in Restructured Power Systems using
Artificial Neural Networks. Electric Power Systems Research.
Volumen 78, Issue 8, p. 1332-1342.
29.Villanueva E., M. (2002). Las Redes Neuronales
Artificiales y su Importancia como Herramienta en la Toma de
Decisiones. Trabajo de Investigación (Lic.) Universidad
Nacional Mayor de San Marcos. Facultad de Ciencias
Matemáticas. EAP de Investigación Operativa.
30.Zhai, K., Jiang, N., Pedrycz, W. (2013) Cost prediction
method based on an improved fuzzy model. The International
Journal of Advanced Manufacturing Technology. Springer
Link. Volume 65, Issue 5-8, pp 1045-1053.
Autores
Edgar Augusto Ruelas Santoyo. Graduado en Ingeniería y en la Maestría en Ingeniería Industrial en el
Instituto Tecnológico de Celaya en 2008 y 2011, respectivamente. Actualmente, estudia un doctorado en el
Posgrado Interinstitucional en Ciencia y Tecnología (PICYT). Profesor en el Departamento de Ingeniería
Industrial, Instituto Tecnológico Superior de Irapuato, Guanajuato, México.
E-mail: edruelas@itesi.edu.mx
José Antonio Laguna González. Graduado en Ingeniería y en la Maestría en Ingeniería Industrial del
Instituto Tecnológico Superior de Irapuato (ITESI) en el 2002 y 2013, respectivamente. Profesor en el
Departamento de Ingeniería Industrial, Instituto Tecnológico Superior de Irapuato, Ext. Abasolo,
Guanajuato, México. Se ha desempeñado en empresas del giro alimenticio y metalmecánico.
E-mail: jolaguna@itesi.edu.mx
Recibido: 07/09/2013 Aceptado: 20/12/2013

Más contenido relacionado

La actualidad más candente

Data Mining
Data MiningData Mining
Data Miningbrobelo
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data MiningAndres Eyherabide
 
Ensayo de estadistica.
Ensayo de estadistica.Ensayo de estadistica.
Ensayo de estadistica.PipeBuitragoM
 
Taller práctico de Analítica Predictiva con Rapid Miner
Taller práctico de Analítica Predictiva  con Rapid MinerTaller práctico de Analítica Predictiva  con Rapid Miner
Taller práctico de Analítica Predictiva con Rapid MinerLPI ONG
 
Minería de Datos. Introducción
Minería de Datos. IntroducciónMinería de Datos. Introducción
Minería de Datos. Introduccióntravon1
 
Factory Physics Parte 6
Factory Physics Parte 6Factory Physics Parte 6
Factory Physics Parte 6jgonza2326
 
Modelos De Data Mining
Modelos De Data MiningModelos De Data Mining
Modelos De Data Miningbrobelo
 
Técnicas mineria de datos
Técnicas mineria de datosTécnicas mineria de datos
Técnicas mineria de datoslalopg
 
La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD travon1
 
Conceptos de programación, métodos estadísticos
Conceptos de programación, métodos estadísticosConceptos de programación, métodos estadísticos
Conceptos de programación, métodos estadísticossahamaramarin
 

La actualidad más candente (16)

Data Mining
Data MiningData Mining
Data Mining
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
Ensayo de estadistica.
Ensayo de estadistica.Ensayo de estadistica.
Ensayo de estadistica.
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
 
Taller práctico de Analítica Predictiva con Rapid Miner
Taller práctico de Analítica Predictiva  con Rapid MinerTaller práctico de Analítica Predictiva  con Rapid Miner
Taller práctico de Analítica Predictiva con Rapid Miner
 
Minería de Datos. Introducción
Minería de Datos. IntroducciónMinería de Datos. Introducción
Minería de Datos. Introducción
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Factory Physics Parte 6
Factory Physics Parte 6Factory Physics Parte 6
Factory Physics Parte 6
 
Modelos De Data Mining
Modelos De Data MiningModelos De Data Mining
Modelos De Data Mining
 
Técnicas mineria de datos
Técnicas mineria de datosTécnicas mineria de datos
Técnicas mineria de datos
 
La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Conceptos de programación, métodos estadísticos
Conceptos de programación, métodos estadísticosConceptos de programación, métodos estadísticos
Conceptos de programación, métodos estadísticos
 

Similar a Art07 tesis-rna-mexico

Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Ana Delgado
 
watermarked_redes-neuronales_sep-24-2023-23-14-45.pdf
watermarked_redes-neuronales_sep-24-2023-23-14-45.pdfwatermarked_redes-neuronales_sep-24-2023-23-14-45.pdf
watermarked_redes-neuronales_sep-24-2023-23-14-45.pdfGianeCastillo
 
Redes neuronales Inteligencia artificial. Carlos Toledo V-26124516
Redes neuronales Inteligencia artificial. Carlos Toledo V-26124516Redes neuronales Inteligencia artificial. Carlos Toledo V-26124516
Redes neuronales Inteligencia artificial. Carlos Toledo V-26124516Carlos Toledo
 
La informática y la estadística para la investigacion
La informática y la estadística para la investigacionLa informática y la estadística para la investigacion
La informática y la estadística para la investigacionLuis Fernández
 
TÉCNICAS DE LA INTELIGENCIA ARTIFICIAL APLICADAS A LA EDUCACIÓN
TÉCNICAS DE LA INTELIGENCIA ARTIFICIAL APLICADAS A LA EDUCACIÓNTÉCNICAS DE LA INTELIGENCIA ARTIFICIAL APLICADAS A LA EDUCACIÓN
TÉCNICAS DE LA INTELIGENCIA ARTIFICIAL APLICADAS A LA EDUCACIÓNBryan Rafael Andia
 
SISTEMA INFORMÁTICO EN EL PROCESO DE VENTAS
SISTEMA INFORMÁTICO EN EL PROCESO DE VENTASSISTEMA INFORMÁTICO EN EL PROCESO DE VENTAS
SISTEMA INFORMÁTICO EN EL PROCESO DE VENTASYerson Falcón Aquilino
 
Inteligencia artificial en la medicina
Inteligencia artificial en la medicinaInteligencia artificial en la medicina
Inteligencia artificial en la medicinaJuanpshinkei
 
Inteligencia artificial en la medicina
Inteligencia artificial en la medicinaInteligencia artificial en la medicina
Inteligencia artificial en la medicinaPablo Jaramillo
 
Investigación de operaciones, su historia
Investigación de operaciones, su historiaInvestigación de operaciones, su historia
Investigación de operaciones, su historiaManuel Bedoya D
 
II Encuentro ASD. ¿Hay ejemplos prácticos de aplicación de los datos al secto...
II Encuentro ASD. ¿Hay ejemplos prácticos de aplicación de los datos al secto...II Encuentro ASD. ¿Hay ejemplos prácticos de aplicación de los datos al secto...
II Encuentro ASD. ¿Hay ejemplos prácticos de aplicación de los datos al secto...SaludDigital
 
Apoyo de la mineria de datos a la vt
Apoyo de la mineria de datos a  la vtApoyo de la mineria de datos a  la vt
Apoyo de la mineria de datos a la vtOscarAngelesSnchez
 
Electiva iii parcial 2 - 02-minería de datos
Electiva iii   parcial 2 - 02-minería de datosElectiva iii   parcial 2 - 02-minería de datos
Electiva iii parcial 2 - 02-minería de datosArlin11
 
Estudio de mercado
Estudio de mercadoEstudio de mercado
Estudio de mercadoMCMurray
 
Glosario Para Seminario De Informatica
Glosario Para Seminario De InformaticaGlosario Para Seminario De Informatica
Glosario Para Seminario De InformaticaLester0310
 

Similar a Art07 tesis-rna-mexico (20)

Redes neuronales
Redes neuronalesRedes neuronales
Redes neuronales
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
watermarked_redes-neuronales_sep-24-2023-23-14-45.pdf
watermarked_redes-neuronales_sep-24-2023-23-14-45.pdfwatermarked_redes-neuronales_sep-24-2023-23-14-45.pdf
watermarked_redes-neuronales_sep-24-2023-23-14-45.pdf
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
 
Estadísticas con calidad
Estadísticas con calidadEstadísticas con calidad
Estadísticas con calidad
 
Redes neuronales Inteligencia artificial. Carlos Toledo V-26124516
Redes neuronales Inteligencia artificial. Carlos Toledo V-26124516Redes neuronales Inteligencia artificial. Carlos Toledo V-26124516
Redes neuronales Inteligencia artificial. Carlos Toledo V-26124516
 
La informática y la estadística para la investigacion
La informática y la estadística para la investigacionLa informática y la estadística para la investigacion
La informática y la estadística para la investigacion
 
Informatica Estadistica
Informatica EstadisticaInformatica Estadistica
Informatica Estadistica
 
TÉCNICAS DE LA INTELIGENCIA ARTIFICIAL APLICADAS A LA EDUCACIÓN
TÉCNICAS DE LA INTELIGENCIA ARTIFICIAL APLICADAS A LA EDUCACIÓNTÉCNICAS DE LA INTELIGENCIA ARTIFICIAL APLICADAS A LA EDUCACIÓN
TÉCNICAS DE LA INTELIGENCIA ARTIFICIAL APLICADAS A LA EDUCACIÓN
 
SISTEMA INFORMÁTICO EN EL PROCESO DE VENTAS
SISTEMA INFORMÁTICO EN EL PROCESO DE VENTASSISTEMA INFORMÁTICO EN EL PROCESO DE VENTAS
SISTEMA INFORMÁTICO EN EL PROCESO DE VENTAS
 
Inteligencia artificial en la medicina
Inteligencia artificial en la medicinaInteligencia artificial en la medicina
Inteligencia artificial en la medicina
 
Inteligencia artificial en la medicina
Inteligencia artificial en la medicinaInteligencia artificial en la medicina
Inteligencia artificial en la medicina
 
Investigación de operaciones, su historia
Investigación de operaciones, su historiaInvestigación de operaciones, su historia
Investigación de operaciones, su historia
 
2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx
 
II Encuentro ASD. ¿Hay ejemplos prácticos de aplicación de los datos al secto...
II Encuentro ASD. ¿Hay ejemplos prácticos de aplicación de los datos al secto...II Encuentro ASD. ¿Hay ejemplos prácticos de aplicación de los datos al secto...
II Encuentro ASD. ¿Hay ejemplos prácticos de aplicación de los datos al secto...
 
Apoyo de la mineria de datos a la vt
Apoyo de la mineria de datos a  la vtApoyo de la mineria de datos a  la vt
Apoyo de la mineria de datos a la vt
 
Electiva iii parcial 2 - 02-minería de datos
Electiva iii   parcial 2 - 02-minería de datosElectiva iii   parcial 2 - 02-minería de datos
Electiva iii parcial 2 - 02-minería de datos
 
Estudio de mercado
Estudio de mercadoEstudio de mercado
Estudio de mercado
 
Glosario Para Seminario De Informatica
Glosario Para Seminario De InformaticaGlosario Para Seminario De Informatica
Glosario Para Seminario De Informatica
 

Último

Tinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiologíaTinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiologíaAlexanderimanolLencr
 
Maquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdfMaquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdfdanielJAlejosC
 
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdfTEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdfXimenaFallaLecca1
 
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
01 MATERIALES AERONAUTICOS VARIOS clase 1.pptoscarvielma45
 
Voladura Controlada Sobrexcavación (como se lleva a cabo una voladura)
Voladura Controlada  Sobrexcavación (como se lleva a cabo una voladura)Voladura Controlada  Sobrexcavación (como se lleva a cabo una voladura)
Voladura Controlada Sobrexcavación (como se lleva a cabo una voladura)ssuser563c56
 
Principales aportes de la carrera de William Edwards Deming
Principales aportes de la carrera de William Edwards DemingPrincipales aportes de la carrera de William Edwards Deming
Principales aportes de la carrera de William Edwards DemingKevinCabrera96
 
Obras paralizadas en el sector construcción
Obras paralizadas en el sector construcciónObras paralizadas en el sector construcción
Obras paralizadas en el sector construcciónXimenaFallaLecca1
 
UNIDAD 3 ELECTRODOS.pptx para biopotenciales
UNIDAD 3 ELECTRODOS.pptx para biopotencialesUNIDAD 3 ELECTRODOS.pptx para biopotenciales
UNIDAD 3 ELECTRODOS.pptx para biopotencialesElianaCceresTorrico
 
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZgustavoiashalom
 
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICAINTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICAJOSLUISCALLATAENRIQU
 
aCARGA y FUERZA UNI 19 marzo 2024-22.ppt
aCARGA y FUERZA UNI 19 marzo 2024-22.pptaCARGA y FUERZA UNI 19 marzo 2024-22.ppt
aCARGA y FUERZA UNI 19 marzo 2024-22.pptCRISTOFERSERGIOCANAL
 
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdf
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdfReporte de simulación de flujo del agua en un volumen de control MNVA.pdf
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdfMikkaelNicolae
 
clasificasion de vias arteriales , vias locales
clasificasion de vias arteriales , vias localesclasificasion de vias arteriales , vias locales
clasificasion de vias arteriales , vias localesMIGUELANGEL2658
 
CARGAS VIVAS Y CARGAS MUERTASEXPOCI.pptx
CARGAS VIVAS Y CARGAS MUERTASEXPOCI.pptxCARGAS VIVAS Y CARGAS MUERTASEXPOCI.pptx
CARGAS VIVAS Y CARGAS MUERTASEXPOCI.pptxvalenciaespinozadavi1
 
CLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxCLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxbingoscarlet
 
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaSesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaXimenaFallaLecca1
 
tema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdftema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdfvictoralejandroayala2
 
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdfLA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdfbcondort
 
nomenclatura de equipo electrico en subestaciones
nomenclatura de equipo electrico en subestacionesnomenclatura de equipo electrico en subestaciones
nomenclatura de equipo electrico en subestacionesCarlosMeraz16
 
Clase 7 MECÁNICA DE FLUIDOS 2 INGENIERIA CIVIL
Clase 7 MECÁNICA DE FLUIDOS 2 INGENIERIA CIVILClase 7 MECÁNICA DE FLUIDOS 2 INGENIERIA CIVIL
Clase 7 MECÁNICA DE FLUIDOS 2 INGENIERIA CIVILProblemSolved
 

Último (20)

Tinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiologíaTinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiología
 
Maquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdfMaquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdf
 
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdfTEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
 
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
 
Voladura Controlada Sobrexcavación (como se lleva a cabo una voladura)
Voladura Controlada  Sobrexcavación (como se lleva a cabo una voladura)Voladura Controlada  Sobrexcavación (como se lleva a cabo una voladura)
Voladura Controlada Sobrexcavación (como se lleva a cabo una voladura)
 
Principales aportes de la carrera de William Edwards Deming
Principales aportes de la carrera de William Edwards DemingPrincipales aportes de la carrera de William Edwards Deming
Principales aportes de la carrera de William Edwards Deming
 
Obras paralizadas en el sector construcción
Obras paralizadas en el sector construcciónObras paralizadas en el sector construcción
Obras paralizadas en el sector construcción
 
UNIDAD 3 ELECTRODOS.pptx para biopotenciales
UNIDAD 3 ELECTRODOS.pptx para biopotencialesUNIDAD 3 ELECTRODOS.pptx para biopotenciales
UNIDAD 3 ELECTRODOS.pptx para biopotenciales
 
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
 
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICAINTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
 
aCARGA y FUERZA UNI 19 marzo 2024-22.ppt
aCARGA y FUERZA UNI 19 marzo 2024-22.pptaCARGA y FUERZA UNI 19 marzo 2024-22.ppt
aCARGA y FUERZA UNI 19 marzo 2024-22.ppt
 
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdf
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdfReporte de simulación de flujo del agua en un volumen de control MNVA.pdf
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdf
 
clasificasion de vias arteriales , vias locales
clasificasion de vias arteriales , vias localesclasificasion de vias arteriales , vias locales
clasificasion de vias arteriales , vias locales
 
CARGAS VIVAS Y CARGAS MUERTASEXPOCI.pptx
CARGAS VIVAS Y CARGAS MUERTASEXPOCI.pptxCARGAS VIVAS Y CARGAS MUERTASEXPOCI.pptx
CARGAS VIVAS Y CARGAS MUERTASEXPOCI.pptx
 
CLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxCLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptx
 
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaSesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
 
tema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdftema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdf
 
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdfLA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
 
nomenclatura de equipo electrico en subestaciones
nomenclatura de equipo electrico en subestacionesnomenclatura de equipo electrico en subestaciones
nomenclatura de equipo electrico en subestaciones
 
Clase 7 MECÁNICA DE FLUIDOS 2 INGENIERIA CIVIL
Clase 7 MECÁNICA DE FLUIDOS 2 INGENIERIA CIVILClase 7 MECÁNICA DE FLUIDOS 2 INGENIERIA CIVIL
Clase 7 MECÁNICA DE FLUIDOS 2 INGENIERIA CIVIL
 

Art07 tesis-rna-mexico

  • 1. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 91 Comparación de predicción basada en redes neuronales contra métodos estadísticos en el pronóstico de ventas Predictive comparison based in neural network versus statistical methods to forecast sales Edgar Augusto Ruelas Santoyo; José Antonio Laguna González Palabras Clave: Pronóstico de ventas, redes neuronales artificiales (RNA) Key words: Sales Forecast, artificial neural networks (ANN) RESUMEN La intención del presente artículo es realizar la comparación y selección de un método para pronosticar las ventas de forma eficiente y que beneficie a organizaciones que ofrecen sus productos al mercado ya que los pronósticos de ventas son datos de entrada a diferentes áreas de la empresa y de ser imprecisos pueden generar gastos para la organización. El caso de estudio en este artículo fue llevado a cabo dentro de la empresa Productos Frugo S.A. de C.V., dedicada a la comercialización de productos alimenticios. Los métodos y metodologías utilizados y posteriormente comparados al pronosticar las ventas de la empresa antes mencionada son: Método de Hold, Winters, la metodología Box Jenkins (ARIMA) y una Red Neuronal Artificial. Los resultados muestran que la red neuronal artificial obtuvo un mejor desempeño logrando el menor error cuadrático medio, de esta forma es posible establecer un panorama adecuado para el uso de la inteligencia artificial dentro de la industria. ABSTRACT The intention of this paper is to compare and select a method to forecast sales efficiently, and provide benefits to organizations offering their products to market because sales forecasts are an input to the company different areas and being inaccurate may cost for the organization. The study case in this paper was carried out within the company Frugo Products SA de C.V.; dedicated to the marketing of food products. The methods and methodologies used and then compared to forecast sales of the aforementioned company are: Hold Method, Winters, Box Jenkins methodology (ARIMA) and Artificial Neural Network. The results show that the artificial neural network achieved better performance scored the lowest mean square error, in this way it is possible to establish an appropriate scenario for the use of artificial intelligence in the industry. INTRODUCCIÓN Los pronósticos de ventas son indicadores de realidades económico-empresariales, básicamente en la situación de la industria en el mercado y en la participación de la empresa en ese mercado. El pronóstico determina qué puede venderse con base en la realidad, y el plan de ventas permite que esa realidad hipotética se materialice, guiando al resto de los planes operativos de la empresa. La elección e implementación de un método adecuado de pronósticos siempre ha sido un tema de gran importancia para las empresas. Se utilizan los pronósticos en el área de compras, marketing, ventas, etc. Un error significante en el pronóstico de ventas podría dejar a una empresa sin la materia prima o insumos necesarios para su producción, o podría generarle un inventario demasiado grande. En ambos casos, el pronóstico erróneo disminuye las utilidades de la empresa. El uso óptimo de los recursos y la creciente demanda de una mayor variedad de productos, entre otros, obliga a los fabricantes a realizar programas de producción más estrictos y flexibles para poder maximizar el uso de los costosos equipos de producción, mano de obra, inversiones en materias primas, de forma que se cumplan las fechas de entrega a los clientes finales minimizando los costos. El objetivo principal de los pronósticos se transforma entonces en convertirse en la entrada para el resto de los planes operativos. Para realizar
  • 2. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 92 eficientes programas de producción que atiendan la demanda sin incurrir en excesivos costos de capital, es deseable un adecuado manejo de la información de ventas con el fin de realizar pronósticos con buen nivel de confianza para todos los departamentos de la empresa. Debido al comportamiento no lineal que presenta un pronóstico de ventas, las redes neuronales artificiales, ANNs, por sus siglas en ingles (Artificial Neural Networks) son un excelente candidato para la predicción de esta estimación. Las ANNs son usadas en modelos y sistemas altamente no lineales (Azadeh, 2008). En general las ANNs son técnicas matemáticas simples diseñadas para cumplir una gran variedad de tareas. Hoy en día las ANNs pueden ser configuradas en varios arreglos para desarrollar diversas tareas, tales como, el reconocimiento de patrones, minería de datos, clasificación y predicción, entre otras (Vahidinasab, 2008). Las ANNs están compuestas de atributos que aprenden soluciones en aplicaciones donde se necesita un mapeo lineal o no lineal. Algunos de estos atributos son: capacidad de aprender, generalización y procesamiento en paralelo, estos atributos hacen que las ANNs puedan resolver problemas complejos haciendo de esta técnica un método preciso y flexible (Balestrassi, 2009), (Freeman, 1991) y (Rabuñal, 2006). El objetivo del presente artículo, se enfoca al uso de redes neuronales para realizar pronósticos de ventas y contrastar los resultados obtenidos contra pronósticos de métodos estadísticos clásicos en función de un error cuadrático medio. Suponiendo que la utilización de un método de pronóstico no tradicional, como las redes neuronales, podrá brindar un pronóstico de ventas más acertado en comparación a los resultados obtenidos utilizando un método de pronóstico estadístico tradicional. Trabajo relacionado Desde la primera mitad del siglo XX se han empezado a desarrollar modelos computacionales que han intentado emular el comportamiento del cerebro humano (McCulloch y Pitts, 1943). Aunque se han propuesto una gran cantidad de ellos, todos usan una estructura en red en la cual los nodos o neuronas son procesos numéricos que involucran estados de otros nodos según sus uniones. Una clase de estos modelos computacionales son las redes de neuronas artificiales (HayKin, 2008). Las redes neuronales artificiales se han hecho muy populares debido a la facilidad en su uso e implementación y la habilidad para aproximar cualquier función matemática, además con su marcada habilidad para obtener resultados de datos complicados e imprecisos, pueden utilizarse para extraer patrones y detectar tramas que son muy difíciles de apreciar por humanos u otras técnicas computacionales. Una de las definiciones que se estima más certera de Red Neuronal Artificial es la siguiente: ``Las redes neuronales artificiales son conjuntos de elementos de cálculo simples, usualmente adaptativos, interconectados masivamente en paralelo y con una organización jerárquica que le permite interactuar con algún sistema del mismo modo que lo hace el sistema nervioso biológico'' (Kohonen, 1989). Su aprendizaje adaptativo, auto- organización, tolerancia a fallos, operación en tiempo real y fácil inserción dentro de la tecnología existente, han hecho que su utilización se haya extendido en áreas como la biológica, financiera, industrial, medio ambiental, militar, salud, etc. (Hilera y Martinez, 1995). Están funcionando en aplicaciones que incluyen identificación de procesos (Gonzalez y Martinez, 1998), detección de fallos en sistemas de control (Aldrich y Van Deventer, 1995), modelación de dinámicas no lineales (Meert y Rijckaert, 1998), control de sistemas no lineales (Rivals and Personnaz, 2000) y optimización de procesos (Nacimiento y Guardani, 2000). Investigaciones proponen el uso de redes neuronales artificiales como herramienta eficiente de pronósticos, ya que no presentan un análisis lineal (Toro et al; 2004) y (Saldaña, 2010). Otra parte importante de la investigación que se ha realizado es la caracterización de los métodos para pronósticos ya que la estimación del comportamiento futuro de algunas variables
  • 3. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 93 puede realizarse utilizando diversos métodos de pronósticos. Cada uno de los métodos de proyección tiene una aplicación de carácter especial que hace de su selección un problema de decisión influido por diversos factores, como son, la validez y disponibilidad de los datos históricos, la precisión deseada del pronóstico, el costo del procedimiento, los beneficios del resultado, los periodos futuros que se desee pronosticar y el tiempo disponible para hacer el estudio entre otros (SapagChain, 2000). Dentro de los métodos de pronósticos se pueden clasificar en función de su carácter, esto es, aplicando métodos de carácter cualitativo, modelos causales y modelos de series de tiempo (Nojek et al., 2003). De acuerdo con Toro et al., en 2004, es posible entrenar a una red neuronal por medio de los niveles de ventas partiendo del siguiente algoritmo. Si V (t) es el nivel de ventas del mes t y k el número de períodos (meses) anteriores a usar en la predicción, se puede decir que el conjunto de datos V (t − k), V (t − k +1),…, V (t −1) son los datos de ventas de los k meses anteriores. Por lo tanto, el objetivo que debe cumplir la red neuronal es que su salida V’ (t), dada por la ecuación V (t) = F [V(t −k),V(t −k +1),…,V(t −1), t] (1) Sea lo más cercana posible a V (t). Por lo tanto, se puede decir que V’ (t) es la estimación de las ventas para el período t. En (Koulouriotis, 2012), se analiza la importancia de reducir el nivel de inventario en una organización a través del pronóstico de ventas, comparando diferentes técnicas entre ellas la inteligencia artificial en un ambiente industrial. Los resultados obtenidos muestran que es posible establecer buenos niveles de inventario a través de los pronósticos realizados por una red neuronal de propagación hacia adelante. Bajo ese mismo enfoque en (Azadeh, 2012), se presenta una red neuronal difusa para estimar el precio del gas natural a partir de parámetros con un cierto nivel de incertidumbre. En (Chang, 2012) establecen un mecanismo de prevención sobre el costo de fabricación basado en redes neurona les artificiales. Dentro de la investigación propuesta en (Nazemi, 2013), se determina que la inteligencia computación a través de una red neuronal resuelve de mejor forma problemas de optimización de cartera con comparación con otros modelos. En (Zhai, 2013) y (Sadeghi, 2013), se propone el uso de tecnologías de la inteligencia artificial como los sistemas difusos para la predicción de costos y establecer una planeación agregada, respectivamente. Ambas implementaciones de la inteligencia artificial dentro del sector industrial demuestran las ventajas de su uso en comparación con métodos tradicionales, propiciando una ventaja competitiva en las organizaciones Después de una breve introducción y análisis del trabajo relacionado al tema a tratar dentro de la sección 1, el artículo se organiza como sigue: en la sección 2, se da una explicación de la metodología a la que se dio seguimiento durante la investigación abordando aspectos como: La recolección de los datos, Autocorrelación y la descripción de cada método propuesto. Consecutivamente se muestran los resultados obtenidos durante la implementación de cada uno de los métodos seleccionados, así como la discusión de los resultados obtenidos dentro de las secciones 3 y 4 respectivamente. Finalmente, las conclusiones se mencionan en la sección 5. Para definir la metodología a emplearse se debe considerar que una serie de datos describe su propio comportamiento, por lo que es importante entender que con los métodos y los pasos resultantes de este trabajo se obtendrá una metodología para elegir los mejores modelos para pronosticar las ventas dentro de la empresa donde se llevó el caso de estudio, se debe estar consciente de que el modelo no será único para todas las situaciones dentro de la misma rama industrial, ya que el tratamiento de los datos se debe realizar bajo diferentes factores. Es decir la metodología propuesta está dedicada a la elección del mejor METODOLOGÍA
  • 4. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 94 modelo de pronóstico y no a encontrar un modelo universal. En la figura 1, se describen los pasos básicos a seguir en la metodología para obtener los pronósticos de ventas: Figura 1. Esquema básico de la metodología empleada en la investigación La primera etapa para realizar pronósticos, es la recolección de datos válidos y confiables. Un pronóstico no puede ser más preciso que los datos en que se basa. Cuando se mide una variable a lo largo del tiempo, las observaciones en diferentes periodos con frecuencia están relacionadas o correlacionadas. Esta correlación se mide mediante el uso del coeficiente de autocorrelación. Posteriormente se selecciona el método de pronóstico adecuado en función del patrón que presenten los datos, el tipo de serie y la facilidad de aplicación (Makradakis, 1986). Además se deben de establecer los parámetros adecuados para el tipo de pronóstico, este paso fue resuelto mediante experimentación exhaustiva tomando como variable de respuesta un error cuadrático medio mínimo. Recolección de datos En la recolección de datos para pronósticos, se deben de identificar dos claras categorías, de entrada y prueba. La primera es vital para diseñar y construir el modelo que permita la realización del pronóstico, la segunda igual de importante, sirve como punto de referencia para validar el resultado obtenido por el pronóstico, ya que se está probando la estimación contra la realidad. Los datos de entrada fueron obtenidos de los registros históricos de los años 2010 y 2011, los cuales se convirtieron en los datos de entrada para cada uno de los métodos de pronósticos, ya construidos dichos modelos, se procede a la prueba de cada uno de ellos y se verifica su eficiencia. Los datos o históricos de prueba fueron las ventas de los años 2012 y 2013, la concentración de los datos fue realizada mensualmente. En la tabla 1, se muestra de forma detallada la información de las ventas necesaria para la evaluación de los modelos elegidos para el desarrollo de los pronósticos. Año Mes Tiemp o (X) Ventas en libras (Y) 2012 Enero 1 1,715,363 Febrero 2 2,338,955 Marzo 3 1,206,298 Abril 4 1,201,767 Mayo 5 1,046,660 Junio 6 1,884,477 Julio 7 1,282,274 Agosto 8 413,025 Septiembre 9 970,179 Octubre 10 1,324,767 Noviembre 11 1,221,979 Diciembre 12 1,106,086 2013 Enero 13 1,784,131 Febrero 14 2,836,453 Marzo 15 3,283,337 Abril 16 2,362,562 Mayo 17 2,802,633 Junio 18 1,751,905 Julio 19 2,496,522 Agosto 20 1,881,808 Si No
  • 5. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 95 Tabla 1. Histórico de ventas 2012 y 2013. Empresa Productos Frugo S.A. de C.V En la figura 2, se muestra un diagrama de dispersión para visualizar la relación que existe entre las ventas de mes a mes, de esta forma es sencillo observar el comportamiento de los datos. Figura 2. Representación gráfica de ventas. Microsoft Excel 2010. Análisis de autocorrelación Para evitar crear ambigüedades a la hora de tomar una decisión sobre el método más conveniente a la hora de realizar los pronósticos, es necesario utilizar una herramienta que permita evaluar el comportamiento de la serie y que además considere a los elementos que la componen, es decir, que muestre si la serie es aleatoria, tiene tendencia o un patrón estacional. Una herramienta viable y que fue utilizada para el análisis de autocorrelación es el autocorrelograma, con él es posible establecer un análisis del patrón de la serie de datos además de obtener el coeficiente de autocorrelación, que sin duda permitirá identificar qué elementos de la serie se encuentran presentes en ésta. La autocorrelación es la correlación que existe entre una variable retrasada con uno o más periodos. Los patrones de datos que incluyen componentes como tendencia, estacionalidad e irregularidad se pueden estudiar usando el enfoque del análisis de autocorrelación. Los coeficientes de autocorrelación para diferentes desfases de tiempo de una variable se emplean para identificar patrones en las series de tiempo de datos. La ecuación siguiente contiene la fórmula para calcular el coeficiente de autocorrelación (rk) entre las observaciones Yt y Yt-k, las causales se encuentran a k periodos de distancia. Septiembre 21 1,975,181 Octubre 22 2,649,544 Noviembre 23 2,945,026 Diciembre 24 2,329,979
  • 6. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 96 (2) Donde r = coeficiente de autocorrelación para un retraso de k periodos. = media de los valores de la serie. Yt = observaciones en el periodo t. Yt-k =observaciones de k periodos anteriores o durante un periodo t-k. Aplicando la ecuación 2, se obtiene el coeficiente de autocorrelación y de esta forma es posible verificar el comportamiento de la serie de tiempo tabla 2. En la figura 3, se muestra gráficamente que el valor obtenido para el retraso 1, r1 es de 0.61082, el cual indica que existe una autocorrelación significativa entre las ventas del primer mes con las ventas del mes siguiente. En general conforme aumente el número de retrasos de tiempo, k, disminuyen los coeficientes de autocorrelación. De acuerdo a los resultados obtenidos autocorrelograma se observa que los datos tienden a caer paulatinamente hacia cero, además que los primeros retrasos son bastante diferentes de cero, como resultado del análisis de los datos se concluye que está presente un patrón tendencial en la serie de tiempo. Tabla 2. Función de Autocorrelación para cada periodo. 22 20 18 16 14 12 10 8 6 4 2 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Lag Autocorrelation Autocorrelación de laventas de brocóli Figura 3. Función de Autocorrelación. Software estadístico Minitab versión 15. Selección del método de pronóstico La selección de la técnica empleada para pronosticar, es definida en base al análisis de los factores que intervienen en la selección del modelo, en este caso se buscan modelos adecuados que se ajusten a patrones con tendencia. De acuerdo con Hanke y Reistch, en 2006, los modelos sugeridos a emplearse para realizar los pronósticos son: Suavización exponencial ajustado a la tendencia, Método de Holt y Suavización exponencial ajustado para variaciones de tendencia y estacionalidades, Método de Winters además de la metodología Box-Jenkins (ARIMA). Estos métodos y metodologías estadísticas serán comparados contra una red neuronal artificial la cual no requiere probar un supuesto de tendencia o estacionalidad en la serie de tiempo previo a la realización del pronóstico. Retrasos en cada periodo Función de Autocorrelación 1 0.610829 2 0.402748 3 0.243364 4 0.261904 5 0.093726 6 -0.084612 7 -0.046443 8 0.051484 9 -0.060716
  • 7. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 97 Método de Holt El nivel de la serie de tiempo puede cambiar ocasionalmente y cuando se usa el suavizamiento exponencial simple es requerido actualizaciones de nivel. En algunas ocasiones los datos observados tendrán una tendencia clara en la información que permita anticipar movimientos futuros hacia arriba. Cuando este sea el caso, será necesaria una función de pronóstico de tendencia lineal. Dado que las series económicas y de negocios rara vez exhiben una tendencia lineal fija que evolucione con el tiempo. Una aportación de Holt, en 1957, es el desarrollo de un método de suavizamiento exponencial lineal, el cual toma en cuenta las tendencias lineales locales en evolución dentro de una serie de tiempo y puede usarse para generar pronósticos. Cuando se anticipa la tendencia en la serie de tiempo, se requiere un estimado de la pendiente y de nivel actual. La técnica de Holt suaviza el nivel y la pendiente de manera directa al usar diferentes constantes de suavizamiento para cada una. Éstas proporcionan estimados de nivel y de la pendiente que se adapta a lo largo del tiempo conforme aparecen nuevas observaciones. Una de las ventajas de Holt es su flexibilidad al seleccionar los coeficientes que controlan el nivel y la tendencia. Los parámetros requeridos son Alfa (α) y Beta (β). Alfa se usa para suavizar los datos a fin de eliminar la aleatoriedad. La constante de suavizamiento β es como α, a excepción de que se usa para suavizar la tendencia en los datos. Ambas constantes de suavizamiento se usan para promediar los valores anteriores y, de esta forma, eliminar el fenómeno aleatorio presente en la serie de tiempo. Las constantes de suavizamiento α y β pueden seleccionarse de manera subjetiva o mediante la minimización de una medida de error de pronósticos como el error cuadrático medio (MSE) (Hanke y Reistch 2006). En la tabla 3, se muestran los resultados de la experimentación realizada para definir los parámetros α y β necesarios para el método Holt. Las tres ecuaciones que se utilizan para el método de Holt son: 1.La serie suavizada exponencialmente, o estimado del nivel actual: (3) 2.El estimado de la tendencia: (4) Pronósticos del periodo p en el futuro: (5) Dónde: Lt = nuevo valor suavizado (estimado del nivel actual) α = constante de suavización para el nivel (0 < α <1) Yt = observación nueva o valor real de la serie en el periodo t β = constante de suavización para el estimado de tendencia (0 < β < 1) Tt = estimado de tendencia p = periodo a pronosticar en el futuro = pronóstico para periodo p en el futuro Método de Winters El método Winters con tres parámetros de suavizamiento exponencial lineal y estacional, es una extensión del método de Holt, tiene el potencial de describir mejor los datos y reducir el error del pronóstico. En el método de Winters se usa una ecuación adicional para estimar la estacionalidad. En la versión multiplicativa del método de Winters, el estimado de la estacionalidad será como un índice estacional y se calcula mediante la ecuación del estimado de la estacionalidad. En la tabla 4, se muestran los resultados de la experimentación realizada para definir los parámetros alfa , beta y gama necesarios para el método Winters. Las cuatro ecuaciones utilizadas en el suavizamiento (multiplicativo) de Winters son: 1.El nivel de la serie estimado por suavizamiento exponencial: (6) 2.El estimado de la tendencia: (7) 3.El estimado de la estacionalidad: (8) 4.Pronóstico del periodo p en el futuro: (9) Donde Lt = nuevo valor suavizado o nivel actual estimado α = constante de suavizamiento para el nivel
  • 8. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 98 Yt = nueva observación o valor real en el periodo t β = constante de suavizamiento para el estimado de tendencia Tt = estimado de tendencia = constante de suavizamiento para el estimado de estacinalidad St = estimado de estacionalidad p = número de periodo a pronosticarse s = longitud de estacionalidad = pronóstico para el periodo p en el futuro Tabla 3. Resultados de la experimentación para definir los parámetros en el método Holt. Tabla 4. Resultados de la experimentación para definir los parámetros en el método Winters. Error Cuadrático Medio 0.6 0.1 3938.6882 0.5 0.1 3969.30554 0.7 0.1 3977.204 0.8 0.1 4076.29505 0.4 0.1 4080.6369 0.6 0.2 4218.96766 0.9 0.1 4233.51164 0.5 0.2 4262.09318 0.7 0.2 4265.64826 0.3 0.1 4287.028504 0.8 0.2 4389.00711 0.4 0.2 4410.060095 0.6 0.3 4473.05642 0.5 0.3 4521.391724 0.7 0.3 4538.82546 0.9 0.2 4584.23129 0.2 0.1 4627.653574 0.3 0.2 4670.158746 0.8 0.3 4698.33332 0.4 0.3 4704.997091 0.5 0.5 4941.154883 0.9 0.3 4943.49782 0.4 0.4 4957.868414 0.2 0.2 5001.967229 0.3 0.3 5041.491025 0.6 0.6 5145.462445 0.1 0.1 5306.60193 0.3 0.4 5355.263543 0.2 0.3 5470.3474 0.1 0.2 5526.450276 Error Cuadrático Medio 0.7 0.1 0.4 4034.77 0.8 0.1 0.4 4057.31 0.7 0.2 0.5 4076.02 0.7 0.2 0.4 4076.54 0.6 0.2 0.4 4109.06 0.6 0.2 0.5 4110.78 0.6 0.1 0.5 4122.04 0.7 0.1 0.2 4137.4 0.6 0.1 0.4 4142.26 0.8 0.1 0.2 4159.72 0.7 0.2 0.2 4178.85 0.7 0.1 0.1 4187.19 0.6 0.2 0.2 4190.14 0.8 0.1 0.1 4203.67 0.7 0.2 0.1 4227.35 0.5 0.2 0.4 4229.18 0.5 0.2 0.5 4231.91 0.9 0.1 0.4 4232.56 0.6 0.2 0.1 4236.58 0.6 0.1 0.2 4240.99 0.6 0.3 0.4 4273.83 0.8 0.2 0.2 4277.29 0.7 0.3 0.4 4287.82 0.7 0.3 0.5 4288.82 0.6 0.3 0.5 4291.12 0.6 0.1 0.1 4292.48 0.8 0.2 0.1 4324.57 0.9 0.1 0.1 4325.9 0.6 0.3 0.2 4342.26 0.5 0.3 0.4 4349.34
  • 9. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 99 Método ARIMA Los Modelos de Promedio Móvil Autorregresivo Integrado, (ARIMA), por sus siglas en inglés, son una clase de modelos que tienen la capacidad de operar sobre series de tiempo estacionarias o no estacionarias. El primer paso en la identificación del modelo consiste en determinar si la serie es estacionaria, es decir, si la serie de tiempo aparenta variar alrededor de un nivel fijo. Una serie no estacionaria se indica si la serie parece crecer o decrecer con relación del tiempo y las autocorrelaciones no pueden desvanecerse con rapidez. Si la serie no es estacionaria, con frecuencia puede convertir a una serie estacionaria al tomar sus diferencias, es decir, la serie es remplazada por una serie de diferencias. Entonces, se especifica un modelo ARIMA para la serie de las diferencias. Se debe especificar el grado de diferenciación y el algoritmo de Box-Jenkins convierte los datos en una serie estacionaria y realizar los cálculos subsecuentes utilizando los datos convertidos. Una vez obtenida una serie estacionaria, se debe identificar la forma del modelo a utilizar. Este paso se logra mediante la comparación de los coeficientes de autocorrelación y de autocorrelación parcial se calcularon a partir de los datos para las autocorrelaciones y autocorrelaciones parciales teóricas de los diversos modelos ARIMA (Hanke y Reistch, 2006), por lo tanto de acuerdo a la figura 3 y 4, el modelo correspondiente es el modelo AR (2). 6 5 4 3 2 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Lag Partial A utocorrelation Partial Autocorrelation Function for VENTAS BROCOLI (with 5% significance limits for the partial autocorrelations) Figura 4. Autocorrelación parcial de la serie de tiempo. Software estadístico Minitab versión 15. Red Neuronal Artificial Una red neuronal artificial es un procesador masivo paralelo formado por unidades simples de procesamiento que tienen una propensión natural para almacenar conocimiento experimental, haciéndolo viable para su uso. La red neuronal se asemeja al cerebro en dos aspectos: i. El conocimiento es adquirido por la red desde su entorno a través de un proceso de aprendizaje. ii.Las fuerzas de las conexiones entre neuronas, conocidas como pesos sinápticos, son usadas para almacenar el conocimiento (Haykin, 2009). La arquitectura de una red neuronal consiste en la organización y disposición de las neuronas en la red formando capas o agrupaciones de neuronas. Los parámetros fundamentales son: número de capas, número de neuronas por capa, grado de conectividad y tipo de conexión entre neuronas (Villanueva, 2002). Redes multicapa: Las redes neuronales artificiales multicapa se forman con un grupo de capas simples en cascada. La salida de una capa es la entrada de la siguiente capa. Se ha demostrado que las redes multicapa presentan cualidades y aspectos por encima de las redes de una capa simple. Dado que este tipo de redes disponen de varias capas, las conexiones entre neuronas pueden ser del tipo feedforward (conexión hacia adelante) o del tipo feedback (conexión hacia atrás). Las redes feedforward son especialmente útiles en aplicaciones de reconocimiento o clasificación de patrones. En la figura 5, se muestra la estructura general de una red de este tipo. La figura y nomenclatura se adoptan de (Hagan, 2002).
  • 10. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 100 Figura 5. Estructura general de una red neuronal multicapa. La entrada a la red es el vector p cuya longitud es igual a R, W es la matriz de pesos con dimensiones SxR, a y b son vectores de longitud S el cual, representa el número de neuronas de la red. La habilidad de la red perceptrón multicapa para aprender a partir de un conjunto de ejemplos, al aproximar relaciones no lineales, filtrar ruido en los datos, etc. hace que sea un modelo adecuado para abordar problemas reales, sin que esto indique que son las mejores herramientas como aproximadores universales. En la tabla 5, se muestra el esquema de la red neuronal artificial construida para la realización de los pronósticos de ventas, cabe destacar que no existe un método específico para llegar a la arquitectura de la red, el parámetro que definió esta arquitectura fue el error cuadrático medio mínimo al momento de realizar los pronósticos. La red de neuronas almacena información en una cadena de interconexiones neuronales por medio de los pesos. La función de transferencia utilizada es la tangente hiperbólica. La arquitectura de diferentes tipos de redes de neuronas artificiales fue explorada, con el objetivo de encontrar el diseño idóneo al problema que debemos resolver. Una etapa de aprendizaje debe ser considerada para la creación de un modelo neuronal, en esta parte es donde se introducen los datos de entrada a la red neuronal artificial. La fase de aprendizaje se utiliza para ajustar los pesos, los cuales inicialmente son valores aleatorios. El valor del error cuadrático medio sirve para evaluar la corrección de pesos en cada iteración. Finalmente, la red neuronal artificial aprende el comportamiento de la base de datos generada por medio de datos introducidos en su capa de entrada. Una vez definidos los parámetros y arquitecturas de los métodos para pronosticar se prueban los métodos seleccionados, para el método de Holt se determina que los mejores valores de acuerdo a un error cuadrático medio mínimo son: alfa de 0.6 y beta de 0.1 (Ver tabla 3). Prosiguiendo con la misma lógica se determina que los mejores parámetros para el método de Winters son: alfa de 0.7, beta de 0.1 y gama 0.4 (Ver tabla 4). La metodología ARIMA queda definida como un modelo AR (2) después de comparar las autocorrelaciones parciales, y por último la red neuronal artificial empleada para la realización de los pronósticos descrita en la tabla 5. Los resultados de la aplicación del método Holt, Winters, metodología ARIMA y la red neuronal trabajando con sus parámetros adecuados para realizar los pronósticos se encuentran en la tabla 6 y figuras 6, 7, 8 y 9 Topología de la Red Neuronal Artificial Numero de Neuronas en la capa oculta 19 Tasa de aprendizaje 0.01 Numero de Iteraciones 4000 Error objetivo 1x10-5 RESULTADOS
  • 11. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 101 respectivamente, las figuras fueron generadas a partir de Microsoft Excel 2010. Los resultados de los pronósticos se encuentran codificados, lo que consiste en dividir el dato real entre diez mil para un mejor manejo de la información, así que solo es necesario realizar la operación inversa para obtener el valor real arrojado por el método seleccionado. Tabla 6. Resultados de cada técnica de pronóstico. Año Mes Tie mpo (X) Resultados en libras (Y) Pronóstico con Método de Holt Pronóstico con Método de Winters Valor pronosticado ARIMA Valor pronosticado ANN 2010 Enero 1 1,715,363 171.5363 178.839179 181.98444 171.5467 Febrero 2 2,338,955 171.5363 211.109168 177.975959 233.8767 Marzo 3 1,206,298 212.6934 141.548676 216.792561 120.6265 Abril 4 1,201,767 155.673 115.525686 146.288296 120.1961 Mayo 5 1,046,660 130.4632 104.682685 146.006255 112.0354 Junio 6 1,884,477 109.525 150.920626 136.351342 188.4516 Julio 7 1,282,274 156.1541 133.040549 188.502763 128.2219 Agosto 8 413,025 136.998 60.1473986 151.017558 112.0207 Septiembre 9 970,179 71.4389 81.4201135 96.9095954 112.021 Octubre 10 1,324,767 80.1792 116.46938 131.590645 132.4692 Noviembre 11 1,221,979 108.0885 111.896028 153.662611 122.1821 Diciembre 12 1,106,086 113.9314 105.309848 147.264387 112.0911 2011 Enero 13 1,784,131 109.1157 144.671885 140.05042 178.3963 Febrero 14 2,836,453 152.0299 233.219576 182.256547 261.4035 Marzo 15 3,283,337 240.2319 273.193935 247.760216 261.4037 Abril 16 2,362,562 307.6118 233.188298 275.577312 261.4037 Mayo 17 2,802,633 275.0359 239.29389 218.262021 261.4037 Junio 18 1,751,905 288.7235 187.047837 245.65503 175.1843 Julio 19 2,496,522 224.3429 205.024267 180.250581 249.6467 Agosto 20 1,881,808 244.7862 190.72641 226.600602 188.1843 Septiembre 21 1,975,181 212.6843 172.981014 188.336627 197.5163 Octubre 22 2,649,544 204.536 235.303969 194.148796 261.4019 Noviembre 23 2,945,026 245.3636 247.765508 236.12573 261.4032 Diciembre 24 2,329,979 282.3719 230.263633 254.518537 233
  • 12. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 102 Figura 6. Ventas reales vs pronóstico con el Método de Holt. Figura 7. Ventas reales vs pronósticos con el Método de Winter. Figura 8. Ventas reales vs pronóstico con el Método de ARIMA. Figura 9. Ventas reales vs pronósticos con la Red neuronal artificial.
  • 13. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 103 Finalmente se llevó a cabo el comparativo y evaluación de cada una de la los métodos, considerando el error cuadrático medio para su evaluación. La finalidad es saber cuál de los métodos alcanzaría el menor error cuadrático medio y de esta forma poder probar la hipótesis planteada sobre la promoción de la inteligencia artificial como método de pronósticos en las organizaciones, como resultado se obtuvo que la red neuronal alcanzó el menor error cuadrático versus la técnica del método de Hold, método de Winters y la metodología Box Jenkin (ARIMA). En la figura 10, se muestran los resultados de la evaluación mediante el MSE. Figura 10. Resultados de la evaluación por el MSE. Microsoft Excel 2010. Como se ha mencionado, las empresas requieren de planes de producción que proporcionen una mejor programación de las actividades en cada una de las áreas, para eso requieren de saber con anticipación cuales pueden ser sus posibles ventas en el futuro de forma precisa, ya que dependiendo de esta información, es posible incurrir en graves errores como son: materia prima insuficiente, falta de personal, exceso de materia prima e incumplimiento en fechas de entrega lo que genera un incremento de costos de producción. La intención de este artículo es encontrar una metodología para pronosticar las ventas de la forma más precisa posible y de esta forma hacer más competitiva a la organización. Algunos investigadores de los pronósticos han notado similitud entre los métodos de inteligencia artificial como lo son las redes neuronales artificiales y los métodos convencionales de pronósticos, esa similitud es la forma en que intentan encontrar con éxito los parámetros de operación necesarios en su arquitectura para predecir la variable dependiente que en este caso son las ventas. Por otro lado, existen diferencias que propician ventajas de una técnica a otra, las redes neuronales no requieren ninguna suposición sobre las distribuciones de probabilidad de los datos, solo los aprenden, al contrario de muchos métodos convencionales de pronósticos, pueden operar con datos incompletos y analizar datos con alta o nula correlación. Una característica importante en las redes neuronales artificiales empleadas en los pronósticos, es que los datos no deben de ser analizados para probar el supuesto de tendencia o estacionalidad en la serie de tiempo previo a la realización del pronóstico. CONCLUSIONES Los resultados observados en esta investigación muestran que los métodos estadísticos para pronosticar utilizados parten del comportamiento de los datos históricos, en estos modelos se supone que el futuro será igual que el pasado, excepto por las variables reconocidas por el modelo. Pero si alguna variable cambia, se hacen ineficientes para seguir pronosticando, por que parten del supuesto de que la población siempre tendrán una distribución normal. En la red neuronal artificial no se requieren especificar supuestos como la distribución de probabilidad o patrón de comportamiento en la serie de tiempo para la realización de pronósticos de forma eficiente, pues el método involucra el aprendizaje de las relaciones mediante los DISCUSIÓN
  • 14. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 104 ejemplos proporcionados, que es al contrario de los métodos convencionales para pronósticos donde se tiene que especificar el patrón de comportamiento de los datos históricos. De acuerdo al error cuadrático medio (MSE) como métrica de desempeño, la red neuronal artificial presento una mejor práctica a la hora de realizar pronósticos. En la fase de prueba llevada a cabo durante veinticuatro periodos descritos es la tabla 1, se puede observar que las ventas totales durante ese periodo de tiempo equivalen a: 44, 810, 911 libras. Las ventas pronosticadas mediante la red neuronal artificial son: 44, 560, 866 libras. Lo cual refleja un 99.442% de exactitud de las ventas reales vs pronóstico con la ANN, lo cual propicia un escenario adecuado para el uso de las redes neuronales artificiales a la hora de pronosticar ventas dentro la industria. REFERENCIAS 1.Aldrich C. and van Deventer J. S. J., (1995). Comparison of different artificial neural nets for the detection and location of gross errors in process systems. Industrial & Engineering Chemistry Research. 34(1):216-224. 2.Azadeh, A., Sheikhalishahi, M., Shahmiri S. (2012) A hybrid neuro-fuzzy simulation approach for improvement of natural gas price forecasting in industrial sectors with vague indicators. The International Journal of Advanced Manufacturing Technology. Springer Link. Volume 62, Issue 1- 4, pp 15-33. 3.Azadeh, A.; Ghaderi, S. F.; Sohrabkhani S., (2008). Annual Electricity Consumption Forecasting by Neural Network in high Energy Consuming Industrial sectors. Energy Conversion and Management. Volumen 49, Issue 8, p. 2272-2278. 4.Balestrassi, P.P.; Popova, E.; Paiva, A.P.; Marangon, J.W., (2009). Design of experiments on Neural Network’s training for nonlinear time series. Forecasting Neurocomputing. Volumen72, Issues 4-6, p. 1160-1178. 5.Chang, P., Lin, J., Dzan, W. (2012) Forecasting of manufacturing cost in mobile phone products by case-based reasoning and artificial neural network models. Journal of Intelligent Manufacturing. Springer Link. Volume 23, Issue 3, pp 517-531. 6.Freeman, J.; Skapura, D., (1991). Neural Networks Algorithms, Applications, and Programming Techniques. Addison-Wesley, New York. 7.González-García R.; Martínez-Rico R,; and Kevrekidis I. G., (1998). Identification of distributed parameter systems: A neural net based approach. Computers and Chemical Engineering, 22:965-968. 8.Hagan M. T., Demuth H. B., Beale H. M., (2002). Neural Network Design, Volumen 10. Campus Pub. Service, University of Colorado Bookstore. 9.Hanke J.; Reitsch A., (2006). Pronósticos en los Negocios, Octava Edición, Prentice Hall, México. 10.Haykin S., (2008). Neural Networks: A Comprehensive Foundation. Prentice Hall, NJ, USA. 11.Haykin, Simon (2009). Neural Networks and Learning Machines. New Jersey; Editorial Pearson Prentice Hall. 12.Hilera J. R.; and Martinez V. J.; Addison-Wesley, (1995). Redes neuronales artificiales Fundamentos, modelos y aplicaciones. Iberoamericana S.A, Madrid. 13.Holt, C.C. (1957). Forecasting trends and seasonals by exponentially weighted averages, Carnegie. Institute of Technology, Pittsburgh ONR memorandum No. 52. 14.Kohonen T., (1989). Self-organization and associative memory. Springer Verlag. New York. 15.Koulouriotis, D., Mantas, G. (2012) Health products sales forecasting using computational intelligence and adaptive neuro fuzzy inference systems. Operational Research. Springer Link. Volume 12, Issue 1, pp 29-43. 16.Makridakis S., (1986). The Art and Science of Forecasting. International Journal of Forecasting 2. 17.McCulloch W. S. and W. Pitts (1943). A logical calculus of the ideas immanent in nervous activity. Bulletin of Mathematical Biology, 5(4):115-133. 18.Meert K. and Rijckaert M., (1998). Intelligent modelling in the chemical process industry with neural networks: a case study. Computers and Chemical Engineering. 22:587-593. 19.Nascimento C. A. O.; Giudici R., and Guardani R., (1996). Neural network based approach for optimization of industrial chemical processes. Redes de neuronas artificiales y algoritmos genéticos. Servicio de Publicaciones Universidad de la Coruña. 20.Nazemi, A., Tahmasbi, N., (2013) A computational intelligence method for solving a class of portfolio optimization problems. Soft Computing. Springer Link. Recuperado de http://link.springer.com/article/10.1007/s00500-013-1186-4. 21.Nojek, S.1.; Britos, P. (2003). Pronosticos de ventas: Comparacion de predicción basada en redes neuronales versus estadístico. Departamento de Ingeniería Industrial. Instituto Tecnológico de Buenos Aires. 22.Rabuñal, J. R.; Dorrado, J., (2006). Artificial neural networks in real-life applications. Idea GroupPublishing, USA. 23.Rivals and Personnaz L., (2000). Nonlinear internal model control using neural networks: application to processes with delay and design issues. IEEE Transactions on Neural Networks. 11(1):80-90. 24.Sadeghi, M., Razavi S., Sadat, S. (2013) A fuzzy grey goal programming approach for aggregate production planning. The International Journal of Advanced Manufacturing Technology. Springer Link. Volume 64, Issue 9-12, pp 1715-1727.
  • 15. Ingeniería Industrial. Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12 ISSN: 1856-8327 Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105 105 25.Saldaña, A; Jöns, S. (2010). Pronósticos para el Rendimiento Del Trigo Usando Redes Neuronales Artificiales 26.SapagChain (2000). Preparación y evaluación de proyectos. Mc-Graw Hill. 27.Toro, E; Mejía, D. (2004). Pronóstico de ventas usando redes neuronales. Universidad Tecnológica de Pereira. 28.Vahidinasab, V.; Jadid, S.; Kazemi, A., (2008). Day-ahead price Forecasting in Restructured Power Systems using Artificial Neural Networks. Electric Power Systems Research. Volumen 78, Issue 8, p. 1332-1342. 29.Villanueva E., M. (2002). Las Redes Neuronales Artificiales y su Importancia como Herramienta en la Toma de Decisiones. Trabajo de Investigación (Lic.) Universidad Nacional Mayor de San Marcos. Facultad de Ciencias Matemáticas. EAP de Investigación Operativa. 30.Zhai, K., Jiang, N., Pedrycz, W. (2013) Cost prediction method based on an improved fuzzy model. The International Journal of Advanced Manufacturing Technology. Springer Link. Volume 65, Issue 5-8, pp 1045-1053. Autores Edgar Augusto Ruelas Santoyo. Graduado en Ingeniería y en la Maestría en Ingeniería Industrial en el Instituto Tecnológico de Celaya en 2008 y 2011, respectivamente. Actualmente, estudia un doctorado en el Posgrado Interinstitucional en Ciencia y Tecnología (PICYT). Profesor en el Departamento de Ingeniería Industrial, Instituto Tecnológico Superior de Irapuato, Guanajuato, México. E-mail: edruelas@itesi.edu.mx José Antonio Laguna González. Graduado en Ingeniería y en la Maestría en Ingeniería Industrial del Instituto Tecnológico Superior de Irapuato (ITESI) en el 2002 y 2013, respectivamente. Profesor en el Departamento de Ingeniería Industrial, Instituto Tecnológico Superior de Irapuato, Ext. Abasolo, Guanajuato, México. Se ha desempeñado en empresas del giro alimenticio y metalmecánico. E-mail: jolaguna@itesi.edu.mx Recibido: 07/09/2013 Aceptado: 20/12/2013