Art07 tesis-rna-mexico

Ingeniería Industrial.
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327
Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105
91
Comparación de predicción basada en redes neuronales contra
métodos estadísticos en el pronóstico de ventas
Predictive comparison based in neural network versus statistical methods to forecast sales
Edgar Augusto Ruelas Santoyo; José Antonio Laguna González
Palabras Clave: Pronóstico de ventas, redes neuronales artificiales (RNA)
Key words: Sales Forecast, artificial neural networks (ANN)
RESUMEN
La intención del presente artículo es realizar la
comparación y selección de un método para pronosticar
las ventas de forma eficiente y que beneficie a
organizaciones que ofrecen sus productos al mercado ya
que los pronósticos de ventas son datos de entrada a
diferentes áreas de la empresa y de ser imprecisos
pueden generar gastos para la organización. El caso de
estudio en este artículo fue llevado a cabo dentro de la
empresa Productos Frugo S.A. de C.V., dedicada a la
comercialización de productos alimenticios. Los
métodos y metodologías utilizados y posteriormente
comparados al pronosticar las ventas de la empresa
antes mencionada son: Método de Hold, Winters, la
metodología Box Jenkins (ARIMA) y una Red Neuronal
Artificial. Los resultados muestran que la red neuronal
artificial obtuvo un mejor desempeño logrando el menor
error cuadrático medio, de esta forma es posible
establecer un panorama adecuado para el uso de la
inteligencia artificial dentro de la industria.
ABSTRACT
The intention of this paper is to compare and select a
method to forecast sales efficiently, and provide benefits
to organizations offering their products to market
because sales forecasts are an input to the company
different areas and being inaccurate may cost for the
organization. The study case in this paper was carried
out within the company Frugo Products SA de C.V.;
dedicated to the marketing of food products. The
methods and methodologies used and then compared to
forecast sales of the aforementioned company are: Hold
Method, Winters, Box Jenkins methodology (ARIMA)
and Artificial Neural Network. The results show that the
artificial neural network achieved better performance
scored the lowest mean square error, in this way it is
possible to establish an appropriate scenario for the use
of artificial intelligence in the industry.
INTRODUCCIÓN
Los pronósticos de ventas son indicadores de
realidades económico-empresariales, básicamente
en la situación de la industria en el mercado y en la
participación de la empresa en ese mercado. El
pronóstico determina qué puede venderse con
base en la realidad, y el plan de ventas permite que
esa realidad hipotética se materialice, guiando al
resto de los planes operativos de la empresa. La
elección e implementación de un método adecuado
de pronósticos siempre ha sido un tema de gran
importancia para las empresas. Se utilizan los
pronósticos en el área de compras, marketing,
ventas, etc. Un error significante en el pronóstico
de ventas podría dejar a una empresa sin la
materia prima o insumos necesarios para su
producción, o podría generarle un inventario
demasiado grande. En ambos casos, el pronóstico
erróneo disminuye las utilidades de la empresa.
El uso óptimo de los recursos y la creciente
demanda de una mayor variedad de productos,
entre otros, obliga a los fabricantes a realizar
programas de producción más estrictos y flexibles
para poder maximizar el uso de los costosos
equipos de producción, mano de obra, inversiones
en materias primas, de forma que se cumplan las
fechas de entrega a los clientes finales
minimizando los costos.
El objetivo principal de los pronósticos se
transforma entonces en convertirse en la entrada
para el resto de los planes operativos. Para realizar

ISSN: 1856-8327
92
eficientes programas de producción que atiendan
la demanda sin incurrir en excesivos costos de
capital, es deseable un adecuado manejo de la
información de ventas con el fin de realizar
pronósticos con buen nivel de confianza para
todos los departamentos de la empresa.
Debido al comportamiento no lineal que presenta
un pronóstico de ventas, las redes neuronales
artificiales, ANNs, por sus siglas en ingles
(Artificial Neural Networks) son un excelente
candidato para la predicción de esta estimación.
Las ANNs son usadas en modelos y sistemas
altamente no lineales (Azadeh, 2008). En general
las ANNs son técnicas matemáticas simples
diseñadas para cumplir una gran variedad de
tareas. Hoy en día las ANNs pueden ser
configuradas en varios arreglos para desarrollar
diversas tareas, tales como, el reconocimiento de
patrones, minería de datos, clasificación y
predicción, entre otras (Vahidinasab, 2008). Las
ANNs están compuestas de atributos que
aprenden soluciones en aplicaciones donde se
necesita un mapeo lineal o no lineal. Algunos de
estos atributos son: capacidad de aprender,
generalización y procesamiento en paralelo, estos
atributos hacen que las ANNs puedan resolver
problemas complejos haciendo de esta técnica un
método preciso y flexible (Balestrassi, 2009),
(Freeman, 1991) y (Rabuñal, 2006). El objetivo del
presente artículo, se enfoca al uso de redes
neuronales para realizar pronósticos de ventas y
contrastar los resultados obtenidos contra
pronósticos de métodos estadísticos clásicos en
función de un error cuadrático medio. Suponiendo
que la utilización de un método de pronóstico no
tradicional, como las redes neuronales, podrá
brindar un pronóstico de ventas más acertado en
comparación a los resultados obtenidos utilizando
un método de pronóstico estadístico tradicional.
Trabajo relacionado
Desde la primera mitad del siglo XX se han
empezado a desarrollar modelos computacionales
que han intentado emular el comportamiento del
cerebro humano (McCulloch y Pitts, 1943). Aunque
se han propuesto una gran cantidad de ellos, todos
usan una estructura en red en la cual los nodos o
neuronas son procesos numéricos que involucran
estados de otros nodos según sus uniones. Una
clase de estos modelos computacionales son las
redes de neuronas artificiales (HayKin, 2008). Las
redes neuronales artificiales se han hecho muy
populares debido a la facilidad en su uso e
implementación y la habilidad para aproximar
cualquier función matemática, además con su
marcada habilidad para obtener resultados de
datos complicados e imprecisos, pueden utilizarse
para extraer patrones y detectar tramas que son
muy difíciles de apreciar por humanos u otras
técnicas computacionales.
Una de las definiciones que se estima más certera
de Red Neuronal Artificial es la siguiente: ``Las
redes neuronales artificiales son conjuntos de
elementos de cálculo simples, usualmente
adaptativos, interconectados masivamente en
paralelo y con una organización jerárquica que le
permite interactuar con algún sistema del mismo
modo que lo hace el sistema nervioso biológico''
(Kohonen, 1989). Su aprendizaje adaptativo, auto-
organización, tolerancia a fallos, operación en
tiempo real y fácil inserción dentro de la tecnología
existente, han hecho que su utilización se haya
extendido en áreas como la biológica, financiera,
industrial, medio ambiental, militar, salud, etc.
(Hilera y Martinez, 1995). Están funcionando en
aplicaciones que incluyen identificación de
procesos (Gonzalez y Martinez, 1998), detección de
fallos en sistemas de control (Aldrich y Van
Deventer, 1995), modelación de dinámicas no
lineales (Meert y Rijckaert, 1998), control de
sistemas no lineales (Rivals and Personnaz, 2000) y
optimización de procesos (Nacimiento y Guardani,
2000).
Investigaciones proponen el uso de redes
neuronales artificiales como herramienta eficiente
de pronósticos, ya que no presentan un análisis
lineal (Toro et al; 2004) y (Saldaña, 2010). Otra
parte importante de la investigación que se ha
realizado es la caracterización de los métodos para
pronósticos ya que la estimación del
comportamiento futuro de algunas variables

ISSN: 1856-8327
93
puede realizarse utilizando diversos métodos de pronósticos. Cada uno de los métodos de
proyección tiene una aplicación de carácter
especial que hace de su selección un problema de
decisión influido por diversos factores, como son,
la validez y disponibilidad de los datos históricos,
la precisión deseada del pronóstico, el costo del
procedimiento, los beneficios del resultado, los
periodos futuros que se desee pronosticar y el
tiempo disponible para hacer el estudio entre otros
(SapagChain, 2000). Dentro de los métodos de
pronósticos se pueden clasificar en función de su
carácter, esto es, aplicando métodos de carácter
cualitativo, modelos causales y modelos de series
de tiempo (Nojek et al., 2003).
De acuerdo con Toro et al., en 2004, es posible
entrenar a una red neuronal por medio de los
niveles de ventas partiendo del siguiente
algoritmo. Si V (t) es el nivel de ventas del mes t y
k el número de períodos (meses) anteriores a usar
en la predicción, se puede decir que el conjunto de
datos V (t − k), V (t − k +1),…, V (t −1) son los datos
de ventas de los k meses anteriores. Por lo tanto, el
objetivo que debe cumplir la red neuronal es que
su salida V’ (t), dada por la ecuación
V (t) = F [V(t −k),V(t −k +1),…,V(t −1), t] (1)
Sea lo más cercana posible a V (t). Por lo tanto, se
puede decir que V’ (t) es la estimación de las
ventas para el período t.
En (Koulouriotis, 2012), se analiza la importancia
de reducir el nivel de inventario en una
organización a través del pronóstico de ventas,
comparando diferentes técnicas entre ellas la
inteligencia artificial en un ambiente industrial.
Los resultados obtenidos muestran que es posible
establecer buenos niveles de inventario a través de
los pronósticos realizados por una red neuronal de
propagación hacia adelante. Bajo ese mismo
enfoque en (Azadeh, 2012), se presenta una red
neuronal difusa para estimar el precio del gas
natural a partir de parámetros con un cierto nivel
de incertidumbre. En (Chang, 2012) establecen un
mecanismo de prevención sobre el costo de
fabricación basado en redes neurona
les artificiales. Dentro de la investigación
propuesta en (Nazemi, 2013), se determina que la
inteligencia computación a través de una red
neuronal resuelve de mejor forma problemas de
optimización de cartera con comparación con otros
modelos. En (Zhai, 2013) y (Sadeghi, 2013), se
propone el uso de tecnologías de la inteligencia
artificial como los sistemas difusos para la
predicción de costos y establecer una planeación
agregada, respectivamente. Ambas
implementaciones de la inteligencia artificial
dentro del sector industrial demuestran las
ventajas de su uso en comparación con métodos
tradicionales, propiciando una ventaja competitiva
en las organizaciones
Después de una breve introducción y análisis del
trabajo relacionado al tema a tratar dentro de la
sección 1, el artículo se organiza como sigue: en la
sección 2, se da una explicación de la metodología
a la que se dio seguimiento durante la
investigación abordando aspectos como: La
recolección de los datos, Autocorrelación y la
descripción de cada método propuesto.
Consecutivamente se muestran los resultados
obtenidos durante la implementación de cada uno
de los métodos seleccionados, así como la
discusión de los resultados obtenidos dentro de las
secciones 3 y 4 respectivamente. Finalmente, las
conclusiones se mencionan en la sección 5.
Para definir la metodología a emplearse se debe
considerar que una serie de datos describe su
propio comportamiento, por lo que es importante
entender que con los métodos y los pasos
resultantes de este trabajo se obtendrá una
metodología para elegir los mejores modelos para
pronosticar las ventas dentro de la empresa donde
se llevó el caso de estudio, se debe estar consciente
de que el modelo no será único para todas las
situaciones dentro de la misma rama industrial, ya
que el tratamiento de los datos se debe realizar
bajo diferentes factores. Es decir la metodología
propuesta está dedicada a la elección del mejor
METODOLOGÍA

ISSN: 1856-8327
94
modelo de pronóstico y no a encontrar un modelo
universal. En la figura 1, se describen los pasos
básicos a seguir en la metodología para obtener los
pronósticos de ventas:
Figura 1. Esquema básico de la metodología
empleada en la investigación
La primera etapa para realizar pronósticos, es la
recolección de datos válidos y confiables. Un
pronóstico no puede ser más preciso que los datos en
que se basa. Cuando se mide una variable a lo largo
del tiempo, las observaciones en diferentes periodos
con frecuencia están relacionadas o correlacionadas.
Esta correlación se mide mediante el uso del
coeficiente de autocorrelación. Posteriormente se
selecciona el método de pronóstico adecuado en
función del patrón que presenten los datos, el tipo de
serie y la facilidad de aplicación (Makradakis, 1986).
Además se deben de establecer los parámetros
adecuados para el tipo de pronóstico, este paso fue
resuelto mediante experimentación exhaustiva
tomando como variable de respuesta un error
cuadrático medio mínimo.
Recolección de datos
En la recolección de datos para pronósticos, se deben de
identificar dos claras categorías, de entrada y prueba. La
primera es vital para diseñar y construir el modelo que
permita la realización del pronóstico, la segunda igual
de importante, sirve como punto de referencia para
validar el resultado obtenido por el pronóstico, ya que se
está probando la estimación contra la realidad.
Los datos de entrada fueron obtenidos de los registros
históricos de los años 2010 y 2011, los cuales se
convirtieron en los datos de entrada para cada uno de
los métodos de pronósticos, ya construidos dichos
modelos, se procede a la prueba de cada uno de ellos y
se verifica su eficiencia. Los datos o históricos de prueba
fueron las ventas de los años 2012 y 2013, la
concentración de los datos fue realizada mensualmente.
En la tabla 1, se muestra de forma detallada la
información de las ventas necesaria para la evaluación
de los modelos elegidos para el desarrollo de los
pronósticos.
Año Mes Tiemp
o (X)
Ventas en libras
(Y)
2012 Enero 1 1,715,363
Febrero 2 2,338,955
Marzo 3 1,206,298
Abril 4 1,201,767
Mayo 5 1,046,660
Junio 6 1,884,477
Julio 7 1,282,274
Agosto 8 413,025
Septiembre 9 970,179
Octubre 10 1,324,767
Noviembre 11 1,221,979
Diciembre 12
1,106,086
2013 Enero 13 1,784,131
Febrero 14 2,836,453
Marzo 15 3,283,337
Abril 16 2,362,562
Mayo 17 2,802,633
Junio 18 1,751,905
Julio 19 2,496,522
Agosto 20 1,881,808
Si
No

ISSN: 1856-8327
95
Tabla 1. Histórico de ventas 2012 y 2013. Empresa Productos Frugo S.A. de C.V
En la figura 2, se muestra un diagrama de dispersión para visualizar la relación que existe entre las ventas
de mes a mes, de esta forma es sencillo observar el comportamiento de los datos.
Figura 2. Representación gráfica de ventas. Microsoft Excel 2010.
Análisis de autocorrelación
Para evitar crear ambigüedades a la hora de tomar
una decisión sobre el método más conveniente a la
hora de realizar los pronósticos, es necesario
utilizar una herramienta que permita evaluar el
comportamiento de la serie y que además
considere a los elementos que la componen, es
decir, que muestre si la serie es aleatoria, tiene
tendencia o un patrón estacional. Una herramienta
viable y que fue utilizada para el análisis de
autocorrelación es el autocorrelograma, con él es
posible establecer un análisis del patrón de la serie
de datos además de obtener el coeficiente de
autocorrelación, que sin duda permitirá identificar
qué elementos de la serie se encuentran presentes
en ésta. La autocorrelación es la correlación que
existe entre una variable retrasada con uno o más
periodos. Los patrones de datos que incluyen
componentes como tendencia, estacionalidad e
irregularidad se pueden estudiar usando el
enfoque del análisis de autocorrelación. Los
coeficientes de autocorrelación para diferentes
desfases de tiempo de una variable se emplean
para identificar patrones en las series de tiempo de
datos. La ecuación siguiente contiene la fórmula
para calcular el coeficiente de autocorrelación (rk)
entre las observaciones Yt y Yt-k, las causales se
encuentran a k periodos de distancia.
Septiembre 21 1,975,181
Octubre 22 2,649,544
Noviembre 23 2,945,026
Diciembre 24 2,329,979

ISSN: 1856-8327
96
(2)
Donde
r = coeficiente de autocorrelación para un retraso de k
periodos.
= media de los valores de la serie.
Yt = observaciones en el periodo t.
Yt-k =observaciones de k periodos anteriores o durante
un periodo t-k.
Aplicando la ecuación 2, se obtiene el coeficiente de
autocorrelación y de esta forma es posible verificar el
comportamiento de la serie de tiempo tabla 2. En la
figura 3, se muestra gráficamente que el valor obtenido
para el retraso 1, r1 es de 0.61082, el cual indica que
existe una autocorrelación significativa entre las ventas
del primer mes con las ventas del mes siguiente. En
general conforme aumente el número de retrasos de
tiempo, k, disminuyen los coeficientes de
autocorrelación. De acuerdo a los resultados obtenidos
autocorrelograma se observa que los datos tienden a
caer paulatinamente hacia cero, además que los
primeros retrasos son bastante diferentes de cero, como
resultado del análisis de los datos se concluye que está
presente un patrón tendencial en la serie de tiempo.
Tabla 2. Función de Autocorrelación
para cada periodo.
22
20
18
16
14
12
10
8
6
4
2
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
Autocorrelation
Autocorrelación de laventas de brocóli
Figura 3. Función de Autocorrelación.
Software estadístico Minitab versión 15.
Selección del método de pronóstico
La selección de la técnica empleada para pronosticar, es
definida en base al análisis de los factores que
intervienen en la selección del modelo, en este caso se
buscan modelos adecuados que se ajusten a patrones
con tendencia. De acuerdo con Hanke y Reistch, en 2006,
los modelos sugeridos a emplearse para realizar los
pronósticos son: Suavización exponencial ajustado a la
tendencia, Método de Holt y Suavización exponencial
ajustado para variaciones de tendencia y
estacionalidades, Método de Winters además de la
metodología Box-Jenkins (ARIMA). Estos métodos y
metodologías estadísticas serán comparados contra una
red neuronal artificial la cual no requiere probar un
supuesto de tendencia o estacionalidad en la serie de
tiempo previo a la realización del pronóstico.
Retrasos
en cada
periodo
Función de
Autocorrelación
1 0.610829
2 0.402748
3 0.243364
4 0.261904
5 0.093726
6 -0.084612
7 -0.046443
8 0.051484
9 -0.060716

ISSN: 1856-8327
97
Método de Holt
El nivel de la serie de tiempo puede cambiar
ocasionalmente y cuando se usa el suavizamiento
exponencial simple es requerido actualizaciones de
nivel. En algunas ocasiones los datos observados
tendrán una tendencia clara en la información que
permita anticipar movimientos futuros hacia arriba.
Cuando este sea el caso, será necesaria una función de
pronóstico de tendencia lineal. Dado que las series
económicas y de negocios rara vez exhiben una
tendencia lineal fija que evolucione con el tiempo. Una
aportación de Holt, en 1957, es el desarrollo de un
método de suavizamiento exponencial lineal, el cual
toma en cuenta las tendencias lineales locales en
evolución dentro de una serie de tiempo y puede usarse
para generar pronósticos. Cuando se anticipa la
tendencia en la serie de tiempo, se requiere un estimado
de la pendiente y de nivel actual. La técnica de Holt
suaviza el nivel y la pendiente de manera directa al usar
diferentes constantes de suavizamiento para cada una.
Éstas proporcionan estimados de nivel y de la pendiente
que se adapta a lo largo del tiempo conforme aparecen
nuevas observaciones. Una de las ventajas de Holt es su
flexibilidad al seleccionar los coeficientes que controlan
el nivel y la tendencia. Los parámetros requeridos son
Alfa (α) y Beta (β). Alfa se usa para suavizar los datos a
fin de eliminar la aleatoriedad. La constante de
suavizamiento β es como α, a excepción de que se usa
para suavizar la tendencia en los datos. Ambas
constantes de suavizamiento se usan para promediar los
valores anteriores y, de esta forma, eliminar el fenómeno
aleatorio presente en la serie de tiempo. Las constantes
de suavizamiento α y β pueden seleccionarse de manera
subjetiva o mediante la minimización de una medida de
error de pronósticos como el error cuadrático medio
(MSE) (Hanke y Reistch 2006). En la tabla 3, se muestran
los resultados de la experimentación realizada para
definir los parámetros α y β necesarios para el método
Holt.
Las tres ecuaciones que se utilizan para el método de
Holt son:
1.La serie suavizada exponencialmente, o estimado del nivel
actual:
(3)
2.El estimado de la tendencia:
(4)
Pronósticos del periodo p en el futuro:
(5)
Dónde:
Lt = nuevo valor suavizado (estimado del nivel actual)
α = constante de suavización para el nivel (0 < α <1)
Yt = observación nueva o valor real de la serie en el
periodo t
β = constante de suavización para el estimado de
tendencia (0 < β < 1)
Tt = estimado de tendencia
p = periodo a pronosticar en el futuro
= pronóstico para periodo p en el futuro
Método de Winters
El método Winters con tres parámetros de
suavizamiento exponencial lineal y estacional, es una
extensión del método de Holt, tiene el potencial de
describir mejor los datos y reducir el error del
pronóstico. En el método de Winters se usa una ecuación
adicional para estimar la estacionalidad. En la versión
multiplicativa del método de Winters, el estimado de la
estacionalidad será como un índice estacional y se
calcula mediante la ecuación del estimado de la
estacionalidad. En la tabla 4, se muestran los resultados
de la experimentación realizada para definir los
parámetros alfa , beta y gama necesarios
para el método Winters. Las cuatro ecuaciones utilizadas
en el suavizamiento (multiplicativo) de Winters son:
1.El nivel de la serie estimado por suavizamiento exponencial:
(6)
2.El estimado de la tendencia:
(7)
3.El estimado de la estacionalidad:
(8)
4.Pronóstico del periodo p en el futuro:
(9)
Donde
Lt = nuevo valor suavizado o nivel actual estimado
α = constante de suavizamiento para el nivel

ISSN: 1856-8327
98
Yt = nueva observación o valor real en el periodo t
β = constante de suavizamiento para el estimado de
tendencia
Tt = estimado de tendencia
= constante de suavizamiento para el estimado de
estacinalidad
St = estimado de estacionalidad
p = número de periodo a pronosticarse
s = longitud de estacionalidad
= pronóstico para el periodo p en el futuro
Tabla 3. Resultados de la experimentación para definir los
parámetros en el método Holt. Tabla 4. Resultados de la experimentación para definir los
parámetros en el método Winters.
Error
Cuadrático
Medio
0.6 0.1 3938.6882
0.5 0.1 3969.30554
0.7 0.1 3977.204
0.8 0.1 4076.29505
0.4 0.1 4080.6369
0.6 0.2 4218.96766
0.9 0.1 4233.51164
0.5 0.2 4262.09318
0.7 0.2 4265.64826
0.3 0.1 4287.028504
0.8 0.2 4389.00711
0.4 0.2 4410.060095
0.6 0.3 4473.05642
0.5 0.3 4521.391724
0.7 0.3 4538.82546
0.9 0.2 4584.23129
0.2 0.1 4627.653574
0.3 0.2 4670.158746
0.8 0.3 4698.33332
0.4 0.3 4704.997091
0.5 0.5 4941.154883
0.9 0.3 4943.49782
0.4 0.4 4957.868414
0.2 0.2 5001.967229
0.3 0.3 5041.491025
0.6 0.6 5145.462445
0.1 0.1 5306.60193
0.3 0.4 5355.263543
0.2 0.3 5470.3474
0.1 0.2 5526.450276
Error
Cuadrático
Medio
0.7 0.1 0.4 4034.77
0.8 0.1 0.4 4057.31
0.7 0.2 0.5 4076.02
0.7 0.2 0.4 4076.54
0.6 0.2 0.4 4109.06
0.6 0.2 0.5 4110.78
0.6 0.1 0.5 4122.04
0.7 0.1 0.2 4137.4
0.6 0.1 0.4 4142.26
0.8 0.1 0.2 4159.72
0.7 0.2 0.2 4178.85
0.7 0.1 0.1 4187.19
0.6 0.2 0.2 4190.14
0.8 0.1 0.1 4203.67
0.7 0.2 0.1 4227.35
0.5 0.2 0.4 4229.18
0.5 0.2 0.5 4231.91
0.9 0.1 0.4 4232.56
0.6 0.2 0.1 4236.58
0.6 0.1 0.2 4240.99
0.6 0.3 0.4 4273.83
0.8 0.2 0.2 4277.29
0.7 0.3 0.4 4287.82
0.7 0.3 0.5 4288.82
0.6 0.3 0.5 4291.12
0.6 0.1 0.1 4292.48
0.8 0.2 0.1 4324.57
0.9 0.1 0.1 4325.9
0.6 0.3 0.2 4342.26
0.5 0.3 0.4 4349.34

ISSN: 1856-8327
99
Método ARIMA
Los Modelos de Promedio Móvil Autorregresivo
Integrado, (ARIMA), por sus siglas en inglés, son
una clase de modelos que tienen la capacidad de
operar sobre series de tiempo estacionarias o no
estacionarias. El primer paso en la identificación
del modelo consiste en determinar si la serie es
estacionaria, es decir, si la serie de tiempo aparenta
variar alrededor de un nivel fijo. Una serie no
estacionaria se indica si la serie parece crecer o
decrecer con relación del tiempo y las
autocorrelaciones no pueden desvanecerse con
rapidez. Si la serie no es estacionaria, con
frecuencia puede convertir a una serie estacionaria
al tomar sus diferencias, es decir, la serie es
remplazada por una serie de diferencias. Entonces,
se especifica un modelo ARIMA para la serie de las
diferencias. Se debe especificar el grado de
diferenciación y el algoritmo de Box-Jenkins
convierte los datos en una serie estacionaria y
realizar los cálculos subsecuentes utilizando los
datos convertidos. Una vez obtenida una serie
estacionaria, se debe identificar la forma del
modelo a utilizar. Este paso se logra mediante la
comparación de los coeficientes de autocorrelación
y de autocorrelación parcial se calcularon a partir
de los datos para las autocorrelaciones y
autocorrelaciones parciales teóricas de los diversos
modelos ARIMA (Hanke y Reistch, 2006), por lo
tanto de acuerdo a la figura 3 y 4, el modelo
correspondiente es el modelo AR (2).
6
5
4
3
2
1
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
Partial
A
utocorrelation
Partial Autocorrelation Function for VENTAS BROCOLI
(with 5% significance limits for the partial autocorrelations)
Figura 4. Autocorrelación parcial de la serie de tiempo.
Software estadístico Minitab versión 15.
Red Neuronal Artificial
Una red neuronal artificial es un procesador
masivo paralelo formado por unidades simples de
procesamiento que tienen una propensión natural
para almacenar conocimiento experimental,
haciéndolo viable para su uso. La red neuronal se
asemeja al cerebro en dos aspectos:
i. El conocimiento es adquirido por la red desde su
entorno a través de un proceso de aprendizaje.
ii.Las fuerzas de las conexiones entre neuronas,
conocidas como pesos sinápticos, son usadas para
almacenar el conocimiento (Haykin, 2009).
La arquitectura de una red neuronal consiste en la
organización y disposición de las neuronas en la
red formando capas o agrupaciones de neuronas.
Los parámetros fundamentales son: número de
capas, número de neuronas por capa, grado de
conectividad y tipo de conexión entre neuronas
(Villanueva, 2002).
Redes multicapa: Las redes neuronales artificiales
multicapa se forman con un grupo de capas
simples en cascada. La salida de una capa es la
entrada de la siguiente capa. Se ha demostrado que
las redes multicapa presentan cualidades y
aspectos por encima de las redes de una capa
simple. Dado que este tipo de redes disponen de
varias capas, las conexiones entre neuronas
pueden ser del tipo feedforward (conexión hacia
adelante) o del tipo feedback (conexión hacia
atrás). Las redes feedforward son especialmente
útiles en aplicaciones de reconocimiento o
clasificación de patrones. En la figura 5, se muestra
la estructura general de una red de este tipo. La
figura y nomenclatura se adoptan de (Hagan,
2002).

ISSN: 1856-8327
100
Figura 5. Estructura general de una red neuronal multicapa.
La entrada a la red es el vector p cuya longitud es igual a
R, W es la matriz de pesos con dimensiones SxR, a y b
son vectores de longitud S el cual, representa el número
de neuronas de la red.
La habilidad de la red perceptrón multicapa para
aprender a partir de un conjunto de ejemplos, al
aproximar relaciones no lineales, filtrar ruido en los
datos, etc. hace que sea un modelo adecuado para
abordar problemas reales, sin que esto indique que son
las mejores herramientas como aproximadores
universales. En la tabla 5, se muestra el esquema de la
red neuronal artificial construida para la realización de
los pronósticos de ventas, cabe destacar que no existe un
método específico para llegar a la arquitectura de la red,
el parámetro que definió esta arquitectura fue el error
cuadrático medio mínimo al momento de realizar los
pronósticos. La red de neuronas almacena información
en una cadena de interconexiones neuronales por medio
de los pesos. La función de transferencia utilizada es la
tangente hiperbólica.
La arquitectura de diferentes tipos de redes de neuronas
artificiales fue explorada, con el objetivo de encontrar el
diseño idóneo al problema que debemos resolver. Una
etapa de aprendizaje debe ser considerada para la
creación de un modelo neuronal, en esta parte es donde
se introducen los datos de entrada a la red neuronal
artificial. La fase de aprendizaje se utiliza para ajustar
los pesos, los cuales inicialmente son valores aleatorios.
El valor del error cuadrático medio sirve para evaluar la
corrección de pesos en cada iteración. Finalmente, la red
neuronal artificial aprende el comportamiento de la base
de datos generada por medio de datos introducidos en
su capa de entrada.
Una vez definidos los parámetros y arquitecturas de
los métodos para pronosticar se prueban los métodos
seleccionados, para el método de Holt se determina
que los mejores valores de acuerdo a un error
cuadrático medio mínimo son: alfa de 0.6 y beta de
0.1 (Ver tabla 3). Prosiguiendo con la misma lógica se
determina que los mejores parámetros para el método
de Winters son: alfa de 0.7, beta de 0.1 y gama 0.4
(Ver tabla 4). La metodología ARIMA queda definida
como un modelo AR (2) después de comparar las
autocorrelaciones parciales, y por último la red
neuronal artificial empleada para la realización de los
pronósticos descrita en la tabla 5. Los resultados de la
aplicación del método Holt, Winters, metodología
ARIMA y la red neuronal trabajando con sus
parámetros adecuados para realizar los pronósticos
se encuentran en la tabla 6 y figuras 6, 7, 8 y 9
Topología de la Red Neuronal Artificial
Numero de Neuronas en la capa
oculta
19
Tasa de aprendizaje 0.01
Numero de Iteraciones 4000
Error objetivo 1x10-5
RESULTADOS

ISSN: 1856-8327
101
respectivamente, las figuras fueron generadas a partir
de Microsoft Excel 2010. Los resultados de los
pronósticos se encuentran codificados, lo que consiste
en dividir el dato real entre diez mil para un mejor
manejo de la información, así que solo es necesario
realizar la operación inversa para obtener el valor real
arrojado por el método seleccionado.
Tabla 6. Resultados de cada técnica de pronóstico.
Año Mes Tie
mpo
(X)
Resultados
en libras (Y)
Pronóstico
con Método de
Holt
Pronóstico
con Método de
Winters
Valor
pronosticado
ARIMA
Valor
pronosticado
ANN
2010
Enero 1 1,715,363 171.5363 178.839179 181.98444 171.5467
Febrero 2 2,338,955 171.5363 211.109168 177.975959 233.8767
Marzo 3 1,206,298 212.6934 141.548676 216.792561 120.6265
Abril 4 1,201,767 155.673 115.525686 146.288296 120.1961
Mayo 5 1,046,660 130.4632 104.682685 146.006255 112.0354
Junio 6 1,884,477 109.525 150.920626 136.351342 188.4516
Julio 7 1,282,274 156.1541 133.040549 188.502763 128.2219
Agosto 8 413,025 136.998 60.1473986 151.017558 112.0207
Septiembre 9 970,179 71.4389 81.4201135 96.9095954 112.021
Octubre 10 1,324,767 80.1792 116.46938 131.590645 132.4692
Noviembre 11 1,221,979 108.0885 111.896028 153.662611 122.1821
Diciembre 12 1,106,086 113.9314 105.309848 147.264387 112.0911
2011
Enero 13 1,784,131 109.1157 144.671885 140.05042 178.3963
Febrero 14 2,836,453 152.0299 233.219576 182.256547 261.4035
Marzo 15 3,283,337 240.2319 273.193935 247.760216 261.4037
Abril 16 2,362,562 307.6118 233.188298 275.577312 261.4037
Mayo 17 2,802,633 275.0359 239.29389 218.262021 261.4037
Junio 18 1,751,905 288.7235 187.047837 245.65503 175.1843
Julio 19 2,496,522 224.3429 205.024267 180.250581 249.6467
Agosto 20 1,881,808 244.7862 190.72641 226.600602 188.1843
Septiembre 21 1,975,181 212.6843 172.981014 188.336627 197.5163
Octubre 22 2,649,544 204.536 235.303969 194.148796 261.4019
Noviembre 23 2,945,026 245.3636 247.765508 236.12573 261.4032
Diciembre 24 2,329,979 282.3719 230.263633 254.518537 233

ISSN: 1856-8327
102
Figura 6. Ventas reales vs pronóstico con el Método de Holt.
Figura 7. Ventas reales vs pronósticos con el Método de Winter.
Figura 8. Ventas reales vs pronóstico con el Método de ARIMA.
Figura 9. Ventas reales vs pronósticos con la Red neuronal artificial.

ISSN: 1856-8327
103
Finalmente se llevó a cabo el comparativo y
evaluación de cada una de la los métodos,
considerando el error cuadrático medio para su
evaluación. La finalidad es saber cuál de los
métodos alcanzaría el menor error cuadrático
medio y de esta forma poder probar la hipótesis
planteada sobre la promoción de la inteligencia
artificial como método de pronósticos en las
organizaciones, como resultado se obtuvo que la
red neuronal alcanzó el menor error cuadrático
versus la técnica del método de Hold, método de
Winters y la metodología Box Jenkin (ARIMA). En
la figura 10, se muestran los resultados de la
evaluación mediante el MSE.
Figura 10. Resultados de la evaluación por el MSE.
Microsoft Excel 2010.
Como se ha mencionado, las empresas requieren
de planes de producción que proporcionen una
mejor programación de las actividades en cada una
de las áreas, para eso requieren de saber con
anticipación cuales pueden ser sus posibles ventas
en el futuro de forma precisa, ya que dependiendo
de esta información, es posible incurrir en graves
errores como son: materia prima insuficiente, falta
de personal, exceso de materia prima e
incumplimiento en fechas de entrega lo que genera
un incremento de costos de producción. La
intención de este artículo es encontrar una
metodología para pronosticar las ventas de la
forma más precisa posible y de esta forma hacer
más competitiva a la organización.
Algunos investigadores de los pronósticos han
notado similitud entre los métodos de inteligencia
artificial como lo son las redes neuronales
artificiales y los métodos convencionales de
pronósticos, esa similitud es la forma en que
intentan encontrar con éxito los parámetros de
operación necesarios en su arquitectura para
predecir la variable dependiente que en este caso
son las ventas. Por otro lado, existen diferencias
que propician ventajas de una técnica a otra, las
redes neuronales no requieren ninguna suposición
sobre las distribuciones de probabilidad de los
datos, solo los aprenden, al contrario de muchos
métodos convencionales de pronósticos, pueden
operar con datos incompletos y analizar datos con
alta o nula correlación. Una característica
importante en las redes neuronales artificiales
empleadas en los pronósticos, es que los datos no
deben de ser analizados para probar el supuesto
de tendencia o estacionalidad en la serie de tiempo
previo a la realización del pronóstico.
CONCLUSIONES
Los resultados observados en esta investigación
muestran que los métodos estadísticos para
pronosticar utilizados parten del comportamiento
de los datos históricos, en estos modelos se supone
que el futuro será igual que el pasado, excepto por
las variables reconocidas por el modelo. Pero si
alguna variable cambia, se hacen ineficientes para
seguir pronosticando, por que parten del supuesto
de que la población siempre tendrán una
distribución normal.
En la red neuronal artificial no se requieren
especificar supuestos como la distribución de
probabilidad o patrón de comportamiento en la
serie de tiempo para la realización de pronósticos
de forma eficiente, pues el método involucra el
aprendizaje de las relaciones mediante los
DISCUSIÓN

ISSN: 1856-8327
104
ejemplos proporcionados, que es al contrario de
los métodos convencionales para pronósticos
donde se tiene que especificar el patrón de
comportamiento de los datos históricos. De
acuerdo al error cuadrático medio (MSE) como
métrica de desempeño, la red neuronal artificial
presento una mejor práctica a la hora de realizar
pronósticos.
En la fase de prueba llevada a cabo durante
veinticuatro periodos descritos es la tabla 1, se
puede observar que las ventas totales durante ese
periodo de tiempo equivalen a: 44, 810, 911 libras.
Las ventas pronosticadas mediante la red neuronal
artificial son: 44, 560, 866 libras. Lo cual refleja un
99.442% de exactitud de las ventas reales vs
pronóstico con la ANN, lo cual propicia un
escenario adecuado para el uso de las redes
neuronales artificiales a la hora de pronosticar
ventas dentro la industria.
REFERENCIAS
1.Aldrich C. and van Deventer J. S. J., (1995). Comparison of
different artificial neural nets for the detection and location of
gross errors in process systems. Industrial & Engineering
Chemistry Research. 34(1):216-224.
2.Azadeh, A., Sheikhalishahi, M., Shahmiri S. (2012) A
hybrid neuro-fuzzy simulation approach for improvement of
natural gas price forecasting in industrial sectors with vague
indicators. The International Journal of Advanced
Manufacturing Technology. Springer Link. Volume 62, Issue 1-
4, pp 15-33.
3.Azadeh, A.; Ghaderi, S. F.; Sohrabkhani S., (2008). Annual
Electricity Consumption Forecasting by Neural Network in
high Energy Consuming Industrial sectors. Energy Conversion
and Management. Volumen 49, Issue 8, p. 2272-2278.
4.Balestrassi, P.P.; Popova, E.; Paiva, A.P.; Marangon, J.W.,
(2009). Design of experiments on Neural Network’s training for
nonlinear time series. Forecasting Neurocomputing.
Volumen72, Issues 4-6, p. 1160-1178.
5.Chang, P., Lin, J., Dzan, W. (2012) Forecasting of
manufacturing cost in mobile phone products by case-based
reasoning and artificial neural network models. Journal of
Intelligent Manufacturing. Springer Link. Volume 23, Issue 3,
pp 517-531.
6.Freeman, J.; Skapura, D., (1991). Neural Networks
Algorithms, Applications, and Programming Techniques.
Addison-Wesley, New York.
7.González-García R.; Martínez-Rico R,; and Kevrekidis I.
G., (1998). Identification of distributed parameter systems: A
neural net based approach. Computers and Chemical
Engineering, 22:965-968.
8.Hagan M. T., Demuth H. B., Beale H. M., (2002). Neural
Network Design, Volumen 10. Campus Pub. Service, University
of Colorado Bookstore.
9.Hanke J.; Reitsch A., (2006). Pronósticos en los Negocios,
Octava Edición, Prentice Hall, México.
10.Haykin S., (2008). Neural Networks: A Comprehensive
Foundation. Prentice Hall, NJ, USA.
11.Haykin, Simon (2009). Neural Networks and Learning
Machines. New Jersey; Editorial Pearson Prentice Hall.
12.Hilera J. R.; and Martinez V. J.; Addison-Wesley, (1995).
Redes neuronales artificiales Fundamentos, modelos y
aplicaciones. Iberoamericana S.A, Madrid.
13.Holt, C.C. (1957). Forecasting trends and seasonals by
exponentially weighted averages, Carnegie. Institute of
Technology, Pittsburgh ONR memorandum No. 52.
14.Kohonen T., (1989). Self-organization and associative
memory. Springer Verlag. New York.
15.Koulouriotis, D., Mantas, G. (2012) Health products sales
forecasting using computational intelligence and adaptive
neuro fuzzy inference systems. Operational Research. Springer
Link. Volume 12, Issue 1, pp 29-43.
16.Makridakis S., (1986). The Art and Science of
Forecasting. International Journal of Forecasting 2.
17.McCulloch W. S. and W. Pitts (1943). A logical calculus
of the ideas immanent in nervous activity. Bulletin of
Mathematical Biology, 5(4):115-133.
18.Meert K. and Rijckaert M., (1998). Intelligent modelling
in the chemical process industry with neural networks: a case
study. Computers and Chemical Engineering. 22:587-593.
19.Nascimento C. A. O.; Giudici R., and Guardani R., (1996).
Neural network based approach for optimization of industrial
chemical processes. Redes de neuronas artificiales y algoritmos
genéticos. Servicio de Publicaciones Universidad de la Coruña.
20.Nazemi, A., Tahmasbi, N., (2013) A computational
intelligence method for solving a class of portfolio optimization
problems. Soft Computing. Springer Link. Recuperado de
http://link.springer.com/article/10.1007/s00500-013-1186-4.
21.Nojek, S.1.; Britos, P. (2003). Pronosticos de ventas:
Comparacion de predicción basada en redes neuronales versus
estadístico. Departamento de Ingeniería Industrial. Instituto
Tecnológico de Buenos Aires.
22.Rabuñal, J. R.; Dorrado, J., (2006). Artificial neural
networks in real-life applications. Idea GroupPublishing, USA.
23.Rivals and Personnaz L., (2000). Nonlinear internal
model control using neural networks: application to processes
with delay and design issues. IEEE Transactions on Neural
Networks. 11(1):80-90.
24.Sadeghi, M., Razavi S., Sadat, S. (2013) A fuzzy grey goal
programming approach for aggregate production planning. The
International Journal of Advanced Manufacturing Technology.
Springer Link. Volume 64, Issue 9-12, pp 1715-1727.

ISSN: 1856-8327
105
25.Saldaña, A; Jöns, S. (2010). Pronósticos para el
Rendimiento Del Trigo Usando Redes Neuronales Artificiales
26.SapagChain (2000). Preparación y evaluación de
proyectos. Mc-Graw Hill.
27.Toro, E; Mejía, D. (2004). Pronóstico de ventas usando
redes neuronales. Universidad Tecnológica de Pereira.
28.Vahidinasab, V.; Jadid, S.; Kazemi, A., (2008). Day-ahead
price Forecasting in Restructured Power Systems using
Artificial Neural Networks. Electric Power Systems Research.
Volumen 78, Issue 8, p. 1332-1342.
29.Villanueva E., M. (2002). Las Redes Neuronales
Artificiales y su Importancia como Herramienta en la Toma de
Decisiones. Trabajo de Investigación (Lic.) Universidad
Nacional Mayor de San Marcos. Facultad de Ciencias
Matemáticas. EAP de Investigación Operativa.
30.Zhai, K., Jiang, N., Pedrycz, W. (2013) Cost prediction
method based on an improved fuzzy model. The International
Journal of Advanced Manufacturing Technology. Springer
Link. Volume 65, Issue 5-8, pp 1045-1053.
Autores
Edgar Augusto Ruelas Santoyo. Graduado en Ingeniería y en la Maestría en Ingeniería Industrial en el
Instituto Tecnológico de Celaya en 2008 y 2011, respectivamente. Actualmente, estudia un doctorado en el
Posgrado Interinstitucional en Ciencia y Tecnología (PICYT). Profesor en el Departamento de Ingeniería
Industrial, Instituto Tecnológico Superior de Irapuato, Guanajuato, México.
E-mail: edruelas@itesi.edu.mx
José Antonio Laguna González. Graduado en Ingeniería y en la Maestría en Ingeniería Industrial del
Instituto Tecnológico Superior de Irapuato (ITESI) en el 2002 y 2013, respectivamente. Profesor en el
Departamento de Ingeniería Industrial, Instituto Tecnológico Superior de Irapuato, Ext. Abasolo,
Guanajuato, México. Se ha desempeñado en empresas del giro alimenticio y metalmecánico.
E-mail: jolaguna@itesi.edu.mx
Recibido: 07/09/2013 Aceptado: 20/12/2013

Art07 tesis-rna-mexico

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (16)

Similar a Art07 tesis-rna-mexico

Similar a Art07 tesis-rna-mexico (20)

Último

Último (20)

Art07 tesis-rna-mexico