PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
Ensayo sobre data mining
1. Página 1 de 5
Influencia de la minería de datos en la forma de hacer negocios
Jorge Luis Mayta Guillermo
“Knowledge has become the key
economic resource and the dominant, if
not the only, source of competitive
advantage.”
Peter F. Drucker
Lee & Siau (2001) afirman que las tecnologías para la generación y recolección de datos
han avanzado rápidamente y dado el escenario actual, la falta de datos no es ya un
problema; la incapacidad para generar información útil si lo es.
El gran crecimiento de la cantidad de datos acumulados por las organizaciones resulta en la
necesidad de desarrollar nuevas tecnologías y herramientas que permitan procesar los datos
y convertirlos en información útil para las organizaciones. Por lo tanto en el ámbito de los
negocios, la minería de datos (DM, por sus siglas en inglés) se ha convertido en el
procedimiento clave para la mejora de los resultados (Bescos, 2006).
Las organizaciones en la búsqueda de información relevante que permita un mejor proceso
de tomas de decisiones, parten de una serie de premisas con el objetivo de alcanzar ciertas
conclusiones. Este esquema de trabajo encaja dentro de lo que se entiende por proceso
inductivo.
El proceso inductivo requiere de ciertas asunciones que reflejan como se leen las
condiciones de la situación a considerar, estas asunciones introducidas en cualquier
problema particular permiten facilitar el razonamiento inductivo (Lee & Siau, 2001). La
inferencia estadística es un medio para llevar a cabo el proceso inductivo, sin embargo
requiere que la evidencia sea definida de antemano y sobre todo que la incertidumbre sea
cuantificable mediante distribuciones de probabilidad, esto dificulta que las organizaciones
puedan hacer un uso adecuado de la información extraída de las distintas fuentes (internas o
externas); el empleo de técnicas de minería de datos surge como alternativa a la estadística
clásica.
¿Qué es la minería de datos?
Según Gargano & Raggad (1999) la minería de datos busca relaciones ocultas, patrones,
correlaciones, e interdependencias en grandes bases de datos que los métodos tradicionales
de recolección de datos podrían pasar por alto.
Daylan, Badur & Darcan (2011) señalan que la minería de datos es el proceso de analizar
datos provenientes de diferentes perspectivas y resumirlos en información útil
principalmente utilizada con el fin de aumentar los ingresos o disminuir costos.
Laudon & Laudon (2012) afirman:
La minería de datos está más orientada al descubrimiento, ya que provee perspectivas hacia
los datos corporativos que no se pueden obtener mediante OLAP, al encontrar patrones y
2. relaciones ocultas en las bases de datos grandes e inferir reglas a partir de esos patrones y
relaciones, para predecir el comportamiento futuro. Los patrones y reglas se utilizan para
guiar la toma de decisiones y pronosticar el efecto de esas decisiones. (p. 234)
Estas definiciones de la minería de datos permiten dilucidar su concepto en términos
generales, sin embargo en el ámbito de los negocios se debe considerar a la minería de
datos como un proceso de negocio crítico que ayuda a aprender de la experiencia. Este
concepto no es nuevo, pero el gran aumento de los datos recopilados hace esencial el uso de
sistemas informáticos.
El uso de herramientas de minería de datos requiere de una serie de pasos previos antes de
su implementación y uso, es por ello que se han establecido diversos modelos de minería de
datos que permitan facilitar el proceso de implementar este tipo de herramientas. De entre
estos modelos destaca el modelo CRISP-DM (Cross Industry Standard Process for Data
Mining) por su amplia aceptación y reconocimiento por parte de diversas organizaciones a
nivel mundial.
Página 2 de 5
Entre las características principales de este modelo destaca:
- Su neutralidad con respecto a la industria, lo cual permite su adaptabilidad a
cualquier tipo de negocio.
- Su enfoque principalmente en cuestiones de negocio y analíticas.
Entre los objetivos y beneficios del modelo CRISP-DM
- Reducción de habilidades requeridas para le descubrimiento de conocimiento.
- Reducción de costos y tiempo.
- Uso general.
- Experiencia reutilizada a futuro.
¿Cuál es el escenario actual?
Muchas organizaciones han fracaso en el uso que le dan las herramientas de minería de
datos y otros tipo de tecnologías, principalmente por no comprender el funcionamiento del
negocio y sobre todo la naturaleza de los datos.
Las organizaciones primero deben, definir más allá de la tecnología a emplear, cuales son
los objetivos que se buscan al utilizar herramientas de minería de datos. Por ejemplo, el
área de marketing tendrá como objetivo saber los hábitos de los clientes y a partir de ello
definir estrategias de lanzamiento de productos, de manera similar el área de atención al
cliente, concentrará sus metas en determinar cuales son los principales motivos de
insatisfacción de los clientes y en base a ello podrá restructurar o mejorar ciertos procesos
que permitan mejorar las relaciones con los clientes.
3. Por lo tanto es vital que las empresas definan un objetivo claro de tal manera que puedan
hacer un mejor uso tanto de las tecnologías como a los recursos asociados a la
implementación de herramientas de minería de datos.
Entre los usos más frecuentes que se le ha dado a la minería de datos se encuentra la gestión
de relaciones con los clientes (CRM, por sus siglas en inglés). Entre los tipos de
información que se pueden obtener de la minería de datos y que se relación con la gestión
de la relación con los clientes son:
- La predicción a través del uso de datos históricos ha permitido determinar
comportamientos futuros. Por ejemplo, Amazon lista una serie de productos
recomendados en base a compras realizadas por clientes de preferencias similares.
- La asociación detecta grupos de ocurrencias vinculadas a un evento. Por ejemplo, en
los supermercados se ha podido establecer que las personas que comprar un
determinado producto tienden a realizar la compra un producto complementario.
En años pasados estas ventajas no podían ser tomadas por las organizaciones dado las
limitaciones de las herramientas de tecnología de la información y en muchas ocasiones
esto se traducía en un elevado costo de producción lo cual resultaba en una baja
rentabilidad para la empresa. La manera en como la minería de datos ha transformado la
manera de hacer negocios se trasluce cada día; desde el momento en que una persona se
despierta observa publicidad en los medios de comunicación que corresponde a un estudio
de investigación que ha determinado los hábitos de consumo de un grupo determinado de
personas en base al descubrimiento de información a partir del uso de herramientas de
minería de datos.
El éxito de las herramientas de minería de datos dependerá en gran medida de la
correlación entre las premisas iniciales y los objetivos alcanzados.
Página 3 de 5
Nuevos escenarios
Actualmente existen diversas formas de minería de datos que se han derivado a partir de
ella, tal es el caso de la minería de texto y de la minería Web.
Gran parte de la información con la que las organizaciones cuentan se encuentra en
repositorios documentales o textos, es decir datos no estructurados. “El objetivo de la
minería textual es extraer nuevo conocimiento a partir de corpus textuales, pero no de
deducirlo” (Brun & Senso, 2004, p.12).
A diferencia de los datos estructurados, que se generan a partir de las transacciones
realizadas y registradas mediante los sistemas tradicionales, los datos no estructurados no
cuenta con una forma definida. Sin embargo, las organizaciones consideran que dichos
datos pueden contener información valiosa con respecto al comportamiento y las actitudes
de los clientes que años atrás eran más difíciles de determinar (Laudon & Laudon, 2012).
Las herramientas de minería de texto pueden proveer las siguientes funciones:
4. - Identificar datos puntuales a partir del texto de los documentos.
- Agrupar documentos similares.
- Determinar el tema o temas tratados en los documentos.
- Facilitar el acceso a la información repartida entre los documentos de la colección,
Página 4 de 5
mediante la elaboración automática de los resúmenes.
Si bien las herramientas de minería de texto son relativamente nuevas, su utilidad radica
principalmente en la ayuda que brindan en acceder e interpretar la información que se
encuentran en documentos, esto debido al gran número de formas con que las personas
generan datos no estructurados y los usos que las empresas dan a dichos datos.
Según Kundu (2012) la minería Web se refiere al proceso global de descubrimiento de
información potencialmente útil y previamente desconocida proveniente de documentos
Web, es así que la minería Web puede ser vista como una extensión de la minería de datos
orientada a los datos de la Web.
Dado el crecimiento explosivo la Web, los sitios web están desempeñando un papel
importante en la proporción de información y conocimiento. Los patrones de uso de la Web
son un aspecto importante para descubrir información oculta y significativa. El analizar la
gran cantidad de datos que encuentran dentro de la Web representa el desafío principal de
la minería Web, considerando también el uso masivo que se da a las redes sociales, la
cuales cuentan con información muy valiosa acerca de los clientes potenciales de cualquier
tipo de organización.
Conclusiones
Dados los nuevos escenarios a consecuencia de la globalización de los mercados es
indiscutible que la manera en que las organizaciones realizan sus procesos de negocios se
ve afectada.
La gran cantidad de datos que se registran a diario a través de los sistemas tradicionales, el
gran volumen de datos que se transfieren a través del correo electrónico en las
organizaciones y el crecimiento explosivo de los datos en la Web (como es el caso de las
redes sociales) obliga a que las empresas utilicen nuevas tecnologías de la información a fin
de mantener su ventaja competitiva.
Una correcta implementación y uso de este tipo de herramientas conlleva a que las
empresas mejoren sus procesos iniciales, dado que es necesario que previamente se definan
los objetivos a seguir esto origina un cambio en la manera de trabajar. Es necesario que a
fin de garantizar la confiabilidad de la información, las organizaciones establezcan políticas
que permitan la integridad de los datos.
Finalmente, al día de hoy es difícil encontrar alguna empresa exitosa que no haya hecho uso
de las herramientas de minería de datos en sus negocios. Teniendo en cuenta que el
conocimiento es el único recurso que permite mantener una ventaja competitiva sostenible
en el tiempo.
5. Página 5 de 5
Referencias
Bescos, J. (mayo, 2006) Data mining: estadística e inducción. E-Deusto, (50), pp. 54-56.
Brun, R., & Senso, J. A. (2004). Minería textual. El Profesional De La Información, 13(1),
11-27.
Daylan, A., Badur, B. Y., & Darcan, O. N. (2011). An Experimental Study for Extending
Data Mining Standards. International Review On Computers & Software, 6(3), 336-
346.
Gargano, M. L &. Raggad, B. G. (1999). Data mining - a powerful information creating
tool. OCLC Systems & Services, 15(2), 81-90
Kundu, S. (2012). AN INTELLIGENT APPROACH OF WEB DATA MINING.
International Journal On Computer Science & Engineering, 4(5), 919-928.
Laudon, K. & Laudon, J. (2012). Sistemas de información gerencial. Naucalpan de Juárez:
Pearson Educación.
Lee, S. J. & Siau, K. (2001). A review of data mining technique. Industrial Management &
Data Systems, 101(1), 41-46.