La complejidad de los procesos académicos, administrativos y financieros en la UACh exige nuevas formas de gestión, de planificación y de evaluación. La UACh es un sistema complejo constituido por numerosos subsistemas (DEIS, UBPP, área, dirección, oficina, departamento) que generan, reproducen y transitan enormes cantidades de datos (información) de muchos tipos y usos operacionales que viajan “aislados” para ser aplicados a una amplia gama de procesos universitarios desarticulados e inconexos
Sistema de Gestión BODEGA DE DATOS [datawarehouse] 2007
1. UNIVERSIDAD AUTÓNOMA CHAPINGO
SISTEMA DE GESTIÓN DE LA UACh
BODEGA DE DATOS UACh
Reingeniería para regular la complejidad de los procesos
académicos, administrativos y financieros
(Marco Conceptual)
PROPUESTA DE TRABAJO (2007-2011)
José Antonio Anaya Roa
2. 1. PRESENTACIÓN
La complejidad de los procesos académicos, administrativos y financieros en la UACh exige
nuevas formas de gestión, de planificación y de evaluación. La Universidad es un sistema
complejo constituido por numerosos subsistemas (DEIS, UBPP, área, dirección, oficina,
departamento, etcétera) en los cuales se genera, reproduce y transita una enorme cantidad
de datos (léase información) de muchos tipos y usos operacionales -producto del trabajo de
muchas personas- que viajan “aislados” para ser aplicados a una amplia gama de procesos1
universitarios desarticulados e inconexos.
Como resultado de incorrectas decisiones, en la UACh se han propagado programas y
plataformas inadecuadas para procesos universitarios. Información contenida en múltiples y
variados sistemas informáticos incomunicados y sin relación alguna (servicios escolares,
patronato, nómina, servicios asistenciales, preparatoria, etc.); dispersa en Bases de Datos
disparejas y sin normalizar; en plataformas con motores de diferentes marcas (Oracle,
SQLServer, MySQL, dbase, PROGRESS), o bien en ACCESS u hojas de calculo de Excel o
lenguajes de programación obsoletos como pascal o cobol que no permiten el manejo
adecuado de grandes cantidades de información, lo cual representa un desorden en la
comunicación y carencia total en transparencia y rendición de cuentas.
Los tiempos de hoy exigen la necesidad de renovar los propósitos de integración. Para una
función universitaria eficiente y eficaz, es de suma importancia sistematizar la información
(datos). No atender con diligencia la problemática de los procesos universitarios, implica
serias dificultades en la gestión y la reproducción del “círculo vicioso” que obstaculiza el
avance y desarrollo institucional.
En este contexto, la presente propuesta de trabajo -continuidad al programa Sistema de
Soluciones soportado en la Tecnología de la Información (STI) desarrollado durante el
periodo 2005-2006 en el Centro del Cómputo Universitario- reafirma la constitución de una
plataforma tecnológica universitaria para atender la calidad, fluidez y eficacia de los
procesos universitarios, mediante el empleo de técnicas propias a la reingeniería de
procesos para la realización de sistemas de extracción, limpieza y transformación de datos
que alimenten una BODEGA DE DATOS UNIVERSITARIA (datawarehousing) debidamente
clasificados de acuerdo a los lineamientos establecido por el Comité de Información y
Transparencia, así como el diseño de depósitos de datos relacionales (datamarts) para
propósitos específicos y patrones multidimensionales (queriers) usando herramientas OLAP2
(recursos humanos, control escolar, recursos materiales, recursos financieros, actividades
académicas), tableros de control de indicadores (scorecards), implementación de
herramientas para el análisis de información e implantación de estas herramientas en
plataformas de Internet/Intranet/Extranet, teniendo en cuenta los más altos estándares de
seguridad, rendimiento y cumplimiento.
La propuesta de trabajo –iniciada en el año 2003 cuando se presentó al HCU el proyecto STI-
presenta un enfoque sistémico y toma en consideración las experiencias en el campo del
desarrollo de sistemas que en la UACh se han realizado desde la fundación del CCU en el año
de 1993. La oportunidad de esta propuesta ha sido acogida con satisfacción general por los
programadores encargados de desarrollar los sistemas de la UACh (Servicios Escolares,
Servicios Asistenciales, Webmaster, Red Financiera, entre otros), enriqueciéndola con sus
experiencias y aportaciones manifiestas en diversas reuniones de trabajo durante el año
1
Proceso = cursos de acción o procedimientos que se aplican de principio a fin para conseguir objetivos precisos.
2
OLAP es un tipo de tecnología que permite a los usuarios mejorar la visión que tienen de sus datos de una
manera rápida, interactiva y fácil de usar.
3. 2006, favoreciendo la consolidación de un equipo de trabajo abocado no sólo a normalizar las
bases de datos universitarias, sino también a estandarizar el motor y el lenguajes de
programación en todos los sistemas informáticos de la universidad para que, mediante
consultas rápidas a la BODEGA DE DATOS UNIVERSITARIA, los procesos administrativos,
financieros, académicos, de recursos humanos y materiales se hagan eficientes y
transparentes. El camino por recorrer es largo y la tarea es ardua, pero existe el
conocimiento, la experiencia y la disposición para llevar a buen término lo que será uno de los
proyectos de mayor alcance y trascendencia para la Universidad.
2. OBJETIVOS
2.1. Generales:
1. Instituir una gestión centrada en las interacciones de las partes y no en sus acciones
consideradas por separado.
2. Emplear los principios del desarrollo organizacional para hacer eficiente el Sistema
de Información Universitaria:
a. Organizar: Recursos Humanos, Bases de Datos y Portal Web.
b. Funcionar: Someter a método la complejidad de los sistemas informáticos
mediante la reingeniería de procesos.
c. Desarrollar: Procedimientos de integración de técnicas y cuerpos de
conocimiento aplicados a procesos de registro y tratamiento de datos e
información.
d. Crecer: Conceptualizar y desarrollar sistemas informáticos de apoyo a la toma
de decisiones para el avance institucional
3. Considerar como elementos esenciales para la efectividad, eficacia y eficiencia de los
sistemas universitarios la cultura organizacional, la normalización de los procesos y la
estructura sistémica.
2.2. Específicos:
1. Consolidar un equipo de trabajo en sistemas informáticos universitarios, donde se
considera la experiencia, el conocimiento, la disposición y el compromiso
institucional.
2. Instituir un modelo de infraestructura organizacional para el manejo de la información
acorde con el concepto de Intranet que permita llevar a la UACh hacia formas más
eficientes de gestión
3. Entender el rol instrumental de las bases de datos y el rol estructural de los sistemas
de información a fin de dar un brinco de calidad en el intercambio efectivo de la
información y comunicación.
4. Evaluar las bases de datos institucionales existentes (Personal, Servicios Escolares,
Recursos Financieros, Recursos Materiales y Actividad Académica) con el propósito
de normalizarlas para evitar redundancia y proteger la integridad de los datos, así
como de evitar problemas de actualización de los datos en las tablas.
5. Como resultado de la evaluación de las bases de datos institucionales se tomará la
decisión de aplicar una reingeniería a los sistemas que no cumplan las
especificaciones necesarias para su empleo de manera eficaz y transparente.
6. Diseñar e implementar una plataforma de sistemas normalizada conformada por;
4. a. Una Bodega de Datos (Data Warehouse)
b. Depósitos de datos relacionales (datamarts) según las necesidades
operacionales.
i. SAFI: Subsistema de Gestión Administrativo y Financiero que agrupa a
los subsistemas responsables de gestionar los recursos que demanda
el componente académico de la universidad, tales como:
1. Subsistema de Gestión de Recursos Humanos (SGRH)
2. Subsistema de Gestión Contable (SCONTA)
3. Subsistema de Gestión Presupuestal y Financiera (SGPF)
4. Subsistema de Gestión Auditorias, Investigaciones Especiales,
Seguimientos, Actas de entrega recepción, Arqueos,
Interventorias, etc (GAI)
5. Subsistema de Recursos Materiales Inventarios (SRM)
6. Subsistema de Compras y Proveedores (SCP)
ii. SGA: Subsistema de Gestión Académica que agrupa a los subsistemas
de las actividades académicas:
1. Subsistema de Servicios Escolares (SSE)
2. Subsistema de Actividades Docentes (SAD)
3. Subsistema de gestión de la investigación (SGI)
4. Subsistema de gestión de difusión cultural (SGDC)
c. Patrones multidimensionales (queriers) usando herramientas OLAP
(Procesamiento Analítico en Línea).
d. Extensiones a SQL
7. Estandarizar el motor y el lenguaje de programación.
8. Diseño de sistemas diversos de acuerdo a los requerimientos de usuarios y con base
en un análisis de los objetivos perseguidos con el sistema
3. MARCO CONCEPTUAL DE LA GESTIÓN ADMINISTRATIVA PAR
EL FORTALECIMIENTO INSTITUCIONAL.
3.1. Los recursos universitarios
El encargo social determinado por Ley a la UACh es, incuestionablemente, la función
académica. Para tal fin, la función administrativa debe supeditarse a las actividades
académicas empleando con eficiencia y racionalidad los recursos financieros, humanos y
técnicos. En este marco conceptual de la función social de la UACh, es necesario lograr un
desempeño óptimo, funcional y transparente en los procesos universitarios, en los cuales
involucran: recursos humanos, recursos financieros, recursos materiales y de servicio y
recursos de información.
Recursos Humanos: Todos los miembros activos de la universidad encargados de realizar la
gama de actividades necesarias para que la Universidad pueda realizar sus objetivos,
entendiéndose por tales: mandos medios y superiores, personal administrativo y personal
académico. La administración básica del factor humano incluye actividades de admisión,
selección, evaluación, contratación, control y capacitación de manera centralizada por el
área correspondiente, a fin de llevar solo un control sobre el total de la plantilla del personal
adscrito a la institución
5. Recursos Financieros: Actividades referentes a la
administración de la información financiera contable y
de tesorería, en aspectos de inversiones, ingresos y
egresos, bajo un modelo de contabilidad de fondos,
que permite registrar, agrupar y presentar los estados
financieros con un enfoque integral
Recursos Propios: Administración de las fuentes
generadoras de ingresos propios para la institución.
Recursos Materiales y Servicios: Administración de los
recursos materiales, así como las actividades
referentes a la adquisición de bienes de consumo y
fijos, construcción de infraestructura y servicios
generales de mantenimiento y transporte.
Recursos Informáticos: Administración de la
infraestructura del STI, los recursos informáticos, los
recursos de información y conocimiento (bibliotecas o
centros de conocimiento), la administración escolar y servicios secretariales de apoyo
docente.
3.2. Los Sistemas de Información
El objeto de los sistemas de información es automatizar los procesos operativos para hacer
eficientes los procesos administrativos, proveer información y alcanzar ventajas mediante su
implementación y utilización en apoyo al proceso de toma de decisiones a fin de garantizar
una de gestión universitaria de calidad, pertinencia y transparencia.
Un sistema de información esta constituido de diversos subsistemas que cumplen una
determinada función, entre las cuales se tienen:
Recursos Humanos: Son aquellos colaboradores que interactúan o tienen algún nivel
de relación con los sistemas de información, los cuales generan y capturan datos, y
hacen uso de sus resultados.
Datos: Son aquellos elementos que se introducen al sistema automatizado para la
generación de información a través de un procesamiento. Dicho de otra manera, un
dato es el registro de un hecho.
Hardware: Corresponde al equipo donde el sistema de información se ejecuta y opera
directamente, además es accedido y enlazado mediante diversos equipos de
comunicación.
Software: Corresponden a los programas que permiten la ejecución de un sistema de
información todos aquellos que lo constituyen para que los datos ingresados
correctamente generan resultados que se convierten en información.
La automatización de los procesos universitarios impacta en una mejor capacidad de
respuesta a las necesidades de los usuarios en tres aspectos principales:
1. Sistemas transaccionales: diseñados para procesar transacciones en procesos
operativos en una organización.
2. Sistema para proporcionar información y apoyar la toma de decisiones.
3. Sistemas estratégicos que interactúan con agentes externos a la organización como
proveedores, egresados, redes académicas, etcétra.
La evolución de los sistemas de información depende del grado de injerencia de los avances
tecnológicos de información y comunicación (TIC´s), los cuales permiten en el contexto actual
6. el intercambio efectivo de información digital, con las ventajas de: accesibilidad,
disponibilidad, inmediatez, versatilidad de consulta, actualidad, facilidad para la
investigación, dinamismo, fluidez, interdisciplinariedad, colaboración, multimedia, posibilidad
de hacer enlaces, e interactividad.
En la medida en que se unifiquen los sistemas informáticos en cuanto a diseño y operación de
los sistemas (es decir, soporte), los procesos se agilizarán y los usuarios tendrán mayores
posibilidades de compartir información, documentos, servicios (realización de trámites) y
aplicaciones por toda la comunidad universidad sin límites geográficos, empleando como
medio el Portal Web de la UACh.
3.3. Los Datos Básicos de UACh:
La UACh es un sistema complejo productor de datos. Como institución educativa vista desde
la óptica de su producción de datos, la UACh constituye un sistema complejo, compuesto a su
vez por una diversidad de subsistemas (UBPP, DEIS, área, dirección, oficina o departamento)
donde se genera una amplia gama de datos dispersos y aislados que impiden su empleo de
manera institucional que, por lo tanto, la mayoría de ellos se convierten en un desperdicio.
Dichos datos empleados de manera integrada en momentos y espacio adecuados,
representan un enorme potencial de información para la toma adecuada de decisiones y en
su caso para la correcta construcción de políticas institucionales.
La producción de datos en la UACh puede clasificarse de la siguiente forma:
Datos de producción: Son datos en bases de datos existentes y localizables en todas
las áreas académicas de la UACh, relacionados con cantidades aplicables a
resultados de actos académicos como son; tesis, artículos científicos, revistas,
acciones culturales, eventos de cine, conferencias y otros.
Datos de herencia: Son todos aquellos datos históricos que se originan en “archivos
perdidos” y cuya principal funcionalidad es apoyar diferentes tipos de análisis de
tendencias. Estas bases tienen orígenes tecnológicos diversos.
Datos de sistemas de oficina: Son los datos que están almacenados con un objetivo
general operacional y se agregan a los conceptos siguientes:
Datos no estructurados: Son datos de fuentes no electrónicas.
Datos estructurados; Son reportes, hojas de cálculos, y otros obtenidos de
procesadores de palabras.
Datos semiestructurados; Son reportes anuales o informes de labores como los
acuerdos del HCU o consejos departamentales
Datos de sistemas externos: Son los que no genera la UACh pero de uso importante
para la misma.
Meta datos: Es toda la información de definición acerca de las fuentes de los datos,
incluyendo los diferentes nombres de los datos, información de contenido, fecha de
creación origen de los mismos, otros.
Los datos y la transferencia de estos se han vuelto la pieza central decisiva de todas las
aplicaciones desarrolladas en la actualidad
3.4. Sistema de Gestión de Base de Datos (SGBD)
El propósito general de los sistemas de gestión de base de datos es manejar de manera clara,
sencilla y ordenada un conjunto de datos.
7. Para tal fin es necesario contar con un software dedicado a servir de interfaz entre la base de
datos, el usuario y las aplicaciones que la utilizan. Se compone de un lenguaje de definición
de datos, de un lenguaje de manipulación de datos y de un lenguaje de consulta.
Características de los SGBD:
Abstracción de la información. Los SGBD ahorran a los usuarios
detalles acerca del almacenamiento físico de los datos. Da lo mismo si
una base de datos ocupa uno o cientos de archivos, este hecho se hace
transparente al usuario. Así, se definen varios niveles de abstracción.
Independencia. La independencia de los datos consiste en la capacidad
de modificar el esquema (físico o lógico) de una base de datos sin tener
que realizar cambios en las aplicaciones que se sirven de ella.
Redundancia mínima. Un buen diseño de una base de datos logrará
evitar la aparición de información repetida o redundante. De entrada, lo
ideal es lograr una redundancia nula; no obstante, en algunos casos la
complejidad de los cálculos hace necesaria la aparición de
redundancias.
Consistencia. En aquellos casos en los que no se ha logrado esta
redundancia nula, será necesario vigilar que aquella información que
aparece repetida se actualice de forma coherente, es decir, que todos
los datos repetidos se actualicen de forma simultánea.
Seguridad. La información almacenada en una base de datos puede
llegar a tener un gran valor. Los SGBD deben garantizar que esta
información se encuentra asegurada frente a usuarios
malintencionados, que intenten leer información privilegiada; frente a
ataques que deseen manipular o destruir la información; o simplemente
ante las torpezas de algún usuario autorizado pero despistado.
Normalmente, los SGBD disponen de un complejo sistema de permisos
a usuarios y grupos de usuarios, que permiten otorgar diversas
categorías de permisos.
Integridad. Se trata de adoptar las medidas necesarias para garantizar
la validez de los datos almacenados. Es decir, se trata de proteger los
datos ante fallos de hardware, datos introducidos por usuarios
descuidados, o cualquier otra circunstancia capaz de corromper la
información almacenada.
Respaldo y recuperación. Los SGBD deben proporcionar una forma
eficiente de realizar copias de seguridad de la información almacenada
en ellos, y de restaurar a partir de estas copias los datos que se hayan
podido perder.
Control de la concurrencia. En la mayoría de entornos (excepto quizás
el doméstico), lo más habitual es que sean muchas las personas que
acceden a una base de datos, bien para recuperar información, bien
para almacenarla. Y es también frecuente que dichos accesos se
realicen de forma simultánea. Así pues, un SGBD debe controlar este
acceso concurrente a la información, que podría derivar en
inconsistencias.
8. Tiempo de respuesta. Lógicamente, es deseable minimizar el tiempo
que el SGBD tarda en darnos la información solicitada y en almacenar
los cambios realizados.
Ventajas:
1. Facilidad de manejo de grandes volúmenes de información.
2. Gran velocidad en muy poco tiempo.
3. Independencia del tratamiento de información.
4. Seguridad de la información (acceso a usuarios autorizados),
protección de información, de modificaciones, inclusiones, consulta.
5. No hay duplicidad de información, comprobación de información en
el momento de introducir la misma.
6. Integridad referencial el terminar los registros.
3.5. Tipos de bases de datos
Una base de datos o banco de datos es un conjunto de datos que pertenecen al mismo
contexto almacenados sistemáticamente para su posterior uso. En la actualidad la mayoría de
las bases de datos tienen formato electrónico, que ofrece un amplio rango de soluciones al
problema de almacenar datos.
Las bases de datos pueden clasificarse de acuerdo a la variabilidad de los datos:
1. Bases de datos estáticas: Bases de datos de sólo lectura, utilizadas primordialmente
para almacenar datos históricos que posteriormente se pueden utilizar para estudiar
el comportamiento de un conjunto de datos a través del tiempo, realizar proyecciones
y tomar decisiones
2. Bases de datos dinámicas: Bases de datos donde la información almacenada se
modifica con el tiempo, permitiendo operaciones como actualización y adición de
datos, además de las operaciones fundamentales de consulta (derivadas de procesos
académicos, financieros, etc.).
3. Bases de datos de texto completo; Almacenan las fuentes primarias, como por
ejemplo, todo el contenido de todas las ediciones de una colección de revistas
científicas
4. Bases de datos bibliográficas: Solo contienen un surrogante (representante) de la
fuente primaria, que permite localizarla. Contiene información sobre el autor, fecha de
publicación, editorial, título, edición, de una determinada publicación, etc. Puede
contener un resúmen o extracto de la publicación original, pero nunca el texto
completo. Como su nombre lo indica, el contenido son cifras o números.
5. Banco de imágenes, audio, video, multimedia, etc
3.5.1. Modelos de bases de datos
Además de la clasificación por la función de las bases de datos, éstas también se pueden
clasificar de acuerdo a su modelo de administración de datos. Un modelo de datos es
básicamente una "descripción" de algo conocido como contenedor de datos (donde se
guarda la información), así como de los métodos para almacenar y recuperar información de
esos contenedores. Los modelos de datos no son cosas físicas: son abstracciones que
9. permiten la implementación de un sistema eficiente de base de datos. Algunos modelos con
frecuencia utilizados en las bases de datos:
1. Bases de datos jerárquicas: En este modelo los datos se organizan en una forma
similar a un árbol (visto al revés), en donde un nodo padre de información puede tener
varios hijos. El nodo que no tiene padres es llamado raíz, y a los nodos que no tienen
hijos se los conoce como hojas. Las bases de datos jerárquicas son especialmente
útiles en el caso de aplicaciones que manejan un gran volumen de información y datos
muy compartidos permitiendo crear estructuras estables y de gran rendimiento. Una
de las principales limitaciones de este modelo es su incapacidad de representar
eficientemente la redundancia de datos.
2. Base de datos de red: Én este modelo se permite que un mismo nodo tenga varios
padres (posibilidad no permitida en el modelo jerárquico). Fue una gran mejora con
respecto al modelo jerárquico, ya que ofrecía una solución eficiente al problema de
redundancia de datos; pero, aun así, la dificultad que significa administrar la
información en una base de datos de red ha significado que sea un modelo utilizado en
su mayoría por programadores más que por usuarios finales.
3. Base de datos relacional: Modelo utilizado para modelar problemas reales y
administrar datos de manera dinámica. La idea fundamental es el uso de "relaciones",
considerados en forma lógica como conjuntos de datos llamados "tuplas". En este
modelo, el lugar y la forma en que se almacenen los datos no tienen relevancia (a
diferencia de otros modelos como el jerárquico y el de red). Esto tiene la considerable
ventaja de que es más fácil de entender y de utilizar para un usuario esporádico de la
base de datos. La información puede ser recuperada o almacenada mediante
"consultas" que ofrecen una amplia flexibilidad y poder para administrar la
información. El lenguaje más habitual para construir las consultas a bases de datos
relacionales es SQL, (Structured Query Language) o (Lenguaje Estructurado de
Consultas), un estándar implementado por los principales motores o sistemas de
gestión de bases de datos relacionales. Durante su diseño, una base de datos
relacional pasa por un proceso al que se le conoce como normalización de una base
de datos.
4. Base de datos multidimensional: Las bases de datos multidimensionales se utilizan
principalmente para crear aplicaciones OLAP, Son bases de datos de una sola tabla,
su peculiaridad es que por cada dimensión tienen un campo y otro campo por cada
métrica o hecho es decir tienen n-tuplas de campos de la forma d1,d2,d3,...,f1,f2,f3,...
la parte importante para la implementación de esta estructura de datos es que la tabla
contiene todas las n-tuplas, con los valores de las métricas previamente
precalculados para ese cruce
5. Bases de datos orientadas a objetos Este modelo almacena en la base de datos
objetos completos (estado y comportamiento). Una base de datos orientada a objetos
completos es una base de datos que incorpora todos los conceptos importantes del
paradigma de objetos:
Encapsulación - Propiedad que permite ocultar la información al resto de los
objetos, impidiendo así accesos incorrectos o conflictos.
Herencia - Propiedad a través de la cual los objetos heredan comportamiento
dentro de una jerarquía de clases.
Polimorfismo - Propiedad de una operación mediante la cual puede ser
aplicada a distintos tipos de objetos.
En bases de datos orientadas a objetos, los usuarios pueden definir operaciones
sobre los datos como parte de la definición de la base de datos. Una operación
(llamada función) se especifica en dos partes. La interfaz (o signatura) de una
operación incluye el nombre de la operación y los tipos de datos de sus argumentos (o
10. parámetros). La implementación (o método) de la operación se especifica
separadamente y puede modificarse sin afectar la interfaz. Los programas de
aplicación de los usuarios pueden operar sobre los datos invocando a dichas
operaciones a través de sus nombres y argumentos, sea cual sea la forma en la que se
han implementado. Esto podría denominarse independencia entre programas y
operaciones.
6. Bases de datos documentales: Permiten la indexación a texto completo, y en líneas
generales realizar búsquedas más potentes. Tesaurus es un sistema de índices
optimizado para este tipo de bases de datos
7. Base de datos deductivas: Es un sistema de base de datos con la diferencia de
permitir hacer deducciones a través de inferencias. Se basa principalmente en reglas
y hechos que son almacenados en la base de datos. Son llamadas base de datos
lógica, a raíz de que se basan en lógica matemática
8. Gestión de bases de datos distribuida: La base de datos está almacenada en varias
computadoras conectadas en red. Surgen debido a la existencia física de organismos
descentralizados. Esto les da la capacidad de unir las bases de datos de cada
localidad y acceder así a distintas universidades, sucursales de tiendas, etcétera
3.5.2. Normalización de una base de datos
El proceso de normalización de una base de datos consiste en aplicar una serie de reglas a
las relaciones obtenidas tras el paso del modelo E-R (entidad-relación) al modelo relacional.
Las bases de datos relacionales se normalizan para:
Evitar la redundancia de los datos.
Evitar problemas de actualización de los datos en las tablas.
Proteger la integridad de los datos.
En el modelo relacional es frecuente llamar tabla a una relación, aunque para que una tabla
bidimensional sea considerada como una relación tiene que cumplir con algunas
restricciones:
Cada columna debe tener su nombre único.
No puede haber dos filas iguales. No se permiten los duplicados.
Todos los datos en una columna deben ser del mismo tipo.
3.6. Bodega de Datos (datawarehouse)
Es una colección de datos orientadas a un dominio, integrado, no volátil y variable en el
tiempo que ayuda a la toma de decisiones. Una Bodega de Datos para UACh tendrá
relevancia al representar el expediente de la UACh. Más allá de la información transaccional y
operacional, la base de datos UACh favorecerá análisis y la divulgación eficientes de datos
(especialmente OLAP, procesamiento analítico en línea). El almacenamiento de los datos no
debe usarse con datos de uso actual. Los almacenes de los datos contienen a menudo
grandes cantidades de información que se subdividen a veces en unidades lógicas más
pequeñas, llamadas los centros comerciales, dependientes de los datos. Generalmente, dos
ideas básicas dirigen la creación de un almacén de los datos:
Integración de los datos de bases de datos distribuidas y diferentemente
estructuradas, que facilita una descripción global y un análisis comprensivo en el
almacén de los datos.
11. Separación de los datos usados en operaciones diarias de los datos usados en el
almacén de los datos para los propósitos de la divulgación, de la ayuda en la toma de
decisiones, para el análisis y para controlar.
Es práctica común normalizar los datos antes de combinarlos en el almacén de datos
mediante una herramienta de extracción, transformación y carga (ETL). Dicha aplicación lee
los datos primarios (a menudo bases de datos OLTP), realiza el proceso cualitativo o la
filtración (incluyendo, si se juzga necesario, desnormalización) y escribe en el almacén.
La función de un almacén de datos es contener datos que son necesarios o útiles para las
institución. Un almacén de datos debe entregar la información correcta a la gente indicada en
el momento adecuado en el formato correcto. El almacén de datos da respuesta a las
necesidades de usuarios. Los usuarios finales fácilmente pueden hacer consultas sobre sus
Almacenes de Datos sin tocar o afectar la operación del sistema. El ambiente de un Data
Warehouse queda definido por la suma de los diferentes DataMarts integrados, no sólo a nivel
físico sino también a nivel lógico.
Para construir un almacén de datos se necesitan herramientas para ayudar a la migración y a
la transformación de los datos hacia la bodega de datos. Ya construido, se requieren medios
para manejar grandes volúmenes de información. Dependiendo de la estructura interna de
los datos de la Bodega y especialmente del tipo de consultas a realizar, se diseña la
arquitectura de la Bodega de datos. Con este criterio, los datos deben ser repartidos entre
numerosos Data Marts.
Fuente de Datos:
Datos operativos actualizados por aplicaciones OLTP (On Line Processing Transaction.
Procesamiento de transacciones en l�a.). Est�almacenados en las bases de datos
operacionales.
3.6.1. Elementos que integran un almacén de datos
1. Metadatos "datos acerca de los datos": Datos que describen cuál es la estructura de
los datos y cómo se relacionan. El Metadato documenta exactamente, entre otras
cosas, qué tablas existen para esa aplicación, qué columnas posee cada una de las
tablas y qué tipo de datos se pueden almacenar. Los datos son de interés para el
usuario final, el Metadato es de interés para los programas que tienen que manejar
estos datos. El papel del Metadato es recoger todas las definiciones de la
organización y concepto de los datos en un "almacén de datos", debe contener toda la
información concerniente:
Tablas
Columnas de tablas
Relaciones entre tablas
Jerarquías / Dimensiones de datos
Entidades y Relaciones
2. Middleware: Su función es asegurar la conectividad entre todos los componentes de la
arquitectura de una bodega de datos. De esta manera se ofrece una mejor relación
costo/rendimiento que pasa por el desarrollo de aplicaciones más complejas, en
menos tiempo
3. Mecanismos de extracción: Los sistemas OLAP están orientados a la realización de
análisis estratégicos de la información contenida en una bodega de datos de una
manera ad-hoc. Los análisis estratégicos requieren de una visión dinámica y
multidimensional de la información diferente a la que se encuentra en los sistemas
OLTP. Este tipo de análisis esta orientado a procesar grandes volúmenes de datos que
permita medir la evolución de la organización a través del tiempo, mediante la
12. confección de comparaciones, el estudio de indicadores, desviaciones, etc. Esto
requiere la posibilidad de realizar análisis Top Down, es decir que estos sistemas
deben poseer el dinamismo necesario para permitir la reformulación de la consulta
realizada de acuerdo al análisis de los resultados obtenidos en una primera instancia
4. Mecanismos de carga
Existen dos formas básicas de desarrollar esta tarea
Acumulación simple. Sin duda, la más sencilla y común, y consiste en realizar
una sumarización o resumen de todas las transacciones comprendidas en el
período de tiempo seleccionado y transportar el resultado como una única
transacción hacia el DW.
Rolling. El proceso de Rolling por su parte, se aplica en los casos en que se
opta por mantener varios niveles de granularidad3
. Para ello se almacena
información resumida a distintos niveles, correspondientes a distintas
agrupaciones de la unidad de tiempo.
3.7. Minería de datos
El término está referido al conjunto de técnicas requeridas para extraer la información
(conocimiento) disponible en las bases de datos de la universidad.
Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis
estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda
la solución a problemas de predicción, clasificación y segmentación. Un proceso típico de
minería de datos parte de la selección del conjunto de datos, tanto en lo que se refiere a las
variables dependientes, como a las variables objetivo, como posiblemente al muestreo de los
registros disponibles. A continuación se analiza las propiedades de los datos, en especial los
histogramas, diagramas de dispersión, presencia de valores atípicos y ausencia de datos.
Como consecuencia de este análisis, al conjunto de datos de entrada se le aplican una serie
de transformaciones con el objetivo de prepararlo para aplicar la técnica de minería de datos
que mejor se adapte a los datos y al problema. Finalmente se selecciona la técnica de
minería, se construye el modelo predictivo, de clasificación o segmentación, y se evalúan los
resultados contrastando con un conjunto de datos previamente reservado para validar la
generalidad del modelo.
Por último, los modelos obtenidos por técnicas de minería de datos se aplican
incorporándolos en los sistemas de análisis de información de las empresas, e incluso, en los
sistemas transaccionales. En este sentido cabe destacar los esfuerzos del Data Mining
Group, que está estandarizando el lenguaje PMML (Predictive Modelling Markup Language),
de manera que los modelos de minería de datos sean interoperables en distintas plataformas,
con independencia del sistema con el que han sido construidos. Los principales fabricantes
de sistemas de bases de datos y programas de análisis de la información hacen uso de este
estándar.
Tradicionalmente, las técnicas de minería de datos se aplicaban sobre información contenida
en almacenes de datos. De hecho, muchas grandes empresas e instituciones han creado y
alimentan bases de datos especialmente diseñadas para proyectos de minería de datos en las
que centralizan información potencialmente útil de todas sus áreas de negocio, etc. No
3
El administrador de granularidad lee los datos, los organiza de forma que pueden ser usados llenos de significado
por todo el sistema, es decir, lanzar los datos fuera, combinar tipos de datos similares o reordenarlos y juntarlos:
Determina cual es necesario, y pasa solo los datos necesarios. Los datos no necesarios son todos descartados, el
administrador de granularidad actua como una criba
13. Aspectos
metodológicos
de Sistema de
Tiempo Real
Aspectos
metodológicos
de Sistema
Basados en el
Conocimiento
Aspectos
metodológicos de
Ingeniería de
Sofware
obstante, actualmente está cobrando una importancia cada vez mayor la minería de datos
desestructurados como información contenida en ficheros de texto, en Internet, etc.
3.- METODOLOGIA
El reconocimiento de nuestras limitaciones y errores ha permitido involucrarnos en un
proceso de transformación en la gestión universitaria que trascienda las perspectivas
individuales para transitar hacia un nuevo modelo de organización consagrado al bienestar y
fortalecimiento de la universidad y de todos sus miembros. Es decir, la búsqueda de un
quehacer universitario benéfico, armónico y placentero, de compromiso institucional que
mejore la imagen universitaria y amplíe su capacidad de planeación, estabilidad y dinamismo.
Un sistema universitario que trascienda en espacio y tiempo a través de una filosofía
académica que impregne y dé sustento a los procesos de cambio. Una filosofía académica de
aliento al compromiso de aprendizaje en equipo y el pensamiento colectivo, que haga a la
comunidad universitaria de la UACh día a día más preparada, productiva y eficiente para la
consecución de un bienestar colectivo; comprometida con los principios que le dieron origen,
así como en la conservación y rescate del patrimonio cultural, científico, ecológico y social,
para que la UACh prevalezca a través del tiempo como un organismo público, autónomo,
plural, dinámico y propositivo.
Para ello es prioritario establecer de una política amplia de gestión encaminada la
coordinación del recurso humano en el campo de la análisis, arquitectura, programación y
auditoría de sistemas -perteneciente a ala Universidad- con el fin de lograr la integración y
unificación de todos los procesos que se realizan en la universidad. Hoy se exige con mayor
rigor la necesidad de hacer realidad propósitos de integración y sistematización.
La aplicación de una reingeniería como método de trabajo
para la actualización de los sistemas informáticos basados en
el conocimiento, de los sistemas de tiempo real y de la
ingeniería del software (zona obscura de la figura) derivará la
puntualidad de la información, el aprovechamiento del
conocimiento generado en la UACh y la respuesta correcta en
el momento oportuno.
Se trabaja en la integración de sistemas digitales de
medición, control y comunicaciones; planeación y operación
de sistemas de producción y transporte; desarrollo de simuladores para el entrenamiento de
operadores y para la prueba de equipos; sistemas integrales de información en tiempo real, e
informática avanzada
VIABILIDAD DEL PROYECTO
La viabilidad de esta propuesta se sustenta en la aceptación del proyecto y la disposición de
realizar un trabajo de equipo por parte de la mayoría de los programadores de la UACh,
manifestada en diversas reuniones de trabajo durante el año 2006. Con el firme propósito
realizar la actividades correspondientes no sólo a normalizar las bases de datos
universitarias, sino también a estandarizar el motor y el lenguajes de programación en todos
los sistemas informáticos de la universidad para que, mediante consultas rápidas vía Portal
Web de la UACH a una BODEGA DE DATOS UNIVERSITARIA, permita en tiempo real obtener
información precisa y validada de los procesos administrativos, financieros, académicos, de
recursos humanos y materiales a fin de hacer eficientes y transparentes los procesos
administrativos y de trámite. El camino por recorrer es largo y la tarea es ardua, pero existe
el conocimiento, la experiencia y la disposición para llevar a buen término lo que será uno de
los proyectos de mayor alcance y trascendencia para la Universidad.
14. SITUACIÓN ACTUAL (PROBLEMÁTICA)
La UACh es un sistema complejo constituido por numerosos subsistemas (DEIS, UBPP, área,
dirección, oficina, departamento, etcétera) donde se genera, reproduce y transita una gran
variedad de datos dispersos y aislados ante falta de una política institucional para regular la
función informática, específicamente a los Sistemas de Información Universitarios.
Bajo estas condiciones de datos disgregados se dificulta el empleo institucional de “datos
básicos” lo cual representa un desperdicio en la información inherente a ellos. Es por esta
razón que cada sistema actual (red financiera, control escolar, carga académica,
contabilidad, recursos humanos, etc.) ha elaborado “su propia base de datos báscisos”.
Los procedimientos tradicionales en la UACh se basan en el excesivo empleo de papel
impreso, documentos con datos e información de difícil manejo a un costo elevado si se
considera la gran cantidad de impresoras, el oneroso gasto en consumibles, así como los
considerables gastos por su reproducción en fotocopias y retraso en la entrega inherente al
cuerpo de mensajeros internos.
En el caso de los procesos automatizados, la Información está contenida en
múltiples y variados sistemas informáticos incomunicados y sin relación
alguna (servicios escolares, patronato, nómina, servicios asistenciales,
preparatoria, etc.). Tal dispersión es resultado de una carencia de política
institucional que ha permitido practicar una “administración de problemas”
para atender sólo sus síntomas y no las causas subyacentes. La contratación
de programadores por las diversas instancias sin rigor metodológico para dar
soluciones puntuales a corto plazo no sólo ha repercutido en un dispendio de
recursos económicos, también ha derivado en la problemática de contar con
bancos de datos o bases de datos disparejas y sin normalizar, en plataformas
con motores de diferentes marcas (Oracle, SQLServer, MySQL, dbase,
PROGRESS), o bien en ACCESS u hojas de calculo de Excel o lenguajes de
programación obsoletos como pascal o cobol que no permiten el manejo
adecuado de grandes cantidades de información, lo cual representa un
desorden en la comunicación y carencia total en transparencia y rendición de
cuentas.
3.2. Portal Web de la Universidad Autónoma Chapingo
Hoy la calidad de los Sitios Web no se mide por lo que muestran (como es el caso actual de la
UACh), sino por lo que hacen; por la cantidad de necesidades que satisfacen, por la
contundencia de sus contenidos, por los servicios que permiten realizar en línea, por el valor
agregado que entregan a sus usuarios y por la facilidad de recorrer es espacio virtual de la
UACh.
El Portal Web UACh es la puerta de entrada para navegar por los sitios y páginas de la
universidad para responder a las demandas de servicios requeridos tanto por la comunidad
universitaria como por todo ciudadano interesado en nuestra Universidad; un medio ágil de
encontrar, acceder e interactuar con la gama de información derivada de la función
universitaria. El Portal Web UACh representa un excelente medio dinámico para ofrecer
contenidos académicos, administrativos, informativos y financieros; es un potente medio
electrónico para la generación de redes de intercambio de información y comunicación tanto
externa (redes interuniversitarias) como interna (conectividad virtual de recursos humanos,
materiales y financieros con las diversas instancias académicas y administrativas en la UACh,
incluidos los Centros Regionales) a través de un portal Intranet UACh
15. 3-2.1. La Intranet UACh
Es un sitio Web interno y privado de la universidad al que la comunidad puede acceder para
realizar múltiples funciones y trámites tendientes a mejorar la eficiencia de función
universitaria. Los servicios que se pueden ofrecerse en la Intranet UACh presentan la ventaja
de contar con mayor seguridad al tratarse de un entorno cerrado y un acceso restringido, con
mayor velocidad ya que no está supeditada al funcionamiento de la red Internet.
El concepto Intranet representa la solución tecnológica a múltiples problemas de
comunicación e información de los procedimientos tradicionales basados en papel y
mensajería. Una intranet contribuye a reducir tiempo y costos de distribución de la
información; en lugar de hacer copias y repartirlas por mensajería ordinaria se pueden
centralizar en el Portal Web de manera interna para ser compartidas por todos los
interesados, quienes podrán consultarlas en cualquier momento y en tiempo real desde una
PC conectada a Internet.
Dentro de las ventajas de la intranet se tienen:
Mejora la eficiencia de los procesos de comunicación e información institucional.
o Permite el acceso a un número ilimitado de usuarios y de una manera
simultánea.
o Comparte información, recursos y experiencias de los DEIS en un mismo
ámbito de acción.
o Ahorra tiempo a los miembros y la difusión de información en tiempo real
o Permite diferente niveles de acceso: la configuración de la intranet puede
contemplar restricciones de acceso a alguno de sus apartados, según los
privilegios otorgados a los distintos tipos de usuarios.
o Evita la duplicidad tanto en la información como en los procesos por ser un
espacio virtual de trabajo común.
o Construye y difunde el conocimiento y las experiencias endógenas
o Permite el acceso puntual y actualizado a la información externa mediante
hiperenlaces a informes y publicaciones on-line de interés para alumnos,
académicos y funcionario.
o Es un motor de cambio hacia la cultura organizacional debido a su flexibilidad
y capacidad para llegar a cualquier rincón de la organización.
o Permite percibir a la Universidad como un sistema social capaz de cambiar y
responder al entorno.
Sus costos de implantación, mantenimiento y uso son muy asequibles por estar
basada en la misma tecnología que Internet
El equipo para estaciones de trabajo observa menor costo y depreciación aún con uso
rudo.
Aplicaciones de impacto de la Intranet:
Reingeniería Colecciones y acervos: Fortalece la digitalización de textos para pasar
de la escritura y el libro al hipertexto y el computador (hipertextualidad).
o Programa universitario de digitalización.
o Revistas Universitarias.
o Publicaciones de alto impacto.
Circuito universitario de bibliotecas virtuales UACh: Permite el acceso a la
información desde cualquier PC conectada a la red, tanto si se encuentra en la misma
16. biblioteca como a muchos kilómetros de distancia Conexión de acervos y colecciones
(internas y externas).
Educación a distancia: Es una buena base para el trabajo a distancia al participar en
otras academias de pensamiento, a través del cual se podrá lograr un enriquecimiento
intelectual
o Mediante el empleo de videoconferencias.
o Mediante la educación a distancia con el empleo de las plataformas educativas
para clases a distancia como son: CLAROLINE, MOODLE o MANHATAN
instaladas en los servidores universitarios.
Informática Administrativa: Potencial herramienta para la realización de diversos
trámites administrativos de manera interna
Capacidad de generar una comunicación bidireccional, ya que con un simple contador
podemos conocer la información que más interesa a nuestros lectores o realizar
simples encuestas «on-line» para pulsar opiniones o realizar sugerencias.
Bodega de datos: Permitir la entrega de información bajo demanda y en el momento
en que se requiere, así como de garantizar la precisión y actualización de dicha
información.
Multimedia Académica; Acceso directo al sistema (paquetería, almacén y
herramientas) sea cual sea el punto desde el que se establezca el contacto
(conectividad e interactividad).
Realidad Virtual
o Programa universitario de desarrollo de audiovisuales.
o Programa universitarios de “edulabs” y centros de idiomas.
o Programa de actualización pedagógica.
o Guía en línea para el ingreso a la UACh.
o Programas y videos en línea
o Programación en línea para la transmisión radiofónica (Actualización
tecnológica)
o Desarrollo de programación para TV
En resumen, la Intranet es el vehículo que permite implementar novedosas formas de gestión,
cambios fundamentales en la manera de realizar los procesos internos, control y
administración.
3.2.2. La Extranet UACh
Ante la necesidad de identificar y autentificar a determinados usuarios externos que
requieren de los servicios y facilidades que se proporcionan a través del Portal UACh, se
contempla la opción de acceso en la modalidad de Extranet, es decir, la entrada de usuarios
externos vía Internet es restringida a quienes no estén autorizados (v.g.r.. proveedores). El
acceso es por medio de una clave de identificación de usuario más una palabra clave. La
identificación de un usuario estará asociada con su perfil, en función de la cual se
determinará qué servicios o funcionalidad le son permitidos. El diseño e implementación del
Portal Extranet deberá contemplar la totalidad de requerimientos para la administración y
registro de los accesos bajo un esquema de seguridad integral.
Inconvenientes:
1. El costo de actualización del hardware y software son muy elevados.
17. 2. Costo (salario) del administrador de la base de datos es costoso.
3. El mal diseño de esta puede originar problemas a futuro.
4. Un mal adiestramiento a los usuarios puede originar problemas a
futuro.
5. Si no se encuentra un manual del sistema no se podrán hacer
relaciones con facilidad.
6. Generan campos vacíos en exceso.
7. El mal diseño de seguridad genera problemas en esta