El documento proporciona información sobre la normalización de bases de datos. Explica que la normalización es el proceso de transformar datos complejos en estructuras de datos más pequeñas para evitar redundancia. También describe los objetivos de la normalización como evitar redundancia, problemas de actualización y proteger la integridad de los datos. Además, resume las reglas de primera, segunda y tercera forma normal así como las reglas de Codd para normalización de bases de datos.
2. ¿Que es la Normalización?
● Es el proceso mediante el cual se transforman datos complejos a un conjunto de estructuras de
datos más pequeñas, que además de ser más simples y más estables, son más fáciles de mantener.
● Es la descomposición o subdivisión de una relación en dos o más relaciones para evitar la redundancia;
también se puede entender la normalización como una serie de reglas que sirven para ayudar a los
diseñadores de bases de datos a desarrollar un esquema que minimice los problemas de lógica.
Cada regla está basada en la que le antecede.
● Se adoptó porque el viejo estilo de poner todos los datos en un solo lugar, como un archivo o una tabla de
la base de datos, era ineficiente y conducía a errores de lógica cuando se trataban de manipular los datos.
Objetivos de la Normalización
● Evitar la redundancia de los datos.
● Evitar problemas de actualización de los datos en las tablas.
● Proteger la integridad de los datos.
● Mantener el número de relaciones al mínimo entre los componentes de la base de datos
(fácil programación y uso por parte del usuario).
3. Terminología Equivalente
● Relación = Tabla o archivo
● Tupla = Registro, fila o renglón
● Atributo = Campo o columna
● Base de datos = Banco de datos
● Dependencia multivaluada = Dependencia multivalor
● Clave = Llave
● Clave primaria = Superclave
● Clave ajena = Clave extranjera o clave foránea
● RDBMS = Del inglés Relational Data Base Manager System que significa, Sistema
Gestor de Base de Datos Relacionales
Dependencia Funcional
Una dependencia funcional son conexiones entre uno o más atributos. Por ejemplo si
conocemos el valor de FechaDeNacimiento podemos conocer el valor de Edad.
Las dependencias funcionales se escriben utilizando una flecha, de la siguiente manera:
FechaDeNacimiento->Edad
Aquí a FechaDeNacimiento se le conoce como un determinante. Se puede leer de dos formas
FechaDeNacimiento determina la Edad o Edad es funcionalmente dependiente de
FechaDeNacimiento. De la normalización (lógica) a la implementación (física o real) puede ser
sugerible tener éstas dependencias funcionales para lograr mayor eficiencia en las tablas.
4. REGLAS DE INFERENCIA
3.1. Axiomas (Reglas de inferencia de Armstrong)
Se definen reglas de inferencia con el objetivo de inferir DF de forma sistemática.
Ejemplo: {A →B, B→C} se puede inferir {A→C}
(R1) Reflexiva: Y ⊆ X ⇒ X→Y (R1) Reflexiva: Y ⊆ X ⇒ X→Y (R1) Reflexiva: Y ⊆ X ⇒ X→Y
A → A
ABC → AB
ABC → AC
A → A
A → C 1
BC → Z
ABC →
ABC
AZ → CZ
BCD → ZD
A → BC
A → C
BC → Z
A → Z
5. DESCOMPOSICIÓN
● Una descomposición de la relación R es un conjunto de relaciones {R1, R2, .. Rn} que
conserva todos los atributos de R:
● Cada Ri= π<Atributos>R(proyección de R)
● Cada atributo de R se encuentra en alguna Ri
● Para cualquier extensión r de R se cumple: r ⊆ r1 * r2 * r3 * … * rn (* es reunión
natural)
● Esto significa (“r⊆...” y no “r=...” ) que la reunión natural de las proyecciones puede
generar tuplas espurias.
● Necesitamos establecer una forma de comprobar que la descomposición NO
conlleva:
● La desaparición de Dependencias funcionales.
● La aparición de tuplas espurias. (pérdida de información)
-Descomposición conservando dependencias
-Descomposición sin pérdidas (o no aditiva)
-Descomposiciones sucesivas sin pérdidas
6. PROCESO DE NORMALIZACIÓN
s la descomposición de esquemas de relación insatisfactorios repartiendo sus atributos
entre otros esquemas de relación más pequeños.
Estos otros esquemas poseen propiedades deseables: menos anomalías de
actualización
● La descomposición debe :
○ Conservar los atributos
○ Conservar las dependencias funcionales (se sacrifica a veces)
○ Evitar el problema de las tuplas espurias
Conceptos del modelo relacional
● X es superclave de R si X → R
● X es clave candidata de R si es superclave mínima:
○ X superclave – ∀ Y∈X, X-Y no es superclave
● Clave primaria de R: es una concreta entre las
candidatas
● Atributo primo: es aquel que forma parte de
alguna clave candidata
● Atributo NO primo: es el que no figura en ninguna
clave candidata
7. REGLAS DE NORMALIZACIÓN
Primera forma normal.
Cada fila o tupla de una tabla debe de representar una entidad y las entidades deben ser únicas por
lo que se debe establecer un atributo o columna que identifique de forma única cada registro de la
tabla, esto se hace estableciendo una llave primaria p.e matricula, numero de palcas de un auto, etc.
Además los atributos de una tabla deben ser atómicos, es decir indivisibles por ejemplo Nombre
(Yadira Karina) no es atómico debido a que puede dividirse en Primer_nombre, Segundo_nombre.
El orden de los atributos no debe ser relevante y no afecta le orden de los atributos.
codigo_clie
nte
nombre apellidos direccion tipo_cliente cod_prod nom_prod precio
1 Yadira
Karina
Fernandez
Cardenas
Av Dinamarca frecuente 2 lapiz 2.5
2 Juan
Carlos
Ruiz Perez Ecatepec ocasional 3 goma 3.5
3 Luis Flores Gomez Distrito Federal frecuente 2 lapiz 2.5
4 Pedro Lopez Perez Mora 34 ocasional 1 cuaderno 15
5 Marisol Aguilar Tapia Emiliano 35 frecuente 3 goma 3.5
6 Olivia España Alvarez Av. Mexico frecuente 4 regla 8
8. REGLAS DE NORMALIZACIÓN
Segunda Forma Normal.
Primero debe de cumplirse la primera regla de normalización.
Toda columna que no sea llave primaria debe de guardar relación directa con su clave principal o
llave primaria.
Cuando la llave primaria de una tabla sea compuesta (que la forman dos o más atributos) los demás
atributos de la tabla deberán de tener relación con ambos atributos que forman la llave primaria).
nombre Direccion tipo_cliente
Yadira Karina Av Dinamarca frecuente
Juan Carlos Ecatepec ocasional
Luis Distrito Federal frecuente
Pedro Mora 34 ocasional
Marisol Emiliano 35 frecuente
Olivia Av. Mexico frecuente
nombre direccion
Yadira Karina Av Dinamarca
Juan Carlos Ecatepec
Luis Distrito Federal
Pedro Mora 34
Marisol Emiliano 35
Olivia Av. Mexico
nombre tipo_cliente
Yadira Karina frecuente
Juan Carlos ocasional
Luis frecuente
Pedro ocasional
Marisol frecuente
Olivia frecuente
9. REGLAS DE NORMALIZACIÓN
Tercera Forma Normal
No deben existir dependencias transitorias y estas deben llevarse a otra entidad y estas
nuevas entidades deben de cumplir con la primera y segunda forma normal.
codi_cliente nombre apellidos direccion tipo_cliente cod_prod nom_prod precio
1 Yadira
Karina
Fernandez
Cardenas
Av Dinamarca frecuente 2 lapiz 2.5
2 Juan
Carlos
Ruiz Perez Ecatepec ocasional 3 goma 3.5
3 Luis Flores Gomez Distrito Federal frecuente 2 lapiz 2.5
4 Pedro Lopez Perez Mora 34 ocasional 1 cuaderno 15
5 Marisol Aguilar Tapia Emiliano 35 frecuente 3 goma 3.5
6 Olivia España Alvarez Av. Mexico frecuente 4 regla 8
10. Reglas de Codd
1 - La Regla de la información
2 - La regla del acceso garantizado
3 - Tratamiento sistemático de los valores nulos
4 - La regla de la descripción de la base de datos
5 - La regla del sub-lenguaje Integral
6 - La regla de la actualización de vistas
7 - La regla de insertar y actualizar
8 - La regla de independencia física
9 - La regla de independencia lógica
10 - La regla de la independencia de la integridad
11 - La regla de la distribución
12 - Regla de la no-subversión