Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Redes bayesianas
1. [REDES BAYESIANAS] 14 de Mayo del 2013
INSTITUTO POLITÉCNICO NACIONAL
ESCUELA SUPERIOR DE INGENIERÍA
MECÁNICA Y ELÉCTRICA
PROBABILIDAD Y ESTADÍSTICA
INGENIERÍA MECÁNICA
Pro: HERNÁNDEZ HERNÁNDE VIRIDIANA
REDES BAYESIANAS
Alumno: PONCE VÁZQUEZ ISMAEL
Grupo: 6MM9
ESIME AZCAPOTZALCO
2. [REDES BAYESIANAS] 14 de Mayo del 2013
INTRODUCCION
2
El procedimiento más antiguo desde hace tiempo para el tratamiento de la
incertidumbre es la probabilidad. Dentro del mundo de la inteligencia artificial,
sobresalieron críticas contra el uso de métodos probabilísticos en sistemas expertos,
principalmente en la parte de los problemas del mundo real. Así se motivó el
desarrollo de otros métodos, como los factores de certeza o la lógica difusa, en donde
se introduce implícita mente hipótesis y aproximaciones aún más exigentes. Todo esto
permitió el desarrollo de las REDES BAYESIANAS en la década de los 80 esto ayudo a
refutar las objeciones anteriores contra el uso de la probabilidad, creando un modelo
de razonamiento casual con un fundamento teórico.
Por otro lado, los diagramas de influencia que aparecieron en la década de los 80,
pueden tomarse como un expansión de las REDES BAYESIANAS, que por tener nodos
de decisión y nodos de utilidad, nos ayuda a resolver problemas de toma de
decisiones. En la década de los 90 ha aumentado súbitamente el número de
investigadores, universidades, y empresas dedicadas a este tema; en la actualidad
existen sistemas bayesianos en las especialidades más diversas, entre algunas que
sobresalen son; medicina, ingeniería, visión artificial, comercio eléctrico, informática
educativa, interfaces inteligentes, etc.
Las REDES BAYESIANAS representan un fenómeno mediante un conjunto de variables
y las relaciones de dependencia ente ellas. Dado este modelo, se pueden hacer
inferencias bayesiana; es decir, estimar la probabilidad posterior de las variables no
conocidas, en base de las conocidas. Estos pueden tener varias aplicaciones, para
clasificación, predicción, diagnostico, etc. También pueden dar
información
interesante entre cómo se relacionan las variables del dominio, tales pueden ser
interpretadas en ocasiones como relación de causa y efecto.
Todo esto era aplicado en el área de “mano” basada en un conocimiento experto, pero
en estos últimos años se han desarrollado varias técnicas para aprender a partir de
datos. También es posible combinar conocimientos expertos con los datos para
aprender el modelo.
REDES BAYESIANAS
Las redes bayesianas son una representación gráfica de dependencia para el
razonamiento probabilístico, tal que en los nodos muestran variables aleatorias y los
arcos representan relaciones de dependencia directa entre las variables, la variable en
la que apunta un arco es dependiente de la que está en el origen de éste. La topología
o estructura de la red nos representa información en las dependencias probabilísticas
entre las variables. La red como lo anterior también nos representa las independencias
condicionales de una variable o conjunto de variables proporcionadas.
ESIME AZCAPOTZALCO
Página 2
3. [REDES BAYESIANAS] 14 de Mayo del 2013
También son utilizadas para proveer una forma compacta, de representar el
conocimiento flexible de razonamiento. Esta se divide en dos etapas; el aprendizaje
estructural y el paramétrico. En la primera consiste en obtener la estructura de red y la
segunda tiene por finalidad estimar los parámetros de la funciones de probabilidad
condicional.
En una RED BAYESIANA todas las relaciones de independencias condicional en el grafo
indica a la relaciones de independencias en la distribución de probabilidad. Estas
independencias simplifican y muestra
el conocimiento y el razonamiento.
Representando una RED BAYESIANA en forma de grafica las dependencia e
independencias entre variables aleatorias, principalmente las independencias
condicionales. Lo anterior se representa con la siguiente notación, para el caso de X
independiente de Y dado Z.
Independencia en la distribución: P(XIY,Z)=P(XIZ).
Independencia en grafo: I<X I Z I Y>.
También una RED BAYESIANA representa una función de distribución conjunta en un
conjunto finito de variables. Se compone de dos partes:
La cualitativa, es una estructura grafica (grafo) que describe la posibilidades
entidades (variable) y dependencia entre ellas.
La parte de cuantitativa está compuesta por probabilidad que representa la
incertidumbre del problema, es decir, creencias de las relaciones causa efecto
entre los nodos.
La independencia condicional se verifica a través del criterio separación –D. Antes de
aclarar formal mente la separación –D, es pertinente distinguir tres tipos de nodos de
acuerdo a las direcciones de los arcos que inciden en el nodo.
Nodos en secuencia: X → Y → Z
Nodos divergentes: X ← Y → Z
Nodos convergentes: X → Y← Z
Los nodos representan variables aleatorias del dominio X₁, X₂,……Xₓ y los aros
representan relaciones de dependencia entre variables.
Separación de D
El conjunto de variables A es independiente del conjunto B dado el conjunto C, si no
existe trayectoria entre A y B en que.
1. Todos los nodos convergentes están o tienen descendientes en C.
ESIME AZCAPOTZALCO
Página 3
3
4. [REDES BAYESIANAS] 14 de Mayo del 2013
2. Todos los demás nodos están fuera de C.
4
Dada una distribución de probabilidad o modelo (M) y una demostración grafica de
dependencia o grafo (G) debe existir una relación entre las independencias
representadas en ambos. En una RED BAYESIANA, cualquier nodo X es independiente
de todos los demás que son sus descendientes dados sus nodos padres, Pa(X),
denominado el control X. Su estructura indica el contorno (paredes) de cada variable.
La estructura se especifica de la siguiente manera:
1.
2.
3.
4.
5.
6.
Pa(C)=ф
Pa(T)=C
Pa(G)=ф
Pa(R)=T
Pa(F)=T,G
Pa(D)=T,G
La cobija de Markov (manto de Markov Blanquet) de un nodo es el conjunto de nodos
que lo hacen independiente del resto de la red. Para una RED BAYESIANA, la cobija de
Markov está formada por.
Nodos padre.
Nodos hijos.
Otros padres de los hijos.
Completa la definición de una RED BAYESIANAN las probabilidades condicionales de
cada variable dados sus padres.
Nodo raíz: vector de probabilidades marginales.
Otros nodos: matriz de probabilidades condicionales dados sus padres.
Dados que los contornos (padres) de cada nodo especifican la estructura, mediante las
probabilidades de dichos nodos podemos especificar también la probabilidad
requerida. Las REDES BAYESIANAS asumen que un nodo depende únicamente de sus
pares y que cada nodo está asociado con una tabla de probabilidad condicional, que
define la probabilidad de cada estado en donde se localice la variable, dados los
posibles estados de sus padres. Una RED BAYESIANA se representa la probabilidad de
distribución conjunta para un conjunto X₁, X₂,……Xₓ tal que:
ESIME AZCAPOTZALCO
Página 4
5. [REDES BAYESIANAS] 14 de Mayo del 2013
El tamaño de la tabla de probabilidad condicional crece exponencialmente con el
número de padres de un nodo, por lo que puede crecer demasiado. Una manera de
reducir este problema es utilizado ciertos modelos para representar las tablas sin
requerir especificar todas las probabilidades, utilizando lo que se conoce como
modelos canónicos. Los principales tipos de modelos canónicos son.
Modelo de interacción disyuntiva(Noisy OR).
Modelo de interacción conjuntiva(Noisy AND).
Compuerta Max (Noisy Max gate),
Compuerta Min (Noisy Min gete).
El modelo cónico más común es el Noisy OR, que se aplica cuando varias causas
pueden ocasionar si se presentan varias causas.
TIPOS DE EVIDENCIAS.
Las REDES BAYESIANAS se utilizan en problemas en los que intervienen la
incertidumbre, dicho de otra manera, donde no se tiene un completo conocimiento
del estado del sistema, antemano. Podemos realizar observaciones (obtener evidencia)
y por lo tanto hay dos tipos de evidencias.
Evidencia firme o específica.
Evidencia parcial o virtual.
VARIABLES CONTINUAS
Las REDES BAYESIANAS permiten usar variables continuas, pero, al haber un número
infinito de estos, el problema reside en la especificación de las tablas de la
probabilidad condicional. Hay dos formas de abordar este problema.
La discretización consiste en dividir el rango de las variables continuas en
números finitos de intervalo exhaustivos y excluyentes. Naturalmente, al
discretizar se pierde información que de pende del dominio y el número de
intervalo. Este método es usualmente usado ya que la mayoría de las
herramientas y algoritmos se basan en nodos directos.
El segundo método se basa en usar modelos paramétricos como la distribución
Gaussiana, que se representa por dos parámetros, la media y la varianza.
INFERENCIA EN REDES BAYESIANAS
Una RED BAYESIANA proporciona un sistema de inferencia, donde una vez localizadas
nuevas evidencias en el estado de ciertos nodos, se modifica sus tablas de
probabilidad; y por consecuencia las nuevas probabilidades son propagadas al resto de
los nodos. La propagación de la probabilidad se conoce como inferencia probabilística,
es decir, la probabilidad de algunas variables puede ser calculada dadas evidencias en
ESIME AZCAPOTZALCO
Página 5
5
6. [REDES BAYESIANAS] 14 de Mayo del 2013
otra variable. La probabilidad antes de introducir evidencia se cono se cómo
probabilidad a priori; una vez introducida la información la probabilidad se conoce
como a posteriori. Existen diferentes tipos de algoritmo para calcular la probabilidad
de una variable a la vezo de todas.
Los principales tipos son:
1. Una variable, cualquier estructura: algoritmo de eliminación (variable
elimination)
2. Cualquier variable, estructura sencillamente
conectadas: algoritmo de
propagación de Pearl.
3. Cualquier variable, cualquier estructura: (i) agrupamiento (junctuin tree),
(ii)simulación estocástica, y (iii) condicionamiento.
En el algoritmo se aplica también la estructura tipo árbol y se pude extender a poli
árboles.
Dada ciertas evidencias E, representa por la instanciación de ciertas variables, la
probabilidad posterior de cualquier variable B, por el teorema de Bayes.
ESIME AZCAPOTZALCO
Página 6
6
7. [REDES BAYESIANAS] 14 de Mayo del 2013
Ya que la estructura de la red es un árbol, el Nodo B la separa en dos supárboles, por lo
que podemos dividir la evidencia en dos grupos.
E-: Datos en el árbol que cuya raíz es B
E+: Datos en el resto del árbol.
Por ingenieros del conocimiento en las REDES BAYESIANAS se entiende el proceso de
construcción, validación y utilización de REDES BAYESIANAS. De manera simplificada
consiste en definir la estructura (el grafo). Esto puede ser llevados a cabo por
ingenieros de domino o, si se tiene bases de datos del dominio, con atuda del
algoritmo de minería de datos.
BIBLIOGRAFIA:
http://ccc.inaoep.mx/webmail
http://www.cc.uah.es/drg/b/RodriguezDolado.BBN.2007.pdf
http://www.frlp.utn.edu.ar/materias/ia/IA2012-TrabajoTeorico-Grupo04.pdf
ESIME AZCAPOTZALCO
Página 7
7