SlideShare una empresa de Scribd logo
1 de 3
Descargar para leer sin conexión
6/19/2014 Bases metodológicas - Materiales didácticos de la UOC
http://materials.cv.uoc.edu/continguts/PID_00163967/web/nwin/rN12454.html 1/3
Bases metodológicas
Supongamos que la categorización y vaciado de un texto, a partir de un sistema de categorías S = {A, B, C, D}
suministra una secuencia como ésta:
D, A, B, C, D, A, B, C, B, A, B, A, C, A, D, C, B, D, B, C, B, D
Entonces, con retardo 1 (cuyo símbolo omitimos),
fAB = 3; fBA = 2; fCB = 3; fBC = 3; fAD = 1; fDA = 2, etc.
En forma tabular y más sintética, ponemos las cuatro categorías tanto en filas como en columnas, y en las
casillas podemos consignar la frecuencia de transición de cada par. Naturalmente, podríamos buscar
asociaciones entre tríos o cuartetos, pero aquí nos limitaremos a los pares. Así, como ya sabíamos, AB ha
aparecido 3 veces mientras que BA sólo 2. Los totales de fila f I+ equivaldrán al número de veces que cada
categoría ha estado en posición antecedente y los totales de columna f+J al número de veces que cada categoría
ha figurado en posición consiguiente. En esta tabla, la diagonal principal es 0 porque las repeticiones AA, BB,
etc., no están permitidas. En una entrevista en la que cada intervención de entrevistador o entrevistado diera
lugar a una sola categoría, no podría haber dos respuestas, ni dos preguntas, seguidas. Pero lo contrario es
perfectamente factible y veremos después tablas donde esta diagonal tiene valores distintos de 0.
Consiguiente (retardo 1)
fIJ A B C D Total
(fI+)
A
0
///
3
/
1
/
1 5
B //
2 0
///
3
//
2 7
Antecedente C /
1
///
3 0
/
1 5
(Retardo 0) D //
2
/
1
/
1 0 4
Total
(f+J)
5 7 5 4 21
Claro está que las frecuencias de transición no nos dicen gran cosa por sí mismas. Que dos categorías hayan
sido enlazadas un cierto número de veces no informa sobre reglas de orden de la cadena, dado que esta
frecuencia depende de la frecuencia global de cada elemento en solitario dentro de dicha cadena. Tampoco nos
serviría una probabilidad absoluta o incondicionada. Por ejemplo, podríamos calcular la probabilidad del par
6/19/2014 Bases metodológicas - Materiales didácticos de la UOC
http://materials.cv.uoc.edu/continguts/PID_00163967/web/nwin/rN12454.html 2/3
CB, que sería pCB = 3/21, es decir, su frecuencia dividida por el número total de pares. Pero este resultado no
nos informaría sobre la fortaleza del enlace entre C y B, porque también estaría supeditado a la frecuencia
global de C y de B por separado.
Lo que nos convendría sería saber con qué probabilidad se da B suponiendo que antes se haya dado C. Esta
probabilidad puede ser calculada como frecuencia relativa de transición, dividiendo el número de veces que ha
figurado B detrás de C por el número de veces que ha aparecido C en posición antecedente. Este último
número no siempre será igual a la frecuencia total de C en la cadena, ya que C puede estar en el último lugar de
la secuencia y entonces ya no sería estrictamente un antecedente. En definitiva, pB/C estimaría la probabilidad
de que en la cadena se produzca B dado que antes se haya producido C y se calcularía por el cociente fCB/fC+
= 3/5.
Como podéis apreciar, este cálculo se puede realizar directamente a partir de una tabla como la anterior, ya que
el numerador del cociente es la frecuencia de cada par y el denominador el total de fila correspondiente.
Entonces obtendríamos una tabla de probabilidades condicionadas como la siguiente:
Consiguiente (retardo 1)
f j / y A B C D
A 0 0,60 0,20 0,20
B 0,29 0 0,43 0,29
Antecedente C 0,20 0,60 0 0,20
(Retardo 0) D 0,50 0,25 0,25 0
Estas cifras ya nos suministran información más aprovechable sobre los vínculos entre categorías. Así vemos
que el vínculo entre A y B es mucho más fuerte que el que hay entre B y A o que el enlace entre C y B es mucho
más consistente que el que hay entre D y B. A mayor abundamiento, la regla de asociación que nos suministra
una probabilidad condicionada permite construir un modelo de relaciones en el corpus o fragmento analizado.
Con el fin de encontrar este modelo, la aproximación correcta sería encontrar la significación estadística de
estos enlaces aislados, punto que tocaremos en un ejemplo próximo. Pero, ahora, para poder ilustrar esta
posibilidad recurriremos de momento a una opción no tan correcta pero que ayuda sin embargo a visualizar el
sistema de relaciones que expresan las probabilidades.
La opción consiste en marcar un mínimo por encima del cual se tienen en cuenta las relaciones. En este ejemplo
podría ser 0,4. Eso quiere decir que las asociaciones por encima de este valor serían incorporadas al modelo
mientras que las otras no. Obviamente, los pares AB, BC, CB, DA serian los beneficiados. Si representáramos
estas relaciones mediante un diagrama de flujo y cada intervalo de 10 puntos (entre 0,40 y 0,49; entre 0,50 y
0,59; y entre 0,60 y 0,69) con flechas de un grueso diferente, obtendríamos un esquema como el de la siguiente
figura.
6/19/2014 Bases metodológicas - Materiales didácticos de la UOC
http://materials.cv.uoc.edu/continguts/PID_00163967/web/nwin/rN12454.html 3/3
Podemos sospechar que la categoría B es candidata a ser un "atractor", por la fortaleza de la convergencia de A
y C hacia ella. A parece tener un vínculo moderado y específico con D, que tiende hacia ella. La relación de B
con C ya es de menor importancia. En este esquema hemos indicado en gris las relaciones descartadas por su
debilidad.
Ni que decir tiene que este ejemplo es totalmente insuficiente de cara a extraer conclusiones. El ejercicio que
acabamos de hacer se tiene que llevar a cabo con cadenas textuales mucho más largas y con frecuencias mucho
más altas de categorías.

Más contenido relacionado

La actualidad más candente

Construcción de modelos geométricos a partir de las sombras y proyecciones
Construcción de modelos geométricos a partir de las sombras y proyeccionesConstrucción de modelos geométricos a partir de las sombras y proyecciones
Construcción de modelos geométricos a partir de las sombras y proyeccionesElias Rofriguez
 
Construcción de modelos geométricos a partir de las sombras
Construcción de modelos geométricos a partir de las sombrasConstrucción de modelos geométricos a partir de las sombras
Construcción de modelos geométricos a partir de las sombrasElias Rofriguez
 
Inecuaciones(3)
Inecuaciones(3)Inecuaciones(3)
Inecuaciones(3)blaikor
 
Algebra proposicionales juana pinto
Algebra proposicionales juana pintoAlgebra proposicionales juana pinto
Algebra proposicionales juana pintoucla
 
Ecuaciones de cuarto grado
Ecuaciones de cuarto gradoEcuaciones de cuarto grado
Ecuaciones de cuarto gradoGabby1749
 
D I V I C IÓ N D E U N S E G M E N T O E N U N A R A Z O N D A D A
D I V I C IÓ N  D E  U N  S E G M E N T O  E N  U N A  R A Z O N  D A D AD I V I C IÓ N  D E  U N  S E G M E N T O  E N  U N A  R A Z O N  D A D A
D I V I C IÓ N D E U N S E G M E N T O E N U N A R A Z O N D A D Aguest547c24
 

La actualidad más candente (11)

Polinomios 2
Polinomios 2Polinomios 2
Polinomios 2
 
Construcción de modelos geométricos a partir de las sombras y proyecciones
Construcción de modelos geométricos a partir de las sombras y proyeccionesConstrucción de modelos geométricos a partir de las sombras y proyecciones
Construcción de modelos geométricos a partir de las sombras y proyecciones
 
Construcción de modelos geométricos a partir de las sombras
Construcción de modelos geométricos a partir de las sombrasConstrucción de modelos geométricos a partir de las sombras
Construcción de modelos geométricos a partir de las sombras
 
Inecuaciones(3)
Inecuaciones(3)Inecuaciones(3)
Inecuaciones(3)
 
Inecuaciones
InecuacionesInecuaciones
Inecuaciones
 
Algebra proposicionales juana pinto
Algebra proposicionales juana pintoAlgebra proposicionales juana pinto
Algebra proposicionales juana pinto
 
Demostración del teorema del seno y coseno
Demostración del teorema del seno y cosenoDemostración del teorema del seno y coseno
Demostración del teorema del seno y coseno
 
Ecuaciones de cuarto grado
Ecuaciones de cuarto gradoEcuaciones de cuarto grado
Ecuaciones de cuarto grado
 
D I V I C IÓ N D E U N S E G M E N T O E N U N A R A Z O N D A D A
D I V I C IÓ N  D E  U N  S E G M E N T O  E N  U N A  R A Z O N  D A D AD I V I C IÓ N  D E  U N  S E G M E N T O  E N  U N A  R A Z O N  D A D A
D I V I C IÓ N D E U N S E G M E N T O E N U N A R A Z O N D A D A
 
Razones y proporciones
Razones y proporcionesRazones y proporciones
Razones y proporciones
 
Teorema de menelao
Teorema de menelaoTeorema de menelao
Teorema de menelao
 

Destacado

Trabajo deivid etica
Trabajo deivid eticaTrabajo deivid etica
Trabajo deivid eticaemy2785
 
Comercio electronico guía para pymes
Comercio electronico guía para pymesComercio electronico guía para pymes
Comercio electronico guía para pymeswoko
 
Encuentro 1 lab.pedagógico eem219
Encuentro 1 lab.pedagógico eem219Encuentro 1 lab.pedagógico eem219
Encuentro 1 lab.pedagógico eem219silviaflocco
 
Estimulación temprana
Estimulación tempranaEstimulación temprana
Estimulación tempranaSonia Morales
 
25 consejos para un buen posicionamiento SEO en tu proyecto web
25 consejos para un buen posicionamiento SEO en tu proyecto web25 consejos para un buen posicionamiento SEO en tu proyecto web
25 consejos para un buen posicionamiento SEO en tu proyecto webwoko
 
7. mantener el software mediante software update services
7.  mantener el software mediante software update services7.  mantener el software mediante software update services
7. mantener el software mediante software update servicesJosé Calvelo Comesaña
 
CHOCOLEAKS Luis Costa Bonino Asesora campaña al gobierno de Tabasco de Arturo...
CHOCOLEAKS Luis Costa Bonino Asesora campaña al gobierno de Tabasco de Arturo...CHOCOLEAKS Luis Costa Bonino Asesora campaña al gobierno de Tabasco de Arturo...
CHOCOLEAKS Luis Costa Bonino Asesora campaña al gobierno de Tabasco de Arturo...chocoliks
 
Happy birthday
Happy birthdayHappy birthday
Happy birthdayresulonah
 

Destacado (20)

[DE] Records Management: Prinzipien, Standards & Trends | Ulrich Kampffmeyer ...
[DE] Records Management: Prinzipien, Standards & Trends | Ulrich Kampffmeyer ...[DE] Records Management: Prinzipien, Standards & Trends | Ulrich Kampffmeyer ...
[DE] Records Management: Prinzipien, Standards & Trends | Ulrich Kampffmeyer ...
 
Trabajo deivid etica
Trabajo deivid eticaTrabajo deivid etica
Trabajo deivid etica
 
Comercio electronico guía para pymes
Comercio electronico guía para pymesComercio electronico guía para pymes
Comercio electronico guía para pymes
 
El Oido.
El Oido.El Oido.
El Oido.
 
Manual
ManualManual
Manual
 
Encuentro 1 lab.pedagógico eem219
Encuentro 1 lab.pedagógico eem219Encuentro 1 lab.pedagógico eem219
Encuentro 1 lab.pedagógico eem219
 
Resumen histórico [autoguardado]
Resumen histórico [autoguardado]Resumen histórico [autoguardado]
Resumen histórico [autoguardado]
 
Redes
RedesRedes
Redes
 
[DE] EIM versus ECM - BIT Interview
[DE] EIM versus ECM - BIT Interview[DE] EIM versus ECM - BIT Interview
[DE] EIM versus ECM - BIT Interview
 
Estimulación temprana
Estimulación tempranaEstimulación temprana
Estimulación temprana
 
Presentacion 1.0
Presentacion 1.0Presentacion 1.0
Presentacion 1.0
 
V unidad chalo gil
V unidad  chalo gilV unidad  chalo gil
V unidad chalo gil
 
25 consejos para un buen posicionamiento SEO en tu proyecto web
25 consejos para un buen posicionamiento SEO en tu proyecto web25 consejos para un buen posicionamiento SEO en tu proyecto web
25 consejos para un buen posicionamiento SEO en tu proyecto web
 
[DE] Bericht zum 7. Records Management Fachtag 2013
[DE] Bericht zum 7. Records Management Fachtag 2013[DE] Bericht zum 7. Records Management Fachtag 2013
[DE] Bericht zum 7. Records Management Fachtag 2013
 
7. mantener el software mediante software update services
7.  mantener el software mediante software update services7.  mantener el software mediante software update services
7. mantener el software mediante software update services
 
[DE] Elektronische Archivierung & Records Management | Ulrich Kampffmeyer | V...
[DE] Elektronische Archivierung & Records Management | Ulrich Kampffmeyer | V...[DE] Elektronische Archivierung & Records Management | Ulrich Kampffmeyer | V...
[DE] Elektronische Archivierung & Records Management | Ulrich Kampffmeyer | V...
 
[DE] EIM-Update 2014 Folien
[DE] EIM-Update 2014 Folien[DE] EIM-Update 2014 Folien
[DE] EIM-Update 2014 Folien
 
CHOCOLEAKS Luis Costa Bonino Asesora campaña al gobierno de Tabasco de Arturo...
CHOCOLEAKS Luis Costa Bonino Asesora campaña al gobierno de Tabasco de Arturo...CHOCOLEAKS Luis Costa Bonino Asesora campaña al gobierno de Tabasco de Arturo...
CHOCOLEAKS Luis Costa Bonino Asesora campaña al gobierno de Tabasco de Arturo...
 
Historia de los juegos
Historia de los juegosHistoria de los juegos
Historia de los juegos
 
Happy birthday
Happy birthdayHappy birthday
Happy birthday
 

Similar a Bases metodológicas - Análisis de categorías y probabilidades condicionadas

Enunciado 2 actividad grupal c
Enunciado 2 actividad grupal cEnunciado 2 actividad grupal c
Enunciado 2 actividad grupal cggaitano
 
Leyes de Conjuntos: ejemplos y descripciones de conceptos
Leyes de Conjuntos: ejemplos y descripciones de conceptosLeyes de Conjuntos: ejemplos y descripciones de conceptos
Leyes de Conjuntos: ejemplos y descripciones de conceptosEuglidis Gonzalez
 
Matematica discreta2011 unidad3_3ºparte_2011
Matematica discreta2011 unidad3_3ºparte_2011Matematica discreta2011 unidad3_3ºparte_2011
Matematica discreta2011 unidad3_3ºparte_2011gmromano
 
Curso básico de electrònica digital
Curso básico de electrònica digitalCurso básico de electrònica digital
Curso básico de electrònica digitalGeovanny Ruiz
 
Algebra relacional
Algebra relacionalAlgebra relacional
Algebra relacionalkandennne
 
Modelo de Biorreactor simple, análisis de estabilidad y esquema de control en...
Modelo de Biorreactor simple, análisis de estabilidad y esquema de control en...Modelo de Biorreactor simple, análisis de estabilidad y esquema de control en...
Modelo de Biorreactor simple, análisis de estabilidad y esquema de control en...Adalberto C
 
Tarea 16 reg_12310146_2
Tarea 16 reg_12310146_2Tarea 16 reg_12310146_2
Tarea 16 reg_12310146_2isragarciav
 
Tarea 16 reg_12310146_2
Tarea 16 reg_12310146_2Tarea 16 reg_12310146_2
Tarea 16 reg_12310146_2Israel Garcia
 

Similar a Bases metodológicas - Análisis de categorías y probabilidades condicionadas (17)

Uvi 6 3
Uvi 6 3Uvi 6 3
Uvi 6 3
 
Enunciado 2 actividad grupal c
Enunciado 2 actividad grupal cEnunciado 2 actividad grupal c
Enunciado 2 actividad grupal c
 
Factoriales con bloques
Factoriales con bloquesFactoriales con bloques
Factoriales con bloques
 
Leyes de Conjuntos: ejemplos y descripciones de conceptos
Leyes de Conjuntos: ejemplos y descripciones de conceptosLeyes de Conjuntos: ejemplos y descripciones de conceptos
Leyes de Conjuntos: ejemplos y descripciones de conceptos
 
Matematica discreta2011 unidad3_3ºparte_2011
Matematica discreta2011 unidad3_3ºparte_2011Matematica discreta2011 unidad3_3ºparte_2011
Matematica discreta2011 unidad3_3ºparte_2011
 
Algebra Booleana
Algebra BooleanaAlgebra Booleana
Algebra Booleana
 
Sets cap3
Sets cap3Sets cap3
Sets cap3
 
Algebrabooleana1
Algebrabooleana1Algebrabooleana1
Algebrabooleana1
 
Algebrabooleana1
Algebrabooleana1Algebrabooleana1
Algebrabooleana1
 
Algebra booleana
Algebra booleanaAlgebra booleana
Algebra booleana
 
Ayudas econometria
Ayudas econometriaAyudas econometria
Ayudas econometria
 
Curso básico de electrònica digital
Curso básico de electrònica digitalCurso básico de electrònica digital
Curso básico de electrònica digital
 
Algebra relacional
Algebra relacionalAlgebra relacional
Algebra relacional
 
Modelo de Biorreactor simple, análisis de estabilidad y esquema de control en...
Modelo de Biorreactor simple, análisis de estabilidad y esquema de control en...Modelo de Biorreactor simple, análisis de estabilidad y esquema de control en...
Modelo de Biorreactor simple, análisis de estabilidad y esquema de control en...
 
1. intervalos
1. intervalos1. intervalos
1. intervalos
 
Tarea 16 reg_12310146_2
Tarea 16 reg_12310146_2Tarea 16 reg_12310146_2
Tarea 16 reg_12310146_2
 
Tarea 16 reg_12310146_2
Tarea 16 reg_12310146_2Tarea 16 reg_12310146_2
Tarea 16 reg_12310146_2
 

Más de Bárbara Pérez

Esquemes estimulació cognitiva mòdul 1
Esquemes estimulació cognitiva mòdul 1Esquemes estimulació cognitiva mòdul 1
Esquemes estimulació cognitiva mòdul 1Bárbara Pérez
 
Apunts estimulacio cognitiva MÓDULO 4
Apunts estimulacio cognitiva MÓDULO 4Apunts estimulacio cognitiva MÓDULO 4
Apunts estimulacio cognitiva MÓDULO 4Bárbara Pérez
 
M3 tecnicas cualitativas
M3 tecnicas cualitativasM3 tecnicas cualitativas
M3 tecnicas cualitativasBárbara Pérez
 
Modulos 5 i 6 aprendizaje y intro m7
Modulos 5 i 6 aprendizaje y intro m7Modulos 5 i 6 aprendizaje y intro m7
Modulos 5 i 6 aprendizaje y intro m7Bárbara Pérez
 
M3 personalidad esquemas
M3 personalidad esquemasM3 personalidad esquemas
M3 personalidad esquemasBárbara Pérez
 
Módulo 2. gusto y olfato
Módulo 2. gusto y olfatoMódulo 2. gusto y olfato
Módulo 2. gusto y olfatoBárbara Pérez
 
Módulo 2. el sistema somatosensorial. el tacto
Módulo 2. el sistema somatosensorial. el tactoMódulo 2. el sistema somatosensorial. el tacto
Módulo 2. el sistema somatosensorial. el tactoBárbara Pérez
 
Módulo 2. el sistema motor
Módulo 2. el sistema motorMódulo 2. el sistema motor
Módulo 2. el sistema motorBárbara Pérez
 
Módulo 1 y módulo 2. la visión y la audición
Módulo 1 y módulo 2. la visión y la audiciónMódulo 1 y módulo 2. la visión y la audición
Módulo 1 y módulo 2. la visión y la audiciónBárbara Pérez
 
Tecnicas de analisis de datos cualitativos módulos1 y 2
Tecnicas de analisis de datos cualitativos módulos1 y 2Tecnicas de analisis de datos cualitativos módulos1 y 2
Tecnicas de analisis de datos cualitativos módulos1 y 2Bárbara Pérez
 
M2 Las células del sistema nervioso, psicobiologia
M2 Las células del sistema nervioso, psicobiologiaM2 Las células del sistema nervioso, psicobiologia
M2 Las células del sistema nervioso, psicobiologiaBárbara Pérez
 
Apunts psicometria modul 1
Apunts psicometria modul 1Apunts psicometria modul 1
Apunts psicometria modul 1Bárbara Pérez
 
Módulo 2 apuntes psico del aprendizaje
Módulo 2 apuntes psico del aprendizajeMódulo 2 apuntes psico del aprendizaje
Módulo 2 apuntes psico del aprendizajeBárbara Pérez
 
Psicología del aprendizaje módulo 1
Psicología del aprendizaje  módulo 1Psicología del aprendizaje  módulo 1
Psicología del aprendizaje módulo 1Bárbara Pérez
 
Visio pei esquema modul 6
Visio pei esquema modul 6Visio pei esquema modul 6
Visio pei esquema modul 6Bárbara Pérez
 
Visio esquema pei modulo 4
Visio esquema pei modulo 4Visio esquema pei modulo 4
Visio esquema pei modulo 4Bárbara Pérez
 

Más de Bárbara Pérez (20)

Esquemes estimulació cognitiva mòdul 1
Esquemes estimulació cognitiva mòdul 1Esquemes estimulació cognitiva mòdul 1
Esquemes estimulació cognitiva mòdul 1
 
Apunts estimulacio cognitiva MÓDULO 4
Apunts estimulacio cognitiva MÓDULO 4Apunts estimulacio cognitiva MÓDULO 4
Apunts estimulacio cognitiva MÓDULO 4
 
Modulo 4 esq
Modulo 4 esqModulo 4 esq
Modulo 4 esq
 
M3 tecnicas cualitativas
M3 tecnicas cualitativasM3 tecnicas cualitativas
M3 tecnicas cualitativas
 
Tadc modulo1 y2
Tadc modulo1 y2Tadc modulo1 y2
Tadc modulo1 y2
 
Modulos 5 i 6 aprendizaje y intro m7
Modulos 5 i 6 aprendizaje y intro m7Modulos 5 i 6 aprendizaje y intro m7
Modulos 5 i 6 aprendizaje y intro m7
 
M3 personalidad esquemas
M3 personalidad esquemasM3 personalidad esquemas
M3 personalidad esquemas
 
Módulo 2. gusto y olfato
Módulo 2. gusto y olfatoMódulo 2. gusto y olfato
Módulo 2. gusto y olfato
 
Módulo 2. el sistema somatosensorial. el tacto
Módulo 2. el sistema somatosensorial. el tactoMódulo 2. el sistema somatosensorial. el tacto
Módulo 2. el sistema somatosensorial. el tacto
 
Módulo 2. el sistema motor
Módulo 2. el sistema motorMódulo 2. el sistema motor
Módulo 2. el sistema motor
 
Módulo 1 y módulo 2. la visión y la audición
Módulo 1 y módulo 2. la visión y la audiciónMódulo 1 y módulo 2. la visión y la audición
Módulo 1 y módulo 2. la visión y la audición
 
Tecnicas de analisis de datos cualitativos módulos1 y 2
Tecnicas de analisis de datos cualitativos módulos1 y 2Tecnicas de analisis de datos cualitativos módulos1 y 2
Tecnicas de analisis de datos cualitativos módulos1 y 2
 
M2 Las células del sistema nervioso, psicobiologia
M2 Las células del sistema nervioso, psicobiologiaM2 Las células del sistema nervioso, psicobiologia
M2 Las células del sistema nervioso, psicobiologia
 
Apunts psicometria modul 1
Apunts psicometria modul 1Apunts psicometria modul 1
Apunts psicometria modul 1
 
Módulo 2 apuntes psico del aprendizaje
Módulo 2 apuntes psico del aprendizajeMódulo 2 apuntes psico del aprendizaje
Módulo 2 apuntes psico del aprendizaje
 
Psicología del aprendizaje módulo 1
Psicología del aprendizaje  módulo 1Psicología del aprendizaje  módulo 1
Psicología del aprendizaje módulo 1
 
Pei esquema modulo 3
Pei esquema modulo 3Pei esquema modulo 3
Pei esquema modulo 3
 
Visio pei esquema modul 6
Visio pei esquema modul 6Visio pei esquema modul 6
Visio pei esquema modul 6
 
Pei esquema modulo 5
Pei esquema modulo 5Pei esquema modulo 5
Pei esquema modulo 5
 
Visio esquema pei modulo 4
Visio esquema pei modulo 4Visio esquema pei modulo 4
Visio esquema pei modulo 4
 

Bases metodológicas - Análisis de categorías y probabilidades condicionadas

  • 1. 6/19/2014 Bases metodológicas - Materiales didácticos de la UOC http://materials.cv.uoc.edu/continguts/PID_00163967/web/nwin/rN12454.html 1/3 Bases metodológicas Supongamos que la categorización y vaciado de un texto, a partir de un sistema de categorías S = {A, B, C, D} suministra una secuencia como ésta: D, A, B, C, D, A, B, C, B, A, B, A, C, A, D, C, B, D, B, C, B, D Entonces, con retardo 1 (cuyo símbolo omitimos), fAB = 3; fBA = 2; fCB = 3; fBC = 3; fAD = 1; fDA = 2, etc. En forma tabular y más sintética, ponemos las cuatro categorías tanto en filas como en columnas, y en las casillas podemos consignar la frecuencia de transición de cada par. Naturalmente, podríamos buscar asociaciones entre tríos o cuartetos, pero aquí nos limitaremos a los pares. Así, como ya sabíamos, AB ha aparecido 3 veces mientras que BA sólo 2. Los totales de fila f I+ equivaldrán al número de veces que cada categoría ha estado en posición antecedente y los totales de columna f+J al número de veces que cada categoría ha figurado en posición consiguiente. En esta tabla, la diagonal principal es 0 porque las repeticiones AA, BB, etc., no están permitidas. En una entrevista en la que cada intervención de entrevistador o entrevistado diera lugar a una sola categoría, no podría haber dos respuestas, ni dos preguntas, seguidas. Pero lo contrario es perfectamente factible y veremos después tablas donde esta diagonal tiene valores distintos de 0. Consiguiente (retardo 1) fIJ A B C D Total (fI+) A 0 /// 3 / 1 / 1 5 B // 2 0 /// 3 // 2 7 Antecedente C / 1 /// 3 0 / 1 5 (Retardo 0) D // 2 / 1 / 1 0 4 Total (f+J) 5 7 5 4 21 Claro está que las frecuencias de transición no nos dicen gran cosa por sí mismas. Que dos categorías hayan sido enlazadas un cierto número de veces no informa sobre reglas de orden de la cadena, dado que esta frecuencia depende de la frecuencia global de cada elemento en solitario dentro de dicha cadena. Tampoco nos serviría una probabilidad absoluta o incondicionada. Por ejemplo, podríamos calcular la probabilidad del par
  • 2. 6/19/2014 Bases metodológicas - Materiales didácticos de la UOC http://materials.cv.uoc.edu/continguts/PID_00163967/web/nwin/rN12454.html 2/3 CB, que sería pCB = 3/21, es decir, su frecuencia dividida por el número total de pares. Pero este resultado no nos informaría sobre la fortaleza del enlace entre C y B, porque también estaría supeditado a la frecuencia global de C y de B por separado. Lo que nos convendría sería saber con qué probabilidad se da B suponiendo que antes se haya dado C. Esta probabilidad puede ser calculada como frecuencia relativa de transición, dividiendo el número de veces que ha figurado B detrás de C por el número de veces que ha aparecido C en posición antecedente. Este último número no siempre será igual a la frecuencia total de C en la cadena, ya que C puede estar en el último lugar de la secuencia y entonces ya no sería estrictamente un antecedente. En definitiva, pB/C estimaría la probabilidad de que en la cadena se produzca B dado que antes se haya producido C y se calcularía por el cociente fCB/fC+ = 3/5. Como podéis apreciar, este cálculo se puede realizar directamente a partir de una tabla como la anterior, ya que el numerador del cociente es la frecuencia de cada par y el denominador el total de fila correspondiente. Entonces obtendríamos una tabla de probabilidades condicionadas como la siguiente: Consiguiente (retardo 1) f j / y A B C D A 0 0,60 0,20 0,20 B 0,29 0 0,43 0,29 Antecedente C 0,20 0,60 0 0,20 (Retardo 0) D 0,50 0,25 0,25 0 Estas cifras ya nos suministran información más aprovechable sobre los vínculos entre categorías. Así vemos que el vínculo entre A y B es mucho más fuerte que el que hay entre B y A o que el enlace entre C y B es mucho más consistente que el que hay entre D y B. A mayor abundamiento, la regla de asociación que nos suministra una probabilidad condicionada permite construir un modelo de relaciones en el corpus o fragmento analizado. Con el fin de encontrar este modelo, la aproximación correcta sería encontrar la significación estadística de estos enlaces aislados, punto que tocaremos en un ejemplo próximo. Pero, ahora, para poder ilustrar esta posibilidad recurriremos de momento a una opción no tan correcta pero que ayuda sin embargo a visualizar el sistema de relaciones que expresan las probabilidades. La opción consiste en marcar un mínimo por encima del cual se tienen en cuenta las relaciones. En este ejemplo podría ser 0,4. Eso quiere decir que las asociaciones por encima de este valor serían incorporadas al modelo mientras que las otras no. Obviamente, los pares AB, BC, CB, DA serian los beneficiados. Si representáramos estas relaciones mediante un diagrama de flujo y cada intervalo de 10 puntos (entre 0,40 y 0,49; entre 0,50 y 0,59; y entre 0,60 y 0,69) con flechas de un grueso diferente, obtendríamos un esquema como el de la siguiente figura.
  • 3. 6/19/2014 Bases metodológicas - Materiales didácticos de la UOC http://materials.cv.uoc.edu/continguts/PID_00163967/web/nwin/rN12454.html 3/3 Podemos sospechar que la categoría B es candidata a ser un "atractor", por la fortaleza de la convergencia de A y C hacia ella. A parece tener un vínculo moderado y específico con D, que tiende hacia ella. La relación de B con C ya es de menor importancia. En este esquema hemos indicado en gris las relaciones descartadas por su debilidad. Ni que decir tiene que este ejemplo es totalmente insuficiente de cara a extraer conclusiones. El ejercicio que acabamos de hacer se tiene que llevar a cabo con cadenas textuales mucho más largas y con frecuencias mucho más altas de categorías.