SlideShare una empresa de Scribd logo
1 de 99
Descargar para leer sin conexión
CAUSA Y EFECTO EN ESTUDIOS OBSERVACIONALES
DE LA SECCIÓN TRANSVERSAL SOBRE
LA SEGURIDAD VIAL
Ezra Hauer, 2005
1. INTRODUCCIÓN
2. ILUSTRACIÓN DE TEMAS EN CRUCES CAMINO-FERROCARRIL A NIVEL
2.1 Cómo medir el 'Efecto de seguridad'
2.2 Examen de la consistencia de las estimaciones del efecto de seguridad
3. CAUSA, EFECTO, CONFUSIÓN Y CONSISTENCIA
3.1 Definición de causa y efecto
3.2 Confusión e intercambiabilidad en estudios transversales observacionales de
seguridad vial.
3.3 Consistencia de los hallazgos
4. CASOS E INQUIETUDES
4.1 Peltzman y otros sobre el efecto regulación seguridad del automóvil
4.2 Lave y otros sobre el límite de velocidad
4.3 Noland sobre la estructura y efecto sobre las muertes
4.4 El medio no es el mensaje
4.5 Algunos modelos a nivel de unidad para caminos
5. RESUMEN
6. CONCLUSIONES
Referencias
1. INTRODUCCIÓN
Gran parte de la investigación sobre seguridad vial1 gira en torno de la causa. Es decir, deseamos
aprender qué cambio en la seguridad resultará de algún tratamiento2. En muchas otras discipli-
nas, el conocimiento de este tipo proviene de experimentos. El aspecto clave de un experimento
es que uno puede cambiar deliberadamente el valor de solo unos pocos factores mientras man-
tiene todos los demás factores constantes, o neutralizar el efecto de todos los demás factores
mediante la aleatorización. En seguridad vial, la experimentación de este tipo es muy rara; el
conocimiento tiene que ser extraído de 'estudios observacionales'; es decir, interpretando los
datos que se pueden encontrar. Los estudios observacionales de seguridad vial son de dos tipos:
• 'antes-después'. Cuando algún cambio o tratamiento se aplicó a un grupo de unidades. El
cambio en el historial de accidentes y en los atributos de estas unidades desde antes del
tratamiento hasta después del tratamiento se utilizan para estimar el cambio en la seguridad
que se debe al tratamiento.
• 'transversal'. Cuando los atributos y el historial de accidentes de las unidades, algunos en-
contrados con tratamiento (atributo) X y algunos encontrados con el tratamiento (atributo) Y,
se utilizan en un intento de estimar el efecto de seguridad de la diferencia de trato (o atributo)
en la pregunta.
La distinción principal entre estos dos tipos de estudio observacional es que en un estudio antes-
después 'tratamiento' significa que algo ha cambiado de 'antes' a 'después', mientras que en un
estudio transversal el elemento de cambio no está presente, sólo existe una diferencia contem-
poránea en algún atributo de interés que podría haber sido diferente y, por lo tanto, se denomina
vagamente "tratamiento".
Se cree que el experimento aleatorio es el estándar de oro que permite la relación causa-efecto.
interpretación. Reconociendo que en muchas disciplinas y circunstancias 4 la experimentación y
aleatorización no son factibles, el estudio observacional de antes y después es quizás el siguiente
en el 1 La seguridad de una unidad es el número de accidentes, por gravedad, que se espera
que ocurran en ella por unidad de tiempo. Una unidad puede ser una intersección señalizada, un
segmento de carretera, un conductor, una flota de camiones, etc.
Generalmente por “tratamiento” nos referimos a una intervención de algún tipo, un cambio en
alguna característica de diseño o, de manera más general, un cambio en un factor que puede
causar un cambio en la seguridad de la unidad. Como será obvio, también usaremos la palabra
'tratamiento' en el sentido de 'diferencia en atributo o característica'. Eso es si una unidad recibirá
la función X y otra característica de la unidad Y, se dice que las dos unidades han recibido un
tratamiento diferente.
En nuestra perspectiva el tratamiento es la causa y nos preguntamos por su efecto. Esto es lo
contrario de ver algún evento. por ejemplo, un accidente) que ocurra y preguntar sobre su causa.
3 Rosenbaum (1995) (Rosenbaum PR 1985) dice que “Un estudio observacional es una investi-
gación empírica de tratamientos, políticas o exposiciones y los efectos que causan, pero se dife-
rencia de un experimento en que el investigador no puede controlar la asignación de tratamientos
a los sujetos. (pág. vii). Luego enfatiza que “Un estudio sin el tratamiento no es ni un experimento
ni un estudio observacional” (p.1). Sin embargo, él también debe permitir una amplia interpreta-
ción de la palabra 'tratamiento' ya que uno de sus ejemplos es un estudio sobre el tabaquismo y
las enfermedades del corazón en el que el atributo de cuánto fumó una persona en el pasado se
interpreta como 'tratamiento'. Así, los límites entre 'tratamiento', 'atributo' y 'exposición' no están
del todo claros.
4 En ciencias sociales, educación, economía, epidemiología, medicina, etc.
4 línea de respetabilidad en términos de permitir interpretaciones de causa-efecto 1 . Si la sección
transversal observacional estudios pueden conducir a conclusiones de causa-efecto es un tema
de controversia. Mientras que algunos afirman que “No hay causalidad sin manipulación” 2 otros
no excluyen la posibilidad 3 .
La cuestión de si la interpretación causal de los estudios transversales es del todo posible es de
importancia central para la seguridad vial. La razón es que las oportunidades de hacer observa-
ciones antes y después estudios sobre, digamos, el efecto de seguridad del cambio en la curva-
tura horizontal, grado de carretera, carril ancho, mediana pendiente, etc. son pocos e imperfec-
tos. Esto es así, en parte, porque cuando se reconstruye una carretera por lo general, se cambian
varios de sus atributos a la vez y es difícil asignar el resultado a cualquier único factor causal.
Además, la reconstrucción de una carretera a menudo la modifica hasta tal punto que no puede
considerarse la misma unidad después de la reconstrucción. Por el contrario, las oportunidades
de los estudios transversales observacionales son abundantes. Esta es la razón por la que gran
parte de lo que se piensa que es El conocimiento sobre el efecto de seguridad de muchas carac-
terísticas viales importantes provino de la sección transversal de observación.
estudios. Sin embargo, si es cierto que tales estudios no pueden conducir a conclusiones de
causa-efecto, entonces gran parte de la tradición existente debe ser cuestionada.
Si bien el tema es de importancia central para la seguridad vial, ha recibido escasa atención.
atención. Por lo que sé, se emitió por primera vez en Hauer (1991) 4 , quien señaló que los
resultados de beforeafter Los estudios tienden a diferir de los estudios transversales. En tales
casos, uno o ambos métodos dan resultados incorrectos. Tarko et al. (2004) argumentó a favor
de dibujar causa-efecto conclusiones de los estudios transversales. Davis (2000) revisó exhaus-
tivamente la información existente literatura relevante sobre la inferencia causal tal como se
aplica a la seguridad vial. Destacó que para dibujar conclusiones de causa-efecto a partir de
datos de sección cruzada, la posibilidad de confusión debe ser eliminado y que esto requiere
información sobre por qué un sitio recibió el tratamiento 'X' y otro recibió el tratamiento 'Y'. Mien-
tras que en 2000 Davis era levemente optimista 5 sobre la posibilidad para controlar la confusión
en estudios transversales, más recientemente Davis (Davis 2004) expresó duda de que se pue-
dan superar los sesgos de agregación inherentes a los estudios transversales.
En suma, una parte del conocimiento que pasa de la investigación a la práctica se basa en con-
clusiones extraídas de estudios transversales. No está claro, en este momento, en qué circuns-
tancias esta información puede interpretarse como representación de causa y efecto. En conse-
cuencia, el principal propósito de este informe es examinar el tema de causa y efecto en la sec-
ción transversal observacional
1 Rubin (1974) expresa este sentimiento de la siguiente manera: “… dada la elección entre los
datos de un experimento aleatorio y un estudio no aleatorizado equivalente, uno debe elegir los
datos del experimento…. Sin embargo, lo haremos desarrollar la posición de que los estudios no
aleatorios, así como los experimentos aleatorios, pueden ser útiles para estimar efectos causales
del tratamiento”. Págs. 688-689.
2 Holland (1986) atribuye esto a D. Rubin, uno de los principales pensadores de la interpretación
causa-efecto de Datos estadísticos.
3 Al hablar de la teoría de la causalidad inferida Pearl (2000) dice que “… la dirección de las
influencias causales puede determinarse a menudo sin recurrir a la información cronológica.
(Aunque, cuando esté disponible, cronológico información puede simplificar significativamente la
tarea de modelado.)”, p.43.
4 Refiriéndose a un informe de investigación en el que se hizo una declaración sobre la superio-
ridad del enfoque de antes y después Hauer (1991) dice que: "La pregunta es si el enfoque de
investigación antes y después es mejor, en general, que el enfoque transversal "y que" Esta
pregunta sería de poco interés si ambos enfoques de investigación condujeran a resultados si-
milares.
conclusiones. Esto, sin embargo, no parece ser el caso”. pags. 26 5 “…no es inconcebible que
un sistema experto, por ejemplo, pueda incorporar el conocimiento de ingeniería existente en un
manera racional y aun así conducir a una selección sin confusión”. pags. 106.
5 estudios sobre seguridad vial. Para hacer obvia la relevancia práctica del problema y el asunto
tangible, en la próxima sección usaré el dispositivo de un estudio de caso.
6 2. UNA ILUSTRACIÓN DE LOS PROBLEMAS EN EL CASO DEL FERROCARRIL PASOS
A NIVEL La pregunta práctica es esta: si realizo alguna 'acción', ¿qué puedo esperar que tenga
su efecto de seguridad? ¿ser? Es decir, en el arte práctico de la gestión de la seguridad vial nos
interesan las relaciones entre las acciones (p. ej., reemplazar los cruces con luces intermitentes
en un paso a nivel) y su esperada efecto de seguridad (reducción de accidentes). En el capítulo
introductorio pregunté, algo abstractamente, si los resultados derivados de los datos de la sec-
ción transversal se pueden utilizar para dicha orientación de causa-efecto. En En este capítulo
quiero ilustrar el tejido rico y problemático de este tema en el contexto de una campo de acción
específico: el de elegir dispositivos de advertencia para los pasos a nivel de ferrocarril y carretera.
2.1 Cómo se puede medir el 'Efecto de seguridad'.
Se entiende bien cómo se mide el efecto de seguridad en un estudio observacional de antes y
después.
Predecimos cuál habría sido la seguridad de las entidades tratadas en el período 'después del
tratamiento' si se hubieran dejado sin tratar. Para ello utilizamos el historial de accidentes de las
entidades tratadas de la período 'antes del tratamiento' y conocimiento de cómo sus atributos
(por ejemplo, flujo de tráfico) cambiaron de el período 'antes' al 'después'. Luego comparamos la
predicción de lo que habría sido en el período 'después' si no hubiera habido tratamiento, a qué
accidentes se materializaron en el período 'después' con el tratamiento en su lugar. Esta compa-
ración puede ser en forma de diferencia: δ = (qué seguridad habría sido sin tratamiento) – (qué
seguridad había con tratamiento); o en forma de proporción: θ = (qué seguridad había con el
tratamiento)/ (qué seguridad habría sido sin tratamiento). los estimaciones de δ o θ pueden servir
como guía para responder la pregunta original: si implementar algún tratamiento (acción) ¿cuál
podemos esperar que sea su efecto? En un estudio observacional que utiliza datos transversales,
el efecto de seguridad se estima bastante diferentemente. Para dilucidar, considere el estudio de
Coleman y Stewart (1976) sobre la seguridad de pasos a nivel ferrocarril-carretera. Usaron datos
transversales de 37,230 pasos a nivel en 15 estados para ajustarse al modelo de regresión rela-
tivamente simple: C log (Trenes/día) CCC wd,3 10 ancho,0 ancho,1 ancho,2 (Trenes/día) Acci-
dentes/año = 10 (Vehículos/día) (Trenes/día) ecuación 1 Se estimaron los coeficientes de regre-
sión C wd,o, …, C wd,3 para tres tipos de dispositivos de advertencia (wd=Puertas Automáticas,
Intermitentes o Crossbucks) y para cuatro condiciones (urbano de vía única o rural y urbano o
rural de vía múltiple). Utilizando los coeficientes de regresión estimados y la ecuación. 1 uno
puede trazar gráficos y comparar frecuencias de accidentes previstas en condiciones idénticas
(número de vías, escenario, trenes/día y vehículos/día) pero con diferentes avisadores.
Considere, por ejemplo, las frecuencias de accidentes pronosticadas en la Figura 1.
7 Figura 1. Predicciones del modelo para Crossbucks y Flashers Con, digamos, 10.000
vehículos de carretera/día, 10 trenes/día, una sola vía férrea y cruces ubicados en un área ur-
bana, se espera que un cruce promedio con 'Crossbucks' tenga 0.182 accidentes/año y se espera
que un cruce promedio cuando esté equipado con 'Flashers' tenga 0.234 accidentes/año.
Parecería natural hacer de esto la base para la anticipación de lo que sería el "efecto de seguri-
dad".
ser cuando un tipo de dispositivo de advertencia es reemplazado por otro 1 . El efecto de segu-
ridad de reemplazar crossbucks por luces intermitentes podría medirse por la diferencia δ =
0.234-0.182 como el aumento de 0,052 accidentes/año o, alternativamente, por la relación θ
=0,234/0,182=1,26 (que se puede leer como 26% aumento de accidentes/año) 2 . Estas medidas
alternativas de efecto de seguridad se basan ambas en la misma información y ambas podrían
servir de orientación. Dado que en seguridad vial la razón mide ( θ ) se encuentra más común-
mente, se usará aquí para representar el efecto de seguridad 3 . En lo que sigue, la relación
(Frecuencia prevista de accidentes con Y)/(Accidente previsto con X) se denotará por θ X a Y .
Cuando para un conjunto dado de atributos θ X a Y <1, el efecto del cambio de X a Y es disminuir
frecuencia de accidentes 4 .
En la ilustración anterior, el efecto de seguridad estimado cuando se basa en datos de sección
transversal fue obtenido ajustando primero una o más ecuaciones de regresión a los datos y
luego usando estos ecuación para predecir cuál sería el efecto de seguridad ( δ o θ ) bajo dos
condiciones específicas. En principio, si los datos transversales son tan abundantes que la cate-
gorización en todas las variables relevantes para la seguridad es factible que se pueda prescindir
del paso de regresión. Entonces uno compararía el número promedio de accidentes/cruce de
dos celdas que tienen los mismos valores de variables relevantes para la seguridad y difieren en
tratamiento. En la práctica de la seguridad vial, esta opción rara vez es práctica; variables rele-
vantes para la seguridad son muchos y, por lo tanto, las celdas no contienen suficientes datos
para una estimación confiable. Las regresiones son utilizado para aliviar el 'problema de datos
escasos'.
1 En el capítulo 3 se proporciona una definición más sistemática de 'efecto de seguridad'.
2 La legitimidad de interpretar la diferencia en las predicciones con lo que se espera que sea la
consecuencia del cambio es cuestionado por muchos. Sin embargo, el examen de tal legitimidad
es uno de los propósitos de esta indagación.
Por lo tanto, hasta el final de la investigación se debe permitir el uso de la diferencia en las
predicciones para estimar el cambio.
3 Rubin (1990, p.283)( Rubin 1990) define el 'efecto causal del tratamiento' de la misma manera,
es decir, por δ o θ .
Argumenta que θ puede ser la mejor medida cuando se piensa que δ es proporcional al número
esperado de accidentes .
('rendimiento' en su contexto).
4 (1- θ X → Y )× 100 es el 'porcentaje de reducción' debido al cambio de X a Y.
8 Habiendo aclarado cómo se puede derivar el efecto de seguridad de los resultados de una
observación estudio transversal, ahora podemos examinar las siguientes preguntas empíricas.
Hizo antes-después Los estudios sobre el efecto de seguridad de los dispositivos de advertencia
en los pasos a nivel de ferrocarril y carretera tienden a producir estimaciones consistentes del
'efecto de seguridad'? ¿Los estudios transversales tendieron a producir "seguridad" consistente?
estimaciones del efecto? ¿Son consistentes los resultados de los estudios de antes y después
con los de estudios transversales? ¿estudios? Estas y otras cuestiones similares se examinan a
continuación.
2.2 Examen de la consistencia de las estimaciones del efecto de seguridad Cada curva en
la Figura 1 es la representación de la ecuación. 1. El θ Crossbuck toFlashers es la relación de
dos de tales ecuaciones; en la ecuación del numerador las constantes de regresión C son para
wd=Intermitentes y en el denominador para wd=Crossbucks. Después de introducir las condicio-
nes específicas (urbano, único vías, volúmenes de trenes) el θ Crossbucks to Flashers es (en
este caso) una función del flujo de tráfico vial únicamente.
Cómo los Coleman-Stewart θ Crossbucks to Flashers y θ Crossbucks to Gates dependen del
tráfico vial diario flujo (AADT) para Vía Única &Urbano y Vía Múltiple &Rural se muestra en la
Figura 2 y Figura 3.
Figura 2. Ratios θ de accidentes previstos para Vía Única, Urbana, 10 trenes/día 9 Figura
3. Ratios θ de accidentes previstos para Vía Múltiple, Rural, 10 trenes/día Cuando se usa
de esta manera, el modelo de Coleman-Stewart implica que en vías urbanas de vía única cruces
(Figura 2) con más de aproximadamente 1000 vehículos de carretera por día, más colisiones son
esperado con 'Flashers' que cuando se usan 'Crossbucks' ( θ Flashers to Crossbucks >1). Apro-
ximadamente el se indica lo contrario para condiciones rurales de múltiples vías (Figura 3). Nota
de Coleman y Stewart que estos resultados son inesperados y dicen que “Pueden ser necesarias
variables adicionales en estos casos para explicar completamente los patrones de ocurrencia de
accidentes” (p. 62).
Una de las razones por las que estos resultados (de la regresión multivariable utilizando la sec-
ción transversal datos) se consideraron "inesperados" fue que eran contrarios a los resultados
de algunos antes-después estudios. Los principales resultados de varios estudios de antes y
después se resumen en la Tabla 1 y se elaboran en la Tabla 2. Las celdas sombreadas dan las
proporciones θ obtenidas en cinco estudios de antes y después.
Tabla 1. Estimaciones de θ de estudios antes y después (sesgados) adaptados de Hauer
y Persaud (1987) Autor California PUC Morrisey Coleman Eck y Halkias Farr y Hitz Año de
publicación 1974 1981 1982 1985 1985 No. de cruces 1552 2994 NA 7734 5903 Crossbucks a
Flashers 0.36 0.35 0.29 0.31 0.30 Crossbucks a Gates 0.12 0.16 0.18 0.16 0.17 Intermitentes a
puertas 0,34 0,36 0,31 0,28 0,28 Todas estas estimaciones, por coherentes que parezcan, se
inflan sistemáticamente debido a errores no corregidos.
sesgo de selección 1 . Un estudio en el que se eliminó este sesgo proporcionó los resultados en
la Tabla 2 .
1 El sesgo de selección surge cuando la decisión de cambiar de un tipo de dispositivo de adver-
tencia a otro está parcialmente motivada por la ocurrencia de accidentes en un sitio y los mismos
accidentes también se utilizan en la cuenta de accidentes 'antes'. los el sesgo tiene sus raíces
en el fenómeno de la regresión a la media. En el momento en que se realizaron estos estudios
la existencia de el sesgo de selección no fue ampliamente apreciado.
10 Tabla 2. Estimaciones de θ de un estudio antes-después sin sesgo adaptado de Hauer
y Persaud (1987) Conversiones Crossbucks a Intermitentes Crossbucks a Gates Intermitentes
toGates Nº de Conversiones 891 1037 934 Estimación sesgada 0,30 0,21 0,40 Estimación im-
parcial 0,49 0,32 0,55 ¿Qué se puede decir acerca de estos resultados? Primero, se debe tener
en cuenta que hay una diferencia rara vez notada entre θ de antes-después estudios y el θ de
regresiones basadas en datos transversales. Cada estudio de antes y después arrojó un estima-
ción única del efecto de seguridad θ . Este es un efecto de seguridad promedio con un promedio
sobre el tratado sitios Por el contrario, el modelo de un estudio transversal hace que θ sea una
función de varios atributos. Eso es muy probable que θ sea una función de los atributos de las
entidades tratadas 1 . Si es así, el θ obtenido de un estudio antes-después, siendo un promedio
sobre una cierta colección de sitios, depende de la mezcla específica de atributos de las entida-
des 'tratadas'; una combinación diferente de entidades tratadas producir un θ diferente . Por lo
tanto, las estimaciones del efecto de seguridad obtenidas mediante un estudio de antes y des-
pués han dos deficiencias. Una es que incluso si cada estudio de un determinado tratamiento o
acción pudiera dar muy estimaciones precisas, las estimaciones de θ promedio tenderían a diferir
de un estudio a otro porque la los sitios en cada estudio diferirían 2 . La otra deficiencia es que
en la medida en que el sitio para el cual algún tratamiento es contemplado por un médico tiene
atributos específicos, el θ promedio basado en un Es posible que el estudio de antes y después
no se aplique a este sitio. Por lo tanto, las estimaciones del efecto de seguridad cuando se deri-
van de un El estudio antes-después es útil en la práctica solo si el efecto de seguridad depende
solo débilmente del sitio.
atributos 3 A este respecto, la regresión basada en datos transversales parece tener una ventaja
sobre un estudio antes-después.
La segunda observación es que, en este caso, no importa cuál sea la mezcla de los tratados
entidades en los estudios de antes y después, los resultados en la Tabla 1 y la Tabla 2 no son
consistentes con los resultados en la Figura 2 y la Figura 3. De ello se deduce que, en este caso,
uno o ambos tipos de estudio no pueden ser confiable.
La tercera observación que se puede hacer es que los resultados (sesgados) de los cinco antes-
después Los estudios en la Tabla 1 son bastante consistentes y es probable que lo sigan siendo
incluso si la regresión-tomean Se eliminó el sesgo de cada uno. Si es así, se puede especular
que en los cinco estudios de antes y después, las conversiones se realizaron en sitios con atri-
butos similares o el efecto de seguridad no realmente no dependen fuertemente de los atributos
de los cruces tratados, contrariamente a lo que podría ser inferido de las Figuras 2 y 3 Esto arroja
una doble duda sobre los resultados de la regresión. Las estimaciones de θ basados en los
modelos de Coleman-Stewart parecen incorrectos y la manera en que θ depende de el volumen
de vehículos y trenes es sospechoso. Lo que parecía ser una ventaja genérica de la regresión-
1 Uno debe apresurarse a agregar que puede ser una función no solo de las variables en el
modelo sino quizás de las variables actualmente no representado en el modelo.
2 Suponga, por ejemplo, que cuando AADT<500 tener carriles de 12' en lugar de carriles de 9'
disminuye los accidentes por un factor de 0,95 pero cuando AADT>2000 la disminución es por
un factor de 0,67 como se indica en Harwood et al. (pág. 30) (Harwood et al.
2000). Si es así, un estudio de antes y después de dicha ampliación de carriles, que incluye en
su mayoría carreteras de bajo volumen, encontraría θ de aproximadamente 0,95, pero si el es-
tudio incluyera principalmente segmentos de carretera de mayor volumen, estimaría θ de alrede-
dor de 0,67 3 En principio, es posible hacer que θ sea una función de atributos también en un
estudio de antes y después. Sin embargo, en la práctica la número de entidades en las que se
aplica un tratamiento rara vez es suficiente para hacer tales distinciones.
11 enfoque de sección transversal - su capacidad automática para hacer que θ sea una función
de atributos - puede, en este caso, sea sólo una ilusión.
Esto lleva a la cuarta observación. Para ser justos, el estudio transversal de Coleman-Stewart se
hizo principalmente para predecir las frecuencias esperadas de accidentes; no estaba destinado
a ser utilizado para la estimación de θ . Sin embargo, su modelo (Eqn. 1) se puede tomar para
implicar que, θ = 10 Δ C 0 (Vehículos/ día) Δ C 1 (Trenes/día) Δ C 2 (Trenes/día) Δ C 3 log 10
(Trenes/día) , donde Δ es la diferencia entre los coeficientes de regresión apropiados. La forma
funcional de esta expresión matemática no refleja un esfuerzo deliberado para encontrar cómo θ
depende de atributos de los cruces. Simplemente se sigue algebraicamente de la elección de la
forma modelo hecha por Coleman-Stewart para otros fines.
En resumen, se puede concluir que el modelo de Coleman-Stewart condujo a estimaciones de θ
que son inconsistente con los resultados de varios estudios de antes y después, y que implica
relaciones entre θ y atributos de cruce que son sospechosos. La pregunta es si otra regresión
los estudios sobre datos transversales obtuvieron mejores resultados. Para responder, algunos
modelos de sección transversal adicionales de se puede examinar la seguridad de los pasos a
nivel.
El siguiente estudio de regresión que se examinará es el de Mengert (1980), quien utilizó datos
sobre más de 200,000 cruces públicos en los EE. UU. El "accidente básico" resultante fórmula
de predicción' (Hitz 1986) para 'Crossbucks' es: 0,616 (hp 1) 0,0077 ms 0,1 (ht 1) 0,0 (hl 1) 0.1336
0,209 tm 0.3334 e e mi mi 0.2 edición 0.2 0.2 a 0.002268 ct 0.2 − × − × − × − × − × × × × × ⎟⎠
⎞ ⎜⎝ ⎛ + × ⎟⎠ ⎞ ⎜⎝ ⎛ × + = × ecuación _ 2 En este, 'a' es accidentes/año; 'c' el promedio de
vehículos de carretera/día; 't' el tren promedio movimientos/día; 'mt' el número de pistas princi-
pales; 'd' trenes directos por día durante el día; 'hp' es 1 si la carretera está pavimentada y 2 si
no; 'ms' es la velocidad máxima del horario; 'ht' es una 'carretera factor de tipo; y 'hl' es el número
de carriles de la autopista. Al igual que en Coleman y Stewart se separan Se estimaron modelos
para cruces 'crossbucks', 'flashers' y 'gates'. Los modelos para 'intermitentes' y 'puertas' tienen
una forma funcional que es similar a la ecuación. 2 pero con sus específicas coeficientes de
regresión. Usando estos tres modelos, la dependencia de θ en las variables seleccionadas es
representado a continuación.
12 Figura 4. Cómo varían las relaciones θ con el flujo de vehículos Figura 5. Cómo varían
las relaciones θ con el flujo del tren 13 Figura 6. Cómo varían las proporciones θ con el
número de pistas principales Figura 7. Cómo varían las relaciones θ con la velocidad del
tren En el modelo de Mengert, θ depende débilmente del 'volumen del vehículo' y del 'volumen
del tren', pero depende en gran medida de los atributos 'número de vías principales' y 'velocidad
máxima del horario'. Una puede imaginar fácilmente una mezcla de atributos de cruces en un
estudio de antes y después de tal manera que, si Mengert los resultados fueran verdaderos,
entonces se obtendrían las estimaciones de la Tabla 1 y la Tabla 2. Por lo tanto, los lo más que
se puede decir es que los resultados del estudio de regresión transversal de Mengert no son
inconsistente con las estimaciones de los estudios de antes y después en la Tabla 1 y la Tabla
2. 1 . Esto, sin embargo, es lo máximo que se puede decir. En general, cuando no se conocen
los atributos de las entidades tratadas, no se puede decir si los θ de los estudios transversales
confirman o niegan los θ del antes-después estudios. Por otro lado, las diferencias entre los
modelos Coleman-Stewart y Mengert son demasiado grandes para atribuirse a errores de esti-
mación; los resultados de estos dos modelos son inconsistentes.
1 Es interesante notar que en el Modelo de asignación de recursos (Hitz, 1986, pp. 54-57) en el
que los modelos de Mengert se utilizan para predecir el número de accidentes, los resultados de
los estudios antes y después se utilizan para estimar la seguridad efecto de los dispositivos de
advertencia. Es como si no se confiara en los resultados de la sección transversal para la esti-
mación del efecto de seguridad.
14 Saltando a través de la división de casi tres décadas, Park, Saccomanno y Lai recientemente
presentó tres artículos, tres modelos de regresión diferentes, todos utilizando los mismos datos
1 . Los tres artículos asumen, descaradamente 2 , que lo que uno encuentra por regresión en
datos de sección transversal puede ser utilizado para predecir la implementación de contrame-
didas de efecto de seguridad 3 .
En el primer artículo, Saccomanno y Lai (2005) utilizaron el análisis factorial para formar cinco
grupos de cruces Después de eso, un modelo de regresión como el de la ecuación. Se ajustaron
3 a cada grupo.
A diferencia de Coleman, Stewart y Mengert, quienes ajustaron ecuaciones separadas a cruces
con crossbucks, flashers y gates, Saccomanno y Lai hacen de 'Warning Device' una variable
dentro la ecuacion. Otra diferencia es que mientras Coleman, Stewart y Mengert eligieron una
forma modelo que permite que la dependencia del tráfico de carreteras y trenes sea altamente
no lineal (ver, por ejemplo, la Figura 1 y la ecuación. 2) Saccomanno, Lai (y luego Park) eligieron
una ecuación modelo que no puede representar tal no linealidad. Los coeficientes de regresión
relevantes se encuentran en la Tabla 3.
AccidentFrequency (RoadTraffic TrainTraffic)e β 1,wd (WarningDevice) β 2 (RoadSpeed). + = ×
ecuación 3 Tabla 3. Coeficientes de regresión de Saccomanno y Lai (2005, p.19) Grupo 1 2
3 4 5 β 1, Puertas 0 0 0 0 0 β 1,Crossbucks 0,87 0,78 1,21 1,28 1,53 β 1, intermitentes 0,63 * * *
0,91 * No estadísticamente significativo Parecería que para cruces en el Grupo 1 aquellos con
cruces tienen e 0.87 =2.39 veces el número de accidentes como cruces con puertas. Reemplazar
crossbucks con puertas entonces parecen reducir los accidentes por un factor de 1/2.39=0.42.
(La estimación imparcial de antes-después estudios mostrados en la Tabla 2 fue 0.32). Los cru-
ces con intermitentes tienen e 0.63 =1.88 veces el número de accidentes con puertas y una
actualización de luces intermitentes a puertas parecería reducir los accidentes por 1/1,88=0,53.
(La estimación imparcial en la Tabla 2 fue 0,55). Los cruces con intermitentes tienen
1,88/2,39=0,79 veces los accidentes de cruces con crossbucks. (La estimación imparcial en la
Tabla 2 era 0. 49.) Si estas diferencias reflejan las deficiencias del modelo, la imprecisión del
antes y el después estimaciones o el hecho de que los cruces en la Tabla 2 eran diferentes de
los cruces en el Grupo 1 no se puede decir De hecho, para los cruces en el Grupo 5, los números
son bastante diferentes. Aquellos con los crossbucks tienen 4,62 veces más accidentes que los
cruces con puertas (en comparación con 2,39 1 La base de datos fue el inventario de pasos a
nivel, exposición y frecuencia de colisión para 10,449 pasos públicos en Canadá durante 1993-
2001 2 Así, en la página 8 de Saccomanno y Lai (2005) los autores dicen que: “Si la contramedida
resulta en cambios en ya sea la pertenencia al grupo o la variable que se encontró significativa
en el modelo de predicción, estimar el número esperado de colisiones antes y después de la
contramedida”.
3 El siguiente comentario curioso está en Park y Saccomanno (2005a): “. intentamos establecer
una estadística relación entre colisiones y diversos factores de ingeniería (es decir, contramedi-
das) sin inferir causalidad.
estos modelos son útiles en el apoyo a la toma de decisiones con la evaluación del tratamiento
rentable para contramedidas específicas”.
(p.3) ¿Por qué predecir cuál será el efecto de implementar una contramedida no equivale a cau-
salidad? aclarado.
15 en el Grupo 1), los cruces con luces intermitentes tienen 2,48 veces el número de accidentes
con puertas y por lo tanto los cruces con luces intermitentes tienen 2,48/4,62=0,53 veces los
accidentes de los cruces con cruces En el segundo artículo, Park y Saccomanno (2005b) intentan
rectificar lo que ven como una fracaso común de los modelos de regresión para producir estima-
ciones sensibles del efecto de contramedida 1 . Como en el primer documento, la mejora espe-
rada reside en un enfoque de dos pasos. El primer paso es dividir los cruces en grupos sensibles
por sus atributos, utilizando una estructura de árbol binario. los El segundo paso es, como antes,
ajustarse a un modelo de regresión como el de la ecuación. 3. La innovación está en que las
agrupaciones obtenidas en el primer paso actúan como variables cuya finalidad es captar posi-
bles interacciones complejas.
Cuando estos términos de interacción no están incluidos en la ecuación del modelo y variables
como Se omiten 'Clase de carretera' y 'Velocidad de carretera', por lo que se reemplazan los
crossbucks con luces intermitentes.
Se estima que reduce los choques a 0.11 de su número (¡una reducción del 89%!). Este resultado
exagerado puede tomarse como evidencia de que cuando las variables importantes no están
representadas en una regresión, no se puede confiar con el propósito de estimar el efecto de
seguridad de la acción. Sin embargo, cuando el términos de interacción se incluyen en la ecua-
ción de regresión, los resultados cambian. Así, por ejemplo, si se supone que la conversión de
crossbucks a flashers se lleva a cabo en 'Otros' caminos el accidente la reducción se estima en
sólo un 28% mientras que en 'Carreteras Arteriales/Colectoras o Locales' sería 75%.
El tercer artículo (Park YJ y Saccomanno 2005a) se basa en el primero en ese apartado Se
ajustan modelos de regresión 2 a varios grupos homogéneos de cruces y a partir del segundo
papel en el que se utiliza el mismo algoritmo de árbol binario para agrupar los cruces. Solo cruce
de atributos que no se pueden cambiar (por ejemplo, clase de carretera o región) se utilizaron
para la agrupación con la esperanza de que esto eliminaría el efecto de estos atributos en la
regresión 3 . Los resultados de interés aquí están en la tabla 4.
1 “. los modelos actuales de predicción de colisiones para pasos a nivel tienden a tener una
estructura simple y están mal especificados en términos de importantes factores de contramedi-
das. Como tales, tienen un uso limitado en el apoyo a la toma de decisiones para el desarrollo y
evaluación de contramedidas”. (pág. 2) 2 Por alguna razón que no se explica, en el segundo
artículo se consideró apropiado un modelo Binomial Negativo, pero En el tercero se utilizó el
modelo de Poisson.
3 Si bien la técnica de agrupación es nueva, la idea es similar a la que hicieron Coleman y Stewart
en 1976 cuando ajustaron modelos separados para 12 grupos de cruce por ubicación (urbana o
rural), vías (únicas o múltiples) y dispositivo de advertencia (crossbucks, intermitentes o puertas).
dieciséis Tabla 4. Multiplicadores de conversión basados en coeficientes de regresión de
Park y Saccomanno (2005, Tablas 3 y 4) y de la Tabla 2.
Crossbucks a Intermitentes Crossbucks a puertas Todas las variables de control 0,18±0,01
0,06±0,01 Solo relacionado con la carretera Variables de control 0,22±0,02 0,06±0,006 Solo re-
lacionados con el ferrocarril Variables de control 0,15±0,01 0,05±0,005 Modelos convencionales
que contienen control atributos tales como clase de carretera, número de vías, etc. No relacio-
nadas con ferrocarriles o carreteras Variables de control 0,19±0,01 0,05±0,005 Arterial o Colector
0,22±0,03 0,06±0,01 Otras Carreteras con Múltiples Pistas 0,31±0,08 0,11±0,02 Carreteras Lo-
cales con Sencillo Pista 0,21±0,02 0,09±0,02 Modelos para cuatro cruce de clases clasificado
por control atributos Otros caminos con solo pista 0,26±0,14 0,34±0,36 De la Tabla 2 Sin sesgo
Antes-Después 0,49 0,32 ± un error estándar La parte superior de la Tabla 4 es para modelos
de regresión de modelos convencionales en los que la carretera y los atributos del carril (como
el ancho de la superficie o el ángulo de vía) se introdujeron como variables; la mitad parte es
para modelos de regresión en cuatro clases de cruces y la última fila es de la Tabla 2.
Considerando la magnitud de los errores estándar, las estimaciones en las partes superior y
media de La tabla 4 son bastante similares. Se puede concluir que las estimaciones son poco
sensibles a la inclusión o exclusión de las variables Carretera y Ferrocarril (y de clasificación).
Como se ha señalado anteriormente, los tres artículos usaban los mismos datos y el mismo
formulario modelo. Aún así, dependiendo de cuál se usaron las variables, qué técnica de agru-
pación se implementó y qué distribución se seleccionó (Poisson o Binomial Negativo), se obtuvo
una variedad de resultados. Además, colectivamente, estos estimaciones son diferentes de las
obtenidas por Coleman-Stewart, por Mengert, y en estudios antes-después.
Un breve resumen de los hallazgos del estudio de caso puede ser útil: 1. Los estudios de antes
y después del efecto de seguridad de los dispositivos de advertencia parecen haber arrojado
resultados consistentes (incluso si sesgados).
2. El inconveniente de un estudio de antes y después es que, por lo general, solo se obtiene un
efecto de seguridad "promedio".
estimado. Si el efecto de seguridad depende de hecho de los atributos de la unidad tratada, como
es Es prudente suponer que el conocimiento únicamente del "efecto promedio" ofrece poca orien-
tación para acción práctica cuando el objetivo es aplicar un tratamiento donde hará el mayor bien.
3. Si el efecto de seguridad depende de los atributos de las entidades tratadas, no se puede decir
si los resultados de un estudio de antes y después son consistentes con los resultados de otro
estudio sin que: una. conocimiento de los atributos de las entidades en el estudio antes-después
y 17 b. conocimiento de cómo el efecto de seguridad depende de estos atributos.
4. Los estudios de regresión basados en datos transversales produjeron resultados muy varia-
dos.
Se puede concluir que la predicción del efecto basada en el modelo de Coleman-Stewart es tan
diferente de lo que se ha encontrado en los estudios de antes y después que probablemente
estén equivocados.
Sin embargo, uno no puede decir por qué están equivocados. Los resultados de Mengert no son
inconsistentes con lo que muestra el antes y el después. Incluso cuando se utilizó la misma base
de datos y el mismo modelo forma asumida, como en los artículos de Saccomanno, Lai y Park,
se obtuvieron resultados muy variados.
obtenido. No se puede decir cuánto de esto refleja el hecho de que el mismo trato cuando apli-
cado a diferentes sitios producirá diferentes resultados y cuánto se debe a la supuestos hechos
en el proceso de modelado o las deficiencias de los datos. En conjunto, los resultados obtenidos
por regresión sobre datos transversales no inspiran confianza. Está difícil saber qué resultado
creer.
5. Ni Coleman, Stewart ni Mengert pretendían que sus resultados se usaran para predecir el
efecto de las contramedidas. Por el contrario, Saccomanno, Lai y Park (y muchos otros) hacen
de la predicción del efecto de la contramedida la piedra angular de su regresión trabajar. Este
estudio de caso no apoya mucho la esperanza de que tal programa de la investigación dará
resultados.
Este estudio de caso es solo una anécdota y sus conclusiones no deben generalizarse.
Sin embargo, la impresión es que los modelos de regresión, cuando se basan en datos transver-
sales, pueden conducir a a resultados que no inspiran confianza. El hecho de que el θ obtenido
de alguna regresión modelos parece depender de los atributos de las entidades tratadas, y por
lo tanto es atractivo en aplicaciones prácticas, puede ser algo así como una ilusión; no es más
que un subproducto de las suposiciones hecho por el modelador sobre la forma funcional de la
ecuación del modelo y sobre qué variables están representados en ella. Hacer que el efecto del
tratamiento sea una función del atributo de las unidades tratadas, como ha sido intentado por
Saccomanno, Lai y Park es importante y debe continuarse.
Hay una gran diferencia entre los estudios de antes y después y las regresiones basadas en
datos transversales que no surgieron naturalmente en la discusión anterior y, sin una mención
de lo cual, esta sección estaría incompleta. Cuando se compara la seguridad de una unidad
antes y después del tratamiento, la unidad sigue siendo la misma (es básicamente el mismo
camino o intersección, utilizado por el mismo tipo de personas, en el mismo lugar, clima, etc.).
Por lo tanto, es razonable esperar que uno puede dar cuenta de lo que ha cambiado desde el
período 'antes' al período 'después'. En cambio, en una sección transversal estudio uno compara
entidades 'con atributo A' (digamos, crossbucks) a diferentes entidades 'con atributo B' (digamos,
luces intermitentes). La unidad proporcionada por el conocimiento de que 'la unidad sigue siendo
la misma' se aplica ahora. No se puede estar seguro de que después de tener en cuenta las
diferencias acerca de qué tenemos datos (tráfico y volúmenes de trenes, número de vías, etc.)
no hay otra sistemática diferencias sobre las entidades 'con A' y 'con B' sobre las que no hay
información. Hay la sospecha omnipresente de que las entidades tienen atributo A pero no B por
una buena razón y que estos las razones no se conocen completamente y son difíciles de explicar
en un modelo de regresión. Así, por ejemplo, un grado el cruce puede tener luces intermitentes
y no crossbucks porque tenía un historial previo de accidentes, tal vez debido a las quejas de los
usuarios de la carretera que sufrieron cuasi accidentes, debido a la existencia de un listado de
prioridades basado en alguna fórmula, etc.; ninguno de estos es fácil de capturar en una regre-
sión.
18 Habiendo presentado los muchos problemas dentro del marco tangible de la seguridad en los
pasos a nivel, el El próximo paso es examinar lo que la literatura científica tiene que decir sobre
el tema de causa-efecto en estudios observacionales.
19 3. CAUSA, EFECTO, CONFUNDIMIENTO Y CONSISTENCIA El concepto de causa es res-
baladizo. Algunas de las dificultades pueden evitarse distinguiendo entre dos cuestiones diferen-
tes: Pregunta A: ¿Cuál es el efecto de seguridad de un tratamiento (una causa)? Pregunta B:
¿Cuáles son las causas de ciertos eventos (p. ej., las causas de los camiones grandes)? fallas 1
)? Cualesquiera que sean las dificultades para responder a la pregunta B, no son motivo de
preocupación; aquí hacemos una pregunta A. Especificamos qué causa (tratamiento) es de inte-
rés y preguntamos sobre su efecto. Si bien es claro qué 'causa' nos interesa, la definición de
'efecto' requiere un cuidado considerable. 2 3.1 Definición de causa y efecto.
La preocupación por la validez de las inferencias causales basadas en datos es común a muchos
disciplinas: educación , medicina, sociología , etc. Naturalmente, mucho se ha escrito sobre el
tema.
El marco de discusión que se utilizará a continuación fue proporcionado por Holland (1986). Sus
méritos son rigor y claridad y por tanto la promesa de que pueda adaptarse a las circunstancias
de la seguridad vial investigar.
Sea 'U' una población de entidades y 'u' una entidad específica de esta población. Porque por
'efecto' entendemos el resultado de un cambio en la naturaleza o magnitud de una causa, y el
cambio es siempre de algo a otra cosa, necesitamos especificar (al menos) dos designaciones
de causa, decir 't' y 'c' 3 . Cada entidad u está asociada con un valor Y(u) - la 'variable de res-
puesta'. De este modo, Y t (u) es el valor de la variable de respuesta que se observaría si la
entidad u estuviera expuesta a la causa ty Y c (u) es el valor que se observaría en la misma
unidad si estuviera expuesta a la causa c.
El efecto de la causa t en relación con la causa c en la entidad u se describe completamente
comparando 4 Y t (u) y Y c (u). Rubin (1990) llama a esto el 'efecto causal a nivel de unidad'.
El “Problema Fundamental de la Inferencia Causal” 5 es que normalmente es imposible tanto
tratar y no tratar la misma unidad 6 y por lo tanto es imposible observar 7 en u tanto Y t (u) como
Y c (u).
1 Usaré los términos 'accidente', 'choque' y 'colisión' para significar lo mismo.
2 Seguiré la notación y exposición de Holland (1986) quien se refiere a su descripción como el
Modelo de Rubin para Inferencia causal basada en Rubin (1974; Rubin 1977; Rubin 1978; Rubin
1980) un formalismo que apareció por primera vez en la literatura estadística en Neyman (1923).
3 En el artículo de Holland, 't' puede connotar tratamiento y 'c' control. Sin embargo, es importante
no precipitarse y no pensar en 'c' como grupo de control. En este punto, 'c' es una causa o un
tratamiento, al igual que 't'.
4 Las medidas comúnmente usadas del efecto causal para una entidad son Y t (u)-Y c (u) y Y t
(u)/Y c (u), (ver, por ejemplo, Rubin 1990).
5 Holanda (1986), página 947.
6 El ejemplo de Holland es un nuevo programa para enseñar matemáticas a estudiantes de
cuarto grado que luego son evaluados al final del año.
Cierto alumno de cuarto grado podría estar expuesto a este nuevo programa o no, pero no ambas
cosas. Por lo tanto, para cualquier u, se puede medir directamente Y t (u) o Y c (u).
7 Dado que Y t (u) o Y c (u) deben permanecer inobservados y, sin embargo, ambos son nece-
sarios, uno de ellos es del tipo hipotético naturaleza de lo que se observaría si se hubiera produ-
cido una acción cuando, de hecho, no se produjo: un contrafactual.
Groenlandia et al. (1999) explican: “Un ejemplo típico es el de McMahon y Pugh, quienes afirman
que '. una asociación puede clasificarse como presuntamente causal cuando se cree que, de
haberse alterado la causa, se habría producido el efecto.
20 Holland dice que hay dos soluciones generales a este problema fundamental; el cientifico
solución y la solución estadística. Él describe la solución científica así: “Por ejemplo, al estudiar
cuidadosamente el comportamiento de una pieza de equipo de laboratorio, un científico puede
llegar a creer que el valor de Y c (u) medido en un momento anterior es igual al valor de Y c (u)
para el experimento actual. Todo lo que tiene que hacer ahora es exponerte a ti.
y mide Y t (u) y ha superado el Problema Fundamental de la Inferencia Causal.
Tenga en cuenta, sin embargo, que este científico hipotético ha hecho una homogeneidad no
comprobable suposición. Mediante un trabajo cuidadoso, puede convencerse a sí mismo y a los
demás de que esta suposición es correcto 1 , pero nunca puede estar absolutamente seguro.”
(pág. 947) El “supuesto de homogeneidad no comprobable es que el valor de Y c (u) observado
en el pasado es lo que el valor de Y c (u) sería si se hubiera observado en el presente si se
aplicara 'c' en lugar de 't'.
La solución estadística descrita por Holland es desviar la atención del efecto a nivel de unidad
(de la causa t en la entidad u relativa a la causa c) al 'efecto promedio' de la causa t relativa a la
causa c cuando el promedio es sobre todas las entidades de la población U. Rubin (1990) llama
a esto el 'típico efecto casual a nivel de unidad" o "efecto causal a nivel de población". La idea
central es que algunas entidades de U son tratados y permiten la estimación del valor esperado
E{Y t (u)} mientras que las entidades restantes de U se dejan sin tratar y permiten estimar E{Y c
(u)}. El efecto promedio T se describe entonces comparando E{Y t (u)} y E{Y c (u)}.
Así como la solución científica depende de una suposición no comprobable, también lo hace la
estadística.
solución. Aquí la suposición no comprobable es que la respuesta promedio a t de las entidades
tratadas es ¿Cuál sería la respuesta promedio a t de todas las entidades en U si se tratara 2 , y
que el promedio respuesta a c de las entidades no tratadas es cuál sería la respuesta promedio
a c de todas las entidades en U, todos habían quedado sin tratamiento 3 . Así como el científico,
el estadístico nunca puede estar seguro que esta suposición es correcta. Sin embargo, mediante
un trabajo cuidadoso (que implica decidir qué entidades son tratados y cuáles no) el estadístico
puede convencerse a sí mismo y a otros de que la suposición está justificado.
En la "solución estadística", la plausibilidad de la suposición no comprobable se basa en aleato-
rización y/o emparejamiento. Ambos requieren que el experimentador tenga control sobre qué
unidad cambió.' …la alteración de la condición antecedente (causa) y el posterior cambio en el
resultado (efecto) son contrario a lo que de hecho se observó; es decir, son contrafactuales ”.
(pág. 30) 1 La “suposición de homogeneidad” de los científicos es la creencia de que “el valor de
Y c (u) medido en un momento anterior es igual a cuál sería el valor de Y c (u) para el experimento
actual”. Esto también es un contrafactual como es obvio si uno lo reformula para decir: “que el
valor de Y c (u) medido en un momento anterior es el que se obtendría en el presente experi-
mente si se aplicó la causa 'c' en lugar de la causa 't'. Parece ser el mismo tipo de homogeneidad
contrafactual suposición que podría hacer un analista en un estudio de antes y después, la creen-
cia de que los accidentes "antes del tratamiento" materializarse en el período 'después del trata-
miento', si la entidad no ha sido tratada. El problema es que el científico en el al laboratorio le
resultaría más fácil convencerse a sí mismo y a los demás de que la suposición es correcta que
al Analista de antes y después. Las razones de la diferencia son obvias; el laboratorio permite el
control de las condiciones y replicación con poca aleatoriedad, el entorno de observación no.
2 La suposición sería claramente incorrecta si las entidades se seleccionan para el tratamiento
porque es más probable que responder a ella que las entidades dejadas sin tratar.
3 La suposición sería claramente incorrecta si la selección para el tratamiento estuviera motivada
por el historial de accidentes de las entidades y no se tuvo en cuenta la regresión a la media.
21 recibe tratamiento y cuál no. Con aleatorización, cuando las entidades de U se asignan a t o
c independientemente de sus atributos (incluida la variable de respuesta), uno puede esperar
que ambos tratados y las entidades no tratadas son representativas de la población U. Con em-
parejamiento, cuando los pares pueden se forman que son idénticos en los atributos 1 , y uno
del par se asigna a t, se obtiene la plausibilidad por los mismos motivos. La creencia fundamental
subyacente de la aleatorización y el emparejamiento estrategias es que la respuesta de una
unidad a un tratamiento está determinada por algunos de sus atributos: el atributos relevantes
para la respuesta, y que las unidades con atributos relevantes para la respuesta idénticos tendrán
respuestas idénticas al tratamiento (ya sea 'c' o 't').
Cuando el estadístico no tiene control sobre la asignación de entidades a t o c, como es cierto
en los estudios observacionales, la pregunta sigue siendo la misma: ¿Es cierto que la respuesta
(promedio) a t de las entidades tratadas es cuál sería la respuesta (promedio) a t de todas las
entidades en U si tratados, y que la respuesta promedio a c de las entidades no tratadas es cuál
sería el promedio respuesta a c de todas las entidades en U, ¿habían quedado todas sin trata-
miento? Sin embargo, ahora los medios por contestarla afirmativamente faltan. Holland (1986)
remite al lector a otras fuentes para su posterior examen.
En palabras de Holland , “las inferencias causales proceden de los valores observados. y de
supuestos que abordan el Problema Fundamental de la Inferencia Causal pero que por lo general
son no comprobable.” (pág. 948). Para progresar uno tiene que hacer la pregunta de seguimiento:
¿Qué hace que el suposiciones no comprobables tan plausibles que el científico o estadístico
puede "convencerse a sí mismo y otros” que la suposición es correcta? Holland no persigue esta
pregunta para el científico excepto para decir que "La ciencia ha progresado mucho utilizando
este enfoque” y que “…es un lugar común en la vida cotidiana como bien” (p. 947). Es útil indagar
un poco más. ¿Qué justifica realmente la creencia del científico de que “el valor de Y c (u) medido
en un momento anterior” es igual a lo que sería el valor de Y c (u) ahora bien, ¿no se había
aplicado la 't'? La justificación parece descansar en la experiencia de que siempre que los cien-
tíficos midieron Y c (u) en momentos anteriores (o hicieron mediciones repetidas de cantidades
bajo circunstancias similares), los valores medidos eran todos iguales (dentro del error de me-
dida). Aunque esto no significa necesariamente que el patrón pasado persistiría siempre, es en-
teramente justificable creer que así sería. La creencia en la 'homogeneidad de la naturaleza' es
una base respetable de creencias causales.
Como se mencionó anteriormente, la justificación de Holland (y Rubin) de la suposición no com-
probable sobre el que descansa la solución estadística deriva de la aleatorización (es decir, la
independencia entre la decisión de asignar entidades a la causa 'c' o 't' y los atributos relevantes
para la respuesta de estos entidades.) Esto difiere de la justificación del científico de varias ma-
neras. Primero, el científico estimación de Y c (u) se basa en experiencias del pasado (o de otro
tiempo) mientras que el estadístico utiliza la experiencia contemporánea de entidades dejadas
sin tratar. En segundo lugar, la suposición del científico está en el nivel de una sola unidad (o de
unidades casi idénticas) mientras que la suposición del estadístico se refiere a promedios sobre
un conjunto (grande) de diferentes unidades. En tercer lugar, la "homogeneidad de la suposición
de la naturaleza es que, en el ambiente controlado del laboratorio, hay razón para cree que si en
la unidad u Y c (u) se obtuvo en un momento también se obtendría en otro momento.
1 En sentido estricto, sólo deben ser evaluados aquellos atributos que tienen algo que ver con la
respuesta al tratamiento.
considerado en el emparejamiento. Estos se denominarán atributos 'relevantes para la respues-
ta'.
22 La creencia de la “homogeneidad de la naturaleza” del estadístico parece ser que dos con-
juntos de entidades que tienen la misma distribución de atributos 1 se puede esperar que tengan
la misma respuesta promedio a causa 'c'.
La comprensión de que todos los conceptos de causalidad requieren una homogeneidad no com-
probable.
suposición y que las suposiciones de homogeneidad del científico y del estadístico son diferentes
y tener diferentes justificaciones es liberador. Crea la oportunidad y la licencia para buscar y
enunciar medios adicionales para justificar los supuestos de homogeneidad, medios que pueden
adecuarse a la realidad de estudios observacionales. La justificación del estadístico de la supo-
sición de homogeneidad se basa en la capacidad de decidir qué entidad obtiene 'c' y cuál obtiene
't'. En los estudios observacionales esto no es posible. Sin embargo, a un nivel más fundamental,
la justificación del estadístico es que (debido a aleatorización y/o emparejamiento) es razonable
creer que las entidades con 'c' tienden a tener los mismos atributos relevantes para la respuesta
que aquellos con 't'. Quizá haya medios por los cuales uno pueda proporcionar a los estudios
observacionales una justificación que se basa en una 'igualdad de respuesta relevante' argu-
mento de los atributos. De manera similar, puede ser posible hacer autostop en los faldones del
abrigo del científico.
cuyo supuesto de homogeneidad era que si Y c (u) se obtenía en el pasado también sería obte-
nido en el futuro. Por lo tanto, la pregunta es si se puede afirmar y justificar la homogeneidad
suposiciones para estudios observacionales de antes y después y estudios transversales obser-
vacionales.
Considere primero un estudio observacional en el que se aplica un tratamiento a las unidades.
El momento de la el tratamiento define, para cada unidad, un período de pretratamiento y de
postratamiento. Llámalo un estudio observacional antes-después. Imagine un experimento de
laboratorio para determinar el coeficiente de Expansión térmica de una barra de metal. Se trata
de medir la longitud de la varilla antes y después calentar y quizás aplicar algunas correcciones
para tener en cuenta los cambios de temperatura y presión en el laboratorio. La idea es que la
longitud de la varilla antes del experimento, después de la corrección por Las diferencias de
temperatura y presión entre el tiempo "antes de calentar" y "después de calentar" son cuál sería
la longitud de la barra en el momento 'después del calentamiento' si la barra se dejara sin calen-
tar.
Siguiendo el ejemplo del científico, lo que debe mostrarse para los estudios observacionales de
antes y después es que al usar valores observados del pasado (y al complementar esto con
información sobre cómo algunas circunstancias relevantes han cambiado desde el período 'an-
tes' al período 'después') es posible predecir el valor de Y c (u) para el período 'después'. Si fuera
posible demostrar que el los valores predichos y medidos de Y c (u) están repetidamente cerca
uno del otro en una variedad de circunstancias, entonces el 'científico observacional' tendría las
bases necesarias para 'convencer a sí mismo y a los demás” que esta marca del supuesto de
homogeneidad está justificada. Sería un justificación similar a la del científico que (después de
'correcciones' por cambios) lo que ha sido observados en el pasado se observarían en el pre-
sente si no se aplicara ningún tratamiento. Si y se puede demostrar que los valores pronosticados
y observados de Y c (u) están 'repetidamente cerca uno del otro' otro' es una pregunta empírica
que puede ser respondida a través de un programa de investigación. por cuanto en investigación
sobre seguridad vial aún no se ha emprendido un programa de investigación de este tipo, aún
no es posible decir si en estudios observacionales de antes y después con unidades tratadas,
los juicios de causalidad puede estar bien fundamentado en el paradigma de un 'científico obser-
vacional'. Pero la perspectiva de éxito es excelente.
Considere a continuación un estudio sobre el efecto de seguridad del cambio de 'c' a 't' en el que
las unidades que tienen 'c' se comparan con otras unidades que tienen 't'. Llámalo un cruce
observacional.
1 Solo la distribución de atributos que afectan la respuesta de las entidades a la causa c debe
ser la misma.
23 estudio de sección. En esta circunstancia, la creencia de que si nada más cambiara el pasado
se parecería a el presente no sirve. Ahora, la suposición que se justifica es que las unidades que
se encuentra que tienen 't' han respondido a 'c' de la misma manera que las unidades que tienen
'c'. Para justificarlo hay que invocar la misma creencia fundamental sobre la que descansa la
solución estadística; es decir, que la respuesta de un unidad a 'c' o 't' está determinada por sus
atributos relevantes para la respuesta (y que las unidades con los atributos idénticos relevantes
para la respuesta tienen respuestas idénticas a 'c' y 't'). En resumen, para justificar la suposición
no comprobable en un estudio transversal observacional uno debe ser capaz de demostrar que
las unidades que tienen 'c' tienen los mismos atributos relevantes para la respuesta que las uni-
dades que tienen 't'. En estudios transversales suele ser difícil proporcionar la justificación reque-
rida. Las dificultades son tanto práctico como conceptual. Para ilustrar, usaré la configuración de
los pasos a nivel de ferrocarril y carretera.
presentado en el Capítulo 2.
Algunos cruces tienen 'crossbucks', otros tienen 'flashes' y hay razones para esto diferencia. Las
razones son de dos tipos, ambas relacionadas con la práctica profesional. El primer tipo de la
razón tiene sus raíces en la eficiencia económica. En general, cuanto más tráfico atiende una
instalación, más caro el tratamiento 1 que recibe. En el marco específico de la seguridad en los
pasos a nivel, los sitios con más tráfico de vehículos y trenes tenderá a estar equipado con la
advertencia más costosa dispositivos. Crossbucks cuestan menos que las luces intermitentes
que, a su vez, son menos costosas que las puertas, y las puertas son más baratos que la sepa-
ración de grados. Uno debe suponer razonablemente que tanto los vehículos como los trenes el
tráfico son atributos relevantes para la respuesta. Por lo tanto, es imposible afirmar que "unidades
encontradas para tienen 'c' (por ejemplo, crossbucks) tienen los mismos atributos relevantes para
la respuesta que las unidades que tienen 't' (digamos, intermitentes) a menos que uno pueda
encontrar muchos cruces que son similares en el tráfico de trenes y vehículos pero difieren en el
dispositivo de advertencia. La dificultad práctica es que, debido a la prevalencia de la sensatez
práctica profesional, se encontrarán pocos cruces de este tipo.
Supongamos ahora que la dificultad práctica puede superarse y que un número suficiente de
cruces coincidentes en el tráfico de vehículos y trenes (y en varios otros atributos relevantes para
la respuesta) como el número de vías, el entorno urbano o rural, la velocidad del tren, el triángulo
visual, etc.).
Ahora uno debe preguntarse por qué algunos de los cruces ostensiblemente similares tienen
crossbucks y otros tienen luces intermitentes No se debe suponer que la elección se ha hecho
sin razón. De lo contrario, la elección de un dispositivo de advertencia a menudo se basa en
consideraciones del historial de accidentes pasados, público presión, cuasi accidentes y de un
juicio profesional sobre por qué algún sitio se beneficiaría de intermitentes y otro no. En conse-
cuencia, la siguiente dificultad conceptual insalvable surge: si los cruces ostensiblemente simila-
res reciben diferentes dispositivos de advertencia por alguna razón, entonces uno no puede afir-
mar que "las unidades que tienen 'c' tienen los mismos atributos relevantes para la respuesta
que las unidades encontrado tener 't'”. Las diferencias en los atributos relevantes para la res-
puesta pueden ser difíciles de identificar o describir, pero se debe suponer que existen.
En resumen, para los estudios observacionales de antes y después podría sugerir un programa
de investigación por que se podría establecer la confianza en el supuesto de homogeneidad no
comprobable. Hay un buena oportunidad para que tenga éxito. Para estudios transversales ob-
servacionales no sé cómo hacer asi que; No puedo imaginar un programa de estudio con buenas
posibilidades de éxito.
1 La práctica profesional relevante se captura en estándares, directrices, garantías, etc., todos
los cuales están escritos de manera que las instalaciones con más tráfico obtienen las
características de diseño, marcas, dispositivos de control de tráfico y mantenimiento más caros
debido a que es en instalaciones de alto uso donde el gasto puede justificarse por la seguridad
y otros ahorros.
24 3.2 Confusión e intercambiabilidad en estudios observacionales de secciones transver-
sales de carreteras La seguridad.
La columna vertebral de la Sección 3.1 es el marco Holland-Rubin que se adapta a la circuns-
tancia en la que algunas unidades fueron efectivamente tratadas. Este marco no simpatiza con
el circunstancia del estudio transversal observacional en el que se encuentra que algunas unida-
des tienen 'c' y se encuentra que otros tienen 't'. Dado que es el estudio transversal observacional
el que está en el centro de nuestra investigación, en lo que sigue, haré uso del trabajo de otros
autores que están más abierto a la posibilidad de interpretación causal en estudios transversales.
El supuesto de homogeneidad para los estudios observacionales transversales 1 está estrecha-
mente relacionado con la noción de 'intercambiabilidad' y de 'confusión'. En este contexto Pearl
(2000) escribe: “Conceptualmente, la conexión entre confusión e intercambiabilidad es la si-
guiente. Si nos comprometemos a evaluar el efecto de algún tratamiento, debemos asegurarnos
de que cualquier respuesta la diferencia entre el grupo tratado y el no tratado se debe al trata-
miento en sí y no (debido) a algunas diferencias intrínsecas entre los grupos que no están rela-
cionadas con el tratamiento. En otra palabras, los dos grupos deben parecerse entre sí en todas
las características que tienen relación con el variable de respuesta. En principio, podríamos ha-
ber terminado la definición de confusión en este punto; declarando simplemente que el efecto
del tratamiento no se confunde si los grupos tratados y no tratados se parecen entre sí en todas
las características relevantes. Esta definición, sin embargo, es demasiado verbal en el sentido
que es muy sensible a la interpretación de los términos "semejanza" y "relevancia".
es menos informal, GR 2 usó el 3 giro de permutación hipotética de De Finetti ; en lugar de juzgar
si dos grupos son similares, se instruye al investigador para que imagine un intercambio hipoté-
tico de los dos grupos (el grupo tratado deja de ser tratado y viceversa) y luego juzgar si los datos
observados en el swap se distinguirían de los datos reales.” (p.
196) Para desarrollar los puntos de vista de Greenland-Robins (GR) a los que se refiere Pearl,
me basaré en el artículo de Greenland et al. {Greenland, 1999 1166 /id.) que proporciona una
formalización de confuso Para evitar la duplicación, convertiré la formalización GR en la notación
'Holanda' introducido anteriormente. Mientras que el punto de partida tanto para Holland-Rubin
como para Greenland et al. es lo mismo -el enfoque contrafáctico de causa y efecto- hay diferen-
cias importantes entre las dos formulaciones. Holland (1986), cree en el lema “No Causation
Without manipulación” y dice que: “Debido a que la experimentación es un instrumento científico
y herramienta estadística y que a menudo introduce claridad en las discusiones de casos espe-
cíficos de causalidad, me baso descaradamente en el lenguaje y el marco de los experimentos
para el modelo de inferencia causal”. (p.946) Los experimentos siempre involucran algún trata-
miento o manipulación. En Por el contrario, Groenlandia et al. (1999) basan su razonamiento en
una comparación de dos poblaciones de unidades; el tratamiento 't' se aplica a las unidades de
población 'A' y el tratamiento 'c' a las unidades de población 'B': una comparación transversal.
1 Que las unidades que tienen 'c' tienen los mismos atributos relevantes para la respuesta que
las unidades que tienen 't'.
2 Aquí se hace referencia a un artículo de Greenland y Robins (1986).
3 (De Finetti 1974).
25 Para definir 'confundir' Groenlandia en al. (1999) argumentan de la siguiente manera. Supon-
gamos que nuestro el objetivo es determinar el efecto del tratamiento 1 't' sobre las respuestas
Y(u) de unidades en población A, relativo al tratamiento 'c', y que μ es un parámetro de la distri-
bución de las respuestas Y(u). A ilustran, Groenlandia et al. (1999) dicen que “Por ejemplo, la
población A podría ser una cohorte de pacientes con cáncer de mama, el tratamiento 't' podría
ser una nueva terapia hormonal, 'c' podría ser un placebo terapia, y el parámetro μ podría ser la
supervivencia esperada o la probabilidad de supervivencia a cinco años de la cohorte.” (pág. 32
).
Sean μ iguales a μ At si se aplica 't' a la población A y μ Ac si se aplica 'c' a la población A. El
efecto causal de 't' relativo a 'c' se define en términos de una comparación entre μ At y μ Ac .
Si las unidades de A se observan bajo el tratamiento 't' entonces μ At es observable o estimable;
sin embargo, μ Ac entonces no se observará 2 . Sin embargo, suponga que esperamos que μ Ac
sea igual a μ Bc , donde μ Bc es el valor de μ para unidades de población B con tratamiento 'c'.
En el ejemplo anterior, este sería el cohorte de pacientes con cáncer de mama que reciben el
placebo. Ahora se puede escribir una definición clara de confuso: “ Decimos que existe confusión
si, de hecho, μ Ac ≠ μ Bc , porque entonces debe haber alguna diferencia entre las poblaciones
A y B (aparte del tratamiento) que es responsable de la discrepancia entre μ Ac y μ Bc ”. (pág.
32) Para ilustrar el concepto en un entorno de seguridad vial, suponga que un conjunto de vías
rurales de dos vías segmentos de carretera tiene cuatro pies de arcenes pavimentados (Carre-
teras A en la Figura 8 con tratamiento 't') y otro conjunto de dichos segmentos de carretera tiene
dos pies de arcenes pavimentados ((Carreteras B con tratamiento 'c').
Los cuadrados negros en la Figura 8 indican cantidades que se pueden observar (estimar). Por
lo tanto, la los observables son μ At (choques/milla-año en las carreteras A que 'se encontró que
tenían t') y μ Bc (choques/milla-año en las carreteras B que se 'encontró que tenían c'). La orde-
nada de un círculo vacío en La Figura 8 es lo que sería μ en los caminos A si estos caminos
tuvieran dos pies de arcenes pavimentados. Círculo 1 y el círculo 2 son solo dos de un número
infinito de posibles posiciones del círculo. La posición de un círculo vacío es inobservable porque
pertenece a una circunstancia que de hecho no existió: un contrafactual 1 Groenlandia et al.
distinguir entre 'tratamiento' como agente administrado por el investigador y 'exposición' que, en
medicina, generalmente se refiere a un agente de daño al que las unidades están expuestas sin
ninguna premeditación por parte del investigador. Desafortunadamente, en seguridad vial, el tér-
mino 'exposición' significa algo completamente diferente (por ejemplo, millas-vehículo de viaje).
Para evitar confusiones, usaré 'tratamiento' para referirme a ambos tipos de agentes.
2 Este es el Problema Fundamental de la Inferencia Causal.
26 Figura 8. Aspectos básicos de una comparación transversal La idea principal es usar la
cantidad observable en los caminos B (es decir, μ Bc ) para adivinar cuál es el podría ser la
ordenada inobservable del círculo vacío. La comparación de μ At con μ Bc no será confundido si
el número medio de choques/(milla-año) en las carreteras B (la ordenada del negro cuadrado a
la izquierda, μ Bc ), es lo mismo que sería en las carreteras A si tuvieran dos pies de pavimentado
hombro, no cuatro (la ordenada del círculo 1). Por el contrario, la comparación de μ At con μ Bc
será confundido si el número medio de choques/(milla-año) en las carreteras B ( μ Bc ), no es lo
mismo que el número de choques/milla-año sería en las carreteras A si tuvieran un arcén pavi-
mentado de dos pies (la ordenada del círculo 2) .
Dado que la posición del círculo es desconocida e inobservable, ¿cómo se puede juzgar si ¿Está
en la posición 1 (sin confusión) o en la posición 2 (confusión)? Hay dos generales enfoques para
disminuir la amenaza del sesgo 1 debido a la confusión en la sección transversal observacional
estudios. Un enfoque es la ecualización de atributos ya sea por 'restricción' o por 'coincidencia'.
Si las carreteras B pueden elegirse de modo que todos sus atributos relevantes para la respuesta
sean los mismos que los de las carreteras Entonces uno puede creer justificadamente que la
ordenada del cuadrado completo izquierdo es la misma que la ordenada del círculo. Este enfoque
se muestra en la Figura 8 por la flecha horizontal entre la izquierda cuadrado completo y círculo
1. El otro enfoque es la igualación por análisis. El paso de análisis consiste de agregar una 'co-
rrección' a μ Bc que tenga en cuenta las diferencias que existen en las respuestas relevantes
atributos entre las carreteras A y B. La 'corrección' corresponde a la flecha vertical en la Figura
8 que va del cuadrado lleno al cuadrado vacío que tiene la misma ordenada que el círculo 2. El
La ordenada del cuadrado vacío es una estimación de cuál sería el μ de las carreteras B si
tuvieran todos los atributos relevantes para la respuesta de las carreteras A, excepto que tienen
el tratamiento 'c'. En la Figura 8 esto ordenada es μ B□ . Si la corrección μ B□ - μ Bc es de la
magnitud correcta, entonces se puede argumentar nuevamente que la comparación no se con-
funde. Ambos enfoques se analizan a continuación.
1 El sesgo en la Figura 8 es la diferencia entre las ordenadas del cuadrado negro de la izquierda
y la ordenada del circulo. Así, si el caso es el círculo 1, no hay sesgo; si el caso es el círculo 2 el
sesgo es apreciable.
27 3.2.1 Enfoque 1: Igualación de Atributos por Restricción o Coincidencia.
La igualación por restricción o emparejamiento es un intento de justificar el juicio de que el La
ordenada del cuadrado completo izquierdo en la figura 8 es la misma que la del círculo 1 porque
la respuesta relevante los atributos de las unidades en las poblaciones A y B son los mismos 1 .
La clave entonces es hacer el unidades de la población A comparables o intercambiables con
las unidades de la población B con respecto a los atributos relevantes para la respuesta (o algún
índice de los mismos). La otra cara del mismo argumento es que si se piensa que las unidades
en A y B difieren en algún atributo relevante para la respuesta, entonces debe juzgarse que existe
confusión.
En el ejemplo de la pavimentación del arcén, la pregunta es si se puede argumentar de manera
convincente que las carreteras B tendrían el mismo número medio de accidentes/milla-año que
las carreteras A si ambos conjuntos de las carreteras tenían el mismo ancho de arcén pavimen-
tado. Para argumentar así uno tiene que saber qué atributos son probable que afecte la respuesta
(choques/milla-año) y muestre que son iguales en ambos conjuntos. En este caso Los atributos
relevantes para la respuesta son muchos: cantidad de tráfico, entorno urbano o rural, condiciones
climáticas.
condiciones, características de los usuarios de la vía, como distribuciones de edad, género, in-
gresos o educación; la carretera antiguo; terreno, mantenimiento invernal, etc. Por lo tanto, la
circunstancia de ancho de arcén pavimentado corresponde al círculo 2 que tiene una ordenada
diferente que el cuadrado completo izquierdo. La respuesta a la La pregunta que se plantea es
que, en el ejemplo del ancho de la banquina pavimentada, no se puede argumentar de manera
convincente que las carreteras que tienen 't' son intercambiables con las carreteras que tienen
'c'; la confusión debe ser juzgado existir. Es decir, mediante una comparación directa, los obser-
vables μ Bc y μ At uno no pueden determinar el efecto de seguridad de arcenes pavimentados
de dos pies versus cuatro pies.
Para hacer que las dos poblaciones sean comparables o intercambiables por 'restricción' sería
necesario estratificar los caminos en A y los caminos en B en celdas que sean homogéneas en
todos los variables relacionadas con la respuesta antes mencionadas y luego comparar los va-
lores de la variable de respuesta (choques/milla-año) solo en las celdas correspondientes.
Incluso con un número modesto de variables uno encuentra rápidamente que ninguna celda con-
tiene suficientes segmentos de carretera para hacer comparaciones significativas. Este es el lla-
mado problema de datos dispersos 2 . Quizás por esta razón, el enfoque de restricción rara vez
ha utilizado en la investigación sobre seguridad vial. Dado que en la investigación de seguridad
vial el enfoque de restricción ha no ha sido ampliamente probado, puede ser prematuro pronun-
ciarse sobre su promesa. Sin embargo, Groenlandia et al. (1999) dicen que en otros campos,
tales métodos “a menudo son inviables o insuficientes para producir intercambiabilidad.” (pág.
35). Es probable que esto se aplique a la investigación sobre seguridad vial no solo debido a la
1 Una vez más, se debe invocar la 'creencia fundamental' de que la respuesta de una unidad a
'c' o 't' está determinada por sus atributos relevantes para la respuesta (y que las unidades con
atributos relevantes para la respuesta idénticos tienen respuestas idénticas a 'c' y 't'). Sobre esto,
Groenlandia et al. (1999) dicen que “Parece intuitivamente claro que si μ Ac y μ Bc difieren en-
tonces (la unidades en) A y B deben diferir con respecto a los factores que afectan a μ “ . Groen-
landia et al. argumentan que las diferencias entre los los atributos relevantes para la respuesta
de A y B no implican confusión, “porque los efectos de las diversas covariables las diferencias
pueden equilibrarse” (p. 33). Si bien tal equilibrio es una posibilidad, es muy poco probable y, en
mi opinión, opinión, sin consecuencias prácticas.
2 Greenland et al (1999) dicen que: ” Los métodos de ajuste más simples comienzan con la
estratificación en factores de confusión. A covariable no puede ser responsable de la confusión
dentro de un estrato que es internamente homogéneo con respecto a la covariable. Esto es así,
independientemente de si se utilizó la covariable para definir el estrato. Por ejemplo, género los
desequilibrios no pueden confundir las observaciones dentro de un estrato compuesto única-
mente por mujeres. Parecería natural, entonces, para controlar la confusión debida a los factores
medidos simplemente estratificándolos a todos. Desafortunadamente, entonces uno enfrentar el
conocido problema de datos dispersos: dados suficientes factores, pocos o ningún estrato tendría
sujetos en ambos grupos de tratamiento, lo que hace que las comparaciones sean ineficientes o
imposibles”. (pág. 35) 28 antes mencionado 'problema de datos dispersos' sino también por la
dificultad añadida de que si una unidad si se encuentra para tienen 't' y otro tiene 'c', los profe-
sionales pensaron que las dos unidades son diferentes y por lo tanto debe estar equipado de
manera diferente. Por lo tanto, estar equipado de manera diferente casi implica la existencia de
diferencias relevantes para la respuesta, algunas de las cuales quizás estén relacionadas con
un juicio no documentado.
Las limitaciones que hacen impracticable la 'restricción' se aplican igualmente a la 'coincidencia'.
3.2.2 Enfoque 2: Igualación de Atributos por Análisis.
El segundo enfoque para eliminar el sesgo debido a la confusión es el indicado por el flecha
vertical en la Figura 8. El objetivo es estimar la 'corrección' μ B□ - μ Bc y agregarla a la observable
μ Bc y así obtener una estimación μ B□ ; esto es lo que serían los μ de las carreteras B si tuvieran
los atributos relevantes para la respuesta de las carreteras A. Ahora que todos los atributos re-
levantes para la respuesta de las carreteras B son los mismos que los de las carreteras A, se
puede argumentar justificadamente que μ Bc es también lo que μ en las carreteras A sería si
tuvieran dos pies de arcén pavimentado, no cuatro. Para ilustrar, si en las carreteras B el prome-
dio velocidad era de 75 km/h y en las carreteras A era de 80 km/h, la corrección sería una esti-
mación de la cambio en la frecuencia esperada de accidentes si la velocidad en las carreteras B
fuera de 80 km/h, no de 75 km/h. voy a referirse a este enfoque como 'Corrección por análisis'.
La corrección se deriva de dos esenciales elementos: una. Información sobre los atributos rele-
vantes para la respuesta de las unidades en las poblaciones A y B; b. Conocimiento de cómo μ
de los caminos en B podría cambiar en respuesta a un cambio en estos atributos relevantes para
la respuesta.
Groenlandia et al. (1999) dicen que “ha habido una enorme cantidad de trabajo dedicado a ajus-
tes analíticos por confusión. Con algunas excepciones, estos métodos se basan en distribuciones
de covariables observadas en las poblaciones comparadas. Tales métodos funcionarán con éxito
controlar los factores de confusión solo en la medida en que se miden y empleado en el análisis.
Luego, también, muchos métodos emplean modelos paramétricos en alguna etapa, y su éxito
depende, pues, de la fidelidad del modelo a la realidad”. (pág. 35); y más tarde “La método más
común para evitar problemas de datos dispersos es imponer restricciones paramétricas en la
regresión del resultado sobre el tratamiento y las covariables; .Sin embargo, teórico Los resulta-
dos indican que ningún enfoque puede resolver completamente los problemas de datos disper-
sos, en la medida en que la muestra el tamaño siempre limitará el número de grados de libertad
disponibles para el ajuste de covariables y prueba de modelos”. (pág. 36) En seguridad vial, el
arte de estimar la magnitud de la corrección (lo que Greenland et al.
llamar el 'ajuste analítico') que se requiere para controlar la confusión en la sección transversal
observacional estudios parece ser en gran medida terra incognita. No es la ambición de este
documento mapear este territorio inexplorado. Sin embargo, desarrollar una apreciación de la
tarea y los obstáculos para su éxito, se requiere una exploración conceptual. Indicar en qué con-
siste la 'corrección por análisis' enfoque en la seguridad vial podría implicar, usaré nuevamente
el ejemplo del ancho de la banquina pavimentada, partiendo de lo que es simple pero poco rea-
lista, y agregando capas de complejidad para gradualmente acercarse a la realidad.
29 Suponga inicialmente que las carreteras A son las mismas que las carreteras B en todos los
atributos relevantes para la respuesta 1 .
Si es así, no se necesita corrección y la ordenada del cuadrado completo izquierdo en la Figura
8 ( μ Bc ) puede ser utilizado legítimamente para estimar cuáles serían los choques/milla-año en
las carreteras A si tuvieran 2' arcenes pavimentados (la ordenada del círculo no observado 1).
Agregue la Capa 1. A continuación, suponga que los caminos en A (aquellos con arcenes pavi-
mentados de cuatro pies) tienen la mismos atributos relevantes para la respuesta que las carre-
teras en B (aquellas con arcenes pavimentados de dos pies) 2 , excepto que en las carreteras B
la velocidad media es de 75 km/h mientras que en las carreteras A es de 80 km/h. la tarea es
Estime cuál sería μ Bc si en las carreteras de B la velocidad promedio fuera de 80 km/h. Para
esto necesitamos saber cómo cambia el μ en este tipo de carretera en función 3 de la velocidad
media. conocimiento de esto tipo a veces se puede extraer de la investigación publicada. La
siguiente observación general 4 Puede ser hecho: O1. Para corregir las diferencias en un atributo
relacionado con la respuesta, uno debe tener conocimiento de la función que dice qué cambio
en la respuesta es causado por un cambio en el atributo. Tal el conocimiento proviene de los
resultados de la investigación.
Agregue la Capa 2. Suponga ahora que en el grupo A hay algunos caminos con una velocidad
promedio de 80 km/h y algunas con 90 km/h mientras que en el grupo B hay algunas carreteras
con 70 km/h y algunas con 75 km/h El tamaño de la corrección dependerá de si las carreteras
de 70 km/h van a ser 'corregido' a 80 km/h o a 90 km/h. En definitiva, la corrección dependerá
de la elección del maridaje para los que no hay motivos claros 5 . Para eludir este tipo de dificultad
uno tiene que traer ambos grupos de caminos a algún valor de atributo común. Así, por ejemplo,
si se eligió una velocidad promedio de 80 ser este valor común, se calcularía una corrección para
aquellos caminos en A donde el promedio la velocidad es de 90 km/h y se calcula otra corrección
para todas las carreteras de B. Así, el remedio es use dos correcciones en lugar de una como se
muestra en la Figura 9 con las dos flechas. la flecha hacia abajo corrige μ At para llevar todos
los caminos A a algún valor común de la(s) variable(s) relevante(s) para la respuesta. los la flecha
hacia arriba corrige μ Bc para que todos los caminos B tengan el mismo valor común. el incon-
fundible comparación es ahora entre μ A□ y μ B□. El precio de aplicar dos correcciones en lugar
de una es el inevitable aumento de la varianza de esta comparación 6 .
1 Los atributos que vienen a la mente pueden ser la cantidad de tráfico, el entorno (urbano o
rural), las condiciones climáticas, el usuario de la vía características (distribución de edad, sexo,
ingresos o educación), antigüedad de la carretera, terreno, mantenimiento invernal, etc.
2 Es decir, la distribución edad-género-ingreso de los conductores, la ocupación de los vehículos,
la mezcla de autos y camiones y su antigüedad y el tráfico durante todas las horas del día son
los mismos en las carreteras A y B, solo el número diario de vehículos es diferente.
3 Por 'función' me refiero a una representación causal de cómo cambian los accidentes espera-
dos en una carretera cuando la velocidad promedio es cambió. Se excluye el tipo de relación que
se podría obtener al comparar algunos caminos con velocidad promedio X con otras vías con
velocidad media Y.
4 Etiquetaré las observaciones generales con O1, O2, etc.
5 Excepto si los choques/milla-año son proporcionales a la velocidad promedio, lo que no parece
ser el caso.
6 La característica adicional de la estrategia de dos correcciones es que el efecto de seguridad
dependerá del valor común elegido. Esto no es necesariamente una desventaja.
30 Figura 9. Las dos 'correcciones'.
Como antes, para estimar las dos correcciones se necesita tener información sobre los puntos
importantes.
atributos relevantes para la respuesta de Roads A y Roads B, así como estar en posesión de
investigaciones basadas en conocimiento sobre la función causa-efecto de cómo cambia la fre-
cuencia esperada de accidentes cuando cambian los atributos relevantes para la respuesta.
Agregue la Capa 3. Hasta ahora, las carreteras de cada grupo diferían solo en la velocidad pro-
medio y se asumió que existe un conocimiento basado en la investigación de la función que
vincula la frecuencia de choque y la velocidad promedio.
Supongamos ahora que las carreteras A difieren de las carreteras B también en que tienden a
estar más cerca de las zonas urbanas.
áreas Tal atributo de 'ubicación' podría influir en la seguridad de varias maneras, por más com-
pleto notificación de accidentes, por menor tiempo de respuesta de los servicios médicos de
emergencia, por diferencias en el edad, género, ingresos de los usuarios de la vía, por diferencias
en el consumo de alcohol, etc. No es probable que uno tener conocimiento de la relación funcio-
nal que vincula la frecuencia de los accidentes y la 'ubicación'. A Es posible que ni siquiera exista
una relación estable (transferible) de este tipo 1 . Sin embargo, sin tal función las correcciones
no se pueden estimar. Así, por lo general, O2. Incluso si uno tiene datos sobre un atributo rela-
cionado con la respuesta, el requisito correspondiente puede faltar una relación funcional. En
ese caso, no se puede aplicar ninguna corrección y el no se puede explicar la confusión debida
a tal atributo.
Una dificultad añadida es que aunque conociéramos las funciones μ ( velocidad media) y μ (ubi-
cación de la carretera) uno no puede asumir que la función conjunta μ ( velocidad promedio,
ubicación de la carretera) es algo simple compuesto de las dos funciones constituyentes
separadas. En general, O3. La corrección por confusión requiere el conocimiento de una función
multivariable que vincule μ a todos los atributos importantes relacionados con la respuesta (va-
riables). En seguridad vial, tales funciones actualmente no existe.
Agregue la capa 4. Otro paso hacia el realismo en el ejemplo del ancho del arcén pavimentado
es asumir que existen variables relacionadas con la respuesta que se sabe que son importantes
(p. ej., distribución de edad de los usuarios de la carretera o fricción de la superficie de la carre-
tera) sobre el cual nuestro conjunto de datos es mudo. En este caso, no hay corrección corres-
pondiente se puede aplicar y se debe suponer que existe confusión.
1 Puede no existir una relación funcional estable porque el atributo urbano, suburbano o rural
refleja un paquete o atributos más fundamentales (informe de accidentes, tiempo de respuesta
de los servicios médicos de emergencia, distribuciones de edad, ingreso de género y otros ras-
gos de los usuarios de la vía pública, consumo de alcohol, etc.) y estos atributos pueden variar
de un urbano (o rural) a otra.
31 O4. Para corregir la confusión, uno debe tener datos sobre lo que se sabe que es importante
atributos relevantes para la respuesta de las unidades en A y B. Si tales datos no están disponi-
bles, confusión debe suponerse que existe.
Agregue la capa 5. Finalmente, están los atributos relevantes para la respuesta que no conoce-
mos.
Destacan entre ellas las razones por las cuales un camino terminó teniendo dos pies de pavi-
mentado hombros y otros cuatro. La influencia de estos atributos, desconocidos, insospechados,
no reconocido o indocumentado pero omnipresente, siempre estará al acecho en el fondo.
En general, O5. En la medida en que hay algunos atributos relevantes para la respuesta que no
conocemos sobre, y hay razones no documentadas para aplicar 'c' a algunas unidades pero 't' a
otras unidades, se debe suponer que existe confusión Esta fuente de confusión no se puede
corregir por.
Si bien algunas de las dificultades a las que se enfrenta el enfoque de "corrección por análisis"
tal vez podrían tratarse si tuviéramos datos mucho más ricos y un conocimiento mucho mejor del
requisito funcional relaciones, algunos obstáculos parecen insuperables. Las dificultades insupe-
rables son dos.
En primer lugar, en el contexto de la seguridad vial siempre será difícil argumentar que el juicio
de profesionales para implementar 't' o 'c' no fue influenciado por la historia pasada de choques
o casi accidentes, por consideraciones basadas en una familiaridad con el sitio y sus circunstan-
cias que no se puede ver en los datos, o por algún atributo relevante de respuesta ahora irreco-
nocible. los La segunda dificultad (aparentemente) insuperable es que generar confianza en la
'corrección por enfoque de análisis, uno tendría que proporcionar evidencia empírica de que μ
A□ es lo que los μ caminos B sería si tiene los atributos relevantes para la respuesta elegidos y
hombros de dos pies y el μ B□ es cerca de lo que sería el μ en las carreteras A si tienen los
atributos relevantes para la respuesta elegidos y hombros de cuatro pies. Esto implica que habría
que encontrar caminos que realmente deberían estar equipados con 't' como son los caminos en
A, pero permaneció equipado con 'c' por algún capricho del destino que es completamente sin
relación con ningún posible atributo relevante para la respuesta. No puedo pensar en algo tan
natural.
experimentos Por lo tanto, no puedo ver una manera de verificar empíricamente que la 'correc-
ción' está cerca de lo que debería ser En resumen, en los estudios observacionales transversales
en los que se comparan las unidades que tienen 'c' con unidades que tienen 't', existirá confusión
a menos que se elimine por 'restricción o emparejamiento' o por 'análisis'. La opción de eliminar
la confusión por 'restricción y coincidencia' es limitado por el problema de los "datos escasos" y
por el de los atributos relacionados con la respuesta desconocida. los posibilidad de 'corrección
por análisis' está circunscrita por las dificultades O1 a O5 enumeradas arriba.
3.2.3 ¿Se pueden igualar los atributos usando modelos de regresión paramétrica? Supon-
gamos ahora que en lugar del enfoque de 'dos correcciones' descrito en la sección 3.2.2, uno
utilizará los datos sobre choques y atributos para estimar dos modelos de regresión, uno para
las carreteras A y otra para caminos B. Una vez hecho esto, se podría: a. especificar un conjunto
de valores de atributos → b.
calcule los choques/año pronosticados para un camino de A y (usando los mismos valores de
atributo) para un camino de B → c. comparar las dos predicciones y así, → d. estimar el efecto
de seguridad de reemplazar arcenes de dos pavimentados por arcenes pavimentados de cuatro
pies para una carretera con el atributo especificado valores.
32 Esta es, en esencia, una versión de 'igualación de atributos' discutida en 3.2.2. llamaré este
es el enfoque de 'ecualización por regresión'. La pregunta es cuáles son las fortalezas y limita-
ciones del uso del enfoque de igualación por regresión para eliminar el sesgo de confusión
cuando se hace uso de datos observacionales de secciones transversales? Para responder a
esta pregunta haré uso de las observaciones O1 a O5 del apartado anterior (3.2.2).
La primera observación general en la sección 3.2.2 (O1) fue que para corregir las diferencias en
un atributos relacionados con la respuesta entre las unidades del grupo A y las unidades del
grupo B que uno debe tener conocimiento de qué cambio en la respuesta es causado por un
cambio en el atributo. En la sección 3.2.2, el Se asumió que la relación funcional necesaria se
basaba en el acervo de hallazgos de la investigación.
acumulado a lo largo del tiempo. Cuando se utiliza el enfoque de ecualización por regresión, se
supone que la relación funcional requerida es el propio modelo de regresión - el resultado de
ajustar un ecuación a los datos de las unidades en el grupo.
El atractivo de este enfoque es que uno no necesita rastrear, dominar y evaluar los datos exis-
tentes.
investigación acumulada para establecer lo que se sabe; que el modelo estimado proporciona la
necesitaba una función de causa-efecto a la manera de 'deus ex machina'. La misma caracterís-
tica de la El enfoque de 'ecualización por regresión' también parece cuidar el O2, que a veces,
incluso si los datos acerca de un atributo relacionado con la respuesta está disponible, el cono-
cimiento de la correspondiente sin confundir Falta la relación funcional. 1 Desafortunadamente,
esta forma automática por la cual una regresión proporciona las relaciones funcionales necesa-
rias es también una fuente de gran debilidad. confiando exclusivamente en la forma funcional y
parámetros estimados del modelo de regresión que fue ajustado al conjunto de datos específico
en cuestión, uno está esencialmente ignorando todo lo que se sabe de investigaciones previas
sobre tales relaciones funcionales 2 . Es como si no existiera ningún conocimiento además lo
que afirma el modelo de regresión actual y como si uno pudiera estar seguro de que cualquiera
que sea el El modelo actual afirma que está lo suficientemente cerca de la verdad, incluso si va
en contra de lo que otros encontraron o lo que comúnmente se conoce. Ninguna suposición es
aceptable. Primero, descartar todo conocimiento fuera del conjunto de datos que se examina
está en desacuerdo con la tradición de la ciencia. En la ciencia, el conocimiento.
es una cuestión de acumulación, y la clave para confiar en alguna afirmación sobre la realidad
es la consistencia con la que se puede obtener. En segundo lugar, la experiencia con modelos
de regresión en carretera la seguridad nos dice que diferentes investigadores tienden a encontrar
diferentes funciones para las mismas variables 3 . Eso Es difícil saber cuál de las diversas rela-
ciones está cerca de reflejar causa y efecto.
Por lo tanto, no puede estar seguro de que cualquier modelo de regresión estimado específico
represente de manera confiable la función causal necesaria necesaria para lograr la igualación
de atributos.
A primera vista, el enfoque de 'ecualización por regresión' también se ocupa de O3: la necesidad
tener una función multivariable que vincule μ con todos los atributos relacionados con la res-
puesta ; el resultado de un regresión siempre hace que μ sea una función de todas las variables
retenidas. Por desgracia, esto no es una función.
encontrado por la investigación acumulada para describir consistente y adecuadamente un fenó-
meno, ni es el función sugerida por una teoría plausible. Es una función que es seleccionada por
el modelador y es 1 Cuando se usa el enfoque de 'ecualización por regresión', para cada atributo
(variable) que se retiene en el modelo siempre hay una relación funcional correspondiente.
2 Esta debilidad podría desaparecer si los modelos de regresión fueran completamente bayesia-
nos, y si se hiciera uso de modelos 'informativos'.
antecedentes que encarnan todo el conocimiento acumulado.
3 Como lo ejemplifican los modelos Coleman-Stewart versus Mengert.
33 basado en la evidencia limitada y generalmente difusa de un solo conjunto de datos. Como
resultado, a menudo es un prototipo simple elegido del pequeño repertorio y compuesto por adi-
tivos o multiplicativos bloques de construcción que en sí mismos son funciones simples, gene-
ralmente de una sola variable. tal La función se puede considerar como una aproximación de la
serie de Taylor de primer orden de la función subyacente desconocida.
función. Como tal, si la función subyacente no es lineal, la aproximación es adecuada solo para
valores cercanos al punto en el que se centra la serie de Taylor, pero no es aplicable a lo largo
del rango de variación variable que normalmente se encuentra en las poblaciones reales de uni-
dades. Por lo tanto, la corrección por confusión que se basa en tal aproximación de primer orden
puede ser ampliamente fuera de la marca.
La pregunta global abordada en este documento es si las regresiones cuando se basan en la
sección transversal los datos pueden apoyar la interpretación de causa y efecto. Mientras no se
responda la pregunta uno no puede asumir que lo hacen o que no lo hacen. Una parte de lo que
se describió como debilidad de el enfoque de igualación por regresión en los párrafos anteriores
se basa en la suposición de que, en seguridad vial, tales regresiones por lo general no logran
captar la causa y el efecto. Si fuera cierto lo contrario, las debilidades identificadas desaparece-
rían.
En la sección 3.2.2, señalé en O4 que: “Para corregir la confusión, uno debe tener datos sobre
lo que se sabe que son atributos relevantes para la respuesta de las unidades en A y B”. lo mismo
es verdadero para el enfoque de igualación por regresión. En la medida en que sabemos de la
existencia de algún atributo relevante para la respuesta que no se usa en la ecuación de regre-
sión 1 , su omisión será un fuente de confusión tal como lo es cuando el enfoque de 'corrección
por análisis' de la sección 3.2.2 es usó. Así, por ejemplo, si los usuarios de las carreteras A
diferían en edad, ingresos o consumo de alcohol de los usuarios de carreteras B, y si la edad,
los ingresos o el BAC no fueran variables en la regresión, entonces la igualación por regresión
los resultados del enfoque se confundirán de la misma manera que los resultados basados en el
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf
8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf

Más contenido relacionado

Similar a 8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf

3-4-5Resumenes Ingenieria Seguridad Vial x16 3p.pdf
3-4-5Resumenes Ingenieria Seguridad Vial x16 3p.pdf3-4-5Resumenes Ingenieria Seguridad Vial x16 3p.pdf
3-4-5Resumenes Ingenieria Seguridad Vial x16 3p.pdfSierra Francisco Justo
 
Articulo 1 alfa_de_cronbach_9-28_2
Articulo 1 alfa_de_cronbach_9-28_2Articulo 1 alfa_de_cronbach_9-28_2
Articulo 1 alfa_de_cronbach_9-28_2helikke
 
VALIDEZ Y CONFIABILIDAD EN LA RECOLECCIÓN DE DATOS
VALIDEZ Y CONFIABILIDAD EN LA RECOLECCIÓN DE DATOSVALIDEZ Y CONFIABILIDAD EN LA RECOLECCIÓN DE DATOS
VALIDEZ Y CONFIABILIDAD EN LA RECOLECCIÓN DE DATOSCARMEN ELENA FLORES DEHOY
 
Binder fisi2.1 caminosmasseguros k.ogden
Binder fisi2.1 caminosmasseguros k.ogdenBinder fisi2.1 caminosmasseguros k.ogden
Binder fisi2.1 caminosmasseguros k.ogdenSierra Francisco Justo
 
Hauer Disenar&GestionarBaseCiencia.pdf
Hauer Disenar&GestionarBaseCiencia.pdfHauer Disenar&GestionarBaseCiencia.pdf
Hauer Disenar&GestionarBaseCiencia.pdfFRANCISCOJUSTOSIERRA
 
Diapositivas causalidad y prediccion
Diapositivas causalidad y prediccionDiapositivas causalidad y prediccion
Diapositivas causalidad y prediccionTulia Torres
 
Curso cii ucla art. confiabilidad
Curso cii  ucla art. confiabilidadCurso cii  ucla art. confiabilidad
Curso cii ucla art. confiabilidadjhoram1
 
Development of safety_performance_functi baby
Development of safety_performance_functi babyDevelopment of safety_performance_functi baby
Development of safety_performance_functi babySierra Francisco Justo
 
Juan Perdomo UNY actividad 4 DIG
Juan Perdomo UNY actividad 4 DIGJuan Perdomo UNY actividad 4 DIG
Juan Perdomo UNY actividad 4 DIGJPerdomoUNY2013
 
Trabajo monografico
Trabajo monograficoTrabajo monografico
Trabajo monograficoEN ZR
 
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdfPág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdfHLeyva1
 
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdfPág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdfHLeyva1
 
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdfPág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdfHLeyva1
 

Similar a 8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf (18)

3-4-5Resumenes Ingenieria Seguridad Vial x16 3p.pdf
3-4-5Resumenes Ingenieria Seguridad Vial x16 3p.pdf3-4-5Resumenes Ingenieria Seguridad Vial x16 3p.pdf
3-4-5Resumenes Ingenieria Seguridad Vial x16 3p.pdf
 
069 gonzalez
069 gonzalez069 gonzalez
069 gonzalez
 
Articulo 1 alfa_de_cronbach_9-28_2
Articulo 1 alfa_de_cronbach_9-28_2Articulo 1 alfa_de_cronbach_9-28_2
Articulo 1 alfa_de_cronbach_9-28_2
 
VALIDEZ Y CONFIABILIDAD EN LA RECOLECCIÓN DE DATOS
VALIDEZ Y CONFIABILIDAD EN LA RECOLECCIÓN DE DATOSVALIDEZ Y CONFIABILIDAD EN LA RECOLECCIÓN DE DATOS
VALIDEZ Y CONFIABILIDAD EN LA RECOLECCIÓN DE DATOS
 
Binder fisi2.1 caminosmasseguros k.ogden
Binder fisi2.1 caminosmasseguros k.ogdenBinder fisi2.1 caminosmasseguros k.ogden
Binder fisi2.1 caminosmasseguros k.ogden
 
Hauer Disenar&GestionarBaseCiencia.pdf
Hauer Disenar&GestionarBaseCiencia.pdfHauer Disenar&GestionarBaseCiencia.pdf
Hauer Disenar&GestionarBaseCiencia.pdf
 
Diapositivas causalidad y prediccion
Diapositivas causalidad y prediccionDiapositivas causalidad y prediccion
Diapositivas causalidad y prediccion
 
Curso cii ucla art. confiabilidad
Curso cii  ucla art. confiabilidadCurso cii  ucla art. confiabilidad
Curso cii ucla art. confiabilidad
 
10. 24.9.22 2.pdf
10. 24.9.22 2.pdf10. 24.9.22 2.pdf
10. 24.9.22 2.pdf
 
24.9.22 2.pdf
24.9.22 2.pdf24.9.22 2.pdf
24.9.22 2.pdf
 
Papers 2
Papers 2Papers 2
Papers 2
 
Development of safety_performance_functi baby
Development of safety_performance_functi babyDevelopment of safety_performance_functi baby
Development of safety_performance_functi baby
 
Juan Perdomo UNY actividad 4 DIG
Juan Perdomo UNY actividad 4 DIGJuan Perdomo UNY actividad 4 DIG
Juan Perdomo UNY actividad 4 DIG
 
Trabajo monografico
Trabajo monograficoTrabajo monografico
Trabajo monografico
 
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdfPág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
 
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdfPág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
 
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdfPág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
Pág 202- 214 Epidemiologia-Clinica-Fletcher-5a-Edicion-pdf.pdf
 
Investigación predictiva
Investigación predictivaInvestigación predictiva
Investigación predictiva
 

Más de Sierra Francisco Justo

10. PrediccionComportamientoCR2C Resumen.pdf
10. PrediccionComportamientoCR2C Resumen.pdf10. PrediccionComportamientoCR2C Resumen.pdf
10. PrediccionComportamientoCR2C Resumen.pdfSierra Francisco Justo
 
10. PrediccionComportamientoCR2C Resumen.pdf
10. PrediccionComportamientoCR2C Resumen.pdf10. PrediccionComportamientoCR2C Resumen.pdf
10. PrediccionComportamientoCR2C Resumen.pdfSierra Francisco Justo
 
14 AdministracionSV SegunConocimiento EH&otros.pdf
14 AdministracionSV SegunConocimiento EH&otros.pdf14 AdministracionSV SegunConocimiento EH&otros.pdf
14 AdministracionSV SegunConocimiento EH&otros.pdfSierra Francisco Justo
 
10. PrediccionComportamientoCR2C Resumen.pdf
10. PrediccionComportamientoCR2C Resumen.pdf10. PrediccionComportamientoCR2C Resumen.pdf
10. PrediccionComportamientoCR2C Resumen.pdfSierra Francisco Justo
 
9 Ancho Carril y Seguridad Borrador.pdf
9 Ancho Carril y Seguridad Borrador.pdf9 Ancho Carril y Seguridad Borrador.pdf
9 Ancho Carril y Seguridad Borrador.pdfSierra Francisco Justo
 
12. SeguridadNormasDisenoGeometrico 21p.pdf
12. SeguridadNormasDisenoGeometrico 21p.pdf12. SeguridadNormasDisenoGeometrico 21p.pdf
12. SeguridadNormasDisenoGeometrico 21p.pdfSierra Francisco Justo
 
13. CAMJ 2012 Defensa Conductores Ancianos.pdf
13. CAMJ 2012 Defensa Conductores Ancianos.pdf13. CAMJ 2012 Defensa Conductores Ancianos.pdf
13. CAMJ 2012 Defensa Conductores Ancianos.pdfSierra Francisco Justo
 
6. IngenieriaSeguridad&SeguridadIngenieria.pdf
6. IngenieriaSeguridad&SeguridadIngenieria.pdf6. IngenieriaSeguridad&SeguridadIngenieria.pdf
6. IngenieriaSeguridad&SeguridadIngenieria.pdfSierra Francisco Justo
 
3. Revision Seguridad Autopista 407 Toronto.pdf
3. Revision Seguridad Autopista 407 Toronto.pdf3. Revision Seguridad Autopista 407 Toronto.pdf
3. Revision Seguridad Autopista 407 Toronto.pdfSierra Francisco Justo
 
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdfSierra Francisco Justo
 
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdfSierra Francisco Justo
 
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdfSierra Francisco Justo
 
11121314Resumenes Ingenieria Seguridad Vial x16 4p.pdf
11121314Resumenes Ingenieria Seguridad Vial x16 4p.pdf11121314Resumenes Ingenieria Seguridad Vial x16 4p.pdf
11121314Resumenes Ingenieria Seguridad Vial x16 4p.pdfSierra Francisco Justo
 
78Resumenes Ingenieria Seguridad Vial x16 3p.pdf
78Resumenes Ingenieria Seguridad Vial x16 3p.pdf78Resumenes Ingenieria Seguridad Vial x16 3p.pdf
78Resumenes Ingenieria Seguridad Vial x16 3p.pdfSierra Francisco Justo
 
78Resumenes Ingenieria Seguridad Vial x16 3p.pdf
78Resumenes Ingenieria Seguridad Vial x16 3p.pdf78Resumenes Ingenieria Seguridad Vial x16 3p.pdf
78Resumenes Ingenieria Seguridad Vial x16 3p.pdfSierra Francisco Justo
 

Más de Sierra Francisco Justo (20)

15 Causa y prevencion de choques.pdf
15 Causa y prevencion de choques.pdf15 Causa y prevencion de choques.pdf
15 Causa y prevencion de choques.pdf
 
10. PrediccionComportamientoCR2C Resumen.pdf
10. PrediccionComportamientoCR2C Resumen.pdf10. PrediccionComportamientoCR2C Resumen.pdf
10. PrediccionComportamientoCR2C Resumen.pdf
 
10. PrediccionComportamientoCR2C Resumen.pdf
10. PrediccionComportamientoCR2C Resumen.pdf10. PrediccionComportamientoCR2C Resumen.pdf
10. PrediccionComportamientoCR2C Resumen.pdf
 
9. Ancho Carril y Seguridad.pdf
9. Ancho Carril y Seguridad.pdf9. Ancho Carril y Seguridad.pdf
9. Ancho Carril y Seguridad.pdf
 
14 AdministracionSV SegunConocimiento EH&otros.pdf
14 AdministracionSV SegunConocimiento EH&otros.pdf14 AdministracionSV SegunConocimiento EH&otros.pdf
14 AdministracionSV SegunConocimiento EH&otros.pdf
 
10. PrediccionComportamientoCR2C Resumen.pdf
10. PrediccionComportamientoCR2C Resumen.pdf10. PrediccionComportamientoCR2C Resumen.pdf
10. PrediccionComportamientoCR2C Resumen.pdf
 
9 Ancho Carril y Seguridad Borrador.pdf
9 Ancho Carril y Seguridad Borrador.pdf9 Ancho Carril y Seguridad Borrador.pdf
9 Ancho Carril y Seguridad Borrador.pdf
 
12. SeguridadNormasDisenoGeometrico 21p.pdf
12. SeguridadNormasDisenoGeometrico 21p.pdf12. SeguridadNormasDisenoGeometrico 21p.pdf
12. SeguridadNormasDisenoGeometrico 21p.pdf
 
13. CAMJ 2012 Defensa Conductores Ancianos.pdf
13. CAMJ 2012 Defensa Conductores Ancianos.pdf13. CAMJ 2012 Defensa Conductores Ancianos.pdf
13. CAMJ 2012 Defensa Conductores Ancianos.pdf
 
7. Seguridad&Evidencia.pdf
7. Seguridad&Evidencia.pdf7. Seguridad&Evidencia.pdf
7. Seguridad&Evidencia.pdf
 
6. IngenieriaSeguridad&SeguridadIngenieria.pdf
6. IngenieriaSeguridad&SeguridadIngenieria.pdf6. IngenieriaSeguridad&SeguridadIngenieria.pdf
6. IngenieriaSeguridad&SeguridadIngenieria.pdf
 
5 . Camino Por Recorrer.pdf
5 . Camino Por Recorrer.pdf5 . Camino Por Recorrer.pdf
5 . Camino Por Recorrer.pdf
 
4. HAUER Hwy 407 PEO Canada'97.pdf
4. HAUER Hwy 407 PEO Canada'97.pdf4. HAUER Hwy 407 PEO Canada'97.pdf
4. HAUER Hwy 407 PEO Canada'97.pdf
 
3. Revision Seguridad Autopista 407 Toronto.pdf
3. Revision Seguridad Autopista 407 Toronto.pdf3. Revision Seguridad Autopista 407 Toronto.pdf
3. Revision Seguridad Autopista 407 Toronto.pdf
 
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
 
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
 
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
1516Resumenes Ingenieria Seguridad Vial x16 3p.pdf
 
11121314Resumenes Ingenieria Seguridad Vial x16 4p.pdf
11121314Resumenes Ingenieria Seguridad Vial x16 4p.pdf11121314Resumenes Ingenieria Seguridad Vial x16 4p.pdf
11121314Resumenes Ingenieria Seguridad Vial x16 4p.pdf
 
78Resumenes Ingenieria Seguridad Vial x16 3p.pdf
78Resumenes Ingenieria Seguridad Vial x16 3p.pdf78Resumenes Ingenieria Seguridad Vial x16 3p.pdf
78Resumenes Ingenieria Seguridad Vial x16 3p.pdf
 
78Resumenes Ingenieria Seguridad Vial x16 3p.pdf
78Resumenes Ingenieria Seguridad Vial x16 3p.pdf78Resumenes Ingenieria Seguridad Vial x16 3p.pdf
78Resumenes Ingenieria Seguridad Vial x16 3p.pdf
 

Último

REGLA DE PROBABILIDADES Y REGLA DE BAYES.pptx
REGLA DE PROBABILIDADES  Y REGLA DE BAYES.pptxREGLA DE PROBABILIDADES  Y REGLA DE BAYES.pptx
REGLA DE PROBABILIDADES Y REGLA DE BAYES.pptxJhonLeon59
 
Ciclo de Refrigeracion aplicado a ToniCorp.pptx
Ciclo de Refrigeracion aplicado a ToniCorp.pptxCiclo de Refrigeracion aplicado a ToniCorp.pptx
Ciclo de Refrigeracion aplicado a ToniCorp.pptxUniversidad de Guayaquil
 
expo unidad5 metodologia de los sistemas blandos .pptx
expo unidad5 metodologia de los sistemas blandos .pptxexpo unidad5 metodologia de los sistemas blandos .pptx
expo unidad5 metodologia de los sistemas blandos .pptxeduardo1sauceda7
 
TIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZ
TIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZTIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZ
TIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZvarichard
 
Diseño digital - M. Morris Mano - 3ed.pdf
Diseño digital - M. Morris Mano - 3ed.pdfDiseño digital - M. Morris Mano - 3ed.pdf
Diseño digital - M. Morris Mano - 3ed.pdfssuserf46a26
 
PRACTICAS_DE_AUTOMATIZACION_industrial (1).pdf
PRACTICAS_DE_AUTOMATIZACION_industrial (1).pdfPRACTICAS_DE_AUTOMATIZACION_industrial (1).pdf
PRACTICAS_DE_AUTOMATIZACION_industrial (1).pdfjorge477728
 
CONCEPTOS BASICOS DE ROBOTICA, CLASES DE ROBOTS
CONCEPTOS BASICOS DE ROBOTICA, CLASES DE ROBOTSCONCEPTOS BASICOS DE ROBOTICA, CLASES DE ROBOTS
CONCEPTOS BASICOS DE ROBOTICA, CLASES DE ROBOTSrobinarielabellafern
 
TEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOS
TEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOSTEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOS
TEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOSCarlosHuamulloDavila1
 
Diseno de Estructuras de Acero - 5ta Ed - McCormac.pdf
Diseno de Estructuras de Acero - 5ta Ed - McCormac.pdfDiseno de Estructuras de Acero - 5ta Ed - McCormac.pdf
Diseno de Estructuras de Acero - 5ta Ed - McCormac.pdfEdwinHurtado31
 
Responsabilidad de padres con sus hijos (1).pptx
Responsabilidad de padres con sus hijos (1).pptxResponsabilidad de padres con sus hijos (1).pptx
Responsabilidad de padres con sus hijos (1).pptxROSARIODELPILARMERIN
 
Circuitos_basicos_de_neumatica miquel carulla .pdf
Circuitos_basicos_de_neumatica  miquel carulla .pdfCircuitos_basicos_de_neumatica  miquel carulla .pdf
Circuitos_basicos_de_neumatica miquel carulla .pdfJosueUlin1
 
ESFUERZO EN VIGAS SESIÓN 5 PROBLEMA RESUELTOS.pdf
ESFUERZO EN VIGAS SESIÓN 5 PROBLEMA RESUELTOS.pdfESFUERZO EN VIGAS SESIÓN 5 PROBLEMA RESUELTOS.pdf
ESFUERZO EN VIGAS SESIÓN 5 PROBLEMA RESUELTOS.pdfSegundo Silva Maguiña
 
UNIDAD III Esquemas de comunicacion pptx
UNIDAD III Esquemas de comunicacion pptxUNIDAD III Esquemas de comunicacion pptx
UNIDAD III Esquemas de comunicacion pptxElybe Hernandez
 
subestaciones electricas , elementos y caracteristicas
subestaciones electricas , elementos y caracteristicassubestaciones electricas , elementos y caracteristicas
subestaciones electricas , elementos y caracteristicaszaydaescalona
 
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...FRANCISCOJUSTOSIERRA
 
1.1 Los 14 principios del Toyota Way -2024.pdf
1.1 Los 14 principios del Toyota Way -2024.pdf1.1 Los 14 principios del Toyota Way -2024.pdf
1.1 Los 14 principios del Toyota Way -2024.pdfThe16Frame
 
707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf
707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf
707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdfErnestoCano12
 
METRADOS EN OBRAS DE PAVIMENTACION- ACTUALIZADA.pptx
METRADOS EN OBRAS DE PAVIMENTACION- ACTUALIZADA.pptxMETRADOS EN OBRAS DE PAVIMENTACION- ACTUALIZADA.pptx
METRADOS EN OBRAS DE PAVIMENTACION- ACTUALIZADA.pptxEdwardRodriguezPalom1
 
Sesión de Clase A dde sistemas de riego y otras obras
Sesión de Clase A dde sistemas de riego y otras obrasSesión de Clase A dde sistemas de riego y otras obras
Sesión de Clase A dde sistemas de riego y otras obrasBildStrify1
 

Último (20)

REGLA DE PROBABILIDADES Y REGLA DE BAYES.pptx
REGLA DE PROBABILIDADES  Y REGLA DE BAYES.pptxREGLA DE PROBABILIDADES  Y REGLA DE BAYES.pptx
REGLA DE PROBABILIDADES Y REGLA DE BAYES.pptx
 
Ciclo de Refrigeracion aplicado a ToniCorp.pptx
Ciclo de Refrigeracion aplicado a ToniCorp.pptxCiclo de Refrigeracion aplicado a ToniCorp.pptx
Ciclo de Refrigeracion aplicado a ToniCorp.pptx
 
expo unidad5 metodologia de los sistemas blandos .pptx
expo unidad5 metodologia de los sistemas blandos .pptxexpo unidad5 metodologia de los sistemas blandos .pptx
expo unidad5 metodologia de los sistemas blandos .pptx
 
TIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZ
TIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZTIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZ
TIPOS DE BASTIDORES Y CARROCERIA EN LA INDUSTRIA AUTOMOTRIZ
 
Diseño digital - M. Morris Mano - 3ed.pdf
Diseño digital - M. Morris Mano - 3ed.pdfDiseño digital - M. Morris Mano - 3ed.pdf
Diseño digital - M. Morris Mano - 3ed.pdf
 
PRACTICAS_DE_AUTOMATIZACION_industrial (1).pdf
PRACTICAS_DE_AUTOMATIZACION_industrial (1).pdfPRACTICAS_DE_AUTOMATIZACION_industrial (1).pdf
PRACTICAS_DE_AUTOMATIZACION_industrial (1).pdf
 
CONCEPTOS BASICOS DE ROBOTICA, CLASES DE ROBOTS
CONCEPTOS BASICOS DE ROBOTICA, CLASES DE ROBOTSCONCEPTOS BASICOS DE ROBOTICA, CLASES DE ROBOTS
CONCEPTOS BASICOS DE ROBOTICA, CLASES DE ROBOTS
 
TEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOS
TEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOSTEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOS
TEST ESPACIAL CONTEO DE CUBOS y TEST DE MOSAICOS
 
Diseno de Estructuras de Acero - 5ta Ed - McCormac.pdf
Diseno de Estructuras de Acero - 5ta Ed - McCormac.pdfDiseno de Estructuras de Acero - 5ta Ed - McCormac.pdf
Diseno de Estructuras de Acero - 5ta Ed - McCormac.pdf
 
Responsabilidad de padres con sus hijos (1).pptx
Responsabilidad de padres con sus hijos (1).pptxResponsabilidad de padres con sus hijos (1).pptx
Responsabilidad de padres con sus hijos (1).pptx
 
Circuitos_basicos_de_neumatica miquel carulla .pdf
Circuitos_basicos_de_neumatica  miquel carulla .pdfCircuitos_basicos_de_neumatica  miquel carulla .pdf
Circuitos_basicos_de_neumatica miquel carulla .pdf
 
ESFUERZO EN VIGAS SESIÓN 5 PROBLEMA RESUELTOS.pdf
ESFUERZO EN VIGAS SESIÓN 5 PROBLEMA RESUELTOS.pdfESFUERZO EN VIGAS SESIÓN 5 PROBLEMA RESUELTOS.pdf
ESFUERZO EN VIGAS SESIÓN 5 PROBLEMA RESUELTOS.pdf
 
UNIDAD III Esquemas de comunicacion pptx
UNIDAD III Esquemas de comunicacion pptxUNIDAD III Esquemas de comunicacion pptx
UNIDAD III Esquemas de comunicacion pptx
 
subestaciones electricas , elementos y caracteristicas
subestaciones electricas , elementos y caracteristicassubestaciones electricas , elementos y caracteristicas
subestaciones electricas , elementos y caracteristicas
 
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 20.5 PREFERIDO.wbk.wbk SEG...
 
1.1 Los 14 principios del Toyota Way -2024.pdf
1.1 Los 14 principios del Toyota Way -2024.pdf1.1 Los 14 principios del Toyota Way -2024.pdf
1.1 Los 14 principios del Toyota Way -2024.pdf
 
707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf
707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf
707555966-El-Libro-de-La-Inteligencia-Artificial-Version-11-Alfredovela.pdf
 
METRADOS EN OBRAS DE PAVIMENTACION- ACTUALIZADA.pptx
METRADOS EN OBRAS DE PAVIMENTACION- ACTUALIZADA.pptxMETRADOS EN OBRAS DE PAVIMENTACION- ACTUALIZADA.pptx
METRADOS EN OBRAS DE PAVIMENTACION- ACTUALIZADA.pptx
 
Sesión de Clase A dde sistemas de riego y otras obras
Sesión de Clase A dde sistemas de riego y otras obrasSesión de Clase A dde sistemas de riego y otras obras
Sesión de Clase A dde sistemas de riego y otras obras
 
Convocatoria de Becas Caja de Ingenieros_UOC 2024-25
Convocatoria de Becas Caja de Ingenieros_UOC 2024-25Convocatoria de Becas Caja de Ingenieros_UOC 2024-25
Convocatoria de Becas Caja de Ingenieros_UOC 2024-25
 

8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf

  • 1. CAUSA Y EFECTO EN ESTUDIOS OBSERVACIONALES DE LA SECCIÓN TRANSVERSAL SOBRE LA SEGURIDAD VIAL Ezra Hauer, 2005 1. INTRODUCCIÓN 2. ILUSTRACIÓN DE TEMAS EN CRUCES CAMINO-FERROCARRIL A NIVEL 2.1 Cómo medir el 'Efecto de seguridad' 2.2 Examen de la consistencia de las estimaciones del efecto de seguridad 3. CAUSA, EFECTO, CONFUSIÓN Y CONSISTENCIA 3.1 Definición de causa y efecto 3.2 Confusión e intercambiabilidad en estudios transversales observacionales de seguridad vial. 3.3 Consistencia de los hallazgos 4. CASOS E INQUIETUDES 4.1 Peltzman y otros sobre el efecto regulación seguridad del automóvil 4.2 Lave y otros sobre el límite de velocidad 4.3 Noland sobre la estructura y efecto sobre las muertes 4.4 El medio no es el mensaje 4.5 Algunos modelos a nivel de unidad para caminos 5. RESUMEN 6. CONCLUSIONES Referencias
  • 2. 1. INTRODUCCIÓN Gran parte de la investigación sobre seguridad vial1 gira en torno de la causa. Es decir, deseamos aprender qué cambio en la seguridad resultará de algún tratamiento2. En muchas otras discipli- nas, el conocimiento de este tipo proviene de experimentos. El aspecto clave de un experimento es que uno puede cambiar deliberadamente el valor de solo unos pocos factores mientras man- tiene todos los demás factores constantes, o neutralizar el efecto de todos los demás factores mediante la aleatorización. En seguridad vial, la experimentación de este tipo es muy rara; el conocimiento tiene que ser extraído de 'estudios observacionales'; es decir, interpretando los datos que se pueden encontrar. Los estudios observacionales de seguridad vial son de dos tipos: • 'antes-después'. Cuando algún cambio o tratamiento se aplicó a un grupo de unidades. El cambio en el historial de accidentes y en los atributos de estas unidades desde antes del tratamiento hasta después del tratamiento se utilizan para estimar el cambio en la seguridad que se debe al tratamiento. • 'transversal'. Cuando los atributos y el historial de accidentes de las unidades, algunos en- contrados con tratamiento (atributo) X y algunos encontrados con el tratamiento (atributo) Y, se utilizan en un intento de estimar el efecto de seguridad de la diferencia de trato (o atributo) en la pregunta. La distinción principal entre estos dos tipos de estudio observacional es que en un estudio antes- después 'tratamiento' significa que algo ha cambiado de 'antes' a 'después', mientras que en un estudio transversal el elemento de cambio no está presente, sólo existe una diferencia contem- poránea en algún atributo de interés que podría haber sido diferente y, por lo tanto, se denomina vagamente "tratamiento". Se cree que el experimento aleatorio es el estándar de oro que permite la relación causa-efecto. interpretación. Reconociendo que en muchas disciplinas y circunstancias 4 la experimentación y aleatorización no son factibles, el estudio observacional de antes y después es quizás el siguiente en el 1 La seguridad de una unidad es el número de accidentes, por gravedad, que se espera que ocurran en ella por unidad de tiempo. Una unidad puede ser una intersección señalizada, un segmento de carretera, un conductor, una flota de camiones, etc. Generalmente por “tratamiento” nos referimos a una intervención de algún tipo, un cambio en alguna característica de diseño o, de manera más general, un cambio en un factor que puede causar un cambio en la seguridad de la unidad. Como será obvio, también usaremos la palabra 'tratamiento' en el sentido de 'diferencia en atributo o característica'. Eso es si una unidad recibirá la función X y otra característica de la unidad Y, se dice que las dos unidades han recibido un tratamiento diferente. En nuestra perspectiva el tratamiento es la causa y nos preguntamos por su efecto. Esto es lo contrario de ver algún evento. por ejemplo, un accidente) que ocurra y preguntar sobre su causa. 3 Rosenbaum (1995) (Rosenbaum PR 1985) dice que “Un estudio observacional es una investi- gación empírica de tratamientos, políticas o exposiciones y los efectos que causan, pero se dife- rencia de un experimento en que el investigador no puede controlar la asignación de tratamientos a los sujetos. (pág. vii). Luego enfatiza que “Un estudio sin el tratamiento no es ni un experimento ni un estudio observacional” (p.1). Sin embargo, él también debe permitir una amplia interpreta- ción de la palabra 'tratamiento' ya que uno de sus ejemplos es un estudio sobre el tabaquismo y las enfermedades del corazón en el que el atributo de cuánto fumó una persona en el pasado se interpreta como 'tratamiento'. Así, los límites entre 'tratamiento', 'atributo' y 'exposición' no están del todo claros.
  • 3. 4 En ciencias sociales, educación, economía, epidemiología, medicina, etc. 4 línea de respetabilidad en términos de permitir interpretaciones de causa-efecto 1 . Si la sección transversal observacional estudios pueden conducir a conclusiones de causa-efecto es un tema de controversia. Mientras que algunos afirman que “No hay causalidad sin manipulación” 2 otros no excluyen la posibilidad 3 . La cuestión de si la interpretación causal de los estudios transversales es del todo posible es de importancia central para la seguridad vial. La razón es que las oportunidades de hacer observa- ciones antes y después estudios sobre, digamos, el efecto de seguridad del cambio en la curva- tura horizontal, grado de carretera, carril ancho, mediana pendiente, etc. son pocos e imperfec- tos. Esto es así, en parte, porque cuando se reconstruye una carretera por lo general, se cambian varios de sus atributos a la vez y es difícil asignar el resultado a cualquier único factor causal. Además, la reconstrucción de una carretera a menudo la modifica hasta tal punto que no puede considerarse la misma unidad después de la reconstrucción. Por el contrario, las oportunidades de los estudios transversales observacionales son abundantes. Esta es la razón por la que gran parte de lo que se piensa que es El conocimiento sobre el efecto de seguridad de muchas carac- terísticas viales importantes provino de la sección transversal de observación. estudios. Sin embargo, si es cierto que tales estudios no pueden conducir a conclusiones de causa-efecto, entonces gran parte de la tradición existente debe ser cuestionada. Si bien el tema es de importancia central para la seguridad vial, ha recibido escasa atención. atención. Por lo que sé, se emitió por primera vez en Hauer (1991) 4 , quien señaló que los resultados de beforeafter Los estudios tienden a diferir de los estudios transversales. En tales casos, uno o ambos métodos dan resultados incorrectos. Tarko et al. (2004) argumentó a favor de dibujar causa-efecto conclusiones de los estudios transversales. Davis (2000) revisó exhaus- tivamente la información existente literatura relevante sobre la inferencia causal tal como se aplica a la seguridad vial. Destacó que para dibujar conclusiones de causa-efecto a partir de datos de sección cruzada, la posibilidad de confusión debe ser eliminado y que esto requiere información sobre por qué un sitio recibió el tratamiento 'X' y otro recibió el tratamiento 'Y'. Mien- tras que en 2000 Davis era levemente optimista 5 sobre la posibilidad para controlar la confusión en estudios transversales, más recientemente Davis (Davis 2004) expresó duda de que se pue- dan superar los sesgos de agregación inherentes a los estudios transversales. En suma, una parte del conocimiento que pasa de la investigación a la práctica se basa en con- clusiones extraídas de estudios transversales. No está claro, en este momento, en qué circuns- tancias esta información puede interpretarse como representación de causa y efecto. En conse- cuencia, el principal propósito de este informe es examinar el tema de causa y efecto en la sec- ción transversal observacional 1 Rubin (1974) expresa este sentimiento de la siguiente manera: “… dada la elección entre los datos de un experimento aleatorio y un estudio no aleatorizado equivalente, uno debe elegir los datos del experimento…. Sin embargo, lo haremos desarrollar la posición de que los estudios no aleatorios, así como los experimentos aleatorios, pueden ser útiles para estimar efectos causales del tratamiento”. Págs. 688-689. 2 Holland (1986) atribuye esto a D. Rubin, uno de los principales pensadores de la interpretación causa-efecto de Datos estadísticos. 3 Al hablar de la teoría de la causalidad inferida Pearl (2000) dice que “… la dirección de las influencias causales puede determinarse a menudo sin recurrir a la información cronológica.
  • 4. (Aunque, cuando esté disponible, cronológico información puede simplificar significativamente la tarea de modelado.)”, p.43. 4 Refiriéndose a un informe de investigación en el que se hizo una declaración sobre la superio- ridad del enfoque de antes y después Hauer (1991) dice que: "La pregunta es si el enfoque de investigación antes y después es mejor, en general, que el enfoque transversal "y que" Esta pregunta sería de poco interés si ambos enfoques de investigación condujeran a resultados si- milares. conclusiones. Esto, sin embargo, no parece ser el caso”. pags. 26 5 “…no es inconcebible que un sistema experto, por ejemplo, pueda incorporar el conocimiento de ingeniería existente en un manera racional y aun así conducir a una selección sin confusión”. pags. 106. 5 estudios sobre seguridad vial. Para hacer obvia la relevancia práctica del problema y el asunto tangible, en la próxima sección usaré el dispositivo de un estudio de caso. 6 2. UNA ILUSTRACIÓN DE LOS PROBLEMAS EN EL CASO DEL FERROCARRIL PASOS A NIVEL La pregunta práctica es esta: si realizo alguna 'acción', ¿qué puedo esperar que tenga su efecto de seguridad? ¿ser? Es decir, en el arte práctico de la gestión de la seguridad vial nos interesan las relaciones entre las acciones (p. ej., reemplazar los cruces con luces intermitentes en un paso a nivel) y su esperada efecto de seguridad (reducción de accidentes). En el capítulo introductorio pregunté, algo abstractamente, si los resultados derivados de los datos de la sec- ción transversal se pueden utilizar para dicha orientación de causa-efecto. En En este capítulo quiero ilustrar el tejido rico y problemático de este tema en el contexto de una campo de acción específico: el de elegir dispositivos de advertencia para los pasos a nivel de ferrocarril y carretera. 2.1 Cómo se puede medir el 'Efecto de seguridad'. Se entiende bien cómo se mide el efecto de seguridad en un estudio observacional de antes y después. Predecimos cuál habría sido la seguridad de las entidades tratadas en el período 'después del tratamiento' si se hubieran dejado sin tratar. Para ello utilizamos el historial de accidentes de las entidades tratadas de la período 'antes del tratamiento' y conocimiento de cómo sus atributos (por ejemplo, flujo de tráfico) cambiaron de el período 'antes' al 'después'. Luego comparamos la predicción de lo que habría sido en el período 'después' si no hubiera habido tratamiento, a qué accidentes se materializaron en el período 'después' con el tratamiento en su lugar. Esta compa- ración puede ser en forma de diferencia: δ = (qué seguridad habría sido sin tratamiento) – (qué seguridad había con tratamiento); o en forma de proporción: θ = (qué seguridad había con el tratamiento)/ (qué seguridad habría sido sin tratamiento). los estimaciones de δ o θ pueden servir como guía para responder la pregunta original: si implementar algún tratamiento (acción) ¿cuál podemos esperar que sea su efecto? En un estudio observacional que utiliza datos transversales, el efecto de seguridad se estima bastante diferentemente. Para dilucidar, considere el estudio de Coleman y Stewart (1976) sobre la seguridad de pasos a nivel ferrocarril-carretera. Usaron datos transversales de 37,230 pasos a nivel en 15 estados para ajustarse al modelo de regresión rela- tivamente simple: C log (Trenes/día) CCC wd,3 10 ancho,0 ancho,1 ancho,2 (Trenes/día) Acci- dentes/año = 10 (Vehículos/día) (Trenes/día) ecuación 1 Se estimaron los coeficientes de regre- sión C wd,o, …, C wd,3 para tres tipos de dispositivos de advertencia (wd=Puertas Automáticas, Intermitentes o Crossbucks) y para cuatro condiciones (urbano de vía única o rural y urbano o rural de vía múltiple). Utilizando los coeficientes de regresión estimados y la ecuación. 1 uno puede trazar gráficos y comparar frecuencias de accidentes previstas en condiciones idénticas (número de vías, escenario, trenes/día y vehículos/día) pero con diferentes avisadores.
  • 5. Considere, por ejemplo, las frecuencias de accidentes pronosticadas en la Figura 1. 7 Figura 1. Predicciones del modelo para Crossbucks y Flashers Con, digamos, 10.000 vehículos de carretera/día, 10 trenes/día, una sola vía férrea y cruces ubicados en un área ur- bana, se espera que un cruce promedio con 'Crossbucks' tenga 0.182 accidentes/año y se espera que un cruce promedio cuando esté equipado con 'Flashers' tenga 0.234 accidentes/año. Parecería natural hacer de esto la base para la anticipación de lo que sería el "efecto de seguri- dad". ser cuando un tipo de dispositivo de advertencia es reemplazado por otro 1 . El efecto de segu- ridad de reemplazar crossbucks por luces intermitentes podría medirse por la diferencia δ = 0.234-0.182 como el aumento de 0,052 accidentes/año o, alternativamente, por la relación θ =0,234/0,182=1,26 (que se puede leer como 26% aumento de accidentes/año) 2 . Estas medidas alternativas de efecto de seguridad se basan ambas en la misma información y ambas podrían servir de orientación. Dado que en seguridad vial la razón mide ( θ ) se encuentra más común- mente, se usará aquí para representar el efecto de seguridad 3 . En lo que sigue, la relación (Frecuencia prevista de accidentes con Y)/(Accidente previsto con X) se denotará por θ X a Y . Cuando para un conjunto dado de atributos θ X a Y <1, el efecto del cambio de X a Y es disminuir frecuencia de accidentes 4 . En la ilustración anterior, el efecto de seguridad estimado cuando se basa en datos de sección transversal fue obtenido ajustando primero una o más ecuaciones de regresión a los datos y luego usando estos ecuación para predecir cuál sería el efecto de seguridad ( δ o θ ) bajo dos condiciones específicas. En principio, si los datos transversales son tan abundantes que la cate- gorización en todas las variables relevantes para la seguridad es factible que se pueda prescindir del paso de regresión. Entonces uno compararía el número promedio de accidentes/cruce de dos celdas que tienen los mismos valores de variables relevantes para la seguridad y difieren en tratamiento. En la práctica de la seguridad vial, esta opción rara vez es práctica; variables rele- vantes para la seguridad son muchos y, por lo tanto, las celdas no contienen suficientes datos para una estimación confiable. Las regresiones son utilizado para aliviar el 'problema de datos escasos'. 1 En el capítulo 3 se proporciona una definición más sistemática de 'efecto de seguridad'. 2 La legitimidad de interpretar la diferencia en las predicciones con lo que se espera que sea la consecuencia del cambio es cuestionado por muchos. Sin embargo, el examen de tal legitimidad es uno de los propósitos de esta indagación. Por lo tanto, hasta el final de la investigación se debe permitir el uso de la diferencia en las predicciones para estimar el cambio. 3 Rubin (1990, p.283)( Rubin 1990) define el 'efecto causal del tratamiento' de la misma manera, es decir, por δ o θ . Argumenta que θ puede ser la mejor medida cuando se piensa que δ es proporcional al número esperado de accidentes . ('rendimiento' en su contexto). 4 (1- θ X → Y )× 100 es el 'porcentaje de reducción' debido al cambio de X a Y. 8 Habiendo aclarado cómo se puede derivar el efecto de seguridad de los resultados de una observación estudio transversal, ahora podemos examinar las siguientes preguntas empíricas. Hizo antes-después Los estudios sobre el efecto de seguridad de los dispositivos de advertencia en los pasos a nivel de ferrocarril y carretera tienden a producir estimaciones consistentes del
  • 6. 'efecto de seguridad'? ¿Los estudios transversales tendieron a producir "seguridad" consistente? estimaciones del efecto? ¿Son consistentes los resultados de los estudios de antes y después con los de estudios transversales? ¿estudios? Estas y otras cuestiones similares se examinan a continuación. 2.2 Examen de la consistencia de las estimaciones del efecto de seguridad Cada curva en la Figura 1 es la representación de la ecuación. 1. El θ Crossbuck toFlashers es la relación de dos de tales ecuaciones; en la ecuación del numerador las constantes de regresión C son para wd=Intermitentes y en el denominador para wd=Crossbucks. Después de introducir las condicio- nes específicas (urbano, único vías, volúmenes de trenes) el θ Crossbucks to Flashers es (en este caso) una función del flujo de tráfico vial únicamente. Cómo los Coleman-Stewart θ Crossbucks to Flashers y θ Crossbucks to Gates dependen del tráfico vial diario flujo (AADT) para Vía Única &Urbano y Vía Múltiple &Rural se muestra en la Figura 2 y Figura 3. Figura 2. Ratios θ de accidentes previstos para Vía Única, Urbana, 10 trenes/día 9 Figura 3. Ratios θ de accidentes previstos para Vía Múltiple, Rural, 10 trenes/día Cuando se usa de esta manera, el modelo de Coleman-Stewart implica que en vías urbanas de vía única cruces (Figura 2) con más de aproximadamente 1000 vehículos de carretera por día, más colisiones son esperado con 'Flashers' que cuando se usan 'Crossbucks' ( θ Flashers to Crossbucks >1). Apro- ximadamente el se indica lo contrario para condiciones rurales de múltiples vías (Figura 3). Nota de Coleman y Stewart que estos resultados son inesperados y dicen que “Pueden ser necesarias variables adicionales en estos casos para explicar completamente los patrones de ocurrencia de accidentes” (p. 62). Una de las razones por las que estos resultados (de la regresión multivariable utilizando la sec- ción transversal datos) se consideraron "inesperados" fue que eran contrarios a los resultados de algunos antes-después estudios. Los principales resultados de varios estudios de antes y después se resumen en la Tabla 1 y se elaboran en la Tabla 2. Las celdas sombreadas dan las proporciones θ obtenidas en cinco estudios de antes y después. Tabla 1. Estimaciones de θ de estudios antes y después (sesgados) adaptados de Hauer y Persaud (1987) Autor California PUC Morrisey Coleman Eck y Halkias Farr y Hitz Año de publicación 1974 1981 1982 1985 1985 No. de cruces 1552 2994 NA 7734 5903 Crossbucks a Flashers 0.36 0.35 0.29 0.31 0.30 Crossbucks a Gates 0.12 0.16 0.18 0.16 0.17 Intermitentes a puertas 0,34 0,36 0,31 0,28 0,28 Todas estas estimaciones, por coherentes que parezcan, se inflan sistemáticamente debido a errores no corregidos. sesgo de selección 1 . Un estudio en el que se eliminó este sesgo proporcionó los resultados en la Tabla 2 . 1 El sesgo de selección surge cuando la decisión de cambiar de un tipo de dispositivo de adver- tencia a otro está parcialmente motivada por la ocurrencia de accidentes en un sitio y los mismos accidentes también se utilizan en la cuenta de accidentes 'antes'. los el sesgo tiene sus raíces en el fenómeno de la regresión a la media. En el momento en que se realizaron estos estudios la existencia de el sesgo de selección no fue ampliamente apreciado. 10 Tabla 2. Estimaciones de θ de un estudio antes-después sin sesgo adaptado de Hauer y Persaud (1987) Conversiones Crossbucks a Intermitentes Crossbucks a Gates Intermitentes toGates Nº de Conversiones 891 1037 934 Estimación sesgada 0,30 0,21 0,40 Estimación im- parcial 0,49 0,32 0,55 ¿Qué se puede decir acerca de estos resultados? Primero, se debe tener en cuenta que hay una diferencia rara vez notada entre θ de antes-después estudios y el θ de
  • 7. regresiones basadas en datos transversales. Cada estudio de antes y después arrojó un estima- ción única del efecto de seguridad θ . Este es un efecto de seguridad promedio con un promedio sobre el tratado sitios Por el contrario, el modelo de un estudio transversal hace que θ sea una función de varios atributos. Eso es muy probable que θ sea una función de los atributos de las entidades tratadas 1 . Si es así, el θ obtenido de un estudio antes-después, siendo un promedio sobre una cierta colección de sitios, depende de la mezcla específica de atributos de las entida- des 'tratadas'; una combinación diferente de entidades tratadas producir un θ diferente . Por lo tanto, las estimaciones del efecto de seguridad obtenidas mediante un estudio de antes y des- pués han dos deficiencias. Una es que incluso si cada estudio de un determinado tratamiento o acción pudiera dar muy estimaciones precisas, las estimaciones de θ promedio tenderían a diferir de un estudio a otro porque la los sitios en cada estudio diferirían 2 . La otra deficiencia es que en la medida en que el sitio para el cual algún tratamiento es contemplado por un médico tiene atributos específicos, el θ promedio basado en un Es posible que el estudio de antes y después no se aplique a este sitio. Por lo tanto, las estimaciones del efecto de seguridad cuando se deri- van de un El estudio antes-después es útil en la práctica solo si el efecto de seguridad depende solo débilmente del sitio. atributos 3 A este respecto, la regresión basada en datos transversales parece tener una ventaja sobre un estudio antes-después. La segunda observación es que, en este caso, no importa cuál sea la mezcla de los tratados entidades en los estudios de antes y después, los resultados en la Tabla 1 y la Tabla 2 no son consistentes con los resultados en la Figura 2 y la Figura 3. De ello se deduce que, en este caso, uno o ambos tipos de estudio no pueden ser confiable. La tercera observación que se puede hacer es que los resultados (sesgados) de los cinco antes- después Los estudios en la Tabla 1 son bastante consistentes y es probable que lo sigan siendo incluso si la regresión-tomean Se eliminó el sesgo de cada uno. Si es así, se puede especular que en los cinco estudios de antes y después, las conversiones se realizaron en sitios con atri- butos similares o el efecto de seguridad no realmente no dependen fuertemente de los atributos de los cruces tratados, contrariamente a lo que podría ser inferido de las Figuras 2 y 3 Esto arroja una doble duda sobre los resultados de la regresión. Las estimaciones de θ basados en los modelos de Coleman-Stewart parecen incorrectos y la manera en que θ depende de el volumen de vehículos y trenes es sospechoso. Lo que parecía ser una ventaja genérica de la regresión- 1 Uno debe apresurarse a agregar que puede ser una función no solo de las variables en el modelo sino quizás de las variables actualmente no representado en el modelo. 2 Suponga, por ejemplo, que cuando AADT<500 tener carriles de 12' en lugar de carriles de 9' disminuye los accidentes por un factor de 0,95 pero cuando AADT>2000 la disminución es por un factor de 0,67 como se indica en Harwood et al. (pág. 30) (Harwood et al. 2000). Si es así, un estudio de antes y después de dicha ampliación de carriles, que incluye en su mayoría carreteras de bajo volumen, encontraría θ de aproximadamente 0,95, pero si el es- tudio incluyera principalmente segmentos de carretera de mayor volumen, estimaría θ de alrede- dor de 0,67 3 En principio, es posible hacer que θ sea una función de atributos también en un estudio de antes y después. Sin embargo, en la práctica la número de entidades en las que se aplica un tratamiento rara vez es suficiente para hacer tales distinciones. 11 enfoque de sección transversal - su capacidad automática para hacer que θ sea una función de atributos - puede, en este caso, sea sólo una ilusión.
  • 8. Esto lleva a la cuarta observación. Para ser justos, el estudio transversal de Coleman-Stewart se hizo principalmente para predecir las frecuencias esperadas de accidentes; no estaba destinado a ser utilizado para la estimación de θ . Sin embargo, su modelo (Eqn. 1) se puede tomar para implicar que, θ = 10 Δ C 0 (Vehículos/ día) Δ C 1 (Trenes/día) Δ C 2 (Trenes/día) Δ C 3 log 10 (Trenes/día) , donde Δ es la diferencia entre los coeficientes de regresión apropiados. La forma funcional de esta expresión matemática no refleja un esfuerzo deliberado para encontrar cómo θ depende de atributos de los cruces. Simplemente se sigue algebraicamente de la elección de la forma modelo hecha por Coleman-Stewart para otros fines. En resumen, se puede concluir que el modelo de Coleman-Stewart condujo a estimaciones de θ que son inconsistente con los resultados de varios estudios de antes y después, y que implica relaciones entre θ y atributos de cruce que son sospechosos. La pregunta es si otra regresión los estudios sobre datos transversales obtuvieron mejores resultados. Para responder, algunos modelos de sección transversal adicionales de se puede examinar la seguridad de los pasos a nivel. El siguiente estudio de regresión que se examinará es el de Mengert (1980), quien utilizó datos sobre más de 200,000 cruces públicos en los EE. UU. El "accidente básico" resultante fórmula de predicción' (Hitz 1986) para 'Crossbucks' es: 0,616 (hp 1) 0,0077 ms 0,1 (ht 1) 0,0 (hl 1) 0.1336 0,209 tm 0.3334 e e mi mi 0.2 edición 0.2 0.2 a 0.002268 ct 0.2 − × − × − × − × − × × × × × ⎟⎠ ⎞ ⎜⎝ ⎛ + × ⎟⎠ ⎞ ⎜⎝ ⎛ × + = × ecuación _ 2 En este, 'a' es accidentes/año; 'c' el promedio de vehículos de carretera/día; 't' el tren promedio movimientos/día; 'mt' el número de pistas princi- pales; 'd' trenes directos por día durante el día; 'hp' es 1 si la carretera está pavimentada y 2 si no; 'ms' es la velocidad máxima del horario; 'ht' es una 'carretera factor de tipo; y 'hl' es el número de carriles de la autopista. Al igual que en Coleman y Stewart se separan Se estimaron modelos para cruces 'crossbucks', 'flashers' y 'gates'. Los modelos para 'intermitentes' y 'puertas' tienen una forma funcional que es similar a la ecuación. 2 pero con sus específicas coeficientes de regresión. Usando estos tres modelos, la dependencia de θ en las variables seleccionadas es representado a continuación. 12 Figura 4. Cómo varían las relaciones θ con el flujo de vehículos Figura 5. Cómo varían las relaciones θ con el flujo del tren 13 Figura 6. Cómo varían las proporciones θ con el número de pistas principales Figura 7. Cómo varían las relaciones θ con la velocidad del tren En el modelo de Mengert, θ depende débilmente del 'volumen del vehículo' y del 'volumen del tren', pero depende en gran medida de los atributos 'número de vías principales' y 'velocidad máxima del horario'. Una puede imaginar fácilmente una mezcla de atributos de cruces en un estudio de antes y después de tal manera que, si Mengert los resultados fueran verdaderos, entonces se obtendrían las estimaciones de la Tabla 1 y la Tabla 2. Por lo tanto, los lo más que se puede decir es que los resultados del estudio de regresión transversal de Mengert no son inconsistente con las estimaciones de los estudios de antes y después en la Tabla 1 y la Tabla 2. 1 . Esto, sin embargo, es lo máximo que se puede decir. En general, cuando no se conocen los atributos de las entidades tratadas, no se puede decir si los θ de los estudios transversales confirman o niegan los θ del antes-después estudios. Por otro lado, las diferencias entre los modelos Coleman-Stewart y Mengert son demasiado grandes para atribuirse a errores de esti- mación; los resultados de estos dos modelos son inconsistentes. 1 Es interesante notar que en el Modelo de asignación de recursos (Hitz, 1986, pp. 54-57) en el que los modelos de Mengert se utilizan para predecir el número de accidentes, los resultados de los estudios antes y después se utilizan para estimar la seguridad efecto de los dispositivos de
  • 9. advertencia. Es como si no se confiara en los resultados de la sección transversal para la esti- mación del efecto de seguridad. 14 Saltando a través de la división de casi tres décadas, Park, Saccomanno y Lai recientemente presentó tres artículos, tres modelos de regresión diferentes, todos utilizando los mismos datos 1 . Los tres artículos asumen, descaradamente 2 , que lo que uno encuentra por regresión en datos de sección transversal puede ser utilizado para predecir la implementación de contrame- didas de efecto de seguridad 3 . En el primer artículo, Saccomanno y Lai (2005) utilizaron el análisis factorial para formar cinco grupos de cruces Después de eso, un modelo de regresión como el de la ecuación. Se ajustaron 3 a cada grupo. A diferencia de Coleman, Stewart y Mengert, quienes ajustaron ecuaciones separadas a cruces con crossbucks, flashers y gates, Saccomanno y Lai hacen de 'Warning Device' una variable dentro la ecuacion. Otra diferencia es que mientras Coleman, Stewart y Mengert eligieron una forma modelo que permite que la dependencia del tráfico de carreteras y trenes sea altamente no lineal (ver, por ejemplo, la Figura 1 y la ecuación. 2) Saccomanno, Lai (y luego Park) eligieron una ecuación modelo que no puede representar tal no linealidad. Los coeficientes de regresión relevantes se encuentran en la Tabla 3. AccidentFrequency (RoadTraffic TrainTraffic)e β 1,wd (WarningDevice) β 2 (RoadSpeed). + = × ecuación 3 Tabla 3. Coeficientes de regresión de Saccomanno y Lai (2005, p.19) Grupo 1 2 3 4 5 β 1, Puertas 0 0 0 0 0 β 1,Crossbucks 0,87 0,78 1,21 1,28 1,53 β 1, intermitentes 0,63 * * * 0,91 * No estadísticamente significativo Parecería que para cruces en el Grupo 1 aquellos con cruces tienen e 0.87 =2.39 veces el número de accidentes como cruces con puertas. Reemplazar crossbucks con puertas entonces parecen reducir los accidentes por un factor de 1/2.39=0.42. (La estimación imparcial de antes-después estudios mostrados en la Tabla 2 fue 0.32). Los cru- ces con intermitentes tienen e 0.63 =1.88 veces el número de accidentes con puertas y una actualización de luces intermitentes a puertas parecería reducir los accidentes por 1/1,88=0,53. (La estimación imparcial en la Tabla 2 fue 0,55). Los cruces con intermitentes tienen 1,88/2,39=0,79 veces los accidentes de cruces con crossbucks. (La estimación imparcial en la Tabla 2 era 0. 49.) Si estas diferencias reflejan las deficiencias del modelo, la imprecisión del antes y el después estimaciones o el hecho de que los cruces en la Tabla 2 eran diferentes de los cruces en el Grupo 1 no se puede decir De hecho, para los cruces en el Grupo 5, los números son bastante diferentes. Aquellos con los crossbucks tienen 4,62 veces más accidentes que los cruces con puertas (en comparación con 2,39 1 La base de datos fue el inventario de pasos a nivel, exposición y frecuencia de colisión para 10,449 pasos públicos en Canadá durante 1993- 2001 2 Así, en la página 8 de Saccomanno y Lai (2005) los autores dicen que: “Si la contramedida resulta en cambios en ya sea la pertenencia al grupo o la variable que se encontró significativa en el modelo de predicción, estimar el número esperado de colisiones antes y después de la contramedida”. 3 El siguiente comentario curioso está en Park y Saccomanno (2005a): “. intentamos establecer una estadística relación entre colisiones y diversos factores de ingeniería (es decir, contramedi- das) sin inferir causalidad. estos modelos son útiles en el apoyo a la toma de decisiones con la evaluación del tratamiento rentable para contramedidas específicas”. (p.3) ¿Por qué predecir cuál será el efecto de implementar una contramedida no equivale a cau- salidad? aclarado.
  • 10. 15 en el Grupo 1), los cruces con luces intermitentes tienen 2,48 veces el número de accidentes con puertas y por lo tanto los cruces con luces intermitentes tienen 2,48/4,62=0,53 veces los accidentes de los cruces con cruces En el segundo artículo, Park y Saccomanno (2005b) intentan rectificar lo que ven como una fracaso común de los modelos de regresión para producir estima- ciones sensibles del efecto de contramedida 1 . Como en el primer documento, la mejora espe- rada reside en un enfoque de dos pasos. El primer paso es dividir los cruces en grupos sensibles por sus atributos, utilizando una estructura de árbol binario. los El segundo paso es, como antes, ajustarse a un modelo de regresión como el de la ecuación. 3. La innovación está en que las agrupaciones obtenidas en el primer paso actúan como variables cuya finalidad es captar posi- bles interacciones complejas. Cuando estos términos de interacción no están incluidos en la ecuación del modelo y variables como Se omiten 'Clase de carretera' y 'Velocidad de carretera', por lo que se reemplazan los crossbucks con luces intermitentes. Se estima que reduce los choques a 0.11 de su número (¡una reducción del 89%!). Este resultado exagerado puede tomarse como evidencia de que cuando las variables importantes no están representadas en una regresión, no se puede confiar con el propósito de estimar el efecto de seguridad de la acción. Sin embargo, cuando el términos de interacción se incluyen en la ecua- ción de regresión, los resultados cambian. Así, por ejemplo, si se supone que la conversión de crossbucks a flashers se lleva a cabo en 'Otros' caminos el accidente la reducción se estima en sólo un 28% mientras que en 'Carreteras Arteriales/Colectoras o Locales' sería 75%. El tercer artículo (Park YJ y Saccomanno 2005a) se basa en el primero en ese apartado Se ajustan modelos de regresión 2 a varios grupos homogéneos de cruces y a partir del segundo papel en el que se utiliza el mismo algoritmo de árbol binario para agrupar los cruces. Solo cruce de atributos que no se pueden cambiar (por ejemplo, clase de carretera o región) se utilizaron para la agrupación con la esperanza de que esto eliminaría el efecto de estos atributos en la regresión 3 . Los resultados de interés aquí están en la tabla 4. 1 “. los modelos actuales de predicción de colisiones para pasos a nivel tienden a tener una estructura simple y están mal especificados en términos de importantes factores de contramedi- das. Como tales, tienen un uso limitado en el apoyo a la toma de decisiones para el desarrollo y evaluación de contramedidas”. (pág. 2) 2 Por alguna razón que no se explica, en el segundo artículo se consideró apropiado un modelo Binomial Negativo, pero En el tercero se utilizó el modelo de Poisson. 3 Si bien la técnica de agrupación es nueva, la idea es similar a la que hicieron Coleman y Stewart en 1976 cuando ajustaron modelos separados para 12 grupos de cruce por ubicación (urbana o rural), vías (únicas o múltiples) y dispositivo de advertencia (crossbucks, intermitentes o puertas). dieciséis Tabla 4. Multiplicadores de conversión basados en coeficientes de regresión de Park y Saccomanno (2005, Tablas 3 y 4) y de la Tabla 2. Crossbucks a Intermitentes Crossbucks a puertas Todas las variables de control 0,18±0,01 0,06±0,01 Solo relacionado con la carretera Variables de control 0,22±0,02 0,06±0,006 Solo re- lacionados con el ferrocarril Variables de control 0,15±0,01 0,05±0,005 Modelos convencionales que contienen control atributos tales como clase de carretera, número de vías, etc. No relacio- nadas con ferrocarriles o carreteras Variables de control 0,19±0,01 0,05±0,005 Arterial o Colector 0,22±0,03 0,06±0,01 Otras Carreteras con Múltiples Pistas 0,31±0,08 0,11±0,02 Carreteras Lo- cales con Sencillo Pista 0,21±0,02 0,09±0,02 Modelos para cuatro cruce de clases clasificado por control atributos Otros caminos con solo pista 0,26±0,14 0,34±0,36 De la Tabla 2 Sin sesgo
  • 11. Antes-Después 0,49 0,32 ± un error estándar La parte superior de la Tabla 4 es para modelos de regresión de modelos convencionales en los que la carretera y los atributos del carril (como el ancho de la superficie o el ángulo de vía) se introdujeron como variables; la mitad parte es para modelos de regresión en cuatro clases de cruces y la última fila es de la Tabla 2. Considerando la magnitud de los errores estándar, las estimaciones en las partes superior y media de La tabla 4 son bastante similares. Se puede concluir que las estimaciones son poco sensibles a la inclusión o exclusión de las variables Carretera y Ferrocarril (y de clasificación). Como se ha señalado anteriormente, los tres artículos usaban los mismos datos y el mismo formulario modelo. Aún así, dependiendo de cuál se usaron las variables, qué técnica de agru- pación se implementó y qué distribución se seleccionó (Poisson o Binomial Negativo), se obtuvo una variedad de resultados. Además, colectivamente, estos estimaciones son diferentes de las obtenidas por Coleman-Stewart, por Mengert, y en estudios antes-después. Un breve resumen de los hallazgos del estudio de caso puede ser útil: 1. Los estudios de antes y después del efecto de seguridad de los dispositivos de advertencia parecen haber arrojado resultados consistentes (incluso si sesgados). 2. El inconveniente de un estudio de antes y después es que, por lo general, solo se obtiene un efecto de seguridad "promedio". estimado. Si el efecto de seguridad depende de hecho de los atributos de la unidad tratada, como es Es prudente suponer que el conocimiento únicamente del "efecto promedio" ofrece poca orien- tación para acción práctica cuando el objetivo es aplicar un tratamiento donde hará el mayor bien. 3. Si el efecto de seguridad depende de los atributos de las entidades tratadas, no se puede decir si los resultados de un estudio de antes y después son consistentes con los resultados de otro estudio sin que: una. conocimiento de los atributos de las entidades en el estudio antes-después y 17 b. conocimiento de cómo el efecto de seguridad depende de estos atributos. 4. Los estudios de regresión basados en datos transversales produjeron resultados muy varia- dos. Se puede concluir que la predicción del efecto basada en el modelo de Coleman-Stewart es tan diferente de lo que se ha encontrado en los estudios de antes y después que probablemente estén equivocados. Sin embargo, uno no puede decir por qué están equivocados. Los resultados de Mengert no son inconsistentes con lo que muestra el antes y el después. Incluso cuando se utilizó la misma base de datos y el mismo modelo forma asumida, como en los artículos de Saccomanno, Lai y Park, se obtuvieron resultados muy variados. obtenido. No se puede decir cuánto de esto refleja el hecho de que el mismo trato cuando apli- cado a diferentes sitios producirá diferentes resultados y cuánto se debe a la supuestos hechos en el proceso de modelado o las deficiencias de los datos. En conjunto, los resultados obtenidos por regresión sobre datos transversales no inspiran confianza. Está difícil saber qué resultado creer. 5. Ni Coleman, Stewart ni Mengert pretendían que sus resultados se usaran para predecir el efecto de las contramedidas. Por el contrario, Saccomanno, Lai y Park (y muchos otros) hacen de la predicción del efecto de la contramedida la piedra angular de su regresión trabajar. Este estudio de caso no apoya mucho la esperanza de que tal programa de la investigación dará resultados. Este estudio de caso es solo una anécdota y sus conclusiones no deben generalizarse.
  • 12. Sin embargo, la impresión es que los modelos de regresión, cuando se basan en datos transver- sales, pueden conducir a a resultados que no inspiran confianza. El hecho de que el θ obtenido de alguna regresión modelos parece depender de los atributos de las entidades tratadas, y por lo tanto es atractivo en aplicaciones prácticas, puede ser algo así como una ilusión; no es más que un subproducto de las suposiciones hecho por el modelador sobre la forma funcional de la ecuación del modelo y sobre qué variables están representados en ella. Hacer que el efecto del tratamiento sea una función del atributo de las unidades tratadas, como ha sido intentado por Saccomanno, Lai y Park es importante y debe continuarse. Hay una gran diferencia entre los estudios de antes y después y las regresiones basadas en datos transversales que no surgieron naturalmente en la discusión anterior y, sin una mención de lo cual, esta sección estaría incompleta. Cuando se compara la seguridad de una unidad antes y después del tratamiento, la unidad sigue siendo la misma (es básicamente el mismo camino o intersección, utilizado por el mismo tipo de personas, en el mismo lugar, clima, etc.). Por lo tanto, es razonable esperar que uno puede dar cuenta de lo que ha cambiado desde el período 'antes' al período 'después'. En cambio, en una sección transversal estudio uno compara entidades 'con atributo A' (digamos, crossbucks) a diferentes entidades 'con atributo B' (digamos, luces intermitentes). La unidad proporcionada por el conocimiento de que 'la unidad sigue siendo la misma' se aplica ahora. No se puede estar seguro de que después de tener en cuenta las diferencias acerca de qué tenemos datos (tráfico y volúmenes de trenes, número de vías, etc.) no hay otra sistemática diferencias sobre las entidades 'con A' y 'con B' sobre las que no hay información. Hay la sospecha omnipresente de que las entidades tienen atributo A pero no B por una buena razón y que estos las razones no se conocen completamente y son difíciles de explicar en un modelo de regresión. Así, por ejemplo, un grado el cruce puede tener luces intermitentes y no crossbucks porque tenía un historial previo de accidentes, tal vez debido a las quejas de los usuarios de la carretera que sufrieron cuasi accidentes, debido a la existencia de un listado de prioridades basado en alguna fórmula, etc.; ninguno de estos es fácil de capturar en una regre- sión. 18 Habiendo presentado los muchos problemas dentro del marco tangible de la seguridad en los pasos a nivel, el El próximo paso es examinar lo que la literatura científica tiene que decir sobre el tema de causa-efecto en estudios observacionales. 19 3. CAUSA, EFECTO, CONFUNDIMIENTO Y CONSISTENCIA El concepto de causa es res- baladizo. Algunas de las dificultades pueden evitarse distinguiendo entre dos cuestiones diferen- tes: Pregunta A: ¿Cuál es el efecto de seguridad de un tratamiento (una causa)? Pregunta B: ¿Cuáles son las causas de ciertos eventos (p. ej., las causas de los camiones grandes)? fallas 1 )? Cualesquiera que sean las dificultades para responder a la pregunta B, no son motivo de preocupación; aquí hacemos una pregunta A. Especificamos qué causa (tratamiento) es de inte- rés y preguntamos sobre su efecto. Si bien es claro qué 'causa' nos interesa, la definición de 'efecto' requiere un cuidado considerable. 2 3.1 Definición de causa y efecto. La preocupación por la validez de las inferencias causales basadas en datos es común a muchos disciplinas: educación , medicina, sociología , etc. Naturalmente, mucho se ha escrito sobre el tema. El marco de discusión que se utilizará a continuación fue proporcionado por Holland (1986). Sus méritos son rigor y claridad y por tanto la promesa de que pueda adaptarse a las circunstancias de la seguridad vial investigar. Sea 'U' una población de entidades y 'u' una entidad específica de esta población. Porque por 'efecto' entendemos el resultado de un cambio en la naturaleza o magnitud de una causa, y el
  • 13. cambio es siempre de algo a otra cosa, necesitamos especificar (al menos) dos designaciones de causa, decir 't' y 'c' 3 . Cada entidad u está asociada con un valor Y(u) - la 'variable de res- puesta'. De este modo, Y t (u) es el valor de la variable de respuesta que se observaría si la entidad u estuviera expuesta a la causa ty Y c (u) es el valor que se observaría en la misma unidad si estuviera expuesta a la causa c. El efecto de la causa t en relación con la causa c en la entidad u se describe completamente comparando 4 Y t (u) y Y c (u). Rubin (1990) llama a esto el 'efecto causal a nivel de unidad'. El “Problema Fundamental de la Inferencia Causal” 5 es que normalmente es imposible tanto tratar y no tratar la misma unidad 6 y por lo tanto es imposible observar 7 en u tanto Y t (u) como Y c (u). 1 Usaré los términos 'accidente', 'choque' y 'colisión' para significar lo mismo. 2 Seguiré la notación y exposición de Holland (1986) quien se refiere a su descripción como el Modelo de Rubin para Inferencia causal basada en Rubin (1974; Rubin 1977; Rubin 1978; Rubin 1980) un formalismo que apareció por primera vez en la literatura estadística en Neyman (1923). 3 En el artículo de Holland, 't' puede connotar tratamiento y 'c' control. Sin embargo, es importante no precipitarse y no pensar en 'c' como grupo de control. En este punto, 'c' es una causa o un tratamiento, al igual que 't'. 4 Las medidas comúnmente usadas del efecto causal para una entidad son Y t (u)-Y c (u) y Y t (u)/Y c (u), (ver, por ejemplo, Rubin 1990). 5 Holanda (1986), página 947. 6 El ejemplo de Holland es un nuevo programa para enseñar matemáticas a estudiantes de cuarto grado que luego son evaluados al final del año. Cierto alumno de cuarto grado podría estar expuesto a este nuevo programa o no, pero no ambas cosas. Por lo tanto, para cualquier u, se puede medir directamente Y t (u) o Y c (u). 7 Dado que Y t (u) o Y c (u) deben permanecer inobservados y, sin embargo, ambos son nece- sarios, uno de ellos es del tipo hipotético naturaleza de lo que se observaría si se hubiera produ- cido una acción cuando, de hecho, no se produjo: un contrafactual. Groenlandia et al. (1999) explican: “Un ejemplo típico es el de McMahon y Pugh, quienes afirman que '. una asociación puede clasificarse como presuntamente causal cuando se cree que, de haberse alterado la causa, se habría producido el efecto. 20 Holland dice que hay dos soluciones generales a este problema fundamental; el cientifico solución y la solución estadística. Él describe la solución científica así: “Por ejemplo, al estudiar cuidadosamente el comportamiento de una pieza de equipo de laboratorio, un científico puede llegar a creer que el valor de Y c (u) medido en un momento anterior es igual al valor de Y c (u) para el experimento actual. Todo lo que tiene que hacer ahora es exponerte a ti. y mide Y t (u) y ha superado el Problema Fundamental de la Inferencia Causal. Tenga en cuenta, sin embargo, que este científico hipotético ha hecho una homogeneidad no comprobable suposición. Mediante un trabajo cuidadoso, puede convencerse a sí mismo y a los demás de que esta suposición es correcto 1 , pero nunca puede estar absolutamente seguro.” (pág. 947) El “supuesto de homogeneidad no comprobable es que el valor de Y c (u) observado en el pasado es lo que el valor de Y c (u) sería si se hubiera observado en el presente si se aplicara 'c' en lugar de 't'.
  • 14. La solución estadística descrita por Holland es desviar la atención del efecto a nivel de unidad (de la causa t en la entidad u relativa a la causa c) al 'efecto promedio' de la causa t relativa a la causa c cuando el promedio es sobre todas las entidades de la población U. Rubin (1990) llama a esto el 'típico efecto casual a nivel de unidad" o "efecto causal a nivel de población". La idea central es que algunas entidades de U son tratados y permiten la estimación del valor esperado E{Y t (u)} mientras que las entidades restantes de U se dejan sin tratar y permiten estimar E{Y c (u)}. El efecto promedio T se describe entonces comparando E{Y t (u)} y E{Y c (u)}. Así como la solución científica depende de una suposición no comprobable, también lo hace la estadística. solución. Aquí la suposición no comprobable es que la respuesta promedio a t de las entidades tratadas es ¿Cuál sería la respuesta promedio a t de todas las entidades en U si se tratara 2 , y que el promedio respuesta a c de las entidades no tratadas es cuál sería la respuesta promedio a c de todas las entidades en U, todos habían quedado sin tratamiento 3 . Así como el científico, el estadístico nunca puede estar seguro que esta suposición es correcta. Sin embargo, mediante un trabajo cuidadoso (que implica decidir qué entidades son tratados y cuáles no) el estadístico puede convencerse a sí mismo y a otros de que la suposición está justificado. En la "solución estadística", la plausibilidad de la suposición no comprobable se basa en aleato- rización y/o emparejamiento. Ambos requieren que el experimentador tenga control sobre qué unidad cambió.' …la alteración de la condición antecedente (causa) y el posterior cambio en el resultado (efecto) son contrario a lo que de hecho se observó; es decir, son contrafactuales ”. (pág. 30) 1 La “suposición de homogeneidad” de los científicos es la creencia de que “el valor de Y c (u) medido en un momento anterior es igual a cuál sería el valor de Y c (u) para el experimento actual”. Esto también es un contrafactual como es obvio si uno lo reformula para decir: “que el valor de Y c (u) medido en un momento anterior es el que se obtendría en el presente experi- mente si se aplicó la causa 'c' en lugar de la causa 't'. Parece ser el mismo tipo de homogeneidad contrafactual suposición que podría hacer un analista en un estudio de antes y después, la creen- cia de que los accidentes "antes del tratamiento" materializarse en el período 'después del trata- miento', si la entidad no ha sido tratada. El problema es que el científico en el al laboratorio le resultaría más fácil convencerse a sí mismo y a los demás de que la suposición es correcta que al Analista de antes y después. Las razones de la diferencia son obvias; el laboratorio permite el control de las condiciones y replicación con poca aleatoriedad, el entorno de observación no. 2 La suposición sería claramente incorrecta si las entidades se seleccionan para el tratamiento porque es más probable que responder a ella que las entidades dejadas sin tratar. 3 La suposición sería claramente incorrecta si la selección para el tratamiento estuviera motivada por el historial de accidentes de las entidades y no se tuvo en cuenta la regresión a la media. 21 recibe tratamiento y cuál no. Con aleatorización, cuando las entidades de U se asignan a t o c independientemente de sus atributos (incluida la variable de respuesta), uno puede esperar que ambos tratados y las entidades no tratadas son representativas de la población U. Con em- parejamiento, cuando los pares pueden se forman que son idénticos en los atributos 1 , y uno del par se asigna a t, se obtiene la plausibilidad por los mismos motivos. La creencia fundamental subyacente de la aleatorización y el emparejamiento estrategias es que la respuesta de una unidad a un tratamiento está determinada por algunos de sus atributos: el atributos relevantes para la respuesta, y que las unidades con atributos relevantes para la respuesta idénticos tendrán respuestas idénticas al tratamiento (ya sea 'c' o 't').
  • 15. Cuando el estadístico no tiene control sobre la asignación de entidades a t o c, como es cierto en los estudios observacionales, la pregunta sigue siendo la misma: ¿Es cierto que la respuesta (promedio) a t de las entidades tratadas es cuál sería la respuesta (promedio) a t de todas las entidades en U si tratados, y que la respuesta promedio a c de las entidades no tratadas es cuál sería el promedio respuesta a c de todas las entidades en U, ¿habían quedado todas sin trata- miento? Sin embargo, ahora los medios por contestarla afirmativamente faltan. Holland (1986) remite al lector a otras fuentes para su posterior examen. En palabras de Holland , “las inferencias causales proceden de los valores observados. y de supuestos que abordan el Problema Fundamental de la Inferencia Causal pero que por lo general son no comprobable.” (pág. 948). Para progresar uno tiene que hacer la pregunta de seguimiento: ¿Qué hace que el suposiciones no comprobables tan plausibles que el científico o estadístico puede "convencerse a sí mismo y otros” que la suposición es correcta? Holland no persigue esta pregunta para el científico excepto para decir que "La ciencia ha progresado mucho utilizando este enfoque” y que “…es un lugar común en la vida cotidiana como bien” (p. 947). Es útil indagar un poco más. ¿Qué justifica realmente la creencia del científico de que “el valor de Y c (u) medido en un momento anterior” es igual a lo que sería el valor de Y c (u) ahora bien, ¿no se había aplicado la 't'? La justificación parece descansar en la experiencia de que siempre que los cien- tíficos midieron Y c (u) en momentos anteriores (o hicieron mediciones repetidas de cantidades bajo circunstancias similares), los valores medidos eran todos iguales (dentro del error de me- dida). Aunque esto no significa necesariamente que el patrón pasado persistiría siempre, es en- teramente justificable creer que así sería. La creencia en la 'homogeneidad de la naturaleza' es una base respetable de creencias causales. Como se mencionó anteriormente, la justificación de Holland (y Rubin) de la suposición no com- probable sobre el que descansa la solución estadística deriva de la aleatorización (es decir, la independencia entre la decisión de asignar entidades a la causa 'c' o 't' y los atributos relevantes para la respuesta de estos entidades.) Esto difiere de la justificación del científico de varias ma- neras. Primero, el científico estimación de Y c (u) se basa en experiencias del pasado (o de otro tiempo) mientras que el estadístico utiliza la experiencia contemporánea de entidades dejadas sin tratar. En segundo lugar, la suposición del científico está en el nivel de una sola unidad (o de unidades casi idénticas) mientras que la suposición del estadístico se refiere a promedios sobre un conjunto (grande) de diferentes unidades. En tercer lugar, la "homogeneidad de la suposición de la naturaleza es que, en el ambiente controlado del laboratorio, hay razón para cree que si en la unidad u Y c (u) se obtuvo en un momento también se obtendría en otro momento. 1 En sentido estricto, sólo deben ser evaluados aquellos atributos que tienen algo que ver con la respuesta al tratamiento. considerado en el emparejamiento. Estos se denominarán atributos 'relevantes para la respues- ta'. 22 La creencia de la “homogeneidad de la naturaleza” del estadístico parece ser que dos con- juntos de entidades que tienen la misma distribución de atributos 1 se puede esperar que tengan la misma respuesta promedio a causa 'c'. La comprensión de que todos los conceptos de causalidad requieren una homogeneidad no com- probable. suposición y que las suposiciones de homogeneidad del científico y del estadístico son diferentes y tener diferentes justificaciones es liberador. Crea la oportunidad y la licencia para buscar y enunciar medios adicionales para justificar los supuestos de homogeneidad, medios que pueden
  • 16. adecuarse a la realidad de estudios observacionales. La justificación del estadístico de la supo- sición de homogeneidad se basa en la capacidad de decidir qué entidad obtiene 'c' y cuál obtiene 't'. En los estudios observacionales esto no es posible. Sin embargo, a un nivel más fundamental, la justificación del estadístico es que (debido a aleatorización y/o emparejamiento) es razonable creer que las entidades con 'c' tienden a tener los mismos atributos relevantes para la respuesta que aquellos con 't'. Quizá haya medios por los cuales uno pueda proporcionar a los estudios observacionales una justificación que se basa en una 'igualdad de respuesta relevante' argu- mento de los atributos. De manera similar, puede ser posible hacer autostop en los faldones del abrigo del científico. cuyo supuesto de homogeneidad era que si Y c (u) se obtenía en el pasado también sería obte- nido en el futuro. Por lo tanto, la pregunta es si se puede afirmar y justificar la homogeneidad suposiciones para estudios observacionales de antes y después y estudios transversales obser- vacionales. Considere primero un estudio observacional en el que se aplica un tratamiento a las unidades. El momento de la el tratamiento define, para cada unidad, un período de pretratamiento y de postratamiento. Llámalo un estudio observacional antes-después. Imagine un experimento de laboratorio para determinar el coeficiente de Expansión térmica de una barra de metal. Se trata de medir la longitud de la varilla antes y después calentar y quizás aplicar algunas correcciones para tener en cuenta los cambios de temperatura y presión en el laboratorio. La idea es que la longitud de la varilla antes del experimento, después de la corrección por Las diferencias de temperatura y presión entre el tiempo "antes de calentar" y "después de calentar" son cuál sería la longitud de la barra en el momento 'después del calentamiento' si la barra se dejara sin calen- tar. Siguiendo el ejemplo del científico, lo que debe mostrarse para los estudios observacionales de antes y después es que al usar valores observados del pasado (y al complementar esto con información sobre cómo algunas circunstancias relevantes han cambiado desde el período 'an- tes' al período 'después') es posible predecir el valor de Y c (u) para el período 'después'. Si fuera posible demostrar que el los valores predichos y medidos de Y c (u) están repetidamente cerca uno del otro en una variedad de circunstancias, entonces el 'científico observacional' tendría las bases necesarias para 'convencer a sí mismo y a los demás” que esta marca del supuesto de homogeneidad está justificada. Sería un justificación similar a la del científico que (después de 'correcciones' por cambios) lo que ha sido observados en el pasado se observarían en el pre- sente si no se aplicara ningún tratamiento. Si y se puede demostrar que los valores pronosticados y observados de Y c (u) están 'repetidamente cerca uno del otro' otro' es una pregunta empírica que puede ser respondida a través de un programa de investigación. por cuanto en investigación sobre seguridad vial aún no se ha emprendido un programa de investigación de este tipo, aún no es posible decir si en estudios observacionales de antes y después con unidades tratadas, los juicios de causalidad puede estar bien fundamentado en el paradigma de un 'científico obser- vacional'. Pero la perspectiva de éxito es excelente. Considere a continuación un estudio sobre el efecto de seguridad del cambio de 'c' a 't' en el que las unidades que tienen 'c' se comparan con otras unidades que tienen 't'. Llámalo un cruce observacional. 1 Solo la distribución de atributos que afectan la respuesta de las entidades a la causa c debe ser la misma. 23 estudio de sección. En esta circunstancia, la creencia de que si nada más cambiara el pasado se parecería a el presente no sirve. Ahora, la suposición que se justifica es que las unidades que
  • 17. se encuentra que tienen 't' han respondido a 'c' de la misma manera que las unidades que tienen 'c'. Para justificarlo hay que invocar la misma creencia fundamental sobre la que descansa la solución estadística; es decir, que la respuesta de un unidad a 'c' o 't' está determinada por sus atributos relevantes para la respuesta (y que las unidades con los atributos idénticos relevantes para la respuesta tienen respuestas idénticas a 'c' y 't'). En resumen, para justificar la suposición no comprobable en un estudio transversal observacional uno debe ser capaz de demostrar que las unidades que tienen 'c' tienen los mismos atributos relevantes para la respuesta que las uni- dades que tienen 't'. En estudios transversales suele ser difícil proporcionar la justificación reque- rida. Las dificultades son tanto práctico como conceptual. Para ilustrar, usaré la configuración de los pasos a nivel de ferrocarril y carretera. presentado en el Capítulo 2. Algunos cruces tienen 'crossbucks', otros tienen 'flashes' y hay razones para esto diferencia. Las razones son de dos tipos, ambas relacionadas con la práctica profesional. El primer tipo de la razón tiene sus raíces en la eficiencia económica. En general, cuanto más tráfico atiende una instalación, más caro el tratamiento 1 que recibe. En el marco específico de la seguridad en los pasos a nivel, los sitios con más tráfico de vehículos y trenes tenderá a estar equipado con la advertencia más costosa dispositivos. Crossbucks cuestan menos que las luces intermitentes que, a su vez, son menos costosas que las puertas, y las puertas son más baratos que la sepa- ración de grados. Uno debe suponer razonablemente que tanto los vehículos como los trenes el tráfico son atributos relevantes para la respuesta. Por lo tanto, es imposible afirmar que "unidades encontradas para tienen 'c' (por ejemplo, crossbucks) tienen los mismos atributos relevantes para la respuesta que las unidades que tienen 't' (digamos, intermitentes) a menos que uno pueda encontrar muchos cruces que son similares en el tráfico de trenes y vehículos pero difieren en el dispositivo de advertencia. La dificultad práctica es que, debido a la prevalencia de la sensatez práctica profesional, se encontrarán pocos cruces de este tipo. Supongamos ahora que la dificultad práctica puede superarse y que un número suficiente de cruces coincidentes en el tráfico de vehículos y trenes (y en varios otros atributos relevantes para la respuesta) como el número de vías, el entorno urbano o rural, la velocidad del tren, el triángulo visual, etc.). Ahora uno debe preguntarse por qué algunos de los cruces ostensiblemente similares tienen crossbucks y otros tienen luces intermitentes No se debe suponer que la elección se ha hecho sin razón. De lo contrario, la elección de un dispositivo de advertencia a menudo se basa en consideraciones del historial de accidentes pasados, público presión, cuasi accidentes y de un juicio profesional sobre por qué algún sitio se beneficiaría de intermitentes y otro no. En conse- cuencia, la siguiente dificultad conceptual insalvable surge: si los cruces ostensiblemente simila- res reciben diferentes dispositivos de advertencia por alguna razón, entonces uno no puede afir- mar que "las unidades que tienen 'c' tienen los mismos atributos relevantes para la respuesta que las unidades encontrado tener 't'”. Las diferencias en los atributos relevantes para la res- puesta pueden ser difíciles de identificar o describir, pero se debe suponer que existen. En resumen, para los estudios observacionales de antes y después podría sugerir un programa de investigación por que se podría establecer la confianza en el supuesto de homogeneidad no comprobable. Hay un buena oportunidad para que tenga éxito. Para estudios transversales ob- servacionales no sé cómo hacer asi que; No puedo imaginar un programa de estudio con buenas posibilidades de éxito. 1 La práctica profesional relevante se captura en estándares, directrices, garantías, etc., todos los cuales están escritos de manera que las instalaciones con más tráfico obtienen las
  • 18. características de diseño, marcas, dispositivos de control de tráfico y mantenimiento más caros debido a que es en instalaciones de alto uso donde el gasto puede justificarse por la seguridad y otros ahorros. 24 3.2 Confusión e intercambiabilidad en estudios observacionales de secciones transver- sales de carreteras La seguridad. La columna vertebral de la Sección 3.1 es el marco Holland-Rubin que se adapta a la circuns- tancia en la que algunas unidades fueron efectivamente tratadas. Este marco no simpatiza con el circunstancia del estudio transversal observacional en el que se encuentra que algunas unida- des tienen 'c' y se encuentra que otros tienen 't'. Dado que es el estudio transversal observacional el que está en el centro de nuestra investigación, en lo que sigue, haré uso del trabajo de otros autores que están más abierto a la posibilidad de interpretación causal en estudios transversales. El supuesto de homogeneidad para los estudios observacionales transversales 1 está estrecha- mente relacionado con la noción de 'intercambiabilidad' y de 'confusión'. En este contexto Pearl (2000) escribe: “Conceptualmente, la conexión entre confusión e intercambiabilidad es la si- guiente. Si nos comprometemos a evaluar el efecto de algún tratamiento, debemos asegurarnos de que cualquier respuesta la diferencia entre el grupo tratado y el no tratado se debe al trata- miento en sí y no (debido) a algunas diferencias intrínsecas entre los grupos que no están rela- cionadas con el tratamiento. En otra palabras, los dos grupos deben parecerse entre sí en todas las características que tienen relación con el variable de respuesta. En principio, podríamos ha- ber terminado la definición de confusión en este punto; declarando simplemente que el efecto del tratamiento no se confunde si los grupos tratados y no tratados se parecen entre sí en todas las características relevantes. Esta definición, sin embargo, es demasiado verbal en el sentido que es muy sensible a la interpretación de los términos "semejanza" y "relevancia". es menos informal, GR 2 usó el 3 giro de permutación hipotética de De Finetti ; en lugar de juzgar si dos grupos son similares, se instruye al investigador para que imagine un intercambio hipoté- tico de los dos grupos (el grupo tratado deja de ser tratado y viceversa) y luego juzgar si los datos observados en el swap se distinguirían de los datos reales.” (p. 196) Para desarrollar los puntos de vista de Greenland-Robins (GR) a los que se refiere Pearl, me basaré en el artículo de Greenland et al. {Greenland, 1999 1166 /id.) que proporciona una formalización de confuso Para evitar la duplicación, convertiré la formalización GR en la notación 'Holanda' introducido anteriormente. Mientras que el punto de partida tanto para Holland-Rubin como para Greenland et al. es lo mismo -el enfoque contrafáctico de causa y efecto- hay diferen- cias importantes entre las dos formulaciones. Holland (1986), cree en el lema “No Causation Without manipulación” y dice que: “Debido a que la experimentación es un instrumento científico y herramienta estadística y que a menudo introduce claridad en las discusiones de casos espe- cíficos de causalidad, me baso descaradamente en el lenguaje y el marco de los experimentos para el modelo de inferencia causal”. (p.946) Los experimentos siempre involucran algún trata- miento o manipulación. En Por el contrario, Groenlandia et al. (1999) basan su razonamiento en una comparación de dos poblaciones de unidades; el tratamiento 't' se aplica a las unidades de población 'A' y el tratamiento 'c' a las unidades de población 'B': una comparación transversal. 1 Que las unidades que tienen 'c' tienen los mismos atributos relevantes para la respuesta que las unidades que tienen 't'. 2 Aquí se hace referencia a un artículo de Greenland y Robins (1986). 3 (De Finetti 1974).
  • 19. 25 Para definir 'confundir' Groenlandia en al. (1999) argumentan de la siguiente manera. Supon- gamos que nuestro el objetivo es determinar el efecto del tratamiento 1 't' sobre las respuestas Y(u) de unidades en población A, relativo al tratamiento 'c', y que μ es un parámetro de la distri- bución de las respuestas Y(u). A ilustran, Groenlandia et al. (1999) dicen que “Por ejemplo, la población A podría ser una cohorte de pacientes con cáncer de mama, el tratamiento 't' podría ser una nueva terapia hormonal, 'c' podría ser un placebo terapia, y el parámetro μ podría ser la supervivencia esperada o la probabilidad de supervivencia a cinco años de la cohorte.” (pág. 32 ). Sean μ iguales a μ At si se aplica 't' a la población A y μ Ac si se aplica 'c' a la población A. El efecto causal de 't' relativo a 'c' se define en términos de una comparación entre μ At y μ Ac . Si las unidades de A se observan bajo el tratamiento 't' entonces μ At es observable o estimable; sin embargo, μ Ac entonces no se observará 2 . Sin embargo, suponga que esperamos que μ Ac sea igual a μ Bc , donde μ Bc es el valor de μ para unidades de población B con tratamiento 'c'. En el ejemplo anterior, este sería el cohorte de pacientes con cáncer de mama que reciben el placebo. Ahora se puede escribir una definición clara de confuso: “ Decimos que existe confusión si, de hecho, μ Ac ≠ μ Bc , porque entonces debe haber alguna diferencia entre las poblaciones A y B (aparte del tratamiento) que es responsable de la discrepancia entre μ Ac y μ Bc ”. (pág. 32) Para ilustrar el concepto en un entorno de seguridad vial, suponga que un conjunto de vías rurales de dos vías segmentos de carretera tiene cuatro pies de arcenes pavimentados (Carre- teras A en la Figura 8 con tratamiento 't') y otro conjunto de dichos segmentos de carretera tiene dos pies de arcenes pavimentados ((Carreteras B con tratamiento 'c'). Los cuadrados negros en la Figura 8 indican cantidades que se pueden observar (estimar). Por lo tanto, la los observables son μ At (choques/milla-año en las carreteras A que 'se encontró que tenían t') y μ Bc (choques/milla-año en las carreteras B que se 'encontró que tenían c'). La orde- nada de un círculo vacío en La Figura 8 es lo que sería μ en los caminos A si estos caminos tuvieran dos pies de arcenes pavimentados. Círculo 1 y el círculo 2 son solo dos de un número infinito de posibles posiciones del círculo. La posición de un círculo vacío es inobservable porque pertenece a una circunstancia que de hecho no existió: un contrafactual 1 Groenlandia et al. distinguir entre 'tratamiento' como agente administrado por el investigador y 'exposición' que, en medicina, generalmente se refiere a un agente de daño al que las unidades están expuestas sin ninguna premeditación por parte del investigador. Desafortunadamente, en seguridad vial, el tér- mino 'exposición' significa algo completamente diferente (por ejemplo, millas-vehículo de viaje). Para evitar confusiones, usaré 'tratamiento' para referirme a ambos tipos de agentes. 2 Este es el Problema Fundamental de la Inferencia Causal. 26 Figura 8. Aspectos básicos de una comparación transversal La idea principal es usar la cantidad observable en los caminos B (es decir, μ Bc ) para adivinar cuál es el podría ser la ordenada inobservable del círculo vacío. La comparación de μ At con μ Bc no será confundido si el número medio de choques/(milla-año) en las carreteras B (la ordenada del negro cuadrado a la izquierda, μ Bc ), es lo mismo que sería en las carreteras A si tuvieran dos pies de pavimentado hombro, no cuatro (la ordenada del círculo 1). Por el contrario, la comparación de μ At con μ Bc será confundido si el número medio de choques/(milla-año) en las carreteras B ( μ Bc ), no es lo mismo que el número de choques/milla-año sería en las carreteras A si tuvieran un arcén pavi- mentado de dos pies (la ordenada del círculo 2) . Dado que la posición del círculo es desconocida e inobservable, ¿cómo se puede juzgar si ¿Está en la posición 1 (sin confusión) o en la posición 2 (confusión)? Hay dos generales enfoques para disminuir la amenaza del sesgo 1 debido a la confusión en la sección transversal observacional
  • 20. estudios. Un enfoque es la ecualización de atributos ya sea por 'restricción' o por 'coincidencia'. Si las carreteras B pueden elegirse de modo que todos sus atributos relevantes para la respuesta sean los mismos que los de las carreteras Entonces uno puede creer justificadamente que la ordenada del cuadrado completo izquierdo es la misma que la ordenada del círculo. Este enfoque se muestra en la Figura 8 por la flecha horizontal entre la izquierda cuadrado completo y círculo 1. El otro enfoque es la igualación por análisis. El paso de análisis consiste de agregar una 'co- rrección' a μ Bc que tenga en cuenta las diferencias que existen en las respuestas relevantes atributos entre las carreteras A y B. La 'corrección' corresponde a la flecha vertical en la Figura 8 que va del cuadrado lleno al cuadrado vacío que tiene la misma ordenada que el círculo 2. El La ordenada del cuadrado vacío es una estimación de cuál sería el μ de las carreteras B si tuvieran todos los atributos relevantes para la respuesta de las carreteras A, excepto que tienen el tratamiento 'c'. En la Figura 8 esto ordenada es μ B□ . Si la corrección μ B□ - μ Bc es de la magnitud correcta, entonces se puede argumentar nuevamente que la comparación no se con- funde. Ambos enfoques se analizan a continuación. 1 El sesgo en la Figura 8 es la diferencia entre las ordenadas del cuadrado negro de la izquierda y la ordenada del circulo. Así, si el caso es el círculo 1, no hay sesgo; si el caso es el círculo 2 el sesgo es apreciable. 27 3.2.1 Enfoque 1: Igualación de Atributos por Restricción o Coincidencia. La igualación por restricción o emparejamiento es un intento de justificar el juicio de que el La ordenada del cuadrado completo izquierdo en la figura 8 es la misma que la del círculo 1 porque la respuesta relevante los atributos de las unidades en las poblaciones A y B son los mismos 1 . La clave entonces es hacer el unidades de la población A comparables o intercambiables con las unidades de la población B con respecto a los atributos relevantes para la respuesta (o algún índice de los mismos). La otra cara del mismo argumento es que si se piensa que las unidades en A y B difieren en algún atributo relevante para la respuesta, entonces debe juzgarse que existe confusión. En el ejemplo de la pavimentación del arcén, la pregunta es si se puede argumentar de manera convincente que las carreteras B tendrían el mismo número medio de accidentes/milla-año que las carreteras A si ambos conjuntos de las carreteras tenían el mismo ancho de arcén pavimen- tado. Para argumentar así uno tiene que saber qué atributos son probable que afecte la respuesta (choques/milla-año) y muestre que son iguales en ambos conjuntos. En este caso Los atributos relevantes para la respuesta son muchos: cantidad de tráfico, entorno urbano o rural, condiciones climáticas. condiciones, características de los usuarios de la vía, como distribuciones de edad, género, in- gresos o educación; la carretera antiguo; terreno, mantenimiento invernal, etc. Por lo tanto, la circunstancia de ancho de arcén pavimentado corresponde al círculo 2 que tiene una ordenada diferente que el cuadrado completo izquierdo. La respuesta a la La pregunta que se plantea es que, en el ejemplo del ancho de la banquina pavimentada, no se puede argumentar de manera convincente que las carreteras que tienen 't' son intercambiables con las carreteras que tienen 'c'; la confusión debe ser juzgado existir. Es decir, mediante una comparación directa, los obser- vables μ Bc y μ At uno no pueden determinar el efecto de seguridad de arcenes pavimentados de dos pies versus cuatro pies. Para hacer que las dos poblaciones sean comparables o intercambiables por 'restricción' sería necesario estratificar los caminos en A y los caminos en B en celdas que sean homogéneas en todos los variables relacionadas con la respuesta antes mencionadas y luego comparar los va- lores de la variable de respuesta (choques/milla-año) solo en las celdas correspondientes.
  • 21. Incluso con un número modesto de variables uno encuentra rápidamente que ninguna celda con- tiene suficientes segmentos de carretera para hacer comparaciones significativas. Este es el lla- mado problema de datos dispersos 2 . Quizás por esta razón, el enfoque de restricción rara vez ha utilizado en la investigación sobre seguridad vial. Dado que en la investigación de seguridad vial el enfoque de restricción ha no ha sido ampliamente probado, puede ser prematuro pronun- ciarse sobre su promesa. Sin embargo, Groenlandia et al. (1999) dicen que en otros campos, tales métodos “a menudo son inviables o insuficientes para producir intercambiabilidad.” (pág. 35). Es probable que esto se aplique a la investigación sobre seguridad vial no solo debido a la 1 Una vez más, se debe invocar la 'creencia fundamental' de que la respuesta de una unidad a 'c' o 't' está determinada por sus atributos relevantes para la respuesta (y que las unidades con atributos relevantes para la respuesta idénticos tienen respuestas idénticas a 'c' y 't'). Sobre esto, Groenlandia et al. (1999) dicen que “Parece intuitivamente claro que si μ Ac y μ Bc difieren en- tonces (la unidades en) A y B deben diferir con respecto a los factores que afectan a μ “ . Groen- landia et al. argumentan que las diferencias entre los los atributos relevantes para la respuesta de A y B no implican confusión, “porque los efectos de las diversas covariables las diferencias pueden equilibrarse” (p. 33). Si bien tal equilibrio es una posibilidad, es muy poco probable y, en mi opinión, opinión, sin consecuencias prácticas. 2 Greenland et al (1999) dicen que: ” Los métodos de ajuste más simples comienzan con la estratificación en factores de confusión. A covariable no puede ser responsable de la confusión dentro de un estrato que es internamente homogéneo con respecto a la covariable. Esto es así, independientemente de si se utilizó la covariable para definir el estrato. Por ejemplo, género los desequilibrios no pueden confundir las observaciones dentro de un estrato compuesto única- mente por mujeres. Parecería natural, entonces, para controlar la confusión debida a los factores medidos simplemente estratificándolos a todos. Desafortunadamente, entonces uno enfrentar el conocido problema de datos dispersos: dados suficientes factores, pocos o ningún estrato tendría sujetos en ambos grupos de tratamiento, lo que hace que las comparaciones sean ineficientes o imposibles”. (pág. 35) 28 antes mencionado 'problema de datos dispersos' sino también por la dificultad añadida de que si una unidad si se encuentra para tienen 't' y otro tiene 'c', los profe- sionales pensaron que las dos unidades son diferentes y por lo tanto debe estar equipado de manera diferente. Por lo tanto, estar equipado de manera diferente casi implica la existencia de diferencias relevantes para la respuesta, algunas de las cuales quizás estén relacionadas con un juicio no documentado. Las limitaciones que hacen impracticable la 'restricción' se aplican igualmente a la 'coincidencia'. 3.2.2 Enfoque 2: Igualación de Atributos por Análisis. El segundo enfoque para eliminar el sesgo debido a la confusión es el indicado por el flecha vertical en la Figura 8. El objetivo es estimar la 'corrección' μ B□ - μ Bc y agregarla a la observable μ Bc y así obtener una estimación μ B□ ; esto es lo que serían los μ de las carreteras B si tuvieran los atributos relevantes para la respuesta de las carreteras A. Ahora que todos los atributos re- levantes para la respuesta de las carreteras B son los mismos que los de las carreteras A, se puede argumentar justificadamente que μ Bc es también lo que μ en las carreteras A sería si tuvieran dos pies de arcén pavimentado, no cuatro. Para ilustrar, si en las carreteras B el prome- dio velocidad era de 75 km/h y en las carreteras A era de 80 km/h, la corrección sería una esti- mación de la cambio en la frecuencia esperada de accidentes si la velocidad en las carreteras B fuera de 80 km/h, no de 75 km/h. voy a referirse a este enfoque como 'Corrección por análisis'. La corrección se deriva de dos esenciales elementos: una. Información sobre los atributos rele- vantes para la respuesta de las unidades en las poblaciones A y B; b. Conocimiento de cómo μ
  • 22. de los caminos en B podría cambiar en respuesta a un cambio en estos atributos relevantes para la respuesta. Groenlandia et al. (1999) dicen que “ha habido una enorme cantidad de trabajo dedicado a ajus- tes analíticos por confusión. Con algunas excepciones, estos métodos se basan en distribuciones de covariables observadas en las poblaciones comparadas. Tales métodos funcionarán con éxito controlar los factores de confusión solo en la medida en que se miden y empleado en el análisis. Luego, también, muchos métodos emplean modelos paramétricos en alguna etapa, y su éxito depende, pues, de la fidelidad del modelo a la realidad”. (pág. 35); y más tarde “La método más común para evitar problemas de datos dispersos es imponer restricciones paramétricas en la regresión del resultado sobre el tratamiento y las covariables; .Sin embargo, teórico Los resulta- dos indican que ningún enfoque puede resolver completamente los problemas de datos disper- sos, en la medida en que la muestra el tamaño siempre limitará el número de grados de libertad disponibles para el ajuste de covariables y prueba de modelos”. (pág. 36) En seguridad vial, el arte de estimar la magnitud de la corrección (lo que Greenland et al. llamar el 'ajuste analítico') que se requiere para controlar la confusión en la sección transversal observacional estudios parece ser en gran medida terra incognita. No es la ambición de este documento mapear este territorio inexplorado. Sin embargo, desarrollar una apreciación de la tarea y los obstáculos para su éxito, se requiere una exploración conceptual. Indicar en qué con- siste la 'corrección por análisis' enfoque en la seguridad vial podría implicar, usaré nuevamente el ejemplo del ancho de la banquina pavimentada, partiendo de lo que es simple pero poco rea- lista, y agregando capas de complejidad para gradualmente acercarse a la realidad. 29 Suponga inicialmente que las carreteras A son las mismas que las carreteras B en todos los atributos relevantes para la respuesta 1 . Si es así, no se necesita corrección y la ordenada del cuadrado completo izquierdo en la Figura 8 ( μ Bc ) puede ser utilizado legítimamente para estimar cuáles serían los choques/milla-año en las carreteras A si tuvieran 2' arcenes pavimentados (la ordenada del círculo no observado 1). Agregue la Capa 1. A continuación, suponga que los caminos en A (aquellos con arcenes pavi- mentados de cuatro pies) tienen la mismos atributos relevantes para la respuesta que las carre- teras en B (aquellas con arcenes pavimentados de dos pies) 2 , excepto que en las carreteras B la velocidad media es de 75 km/h mientras que en las carreteras A es de 80 km/h. la tarea es Estime cuál sería μ Bc si en las carreteras de B la velocidad promedio fuera de 80 km/h. Para esto necesitamos saber cómo cambia el μ en este tipo de carretera en función 3 de la velocidad media. conocimiento de esto tipo a veces se puede extraer de la investigación publicada. La siguiente observación general 4 Puede ser hecho: O1. Para corregir las diferencias en un atributo relacionado con la respuesta, uno debe tener conocimiento de la función que dice qué cambio en la respuesta es causado por un cambio en el atributo. Tal el conocimiento proviene de los resultados de la investigación. Agregue la Capa 2. Suponga ahora que en el grupo A hay algunos caminos con una velocidad promedio de 80 km/h y algunas con 90 km/h mientras que en el grupo B hay algunas carreteras con 70 km/h y algunas con 75 km/h El tamaño de la corrección dependerá de si las carreteras de 70 km/h van a ser 'corregido' a 80 km/h o a 90 km/h. En definitiva, la corrección dependerá de la elección del maridaje para los que no hay motivos claros 5 . Para eludir este tipo de dificultad uno tiene que traer ambos grupos de caminos a algún valor de atributo común. Así, por ejemplo, si se eligió una velocidad promedio de 80 ser este valor común, se calcularía una corrección para aquellos caminos en A donde el promedio la velocidad es de 90 km/h y se calcula otra corrección para todas las carreteras de B. Así, el remedio es use dos correcciones en lugar de una como se
  • 23. muestra en la Figura 9 con las dos flechas. la flecha hacia abajo corrige μ At para llevar todos los caminos A a algún valor común de la(s) variable(s) relevante(s) para la respuesta. los la flecha hacia arriba corrige μ Bc para que todos los caminos B tengan el mismo valor común. el incon- fundible comparación es ahora entre μ A□ y μ B□. El precio de aplicar dos correcciones en lugar de una es el inevitable aumento de la varianza de esta comparación 6 . 1 Los atributos que vienen a la mente pueden ser la cantidad de tráfico, el entorno (urbano o rural), las condiciones climáticas, el usuario de la vía características (distribución de edad, sexo, ingresos o educación), antigüedad de la carretera, terreno, mantenimiento invernal, etc. 2 Es decir, la distribución edad-género-ingreso de los conductores, la ocupación de los vehículos, la mezcla de autos y camiones y su antigüedad y el tráfico durante todas las horas del día son los mismos en las carreteras A y B, solo el número diario de vehículos es diferente. 3 Por 'función' me refiero a una representación causal de cómo cambian los accidentes espera- dos en una carretera cuando la velocidad promedio es cambió. Se excluye el tipo de relación que se podría obtener al comparar algunos caminos con velocidad promedio X con otras vías con velocidad media Y. 4 Etiquetaré las observaciones generales con O1, O2, etc. 5 Excepto si los choques/milla-año son proporcionales a la velocidad promedio, lo que no parece ser el caso. 6 La característica adicional de la estrategia de dos correcciones es que el efecto de seguridad dependerá del valor común elegido. Esto no es necesariamente una desventaja. 30 Figura 9. Las dos 'correcciones'. Como antes, para estimar las dos correcciones se necesita tener información sobre los puntos importantes. atributos relevantes para la respuesta de Roads A y Roads B, así como estar en posesión de investigaciones basadas en conocimiento sobre la función causa-efecto de cómo cambia la fre- cuencia esperada de accidentes cuando cambian los atributos relevantes para la respuesta. Agregue la Capa 3. Hasta ahora, las carreteras de cada grupo diferían solo en la velocidad pro- medio y se asumió que existe un conocimiento basado en la investigación de la función que vincula la frecuencia de choque y la velocidad promedio. Supongamos ahora que las carreteras A difieren de las carreteras B también en que tienden a estar más cerca de las zonas urbanas. áreas Tal atributo de 'ubicación' podría influir en la seguridad de varias maneras, por más com- pleto notificación de accidentes, por menor tiempo de respuesta de los servicios médicos de emergencia, por diferencias en el edad, género, ingresos de los usuarios de la vía, por diferencias en el consumo de alcohol, etc. No es probable que uno tener conocimiento de la relación funcio- nal que vincula la frecuencia de los accidentes y la 'ubicación'. A Es posible que ni siquiera exista una relación estable (transferible) de este tipo 1 . Sin embargo, sin tal función las correcciones no se pueden estimar. Así, por lo general, O2. Incluso si uno tiene datos sobre un atributo rela- cionado con la respuesta, el requisito correspondiente puede faltar una relación funcional. En ese caso, no se puede aplicar ninguna corrección y el no se puede explicar la confusión debida a tal atributo. Una dificultad añadida es que aunque conociéramos las funciones μ ( velocidad media) y μ (ubi- cación de la carretera) uno no puede asumir que la función conjunta μ ( velocidad promedio, ubicación de la carretera) es algo simple compuesto de las dos funciones constituyentes
  • 24. separadas. En general, O3. La corrección por confusión requiere el conocimiento de una función multivariable que vincule μ a todos los atributos importantes relacionados con la respuesta (va- riables). En seguridad vial, tales funciones actualmente no existe. Agregue la capa 4. Otro paso hacia el realismo en el ejemplo del ancho del arcén pavimentado es asumir que existen variables relacionadas con la respuesta que se sabe que son importantes (p. ej., distribución de edad de los usuarios de la carretera o fricción de la superficie de la carre- tera) sobre el cual nuestro conjunto de datos es mudo. En este caso, no hay corrección corres- pondiente se puede aplicar y se debe suponer que existe confusión. 1 Puede no existir una relación funcional estable porque el atributo urbano, suburbano o rural refleja un paquete o atributos más fundamentales (informe de accidentes, tiempo de respuesta de los servicios médicos de emergencia, distribuciones de edad, ingreso de género y otros ras- gos de los usuarios de la vía pública, consumo de alcohol, etc.) y estos atributos pueden variar de un urbano (o rural) a otra. 31 O4. Para corregir la confusión, uno debe tener datos sobre lo que se sabe que es importante atributos relevantes para la respuesta de las unidades en A y B. Si tales datos no están disponi- bles, confusión debe suponerse que existe. Agregue la capa 5. Finalmente, están los atributos relevantes para la respuesta que no conoce- mos. Destacan entre ellas las razones por las cuales un camino terminó teniendo dos pies de pavi- mentado hombros y otros cuatro. La influencia de estos atributos, desconocidos, insospechados, no reconocido o indocumentado pero omnipresente, siempre estará al acecho en el fondo. En general, O5. En la medida en que hay algunos atributos relevantes para la respuesta que no conocemos sobre, y hay razones no documentadas para aplicar 'c' a algunas unidades pero 't' a otras unidades, se debe suponer que existe confusión Esta fuente de confusión no se puede corregir por. Si bien algunas de las dificultades a las que se enfrenta el enfoque de "corrección por análisis" tal vez podrían tratarse si tuviéramos datos mucho más ricos y un conocimiento mucho mejor del requisito funcional relaciones, algunos obstáculos parecen insuperables. Las dificultades insupe- rables son dos. En primer lugar, en el contexto de la seguridad vial siempre será difícil argumentar que el juicio de profesionales para implementar 't' o 'c' no fue influenciado por la historia pasada de choques o casi accidentes, por consideraciones basadas en una familiaridad con el sitio y sus circunstan- cias que no se puede ver en los datos, o por algún atributo relevante de respuesta ahora irreco- nocible. los La segunda dificultad (aparentemente) insuperable es que generar confianza en la 'corrección por enfoque de análisis, uno tendría que proporcionar evidencia empírica de que μ A□ es lo que los μ caminos B sería si tiene los atributos relevantes para la respuesta elegidos y hombros de dos pies y el μ B□ es cerca de lo que sería el μ en las carreteras A si tienen los atributos relevantes para la respuesta elegidos y hombros de cuatro pies. Esto implica que habría que encontrar caminos que realmente deberían estar equipados con 't' como son los caminos en A, pero permaneció equipado con 'c' por algún capricho del destino que es completamente sin relación con ningún posible atributo relevante para la respuesta. No puedo pensar en algo tan natural. experimentos Por lo tanto, no puedo ver una manera de verificar empíricamente que la 'correc- ción' está cerca de lo que debería ser En resumen, en los estudios observacionales transversales en los que se comparan las unidades que tienen 'c' con unidades que tienen 't', existirá confusión
  • 25. a menos que se elimine por 'restricción o emparejamiento' o por 'análisis'. La opción de eliminar la confusión por 'restricción y coincidencia' es limitado por el problema de los "datos escasos" y por el de los atributos relacionados con la respuesta desconocida. los posibilidad de 'corrección por análisis' está circunscrita por las dificultades O1 a O5 enumeradas arriba. 3.2.3 ¿Se pueden igualar los atributos usando modelos de regresión paramétrica? Supon- gamos ahora que en lugar del enfoque de 'dos correcciones' descrito en la sección 3.2.2, uno utilizará los datos sobre choques y atributos para estimar dos modelos de regresión, uno para las carreteras A y otra para caminos B. Una vez hecho esto, se podría: a. especificar un conjunto de valores de atributos → b. calcule los choques/año pronosticados para un camino de A y (usando los mismos valores de atributo) para un camino de B → c. comparar las dos predicciones y así, → d. estimar el efecto de seguridad de reemplazar arcenes de dos pavimentados por arcenes pavimentados de cuatro pies para una carretera con el atributo especificado valores. 32 Esta es, en esencia, una versión de 'igualación de atributos' discutida en 3.2.2. llamaré este es el enfoque de 'ecualización por regresión'. La pregunta es cuáles son las fortalezas y limita- ciones del uso del enfoque de igualación por regresión para eliminar el sesgo de confusión cuando se hace uso de datos observacionales de secciones transversales? Para responder a esta pregunta haré uso de las observaciones O1 a O5 del apartado anterior (3.2.2). La primera observación general en la sección 3.2.2 (O1) fue que para corregir las diferencias en un atributos relacionados con la respuesta entre las unidades del grupo A y las unidades del grupo B que uno debe tener conocimiento de qué cambio en la respuesta es causado por un cambio en el atributo. En la sección 3.2.2, el Se asumió que la relación funcional necesaria se basaba en el acervo de hallazgos de la investigación. acumulado a lo largo del tiempo. Cuando se utiliza el enfoque de ecualización por regresión, se supone que la relación funcional requerida es el propio modelo de regresión - el resultado de ajustar un ecuación a los datos de las unidades en el grupo. El atractivo de este enfoque es que uno no necesita rastrear, dominar y evaluar los datos exis- tentes. investigación acumulada para establecer lo que se sabe; que el modelo estimado proporciona la necesitaba una función de causa-efecto a la manera de 'deus ex machina'. La misma caracterís- tica de la El enfoque de 'ecualización por regresión' también parece cuidar el O2, que a veces, incluso si los datos acerca de un atributo relacionado con la respuesta está disponible, el cono- cimiento de la correspondiente sin confundir Falta la relación funcional. 1 Desafortunadamente, esta forma automática por la cual una regresión proporciona las relaciones funcionales necesa- rias es también una fuente de gran debilidad. confiando exclusivamente en la forma funcional y parámetros estimados del modelo de regresión que fue ajustado al conjunto de datos específico en cuestión, uno está esencialmente ignorando todo lo que se sabe de investigaciones previas sobre tales relaciones funcionales 2 . Es como si no existiera ningún conocimiento además lo que afirma el modelo de regresión actual y como si uno pudiera estar seguro de que cualquiera que sea el El modelo actual afirma que está lo suficientemente cerca de la verdad, incluso si va en contra de lo que otros encontraron o lo que comúnmente se conoce. Ninguna suposición es aceptable. Primero, descartar todo conocimiento fuera del conjunto de datos que se examina está en desacuerdo con la tradición de la ciencia. En la ciencia, el conocimiento. es una cuestión de acumulación, y la clave para confiar en alguna afirmación sobre la realidad es la consistencia con la que se puede obtener. En segundo lugar, la experiencia con modelos
  • 26. de regresión en carretera la seguridad nos dice que diferentes investigadores tienden a encontrar diferentes funciones para las mismas variables 3 . Eso Es difícil saber cuál de las diversas rela- ciones está cerca de reflejar causa y efecto. Por lo tanto, no puede estar seguro de que cualquier modelo de regresión estimado específico represente de manera confiable la función causal necesaria necesaria para lograr la igualación de atributos. A primera vista, el enfoque de 'ecualización por regresión' también se ocupa de O3: la necesidad tener una función multivariable que vincule μ con todos los atributos relacionados con la res- puesta ; el resultado de un regresión siempre hace que μ sea una función de todas las variables retenidas. Por desgracia, esto no es una función. encontrado por la investigación acumulada para describir consistente y adecuadamente un fenó- meno, ni es el función sugerida por una teoría plausible. Es una función que es seleccionada por el modelador y es 1 Cuando se usa el enfoque de 'ecualización por regresión', para cada atributo (variable) que se retiene en el modelo siempre hay una relación funcional correspondiente. 2 Esta debilidad podría desaparecer si los modelos de regresión fueran completamente bayesia- nos, y si se hiciera uso de modelos 'informativos'. antecedentes que encarnan todo el conocimiento acumulado. 3 Como lo ejemplifican los modelos Coleman-Stewart versus Mengert. 33 basado en la evidencia limitada y generalmente difusa de un solo conjunto de datos. Como resultado, a menudo es un prototipo simple elegido del pequeño repertorio y compuesto por adi- tivos o multiplicativos bloques de construcción que en sí mismos son funciones simples, gene- ralmente de una sola variable. tal La función se puede considerar como una aproximación de la serie de Taylor de primer orden de la función subyacente desconocida. función. Como tal, si la función subyacente no es lineal, la aproximación es adecuada solo para valores cercanos al punto en el que se centra la serie de Taylor, pero no es aplicable a lo largo del rango de variación variable que normalmente se encuentra en las poblaciones reales de uni- dades. Por lo tanto, la corrección por confusión que se basa en tal aproximación de primer orden puede ser ampliamente fuera de la marca. La pregunta global abordada en este documento es si las regresiones cuando se basan en la sección transversal los datos pueden apoyar la interpretación de causa y efecto. Mientras no se responda la pregunta uno no puede asumir que lo hacen o que no lo hacen. Una parte de lo que se describió como debilidad de el enfoque de igualación por regresión en los párrafos anteriores se basa en la suposición de que, en seguridad vial, tales regresiones por lo general no logran captar la causa y el efecto. Si fuera cierto lo contrario, las debilidades identificadas desaparece- rían. En la sección 3.2.2, señalé en O4 que: “Para corregir la confusión, uno debe tener datos sobre lo que se sabe que son atributos relevantes para la respuesta de las unidades en A y B”. lo mismo es verdadero para el enfoque de igualación por regresión. En la medida en que sabemos de la existencia de algún atributo relevante para la respuesta que no se usa en la ecuación de regre- sión 1 , su omisión será un fuente de confusión tal como lo es cuando el enfoque de 'corrección por análisis' de la sección 3.2.2 es usó. Así, por ejemplo, si los usuarios de las carreteras A diferían en edad, ingresos o consumo de alcohol de los usuarios de carreteras B, y si la edad, los ingresos o el BAC no fueran variables en la regresión, entonces la igualación por regresión los resultados del enfoque se confundirán de la misma manera que los resultados basados en el