CAUSA Y EFECTO EN ESTUDIOS OBSERVACIONALES
DE LA SECCIÓN TRANSVERSAL SOBRE
LA SEGURIDAD VIAL
Ezra Hauer, 2005
1. INTRODUCCIÓN
2. ILUSTRACIÓN DE TEMAS EN CRUCES CAMINO-FERROCARRIL A NIVEL
2.1 Cómo medir el 'Efecto de seguridad'
2.2 Examen de la consistencia de las estimaciones del efecto de seguridad
3. CAUSA, EFECTO, CONFUSIÓN Y CONSISTENCIA
3.1 Definición de causa y efecto
3.2 Confusión e intercambiabilidad en estudios transversales observacionales de
seguridad vial.
3.3 Consistencia de los hallazgos
4. CASOS E INQUIETUDES
4.1 Peltzman y otros sobre el efecto regulación seguridad del automóvil
4.2 Lave y otros sobre el límite de velocidad
4.3 Noland sobre la estructura y efecto sobre las muertes
4.4 El medio no es el mensaje
4.5 Algunos modelos a nivel de unidad para caminos
5. RESUMEN
6. CONCLUSIONES
Referencias
1. INTRODUCCIÓN
Gran parte de la investigación sobre seguridad vial1 gira en torno de la causa. Es decir, deseamos
aprender qué cambio en la seguridad resultará de algún tratamiento2. En muchas otras discipli-
nas, el conocimiento de este tipo proviene de experimentos. El aspecto clave de un experimento
es que uno puede cambiar deliberadamente el valor de solo unos pocos factores mientras man-
tiene todos los demás factores constantes, o neutralizar el efecto de todos los demás factores
mediante la aleatorización. En seguridad vial, la experimentación de este tipo es muy rara; el
conocimiento tiene que ser extraído de 'estudios observacionales'; es decir, interpretando los
datos que se pueden encontrar. Los estudios observacionales de seguridad vial son de dos tipos:
• 'antes-después'. Cuando algún cambio o tratamiento se aplicó a un grupo de unidades. El
cambio en el historial de accidentes y en los atributos de estas unidades desde antes del
tratamiento hasta después del tratamiento se utilizan para estimar el cambio en la seguridad
que se debe al tratamiento.
• 'transversal'. Cuando los atributos y el historial de accidentes de las unidades, algunos en-
contrados con tratamiento (atributo) X y algunos encontrados con el tratamiento (atributo) Y,
se utilizan en un intento de estimar el efecto de seguridad de la diferencia de trato (o atributo)
en la pregunta.
La distinción principal entre estos dos tipos de estudio observacional es que en un estudio antes-
después 'tratamiento' significa que algo ha cambiado de 'antes' a 'después', mientras que en un
estudio transversal el elemento de cambio no está presente, sólo existe una diferencia contem-
poránea en algún atributo de interés que podría haber sido diferente y, por lo tanto, se denomina
vagamente "tratamiento".
Se cree que el experimento aleatorio es el estándar de oro que permite la relación causa-efecto.
interpretación. Reconociendo que en muchas disciplinas y circunstancias 4 la experimentación y
aleatorización no son factibles, el estudio observacional de antes y después es quizás el siguiente
en el 1 La seguridad de una unidad es el número de accidentes, por gravedad, que se espera
que ocurran en ella por unidad de tiempo. Una unidad puede ser una intersección señalizada, un
segmento de carretera, un conductor, una flota de camiones, etc.
Generalmente por “tratamiento” nos referimos a una intervención de algún tipo, un cambio en
alguna característica de diseño o, de manera más general, un cambio en un factor que puede
causar un cambio en la seguridad de la unidad. Como será obvio, también usaremos la palabra
'tratamiento' en el sentido de 'diferencia en atributo o característica'. Eso es si una unidad recibirá
la función X y otra característica de la unidad Y, se dice que las dos unidades han recibido un
tratamiento diferente.
En nuestra perspectiva el tratamiento es la causa y nos preguntamos por su efecto. Esto es lo
contrario de ver algún evento. por ejemplo, un accidente) que ocurra y preguntar sobre su causa.
3 Rosenbaum (1995) (Rosenbaum PR 1985) dice que “Un estudio observacional es una investi-
gación empírica de tratamientos, políticas o exposiciones y los efectos que causan, pero se dife-
rencia de un experimento en que el investigador no puede controlar la asignación de tratamientos
a los sujetos. (pág. vii). Luego enfatiza que “Un estudio sin el tratamiento no es ni un experimento
ni un estudio observacional” (p.1). Sin embargo, él también debe permitir una amplia interpreta-
ción de la palabra 'tratamiento' ya que uno de sus ejemplos es un estudio sobre el tabaquismo y
las enfermedades del corazón en el que el atributo de cuánto fumó una persona en el pasado se
interpreta como 'tratamiento'. Así, los límites entre 'tratamiento', 'atributo' y 'exposición' no están
del todo claros.
4 En ciencias sociales, educación, economía, epidemiología, medicina, etc.
4 línea de respetabilidad en términos de permitir interpretaciones de causa-efecto 1 . Si la sección
transversal observacional estudios pueden conducir a conclusiones de causa-efecto es un tema
de controversia. Mientras que algunos afirman que “No hay causalidad sin manipulación” 2 otros
no excluyen la posibilidad 3 .
La cuestión de si la interpretación causal de los estudios transversales es del todo posible es de
importancia central para la seguridad vial. La razón es que las oportunidades de hacer observa-
ciones antes y después estudios sobre, digamos, el efecto de seguridad del cambio en la curva-
tura horizontal, grado de carretera, carril ancho, mediana pendiente, etc. son pocos e imperfec-
tos. Esto es así, en parte, porque cuando se reconstruye una carretera por lo general, se cambian
varios de sus atributos a la vez y es difícil asignar el resultado a cualquier único factor causal.
Además, la reconstrucción de una carretera a menudo la modifica hasta tal punto que no puede
considerarse la misma unidad después de la reconstrucción. Por el contrario, las oportunidades
de los estudios transversales observacionales son abundantes. Esta es la razón por la que gran
parte de lo que se piensa que es El conocimiento sobre el efecto de seguridad de muchas carac-
terísticas viales importantes provino de la sección transversal de observación.
estudios. Sin embargo, si es cierto que tales estudios no pueden conducir a conclusiones de
causa-efecto, entonces gran parte de la tradición existente debe ser cuestionada.
Si bien el tema es de importancia central para la seguridad vial, ha recibido escasa atención.
atención. Por lo que sé, se emitió por primera vez en Hauer (1991) 4 , quien señaló que los
resultados de beforeafter Los estudios tienden a diferir de los estudios transversales. En tales
casos, uno o ambos métodos dan resultados incorrectos. Tarko et al. (2004) argumentó a favor
de dibujar causa-efecto conclusiones de los estudios transversales. Davis (2000) revisó exhaus-
tivamente la información existente literatura relevante sobre la inferencia causal tal como se
aplica a la seguridad vial. Destacó que para dibujar conclusiones de causa-efecto a partir de
datos de sección cruzada, la posibilidad de confusión debe ser eliminado y que esto requiere
información sobre por qué un sitio recibió el tratamiento 'X' y otro recibió el tratamiento 'Y'. Mien-
tras que en 2000 Davis era levemente optimista 5 sobre la posibilidad para controlar la confusión
en estudios transversales, más recientemente Davis (Davis 2004) expresó duda de que se pue-
dan superar los sesgos de agregación inherentes a los estudios transversales.
En suma, una parte del conocimiento que pasa de la investigación a la práctica se basa en con-
clusiones extraídas de estudios transversales. No está claro, en este momento, en qué circuns-
tancias esta información puede interpretarse como representación de causa y efecto. En conse-
cuencia, el principal propósito de este informe es examinar el tema de causa y efecto en la sec-
ción transversal observacional
1 Rubin (1974) expresa este sentimiento de la siguiente manera: “… dada la elección entre los
datos de un experimento aleatorio y un estudio no aleatorizado equivalente, uno debe elegir los
datos del experimento…. Sin embargo, lo haremos desarrollar la posición de que los estudios no
aleatorios, así como los experimentos aleatorios, pueden ser útiles para estimar efectos causales
del tratamiento”. Págs. 688-689.
2 Holland (1986) atribuye esto a D. Rubin, uno de los principales pensadores de la interpretación
causa-efecto de Datos estadísticos.
3 Al hablar de la teoría de la causalidad inferida Pearl (2000) dice que “… la dirección de las
influencias causales puede determinarse a menudo sin recurrir a la información cronológica.
(Aunque, cuando esté disponible, cronológico información puede simplificar significativamente la
tarea de modelado.)”, p.43.
4 Refiriéndose a un informe de investigación en el que se hizo una declaración sobre la superio-
ridad del enfoque de antes y después Hauer (1991) dice que: "La pregunta es si el enfoque de
investigación antes y después es mejor, en general, que el enfoque transversal "y que" Esta
pregunta sería de poco interés si ambos enfoques de investigación condujeran a resultados si-
milares.
conclusiones. Esto, sin embargo, no parece ser el caso”. pags. 26 5 “…no es inconcebible que
un sistema experto, por ejemplo, pueda incorporar el conocimiento de ingeniería existente en un
manera racional y aun así conducir a una selección sin confusión”. pags. 106.
5 estudios sobre seguridad vial. Para hacer obvia la relevancia práctica del problema y el asunto
tangible, en la próxima sección usaré el dispositivo de un estudio de caso.
6 2. UNA ILUSTRACIÓN DE LOS PROBLEMAS EN EL CASO DEL FERROCARRIL PASOS
A NIVEL La pregunta práctica es esta: si realizo alguna 'acción', ¿qué puedo esperar que tenga
su efecto de seguridad? ¿ser? Es decir, en el arte práctico de la gestión de la seguridad vial nos
interesan las relaciones entre las acciones (p. ej., reemplazar los cruces con luces intermitentes
en un paso a nivel) y su esperada efecto de seguridad (reducción de accidentes). En el capítulo
introductorio pregunté, algo abstractamente, si los resultados derivados de los datos de la sec-
ción transversal se pueden utilizar para dicha orientación de causa-efecto. En En este capítulo
quiero ilustrar el tejido rico y problemático de este tema en el contexto de una campo de acción
específico: el de elegir dispositivos de advertencia para los pasos a nivel de ferrocarril y carretera.
2.1 Cómo se puede medir el 'Efecto de seguridad'.
Se entiende bien cómo se mide el efecto de seguridad en un estudio observacional de antes y
después.
Predecimos cuál habría sido la seguridad de las entidades tratadas en el período 'después del
tratamiento' si se hubieran dejado sin tratar. Para ello utilizamos el historial de accidentes de las
entidades tratadas de la período 'antes del tratamiento' y conocimiento de cómo sus atributos
(por ejemplo, flujo de tráfico) cambiaron de el período 'antes' al 'después'. Luego comparamos la
predicción de lo que habría sido en el período 'después' si no hubiera habido tratamiento, a qué
accidentes se materializaron en el período 'después' con el tratamiento en su lugar. Esta compa-
ración puede ser en forma de diferencia: δ = (qué seguridad habría sido sin tratamiento) – (qué
seguridad había con tratamiento); o en forma de proporción: θ = (qué seguridad había con el
tratamiento)/ (qué seguridad habría sido sin tratamiento). los estimaciones de δ o θ pueden servir
como guía para responder la pregunta original: si implementar algún tratamiento (acción) ¿cuál
podemos esperar que sea su efecto? En un estudio observacional que utiliza datos transversales,
el efecto de seguridad se estima bastante diferentemente. Para dilucidar, considere el estudio de
Coleman y Stewart (1976) sobre la seguridad de pasos a nivel ferrocarril-carretera. Usaron datos
transversales de 37,230 pasos a nivel en 15 estados para ajustarse al modelo de regresión rela-
tivamente simple: C log (Trenes/día) CCC wd,3 10 ancho,0 ancho,1 ancho,2 (Trenes/día) Acci-
dentes/año = 10 (Vehículos/día) (Trenes/día) ecuación 1 Se estimaron los coeficientes de regre-
sión C wd,o, …, C wd,3 para tres tipos de dispositivos de advertencia (wd=Puertas Automáticas,
Intermitentes o Crossbucks) y para cuatro condiciones (urbano de vía única o rural y urbano o
rural de vía múltiple). Utilizando los coeficientes de regresión estimados y la ecuación. 1 uno
puede trazar gráficos y comparar frecuencias de accidentes previstas en condiciones idénticas
(número de vías, escenario, trenes/día y vehículos/día) pero con diferentes avisadores.
Considere, por ejemplo, las frecuencias de accidentes pronosticadas en la Figura 1.
7 Figura 1. Predicciones del modelo para Crossbucks y Flashers Con, digamos, 10.000
vehículos de carretera/día, 10 trenes/día, una sola vía férrea y cruces ubicados en un área ur-
bana, se espera que un cruce promedio con 'Crossbucks' tenga 0.182 accidentes/año y se espera
que un cruce promedio cuando esté equipado con 'Flashers' tenga 0.234 accidentes/año.
Parecería natural hacer de esto la base para la anticipación de lo que sería el "efecto de seguri-
dad".
ser cuando un tipo de dispositivo de advertencia es reemplazado por otro 1 . El efecto de segu-
ridad de reemplazar crossbucks por luces intermitentes podría medirse por la diferencia δ =
0.234-0.182 como el aumento de 0,052 accidentes/año o, alternativamente, por la relación θ
=0,234/0,182=1,26 (que se puede leer como 26% aumento de accidentes/año) 2 . Estas medidas
alternativas de efecto de seguridad se basan ambas en la misma información y ambas podrían
servir de orientación. Dado que en seguridad vial la razón mide ( θ ) se encuentra más común-
mente, se usará aquí para representar el efecto de seguridad 3 . En lo que sigue, la relación
(Frecuencia prevista de accidentes con Y)/(Accidente previsto con X) se denotará por θ X a Y .
Cuando para un conjunto dado de atributos θ X a Y <1, el efecto del cambio de X a Y es disminuir
frecuencia de accidentes 4 .
En la ilustración anterior, el efecto de seguridad estimado cuando se basa en datos de sección
transversal fue obtenido ajustando primero una o más ecuaciones de regresión a los datos y
luego usando estos ecuación para predecir cuál sería el efecto de seguridad ( δ o θ ) bajo dos
condiciones específicas. En principio, si los datos transversales son tan abundantes que la cate-
gorización en todas las variables relevantes para la seguridad es factible que se pueda prescindir
del paso de regresión. Entonces uno compararía el número promedio de accidentes/cruce de
dos celdas que tienen los mismos valores de variables relevantes para la seguridad y difieren en
tratamiento. En la práctica de la seguridad vial, esta opción rara vez es práctica; variables rele-
vantes para la seguridad son muchos y, por lo tanto, las celdas no contienen suficientes datos
para una estimación confiable. Las regresiones son utilizado para aliviar el 'problema de datos
escasos'.
1 En el capítulo 3 se proporciona una definición más sistemática de 'efecto de seguridad'.
2 La legitimidad de interpretar la diferencia en las predicciones con lo que se espera que sea la
consecuencia del cambio es cuestionado por muchos. Sin embargo, el examen de tal legitimidad
es uno de los propósitos de esta indagación.
Por lo tanto, hasta el final de la investigación se debe permitir el uso de la diferencia en las
predicciones para estimar el cambio.
3 Rubin (1990, p.283)( Rubin 1990) define el 'efecto causal del tratamiento' de la misma manera,
es decir, por δ o θ .
Argumenta que θ puede ser la mejor medida cuando se piensa que δ es proporcional al número
esperado de accidentes .
('rendimiento' en su contexto).
4 (1- θ X → Y )× 100 es el 'porcentaje de reducción' debido al cambio de X a Y.
8 Habiendo aclarado cómo se puede derivar el efecto de seguridad de los resultados de una
observación estudio transversal, ahora podemos examinar las siguientes preguntas empíricas.
Hizo antes-después Los estudios sobre el efecto de seguridad de los dispositivos de advertencia
en los pasos a nivel de ferrocarril y carretera tienden a producir estimaciones consistentes del
'efecto de seguridad'? ¿Los estudios transversales tendieron a producir "seguridad" consistente?
estimaciones del efecto? ¿Son consistentes los resultados de los estudios de antes y después
con los de estudios transversales? ¿estudios? Estas y otras cuestiones similares se examinan a
continuación.
2.2 Examen de la consistencia de las estimaciones del efecto de seguridad Cada curva en
la Figura 1 es la representación de la ecuación. 1. El θ Crossbuck toFlashers es la relación de
dos de tales ecuaciones; en la ecuación del numerador las constantes de regresión C son para
wd=Intermitentes y en el denominador para wd=Crossbucks. Después de introducir las condicio-
nes específicas (urbano, único vías, volúmenes de trenes) el θ Crossbucks to Flashers es (en
este caso) una función del flujo de tráfico vial únicamente.
Cómo los Coleman-Stewart θ Crossbucks to Flashers y θ Crossbucks to Gates dependen del
tráfico vial diario flujo (AADT) para Vía Única &Urbano y Vía Múltiple &Rural se muestra en la
Figura 2 y Figura 3.
Figura 2. Ratios θ de accidentes previstos para Vía Única, Urbana, 10 trenes/día 9 Figura
3. Ratios θ de accidentes previstos para Vía Múltiple, Rural, 10 trenes/día Cuando se usa
de esta manera, el modelo de Coleman-Stewart implica que en vías urbanas de vía única cruces
(Figura 2) con más de aproximadamente 1000 vehículos de carretera por día, más colisiones son
esperado con 'Flashers' que cuando se usan 'Crossbucks' ( θ Flashers to Crossbucks >1). Apro-
ximadamente el se indica lo contrario para condiciones rurales de múltiples vías (Figura 3). Nota
de Coleman y Stewart que estos resultados son inesperados y dicen que “Pueden ser necesarias
variables adicionales en estos casos para explicar completamente los patrones de ocurrencia de
accidentes” (p. 62).
Una de las razones por las que estos resultados (de la regresión multivariable utilizando la sec-
ción transversal datos) se consideraron "inesperados" fue que eran contrarios a los resultados
de algunos antes-después estudios. Los principales resultados de varios estudios de antes y
después se resumen en la Tabla 1 y se elaboran en la Tabla 2. Las celdas sombreadas dan las
proporciones θ obtenidas en cinco estudios de antes y después.
Tabla 1. Estimaciones de θ de estudios antes y después (sesgados) adaptados de Hauer
y Persaud (1987) Autor California PUC Morrisey Coleman Eck y Halkias Farr y Hitz Año de
publicación 1974 1981 1982 1985 1985 No. de cruces 1552 2994 NA 7734 5903 Crossbucks a
Flashers 0.36 0.35 0.29 0.31 0.30 Crossbucks a Gates 0.12 0.16 0.18 0.16 0.17 Intermitentes a
puertas 0,34 0,36 0,31 0,28 0,28 Todas estas estimaciones, por coherentes que parezcan, se
inflan sistemáticamente debido a errores no corregidos.
sesgo de selección 1 . Un estudio en el que se eliminó este sesgo proporcionó los resultados en
la Tabla 2 .
1 El sesgo de selección surge cuando la decisión de cambiar de un tipo de dispositivo de adver-
tencia a otro está parcialmente motivada por la ocurrencia de accidentes en un sitio y los mismos
accidentes también se utilizan en la cuenta de accidentes 'antes'. los el sesgo tiene sus raíces
en el fenómeno de la regresión a la media. En el momento en que se realizaron estos estudios
la existencia de el sesgo de selección no fue ampliamente apreciado.
10 Tabla 2. Estimaciones de θ de un estudio antes-después sin sesgo adaptado de Hauer
y Persaud (1987) Conversiones Crossbucks a Intermitentes Crossbucks a Gates Intermitentes
toGates Nº de Conversiones 891 1037 934 Estimación sesgada 0,30 0,21 0,40 Estimación im-
parcial 0,49 0,32 0,55 ¿Qué se puede decir acerca de estos resultados? Primero, se debe tener
en cuenta que hay una diferencia rara vez notada entre θ de antes-después estudios y el θ de
regresiones basadas en datos transversales. Cada estudio de antes y después arrojó un estima-
ción única del efecto de seguridad θ . Este es un efecto de seguridad promedio con un promedio
sobre el tratado sitios Por el contrario, el modelo de un estudio transversal hace que θ sea una
función de varios atributos. Eso es muy probable que θ sea una función de los atributos de las
entidades tratadas 1 . Si es así, el θ obtenido de un estudio antes-después, siendo un promedio
sobre una cierta colección de sitios, depende de la mezcla específica de atributos de las entida-
des 'tratadas'; una combinación diferente de entidades tratadas producir un θ diferente . Por lo
tanto, las estimaciones del efecto de seguridad obtenidas mediante un estudio de antes y des-
pués han dos deficiencias. Una es que incluso si cada estudio de un determinado tratamiento o
acción pudiera dar muy estimaciones precisas, las estimaciones de θ promedio tenderían a diferir
de un estudio a otro porque la los sitios en cada estudio diferirían 2 . La otra deficiencia es que
en la medida en que el sitio para el cual algún tratamiento es contemplado por un médico tiene
atributos específicos, el θ promedio basado en un Es posible que el estudio de antes y después
no se aplique a este sitio. Por lo tanto, las estimaciones del efecto de seguridad cuando se deri-
van de un El estudio antes-después es útil en la práctica solo si el efecto de seguridad depende
solo débilmente del sitio.
atributos 3 A este respecto, la regresión basada en datos transversales parece tener una ventaja
sobre un estudio antes-después.
La segunda observación es que, en este caso, no importa cuál sea la mezcla de los tratados
entidades en los estudios de antes y después, los resultados en la Tabla 1 y la Tabla 2 no son
consistentes con los resultados en la Figura 2 y la Figura 3. De ello se deduce que, en este caso,
uno o ambos tipos de estudio no pueden ser confiable.
La tercera observación que se puede hacer es que los resultados (sesgados) de los cinco antes-
después Los estudios en la Tabla 1 son bastante consistentes y es probable que lo sigan siendo
incluso si la regresión-tomean Se eliminó el sesgo de cada uno. Si es así, se puede especular
que en los cinco estudios de antes y después, las conversiones se realizaron en sitios con atri-
butos similares o el efecto de seguridad no realmente no dependen fuertemente de los atributos
de los cruces tratados, contrariamente a lo que podría ser inferido de las Figuras 2 y 3 Esto arroja
una doble duda sobre los resultados de la regresión. Las estimaciones de θ basados en los
modelos de Coleman-Stewart parecen incorrectos y la manera en que θ depende de el volumen
de vehículos y trenes es sospechoso. Lo que parecía ser una ventaja genérica de la regresión-
1 Uno debe apresurarse a agregar que puede ser una función no solo de las variables en el
modelo sino quizás de las variables actualmente no representado en el modelo.
2 Suponga, por ejemplo, que cuando AADT<500 tener carriles de 12' en lugar de carriles de 9'
disminuye los accidentes por un factor de 0,95 pero cuando AADT>2000 la disminución es por
un factor de 0,67 como se indica en Harwood et al. (pág. 30) (Harwood et al.
2000). Si es así, un estudio de antes y después de dicha ampliación de carriles, que incluye en
su mayoría carreteras de bajo volumen, encontraría θ de aproximadamente 0,95, pero si el es-
tudio incluyera principalmente segmentos de carretera de mayor volumen, estimaría θ de alrede-
dor de 0,67 3 En principio, es posible hacer que θ sea una función de atributos también en un
estudio de antes y después. Sin embargo, en la práctica la número de entidades en las que se
aplica un tratamiento rara vez es suficiente para hacer tales distinciones.
11 enfoque de sección transversal - su capacidad automática para hacer que θ sea una función
de atributos - puede, en este caso, sea sólo una ilusión.
Esto lleva a la cuarta observación. Para ser justos, el estudio transversal de Coleman-Stewart se
hizo principalmente para predecir las frecuencias esperadas de accidentes; no estaba destinado
a ser utilizado para la estimación de θ . Sin embargo, su modelo (Eqn. 1) se puede tomar para
implicar que, θ = 10 Δ C 0 (Vehículos/ día) Δ C 1 (Trenes/día) Δ C 2 (Trenes/día) Δ C 3 log 10
(Trenes/día) , donde Δ es la diferencia entre los coeficientes de regresión apropiados. La forma
funcional de esta expresión matemática no refleja un esfuerzo deliberado para encontrar cómo θ
depende de atributos de los cruces. Simplemente se sigue algebraicamente de la elección de la
forma modelo hecha por Coleman-Stewart para otros fines.
En resumen, se puede concluir que el modelo de Coleman-Stewart condujo a estimaciones de θ
que son inconsistente con los resultados de varios estudios de antes y después, y que implica
relaciones entre θ y atributos de cruce que son sospechosos. La pregunta es si otra regresión
los estudios sobre datos transversales obtuvieron mejores resultados. Para responder, algunos
modelos de sección transversal adicionales de se puede examinar la seguridad de los pasos a
nivel.
El siguiente estudio de regresión que se examinará es el de Mengert (1980), quien utilizó datos
sobre más de 200,000 cruces públicos en los EE. UU. El "accidente básico" resultante fórmula
de predicción' (Hitz 1986) para 'Crossbucks' es: 0,616 (hp 1) 0,0077 ms 0,1 (ht 1) 0,0 (hl 1) 0.1336
0,209 tm 0.3334 e e mi mi 0.2 edición 0.2 0.2 a 0.002268 ct 0.2 − × − × − × − × − × × × × × ⎟⎠
⎞ ⎜⎝ ⎛ + × ⎟⎠ ⎞ ⎜⎝ ⎛ × + = × ecuación _ 2 En este, 'a' es accidentes/año; 'c' el promedio de
vehículos de carretera/día; 't' el tren promedio movimientos/día; 'mt' el número de pistas princi-
pales; 'd' trenes directos por día durante el día; 'hp' es 1 si la carretera está pavimentada y 2 si
no; 'ms' es la velocidad máxima del horario; 'ht' es una 'carretera factor de tipo; y 'hl' es el número
de carriles de la autopista. Al igual que en Coleman y Stewart se separan Se estimaron modelos
para cruces 'crossbucks', 'flashers' y 'gates'. Los modelos para 'intermitentes' y 'puertas' tienen
una forma funcional que es similar a la ecuación. 2 pero con sus específicas coeficientes de
regresión. Usando estos tres modelos, la dependencia de θ en las variables seleccionadas es
representado a continuación.
12 Figura 4. Cómo varían las relaciones θ con el flujo de vehículos Figura 5. Cómo varían
las relaciones θ con el flujo del tren 13 Figura 6. Cómo varían las proporciones θ con el
número de pistas principales Figura 7. Cómo varían las relaciones θ con la velocidad del
tren En el modelo de Mengert, θ depende débilmente del 'volumen del vehículo' y del 'volumen
del tren', pero depende en gran medida de los atributos 'número de vías principales' y 'velocidad
máxima del horario'. Una puede imaginar fácilmente una mezcla de atributos de cruces en un
estudio de antes y después de tal manera que, si Mengert los resultados fueran verdaderos,
entonces se obtendrían las estimaciones de la Tabla 1 y la Tabla 2. Por lo tanto, los lo más que
se puede decir es que los resultados del estudio de regresión transversal de Mengert no son
inconsistente con las estimaciones de los estudios de antes y después en la Tabla 1 y la Tabla
2. 1 . Esto, sin embargo, es lo máximo que se puede decir. En general, cuando no se conocen
los atributos de las entidades tratadas, no se puede decir si los θ de los estudios transversales
confirman o niegan los θ del antes-después estudios. Por otro lado, las diferencias entre los
modelos Coleman-Stewart y Mengert son demasiado grandes para atribuirse a errores de esti-
mación; los resultados de estos dos modelos son inconsistentes.
1 Es interesante notar que en el Modelo de asignación de recursos (Hitz, 1986, pp. 54-57) en el
que los modelos de Mengert se utilizan para predecir el número de accidentes, los resultados de
los estudios antes y después se utilizan para estimar la seguridad efecto de los dispositivos de
advertencia. Es como si no se confiara en los resultados de la sección transversal para la esti-
mación del efecto de seguridad.
14 Saltando a través de la división de casi tres décadas, Park, Saccomanno y Lai recientemente
presentó tres artículos, tres modelos de regresión diferentes, todos utilizando los mismos datos
1 . Los tres artículos asumen, descaradamente 2 , que lo que uno encuentra por regresión en
datos de sección transversal puede ser utilizado para predecir la implementación de contrame-
didas de efecto de seguridad 3 .
En el primer artículo, Saccomanno y Lai (2005) utilizaron el análisis factorial para formar cinco
grupos de cruces Después de eso, un modelo de regresión como el de la ecuación. Se ajustaron
3 a cada grupo.
A diferencia de Coleman, Stewart y Mengert, quienes ajustaron ecuaciones separadas a cruces
con crossbucks, flashers y gates, Saccomanno y Lai hacen de 'Warning Device' una variable
dentro la ecuacion. Otra diferencia es que mientras Coleman, Stewart y Mengert eligieron una
forma modelo que permite que la dependencia del tráfico de carreteras y trenes sea altamente
no lineal (ver, por ejemplo, la Figura 1 y la ecuación. 2) Saccomanno, Lai (y luego Park) eligieron
una ecuación modelo que no puede representar tal no linealidad. Los coeficientes de regresión
relevantes se encuentran en la Tabla 3.
AccidentFrequency (RoadTraffic TrainTraffic)e β 1,wd (WarningDevice) β 2 (RoadSpeed). + = ×
ecuación 3 Tabla 3. Coeficientes de regresión de Saccomanno y Lai (2005, p.19) Grupo 1 2
3 4 5 β 1, Puertas 0 0 0 0 0 β 1,Crossbucks 0,87 0,78 1,21 1,28 1,53 β 1, intermitentes 0,63 * * *
0,91 * No estadísticamente significativo Parecería que para cruces en el Grupo 1 aquellos con
cruces tienen e 0.87 =2.39 veces el número de accidentes como cruces con puertas. Reemplazar
crossbucks con puertas entonces parecen reducir los accidentes por un factor de 1/2.39=0.42.
(La estimación imparcial de antes-después estudios mostrados en la Tabla 2 fue 0.32). Los cru-
ces con intermitentes tienen e 0.63 =1.88 veces el número de accidentes con puertas y una
actualización de luces intermitentes a puertas parecería reducir los accidentes por 1/1,88=0,53.
(La estimación imparcial en la Tabla 2 fue 0,55). Los cruces con intermitentes tienen
1,88/2,39=0,79 veces los accidentes de cruces con crossbucks. (La estimación imparcial en la
Tabla 2 era 0. 49.) Si estas diferencias reflejan las deficiencias del modelo, la imprecisión del
antes y el después estimaciones o el hecho de que los cruces en la Tabla 2 eran diferentes de
los cruces en el Grupo 1 no se puede decir De hecho, para los cruces en el Grupo 5, los números
son bastante diferentes. Aquellos con los crossbucks tienen 4,62 veces más accidentes que los
cruces con puertas (en comparación con 2,39 1 La base de datos fue el inventario de pasos a
nivel, exposición y frecuencia de colisión para 10,449 pasos públicos en Canadá durante 1993-
2001 2 Así, en la página 8 de Saccomanno y Lai (2005) los autores dicen que: “Si la contramedida
resulta en cambios en ya sea la pertenencia al grupo o la variable que se encontró significativa
en el modelo de predicción, estimar el número esperado de colisiones antes y después de la
contramedida”.
3 El siguiente comentario curioso está en Park y Saccomanno (2005a): “. intentamos establecer
una estadística relación entre colisiones y diversos factores de ingeniería (es decir, contramedi-
das) sin inferir causalidad.
estos modelos son útiles en el apoyo a la toma de decisiones con la evaluación del tratamiento
rentable para contramedidas específicas”.
(p.3) ¿Por qué predecir cuál será el efecto de implementar una contramedida no equivale a cau-
salidad? aclarado.
15 en el Grupo 1), los cruces con luces intermitentes tienen 2,48 veces el número de accidentes
con puertas y por lo tanto los cruces con luces intermitentes tienen 2,48/4,62=0,53 veces los
accidentes de los cruces con cruces En el segundo artículo, Park y Saccomanno (2005b) intentan
rectificar lo que ven como una fracaso común de los modelos de regresión para producir estima-
ciones sensibles del efecto de contramedida 1 . Como en el primer documento, la mejora espe-
rada reside en un enfoque de dos pasos. El primer paso es dividir los cruces en grupos sensibles
por sus atributos, utilizando una estructura de árbol binario. los El segundo paso es, como antes,
ajustarse a un modelo de regresión como el de la ecuación. 3. La innovación está en que las
agrupaciones obtenidas en el primer paso actúan como variables cuya finalidad es captar posi-
bles interacciones complejas.
Cuando estos términos de interacción no están incluidos en la ecuación del modelo y variables
como Se omiten 'Clase de carretera' y 'Velocidad de carretera', por lo que se reemplazan los
crossbucks con luces intermitentes.
Se estima que reduce los choques a 0.11 de su número (¡una reducción del 89%!). Este resultado
exagerado puede tomarse como evidencia de que cuando las variables importantes no están
representadas en una regresión, no se puede confiar con el propósito de estimar el efecto de
seguridad de la acción. Sin embargo, cuando el términos de interacción se incluyen en la ecua-
ción de regresión, los resultados cambian. Así, por ejemplo, si se supone que la conversión de
crossbucks a flashers se lleva a cabo en 'Otros' caminos el accidente la reducción se estima en
sólo un 28% mientras que en 'Carreteras Arteriales/Colectoras o Locales' sería 75%.
El tercer artículo (Park YJ y Saccomanno 2005a) se basa en el primero en ese apartado Se
ajustan modelos de regresión 2 a varios grupos homogéneos de cruces y a partir del segundo
papel en el que se utiliza el mismo algoritmo de árbol binario para agrupar los cruces. Solo cruce
de atributos que no se pueden cambiar (por ejemplo, clase de carretera o región) se utilizaron
para la agrupación con la esperanza de que esto eliminaría el efecto de estos atributos en la
regresión 3 . Los resultados de interés aquí están en la tabla 4.
1 “. los modelos actuales de predicción de colisiones para pasos a nivel tienden a tener una
estructura simple y están mal especificados en términos de importantes factores de contramedi-
das. Como tales, tienen un uso limitado en el apoyo a la toma de decisiones para el desarrollo y
evaluación de contramedidas”. (pág. 2) 2 Por alguna razón que no se explica, en el segundo
artículo se consideró apropiado un modelo Binomial Negativo, pero En el tercero se utilizó el
modelo de Poisson.
3 Si bien la técnica de agrupación es nueva, la idea es similar a la que hicieron Coleman y Stewart
en 1976 cuando ajustaron modelos separados para 12 grupos de cruce por ubicación (urbana o
rural), vías (únicas o múltiples) y dispositivo de advertencia (crossbucks, intermitentes o puertas).
dieciséis Tabla 4. Multiplicadores de conversión basados en coeficientes de regresión de
Park y Saccomanno (2005, Tablas 3 y 4) y de la Tabla 2.
Crossbucks a Intermitentes Crossbucks a puertas Todas las variables de control 0,18±0,01
0,06±0,01 Solo relacionado con la carretera Variables de control 0,22±0,02 0,06±0,006 Solo re-
lacionados con el ferrocarril Variables de control 0,15±0,01 0,05±0,005 Modelos convencionales
que contienen control atributos tales como clase de carretera, número de vías, etc. No relacio-
nadas con ferrocarriles o carreteras Variables de control 0,19±0,01 0,05±0,005 Arterial o Colector
0,22±0,03 0,06±0,01 Otras Carreteras con Múltiples Pistas 0,31±0,08 0,11±0,02 Carreteras Lo-
cales con Sencillo Pista 0,21±0,02 0,09±0,02 Modelos para cuatro cruce de clases clasificado
por control atributos Otros caminos con solo pista 0,26±0,14 0,34±0,36 De la Tabla 2 Sin sesgo
Antes-Después 0,49 0,32 ± un error estándar La parte superior de la Tabla 4 es para modelos
de regresión de modelos convencionales en los que la carretera y los atributos del carril (como
el ancho de la superficie o el ángulo de vía) se introdujeron como variables; la mitad parte es
para modelos de regresión en cuatro clases de cruces y la última fila es de la Tabla 2.
Considerando la magnitud de los errores estándar, las estimaciones en las partes superior y
media de La tabla 4 son bastante similares. Se puede concluir que las estimaciones son poco
sensibles a la inclusión o exclusión de las variables Carretera y Ferrocarril (y de clasificación).
Como se ha señalado anteriormente, los tres artículos usaban los mismos datos y el mismo
formulario modelo. Aún así, dependiendo de cuál se usaron las variables, qué técnica de agru-
pación se implementó y qué distribución se seleccionó (Poisson o Binomial Negativo), se obtuvo
una variedad de resultados. Además, colectivamente, estos estimaciones son diferentes de las
obtenidas por Coleman-Stewart, por Mengert, y en estudios antes-después.
Un breve resumen de los hallazgos del estudio de caso puede ser útil: 1. Los estudios de antes
y después del efecto de seguridad de los dispositivos de advertencia parecen haber arrojado
resultados consistentes (incluso si sesgados).
2. El inconveniente de un estudio de antes y después es que, por lo general, solo se obtiene un
efecto de seguridad "promedio".
estimado. Si el efecto de seguridad depende de hecho de los atributos de la unidad tratada, como
es Es prudente suponer que el conocimiento únicamente del "efecto promedio" ofrece poca orien-
tación para acción práctica cuando el objetivo es aplicar un tratamiento donde hará el mayor bien.
3. Si el efecto de seguridad depende de los atributos de las entidades tratadas, no se puede decir
si los resultados de un estudio de antes y después son consistentes con los resultados de otro
estudio sin que: una. conocimiento de los atributos de las entidades en el estudio antes-después
y 17 b. conocimiento de cómo el efecto de seguridad depende de estos atributos.
4. Los estudios de regresión basados en datos transversales produjeron resultados muy varia-
dos.
Se puede concluir que la predicción del efecto basada en el modelo de Coleman-Stewart es tan
diferente de lo que se ha encontrado en los estudios de antes y después que probablemente
estén equivocados.
Sin embargo, uno no puede decir por qué están equivocados. Los resultados de Mengert no son
inconsistentes con lo que muestra el antes y el después. Incluso cuando se utilizó la misma base
de datos y el mismo modelo forma asumida, como en los artículos de Saccomanno, Lai y Park,
se obtuvieron resultados muy variados.
obtenido. No se puede decir cuánto de esto refleja el hecho de que el mismo trato cuando apli-
cado a diferentes sitios producirá diferentes resultados y cuánto se debe a la supuestos hechos
en el proceso de modelado o las deficiencias de los datos. En conjunto, los resultados obtenidos
por regresión sobre datos transversales no inspiran confianza. Está difícil saber qué resultado
creer.
5. Ni Coleman, Stewart ni Mengert pretendían que sus resultados se usaran para predecir el
efecto de las contramedidas. Por el contrario, Saccomanno, Lai y Park (y muchos otros) hacen
de la predicción del efecto de la contramedida la piedra angular de su regresión trabajar. Este
estudio de caso no apoya mucho la esperanza de que tal programa de la investigación dará
resultados.
Este estudio de caso es solo una anécdota y sus conclusiones no deben generalizarse.
Sin embargo, la impresión es que los modelos de regresión, cuando se basan en datos transver-
sales, pueden conducir a a resultados que no inspiran confianza. El hecho de que el θ obtenido
de alguna regresión modelos parece depender de los atributos de las entidades tratadas, y por
lo tanto es atractivo en aplicaciones prácticas, puede ser algo así como una ilusión; no es más
que un subproducto de las suposiciones hecho por el modelador sobre la forma funcional de la
ecuación del modelo y sobre qué variables están representados en ella. Hacer que el efecto del
tratamiento sea una función del atributo de las unidades tratadas, como ha sido intentado por
Saccomanno, Lai y Park es importante y debe continuarse.
Hay una gran diferencia entre los estudios de antes y después y las regresiones basadas en
datos transversales que no surgieron naturalmente en la discusión anterior y, sin una mención
de lo cual, esta sección estaría incompleta. Cuando se compara la seguridad de una unidad
antes y después del tratamiento, la unidad sigue siendo la misma (es básicamente el mismo
camino o intersección, utilizado por el mismo tipo de personas, en el mismo lugar, clima, etc.).
Por lo tanto, es razonable esperar que uno puede dar cuenta de lo que ha cambiado desde el
período 'antes' al período 'después'. En cambio, en una sección transversal estudio uno compara
entidades 'con atributo A' (digamos, crossbucks) a diferentes entidades 'con atributo B' (digamos,
luces intermitentes). La unidad proporcionada por el conocimiento de que 'la unidad sigue siendo
la misma' se aplica ahora. No se puede estar seguro de que después de tener en cuenta las
diferencias acerca de qué tenemos datos (tráfico y volúmenes de trenes, número de vías, etc.)
no hay otra sistemática diferencias sobre las entidades 'con A' y 'con B' sobre las que no hay
información. Hay la sospecha omnipresente de que las entidades tienen atributo A pero no B por
una buena razón y que estos las razones no se conocen completamente y son difíciles de explicar
en un modelo de regresión. Así, por ejemplo, un grado el cruce puede tener luces intermitentes
y no crossbucks porque tenía un historial previo de accidentes, tal vez debido a las quejas de los
usuarios de la carretera que sufrieron cuasi accidentes, debido a la existencia de un listado de
prioridades basado en alguna fórmula, etc.; ninguno de estos es fácil de capturar en una regre-
sión.
18 Habiendo presentado los muchos problemas dentro del marco tangible de la seguridad en los
pasos a nivel, el El próximo paso es examinar lo que la literatura científica tiene que decir sobre
el tema de causa-efecto en estudios observacionales.
19 3. CAUSA, EFECTO, CONFUNDIMIENTO Y CONSISTENCIA El concepto de causa es res-
baladizo. Algunas de las dificultades pueden evitarse distinguiendo entre dos cuestiones diferen-
tes: Pregunta A: ¿Cuál es el efecto de seguridad de un tratamiento (una causa)? Pregunta B:
¿Cuáles son las causas de ciertos eventos (p. ej., las causas de los camiones grandes)? fallas 1
)? Cualesquiera que sean las dificultades para responder a la pregunta B, no son motivo de
preocupación; aquí hacemos una pregunta A. Especificamos qué causa (tratamiento) es de inte-
rés y preguntamos sobre su efecto. Si bien es claro qué 'causa' nos interesa, la definición de
'efecto' requiere un cuidado considerable. 2 3.1 Definición de causa y efecto.
La preocupación por la validez de las inferencias causales basadas en datos es común a muchos
disciplinas: educación , medicina, sociología , etc. Naturalmente, mucho se ha escrito sobre el
tema.
El marco de discusión que se utilizará a continuación fue proporcionado por Holland (1986). Sus
méritos son rigor y claridad y por tanto la promesa de que pueda adaptarse a las circunstancias
de la seguridad vial investigar.
Sea 'U' una población de entidades y 'u' una entidad específica de esta población. Porque por
'efecto' entendemos el resultado de un cambio en la naturaleza o magnitud de una causa, y el
cambio es siempre de algo a otra cosa, necesitamos especificar (al menos) dos designaciones
de causa, decir 't' y 'c' 3 . Cada entidad u está asociada con un valor Y(u) - la 'variable de res-
puesta'. De este modo, Y t (u) es el valor de la variable de respuesta que se observaría si la
entidad u estuviera expuesta a la causa ty Y c (u) es el valor que se observaría en la misma
unidad si estuviera expuesta a la causa c.
El efecto de la causa t en relación con la causa c en la entidad u se describe completamente
comparando 4 Y t (u) y Y c (u). Rubin (1990) llama a esto el 'efecto causal a nivel de unidad'.
El “Problema Fundamental de la Inferencia Causal” 5 es que normalmente es imposible tanto
tratar y no tratar la misma unidad 6 y por lo tanto es imposible observar 7 en u tanto Y t (u) como
Y c (u).
1 Usaré los términos 'accidente', 'choque' y 'colisión' para significar lo mismo.
2 Seguiré la notación y exposición de Holland (1986) quien se refiere a su descripción como el
Modelo de Rubin para Inferencia causal basada en Rubin (1974; Rubin 1977; Rubin 1978; Rubin
1980) un formalismo que apareció por primera vez en la literatura estadística en Neyman (1923).
3 En el artículo de Holland, 't' puede connotar tratamiento y 'c' control. Sin embargo, es importante
no precipitarse y no pensar en 'c' como grupo de control. En este punto, 'c' es una causa o un
tratamiento, al igual que 't'.
4 Las medidas comúnmente usadas del efecto causal para una entidad son Y t (u)-Y c (u) y Y t
(u)/Y c (u), (ver, por ejemplo, Rubin 1990).
5 Holanda (1986), página 947.
6 El ejemplo de Holland es un nuevo programa para enseñar matemáticas a estudiantes de
cuarto grado que luego son evaluados al final del año.
Cierto alumno de cuarto grado podría estar expuesto a este nuevo programa o no, pero no ambas
cosas. Por lo tanto, para cualquier u, se puede medir directamente Y t (u) o Y c (u).
7 Dado que Y t (u) o Y c (u) deben permanecer inobservados y, sin embargo, ambos son nece-
sarios, uno de ellos es del tipo hipotético naturaleza de lo que se observaría si se hubiera produ-
cido una acción cuando, de hecho, no se produjo: un contrafactual.
Groenlandia et al. (1999) explican: “Un ejemplo típico es el de McMahon y Pugh, quienes afirman
que '. una asociación puede clasificarse como presuntamente causal cuando se cree que, de
haberse alterado la causa, se habría producido el efecto.
20 Holland dice que hay dos soluciones generales a este problema fundamental; el cientifico
solución y la solución estadística. Él describe la solución científica así: “Por ejemplo, al estudiar
cuidadosamente el comportamiento de una pieza de equipo de laboratorio, un científico puede
llegar a creer que el valor de Y c (u) medido en un momento anterior es igual al valor de Y c (u)
para el experimento actual. Todo lo que tiene que hacer ahora es exponerte a ti.
y mide Y t (u) y ha superado el Problema Fundamental de la Inferencia Causal.
Tenga en cuenta, sin embargo, que este científico hipotético ha hecho una homogeneidad no
comprobable suposición. Mediante un trabajo cuidadoso, puede convencerse a sí mismo y a los
demás de que esta suposición es correcto 1 , pero nunca puede estar absolutamente seguro.”
(pág. 947) El “supuesto de homogeneidad no comprobable es que el valor de Y c (u) observado
en el pasado es lo que el valor de Y c (u) sería si se hubiera observado en el presente si se
aplicara 'c' en lugar de 't'.
La solución estadística descrita por Holland es desviar la atención del efecto a nivel de unidad
(de la causa t en la entidad u relativa a la causa c) al 'efecto promedio' de la causa t relativa a la
causa c cuando el promedio es sobre todas las entidades de la población U. Rubin (1990) llama
a esto el 'típico efecto casual a nivel de unidad" o "efecto causal a nivel de población". La idea
central es que algunas entidades de U son tratados y permiten la estimación del valor esperado
E{Y t (u)} mientras que las entidades restantes de U se dejan sin tratar y permiten estimar E{Y c
(u)}. El efecto promedio T se describe entonces comparando E{Y t (u)} y E{Y c (u)}.
Así como la solución científica depende de una suposición no comprobable, también lo hace la
estadística.
solución. Aquí la suposición no comprobable es que la respuesta promedio a t de las entidades
tratadas es ¿Cuál sería la respuesta promedio a t de todas las entidades en U si se tratara 2 , y
que el promedio respuesta a c de las entidades no tratadas es cuál sería la respuesta promedio
a c de todas las entidades en U, todos habían quedado sin tratamiento 3 . Así como el científico,
el estadístico nunca puede estar seguro que esta suposición es correcta. Sin embargo, mediante
un trabajo cuidadoso (que implica decidir qué entidades son tratados y cuáles no) el estadístico
puede convencerse a sí mismo y a otros de que la suposición está justificado.
En la "solución estadística", la plausibilidad de la suposición no comprobable se basa en aleato-
rización y/o emparejamiento. Ambos requieren que el experimentador tenga control sobre qué
unidad cambió.' …la alteración de la condición antecedente (causa) y el posterior cambio en el
resultado (efecto) son contrario a lo que de hecho se observó; es decir, son contrafactuales ”.
(pág. 30) 1 La “suposición de homogeneidad” de los científicos es la creencia de que “el valor de
Y c (u) medido en un momento anterior es igual a cuál sería el valor de Y c (u) para el experimento
actual”. Esto también es un contrafactual como es obvio si uno lo reformula para decir: “que el
valor de Y c (u) medido en un momento anterior es el que se obtendría en el presente experi-
mente si se aplicó la causa 'c' en lugar de la causa 't'. Parece ser el mismo tipo de homogeneidad
contrafactual suposición que podría hacer un analista en un estudio de antes y después, la creen-
cia de que los accidentes "antes del tratamiento" materializarse en el período 'después del trata-
miento', si la entidad no ha sido tratada. El problema es que el científico en el al laboratorio le
resultaría más fácil convencerse a sí mismo y a los demás de que la suposición es correcta que
al Analista de antes y después. Las razones de la diferencia son obvias; el laboratorio permite el
control de las condiciones y replicación con poca aleatoriedad, el entorno de observación no.
2 La suposición sería claramente incorrecta si las entidades se seleccionan para el tratamiento
porque es más probable que responder a ella que las entidades dejadas sin tratar.
3 La suposición sería claramente incorrecta si la selección para el tratamiento estuviera motivada
por el historial de accidentes de las entidades y no se tuvo en cuenta la regresión a la media.
21 recibe tratamiento y cuál no. Con aleatorización, cuando las entidades de U se asignan a t o
c independientemente de sus atributos (incluida la variable de respuesta), uno puede esperar
que ambos tratados y las entidades no tratadas son representativas de la población U. Con em-
parejamiento, cuando los pares pueden se forman que son idénticos en los atributos 1 , y uno
del par se asigna a t, se obtiene la plausibilidad por los mismos motivos. La creencia fundamental
subyacente de la aleatorización y el emparejamiento estrategias es que la respuesta de una
unidad a un tratamiento está determinada por algunos de sus atributos: el atributos relevantes
para la respuesta, y que las unidades con atributos relevantes para la respuesta idénticos tendrán
respuestas idénticas al tratamiento (ya sea 'c' o 't').
Cuando el estadístico no tiene control sobre la asignación de entidades a t o c, como es cierto
en los estudios observacionales, la pregunta sigue siendo la misma: ¿Es cierto que la respuesta
(promedio) a t de las entidades tratadas es cuál sería la respuesta (promedio) a t de todas las
entidades en U si tratados, y que la respuesta promedio a c de las entidades no tratadas es cuál
sería el promedio respuesta a c de todas las entidades en U, ¿habían quedado todas sin trata-
miento? Sin embargo, ahora los medios por contestarla afirmativamente faltan. Holland (1986)
remite al lector a otras fuentes para su posterior examen.
En palabras de Holland , “las inferencias causales proceden de los valores observados. y de
supuestos que abordan el Problema Fundamental de la Inferencia Causal pero que por lo general
son no comprobable.” (pág. 948). Para progresar uno tiene que hacer la pregunta de seguimiento:
¿Qué hace que el suposiciones no comprobables tan plausibles que el científico o estadístico
puede "convencerse a sí mismo y otros” que la suposición es correcta? Holland no persigue esta
pregunta para el científico excepto para decir que "La ciencia ha progresado mucho utilizando
este enfoque” y que “…es un lugar común en la vida cotidiana como bien” (p. 947). Es útil indagar
un poco más. ¿Qué justifica realmente la creencia del científico de que “el valor de Y c (u) medido
en un momento anterior” es igual a lo que sería el valor de Y c (u) ahora bien, ¿no se había
aplicado la 't'? La justificación parece descansar en la experiencia de que siempre que los cien-
tíficos midieron Y c (u) en momentos anteriores (o hicieron mediciones repetidas de cantidades
bajo circunstancias similares), los valores medidos eran todos iguales (dentro del error de me-
dida). Aunque esto no significa necesariamente que el patrón pasado persistiría siempre, es en-
teramente justificable creer que así sería. La creencia en la 'homogeneidad de la naturaleza' es
una base respetable de creencias causales.
Como se mencionó anteriormente, la justificación de Holland (y Rubin) de la suposición no com-
probable sobre el que descansa la solución estadística deriva de la aleatorización (es decir, la
independencia entre la decisión de asignar entidades a la causa 'c' o 't' y los atributos relevantes
para la respuesta de estos entidades.) Esto difiere de la justificación del científico de varias ma-
neras. Primero, el científico estimación de Y c (u) se basa en experiencias del pasado (o de otro
tiempo) mientras que el estadístico utiliza la experiencia contemporánea de entidades dejadas
sin tratar. En segundo lugar, la suposición del científico está en el nivel de una sola unidad (o de
unidades casi idénticas) mientras que la suposición del estadístico se refiere a promedios sobre
un conjunto (grande) de diferentes unidades. En tercer lugar, la "homogeneidad de la suposición
de la naturaleza es que, en el ambiente controlado del laboratorio, hay razón para cree que si en
la unidad u Y c (u) se obtuvo en un momento también se obtendría en otro momento.
1 En sentido estricto, sólo deben ser evaluados aquellos atributos que tienen algo que ver con la
respuesta al tratamiento.
considerado en el emparejamiento. Estos se denominarán atributos 'relevantes para la respues-
ta'.
22 La creencia de la “homogeneidad de la naturaleza” del estadístico parece ser que dos con-
juntos de entidades que tienen la misma distribución de atributos 1 se puede esperar que tengan
la misma respuesta promedio a causa 'c'.
La comprensión de que todos los conceptos de causalidad requieren una homogeneidad no com-
probable.
suposición y que las suposiciones de homogeneidad del científico y del estadístico son diferentes
y tener diferentes justificaciones es liberador. Crea la oportunidad y la licencia para buscar y
enunciar medios adicionales para justificar los supuestos de homogeneidad, medios que pueden
adecuarse a la realidad de estudios observacionales. La justificación del estadístico de la supo-
sición de homogeneidad se basa en la capacidad de decidir qué entidad obtiene 'c' y cuál obtiene
't'. En los estudios observacionales esto no es posible. Sin embargo, a un nivel más fundamental,
la justificación del estadístico es que (debido a aleatorización y/o emparejamiento) es razonable
creer que las entidades con 'c' tienden a tener los mismos atributos relevantes para la respuesta
que aquellos con 't'. Quizá haya medios por los cuales uno pueda proporcionar a los estudios
observacionales una justificación que se basa en una 'igualdad de respuesta relevante' argu-
mento de los atributos. De manera similar, puede ser posible hacer autostop en los faldones del
abrigo del científico.
cuyo supuesto de homogeneidad era que si Y c (u) se obtenía en el pasado también sería obte-
nido en el futuro. Por lo tanto, la pregunta es si se puede afirmar y justificar la homogeneidad
suposiciones para estudios observacionales de antes y después y estudios transversales obser-
vacionales.
Considere primero un estudio observacional en el que se aplica un tratamiento a las unidades.
El momento de la el tratamiento define, para cada unidad, un período de pretratamiento y de
postratamiento. Llámalo un estudio observacional antes-después. Imagine un experimento de
laboratorio para determinar el coeficiente de Expansión térmica de una barra de metal. Se trata
de medir la longitud de la varilla antes y después calentar y quizás aplicar algunas correcciones
para tener en cuenta los cambios de temperatura y presión en el laboratorio. La idea es que la
longitud de la varilla antes del experimento, después de la corrección por Las diferencias de
temperatura y presión entre el tiempo "antes de calentar" y "después de calentar" son cuál sería
la longitud de la barra en el momento 'después del calentamiento' si la barra se dejara sin calen-
tar.
Siguiendo el ejemplo del científico, lo que debe mostrarse para los estudios observacionales de
antes y después es que al usar valores observados del pasado (y al complementar esto con
información sobre cómo algunas circunstancias relevantes han cambiado desde el período 'an-
tes' al período 'después') es posible predecir el valor de Y c (u) para el período 'después'. Si fuera
posible demostrar que el los valores predichos y medidos de Y c (u) están repetidamente cerca
uno del otro en una variedad de circunstancias, entonces el 'científico observacional' tendría las
bases necesarias para 'convencer a sí mismo y a los demás” que esta marca del supuesto de
homogeneidad está justificada. Sería un justificación similar a la del científico que (después de
'correcciones' por cambios) lo que ha sido observados en el pasado se observarían en el pre-
sente si no se aplicara ningún tratamiento. Si y se puede demostrar que los valores pronosticados
y observados de Y c (u) están 'repetidamente cerca uno del otro' otro' es una pregunta empírica
que puede ser respondida a través de un programa de investigación. por cuanto en investigación
sobre seguridad vial aún no se ha emprendido un programa de investigación de este tipo, aún
no es posible decir si en estudios observacionales de antes y después con unidades tratadas,
los juicios de causalidad puede estar bien fundamentado en el paradigma de un 'científico obser-
vacional'. Pero la perspectiva de éxito es excelente.
Considere a continuación un estudio sobre el efecto de seguridad del cambio de 'c' a 't' en el que
las unidades que tienen 'c' se comparan con otras unidades que tienen 't'. Llámalo un cruce
observacional.
1 Solo la distribución de atributos que afectan la respuesta de las entidades a la causa c debe
ser la misma.
23 estudio de sección. En esta circunstancia, la creencia de que si nada más cambiara el pasado
se parecería a el presente no sirve. Ahora, la suposición que se justifica es que las unidades que
se encuentra que tienen 't' han respondido a 'c' de la misma manera que las unidades que tienen
'c'. Para justificarlo hay que invocar la misma creencia fundamental sobre la que descansa la
solución estadística; es decir, que la respuesta de un unidad a 'c' o 't' está determinada por sus
atributos relevantes para la respuesta (y que las unidades con los atributos idénticos relevantes
para la respuesta tienen respuestas idénticas a 'c' y 't'). En resumen, para justificar la suposición
no comprobable en un estudio transversal observacional uno debe ser capaz de demostrar que
las unidades que tienen 'c' tienen los mismos atributos relevantes para la respuesta que las uni-
dades que tienen 't'. En estudios transversales suele ser difícil proporcionar la justificación reque-
rida. Las dificultades son tanto práctico como conceptual. Para ilustrar, usaré la configuración de
los pasos a nivel de ferrocarril y carretera.
presentado en el Capítulo 2.
Algunos cruces tienen 'crossbucks', otros tienen 'flashes' y hay razones para esto diferencia. Las
razones son de dos tipos, ambas relacionadas con la práctica profesional. El primer tipo de la
razón tiene sus raíces en la eficiencia económica. En general, cuanto más tráfico atiende una
instalación, más caro el tratamiento 1 que recibe. En el marco específico de la seguridad en los
pasos a nivel, los sitios con más tráfico de vehículos y trenes tenderá a estar equipado con la
advertencia más costosa dispositivos. Crossbucks cuestan menos que las luces intermitentes
que, a su vez, son menos costosas que las puertas, y las puertas son más baratos que la sepa-
ración de grados. Uno debe suponer razonablemente que tanto los vehículos como los trenes el
tráfico son atributos relevantes para la respuesta. Por lo tanto, es imposible afirmar que "unidades
encontradas para tienen 'c' (por ejemplo, crossbucks) tienen los mismos atributos relevantes para
la respuesta que las unidades que tienen 't' (digamos, intermitentes) a menos que uno pueda
encontrar muchos cruces que son similares en el tráfico de trenes y vehículos pero difieren en el
dispositivo de advertencia. La dificultad práctica es que, debido a la prevalencia de la sensatez
práctica profesional, se encontrarán pocos cruces de este tipo.
Supongamos ahora que la dificultad práctica puede superarse y que un número suficiente de
cruces coincidentes en el tráfico de vehículos y trenes (y en varios otros atributos relevantes para
la respuesta) como el número de vías, el entorno urbano o rural, la velocidad del tren, el triángulo
visual, etc.).
Ahora uno debe preguntarse por qué algunos de los cruces ostensiblemente similares tienen
crossbucks y otros tienen luces intermitentes No se debe suponer que la elección se ha hecho
sin razón. De lo contrario, la elección de un dispositivo de advertencia a menudo se basa en
consideraciones del historial de accidentes pasados, público presión, cuasi accidentes y de un
juicio profesional sobre por qué algún sitio se beneficiaría de intermitentes y otro no. En conse-
cuencia, la siguiente dificultad conceptual insalvable surge: si los cruces ostensiblemente simila-
res reciben diferentes dispositivos de advertencia por alguna razón, entonces uno no puede afir-
mar que "las unidades que tienen 'c' tienen los mismos atributos relevantes para la respuesta
que las unidades encontrado tener 't'”. Las diferencias en los atributos relevantes para la res-
puesta pueden ser difíciles de identificar o describir, pero se debe suponer que existen.
En resumen, para los estudios observacionales de antes y después podría sugerir un programa
de investigación por que se podría establecer la confianza en el supuesto de homogeneidad no
comprobable. Hay un buena oportunidad para que tenga éxito. Para estudios transversales ob-
servacionales no sé cómo hacer asi que; No puedo imaginar un programa de estudio con buenas
posibilidades de éxito.
1 La práctica profesional relevante se captura en estándares, directrices, garantías, etc., todos
los cuales están escritos de manera que las instalaciones con más tráfico obtienen las
características de diseño, marcas, dispositivos de control de tráfico y mantenimiento más caros
debido a que es en instalaciones de alto uso donde el gasto puede justificarse por la seguridad
y otros ahorros.
24 3.2 Confusión e intercambiabilidad en estudios observacionales de secciones transver-
sales de carreteras La seguridad.
La columna vertebral de la Sección 3.1 es el marco Holland-Rubin que se adapta a la circuns-
tancia en la que algunas unidades fueron efectivamente tratadas. Este marco no simpatiza con
el circunstancia del estudio transversal observacional en el que se encuentra que algunas unida-
des tienen 'c' y se encuentra que otros tienen 't'. Dado que es el estudio transversal observacional
el que está en el centro de nuestra investigación, en lo que sigue, haré uso del trabajo de otros
autores que están más abierto a la posibilidad de interpretación causal en estudios transversales.
El supuesto de homogeneidad para los estudios observacionales transversales 1 está estrecha-
mente relacionado con la noción de 'intercambiabilidad' y de 'confusión'. En este contexto Pearl
(2000) escribe: “Conceptualmente, la conexión entre confusión e intercambiabilidad es la si-
guiente. Si nos comprometemos a evaluar el efecto de algún tratamiento, debemos asegurarnos
de que cualquier respuesta la diferencia entre el grupo tratado y el no tratado se debe al trata-
miento en sí y no (debido) a algunas diferencias intrínsecas entre los grupos que no están rela-
cionadas con el tratamiento. En otra palabras, los dos grupos deben parecerse entre sí en todas
las características que tienen relación con el variable de respuesta. En principio, podríamos ha-
ber terminado la definición de confusión en este punto; declarando simplemente que el efecto
del tratamiento no se confunde si los grupos tratados y no tratados se parecen entre sí en todas
las características relevantes. Esta definición, sin embargo, es demasiado verbal en el sentido
que es muy sensible a la interpretación de los términos "semejanza" y "relevancia".
es menos informal, GR 2 usó el 3 giro de permutación hipotética de De Finetti ; en lugar de juzgar
si dos grupos son similares, se instruye al investigador para que imagine un intercambio hipoté-
tico de los dos grupos (el grupo tratado deja de ser tratado y viceversa) y luego juzgar si los datos
observados en el swap se distinguirían de los datos reales.” (p.
196) Para desarrollar los puntos de vista de Greenland-Robins (GR) a los que se refiere Pearl,
me basaré en el artículo de Greenland et al. {Greenland, 1999 1166 /id.) que proporciona una
formalización de confuso Para evitar la duplicación, convertiré la formalización GR en la notación
'Holanda' introducido anteriormente. Mientras que el punto de partida tanto para Holland-Rubin
como para Greenland et al. es lo mismo -el enfoque contrafáctico de causa y efecto- hay diferen-
cias importantes entre las dos formulaciones. Holland (1986), cree en el lema “No Causation
Without manipulación” y dice que: “Debido a que la experimentación es un instrumento científico
y herramienta estadística y que a menudo introduce claridad en las discusiones de casos espe-
cíficos de causalidad, me baso descaradamente en el lenguaje y el marco de los experimentos
para el modelo de inferencia causal”. (p.946) Los experimentos siempre involucran algún trata-
miento o manipulación. En Por el contrario, Groenlandia et al. (1999) basan su razonamiento en
una comparación de dos poblaciones de unidades; el tratamiento 't' se aplica a las unidades de
población 'A' y el tratamiento 'c' a las unidades de población 'B': una comparación transversal.
1 Que las unidades que tienen 'c' tienen los mismos atributos relevantes para la respuesta que
las unidades que tienen 't'.
2 Aquí se hace referencia a un artículo de Greenland y Robins (1986).
3 (De Finetti 1974).
25 Para definir 'confundir' Groenlandia en al. (1999) argumentan de la siguiente manera. Supon-
gamos que nuestro el objetivo es determinar el efecto del tratamiento 1 't' sobre las respuestas
Y(u) de unidades en población A, relativo al tratamiento 'c', y que μ es un parámetro de la distri-
bución de las respuestas Y(u). A ilustran, Groenlandia et al. (1999) dicen que “Por ejemplo, la
población A podría ser una cohorte de pacientes con cáncer de mama, el tratamiento 't' podría
ser una nueva terapia hormonal, 'c' podría ser un placebo terapia, y el parámetro μ podría ser la
supervivencia esperada o la probabilidad de supervivencia a cinco años de la cohorte.” (pág. 32
).
Sean μ iguales a μ At si se aplica 't' a la población A y μ Ac si se aplica 'c' a la población A. El
efecto causal de 't' relativo a 'c' se define en términos de una comparación entre μ At y μ Ac .
Si las unidades de A se observan bajo el tratamiento 't' entonces μ At es observable o estimable;
sin embargo, μ Ac entonces no se observará 2 . Sin embargo, suponga que esperamos que μ Ac
sea igual a μ Bc , donde μ Bc es el valor de μ para unidades de población B con tratamiento 'c'.
En el ejemplo anterior, este sería el cohorte de pacientes con cáncer de mama que reciben el
placebo. Ahora se puede escribir una definición clara de confuso: “ Decimos que existe confusión
si, de hecho, μ Ac ≠ μ Bc , porque entonces debe haber alguna diferencia entre las poblaciones
A y B (aparte del tratamiento) que es responsable de la discrepancia entre μ Ac y μ Bc ”. (pág.
32) Para ilustrar el concepto en un entorno de seguridad vial, suponga que un conjunto de vías
rurales de dos vías segmentos de carretera tiene cuatro pies de arcenes pavimentados (Carre-
teras A en la Figura 8 con tratamiento 't') y otro conjunto de dichos segmentos de carretera tiene
dos pies de arcenes pavimentados ((Carreteras B con tratamiento 'c').
Los cuadrados negros en la Figura 8 indican cantidades que se pueden observar (estimar). Por
lo tanto, la los observables son μ At (choques/milla-año en las carreteras A que 'se encontró que
tenían t') y μ Bc (choques/milla-año en las carreteras B que se 'encontró que tenían c'). La orde-
nada de un círculo vacío en La Figura 8 es lo que sería μ en los caminos A si estos caminos
tuvieran dos pies de arcenes pavimentados. Círculo 1 y el círculo 2 son solo dos de un número
infinito de posibles posiciones del círculo. La posición de un círculo vacío es inobservable porque
pertenece a una circunstancia que de hecho no existió: un contrafactual 1 Groenlandia et al.
distinguir entre 'tratamiento' como agente administrado por el investigador y 'exposición' que, en
medicina, generalmente se refiere a un agente de daño al que las unidades están expuestas sin
ninguna premeditación por parte del investigador. Desafortunadamente, en seguridad vial, el tér-
mino 'exposición' significa algo completamente diferente (por ejemplo, millas-vehículo de viaje).
Para evitar confusiones, usaré 'tratamiento' para referirme a ambos tipos de agentes.
2 Este es el Problema Fundamental de la Inferencia Causal.
26 Figura 8. Aspectos básicos de una comparación transversal La idea principal es usar la
cantidad observable en los caminos B (es decir, μ Bc ) para adivinar cuál es el podría ser la
ordenada inobservable del círculo vacío. La comparación de μ At con μ Bc no será confundido si
el número medio de choques/(milla-año) en las carreteras B (la ordenada del negro cuadrado a
la izquierda, μ Bc ), es lo mismo que sería en las carreteras A si tuvieran dos pies de pavimentado
hombro, no cuatro (la ordenada del círculo 1). Por el contrario, la comparación de μ At con μ Bc
será confundido si el número medio de choques/(milla-año) en las carreteras B ( μ Bc ), no es lo
mismo que el número de choques/milla-año sería en las carreteras A si tuvieran un arcén pavi-
mentado de dos pies (la ordenada del círculo 2) .
Dado que la posición del círculo es desconocida e inobservable, ¿cómo se puede juzgar si ¿Está
en la posición 1 (sin confusión) o en la posición 2 (confusión)? Hay dos generales enfoques para
disminuir la amenaza del sesgo 1 debido a la confusión en la sección transversal observacional
estudios. Un enfoque es la ecualización de atributos ya sea por 'restricción' o por 'coincidencia'.
Si las carreteras B pueden elegirse de modo que todos sus atributos relevantes para la respuesta
sean los mismos que los de las carreteras Entonces uno puede creer justificadamente que la
ordenada del cuadrado completo izquierdo es la misma que la ordenada del círculo. Este enfoque
se muestra en la Figura 8 por la flecha horizontal entre la izquierda cuadrado completo y círculo
1. El otro enfoque es la igualación por análisis. El paso de análisis consiste de agregar una 'co-
rrección' a μ Bc que tenga en cuenta las diferencias que existen en las respuestas relevantes
atributos entre las carreteras A y B. La 'corrección' corresponde a la flecha vertical en la Figura
8 que va del cuadrado lleno al cuadrado vacío que tiene la misma ordenada que el círculo 2. El
La ordenada del cuadrado vacío es una estimación de cuál sería el μ de las carreteras B si
tuvieran todos los atributos relevantes para la respuesta de las carreteras A, excepto que tienen
el tratamiento 'c'. En la Figura 8 esto ordenada es μ B□ . Si la corrección μ B□ - μ Bc es de la
magnitud correcta, entonces se puede argumentar nuevamente que la comparación no se con-
funde. Ambos enfoques se analizan a continuación.
1 El sesgo en la Figura 8 es la diferencia entre las ordenadas del cuadrado negro de la izquierda
y la ordenada del circulo. Así, si el caso es el círculo 1, no hay sesgo; si el caso es el círculo 2 el
sesgo es apreciable.
27 3.2.1 Enfoque 1: Igualación de Atributos por Restricción o Coincidencia.
La igualación por restricción o emparejamiento es un intento de justificar el juicio de que el La
ordenada del cuadrado completo izquierdo en la figura 8 es la misma que la del círculo 1 porque
la respuesta relevante los atributos de las unidades en las poblaciones A y B son los mismos 1 .
La clave entonces es hacer el unidades de la población A comparables o intercambiables con
las unidades de la población B con respecto a los atributos relevantes para la respuesta (o algún
índice de los mismos). La otra cara del mismo argumento es que si se piensa que las unidades
en A y B difieren en algún atributo relevante para la respuesta, entonces debe juzgarse que existe
confusión.
En el ejemplo de la pavimentación del arcén, la pregunta es si se puede argumentar de manera
convincente que las carreteras B tendrían el mismo número medio de accidentes/milla-año que
las carreteras A si ambos conjuntos de las carreteras tenían el mismo ancho de arcén pavimen-
tado. Para argumentar así uno tiene que saber qué atributos son probable que afecte la respuesta
(choques/milla-año) y muestre que son iguales en ambos conjuntos. En este caso Los atributos
relevantes para la respuesta son muchos: cantidad de tráfico, entorno urbano o rural, condiciones
climáticas.
condiciones, características de los usuarios de la vía, como distribuciones de edad, género, in-
gresos o educación; la carretera antiguo; terreno, mantenimiento invernal, etc. Por lo tanto, la
circunstancia de ancho de arcén pavimentado corresponde al círculo 2 que tiene una ordenada
diferente que el cuadrado completo izquierdo. La respuesta a la La pregunta que se plantea es
que, en el ejemplo del ancho de la banquina pavimentada, no se puede argumentar de manera
convincente que las carreteras que tienen 't' son intercambiables con las carreteras que tienen
'c'; la confusión debe ser juzgado existir. Es decir, mediante una comparación directa, los obser-
vables μ Bc y μ At uno no pueden determinar el efecto de seguridad de arcenes pavimentados
de dos pies versus cuatro pies.
Para hacer que las dos poblaciones sean comparables o intercambiables por 'restricción' sería
necesario estratificar los caminos en A y los caminos en B en celdas que sean homogéneas en
todos los variables relacionadas con la respuesta antes mencionadas y luego comparar los va-
lores de la variable de respuesta (choques/milla-año) solo en las celdas correspondientes.
Incluso con un número modesto de variables uno encuentra rápidamente que ninguna celda con-
tiene suficientes segmentos de carretera para hacer comparaciones significativas. Este es el lla-
mado problema de datos dispersos 2 . Quizás por esta razón, el enfoque de restricción rara vez
ha utilizado en la investigación sobre seguridad vial. Dado que en la investigación de seguridad
vial el enfoque de restricción ha no ha sido ampliamente probado, puede ser prematuro pronun-
ciarse sobre su promesa. Sin embargo, Groenlandia et al. (1999) dicen que en otros campos,
tales métodos “a menudo son inviables o insuficientes para producir intercambiabilidad.” (pág.
35). Es probable que esto se aplique a la investigación sobre seguridad vial no solo debido a la
1 Una vez más, se debe invocar la 'creencia fundamental' de que la respuesta de una unidad a
'c' o 't' está determinada por sus atributos relevantes para la respuesta (y que las unidades con
atributos relevantes para la respuesta idénticos tienen respuestas idénticas a 'c' y 't'). Sobre esto,
Groenlandia et al. (1999) dicen que “Parece intuitivamente claro que si μ Ac y μ Bc difieren en-
tonces (la unidades en) A y B deben diferir con respecto a los factores que afectan a μ “ . Groen-
landia et al. argumentan que las diferencias entre los los atributos relevantes para la respuesta
de A y B no implican confusión, “porque los efectos de las diversas covariables las diferencias
pueden equilibrarse” (p. 33). Si bien tal equilibrio es una posibilidad, es muy poco probable y, en
mi opinión, opinión, sin consecuencias prácticas.
2 Greenland et al (1999) dicen que: ” Los métodos de ajuste más simples comienzan con la
estratificación en factores de confusión. A covariable no puede ser responsable de la confusión
dentro de un estrato que es internamente homogéneo con respecto a la covariable. Esto es así,
independientemente de si se utilizó la covariable para definir el estrato. Por ejemplo, género los
desequilibrios no pueden confundir las observaciones dentro de un estrato compuesto única-
mente por mujeres. Parecería natural, entonces, para controlar la confusión debida a los factores
medidos simplemente estratificándolos a todos. Desafortunadamente, entonces uno enfrentar el
conocido problema de datos dispersos: dados suficientes factores, pocos o ningún estrato tendría
sujetos en ambos grupos de tratamiento, lo que hace que las comparaciones sean ineficientes o
imposibles”. (pág. 35) 28 antes mencionado 'problema de datos dispersos' sino también por la
dificultad añadida de que si una unidad si se encuentra para tienen 't' y otro tiene 'c', los profe-
sionales pensaron que las dos unidades son diferentes y por lo tanto debe estar equipado de
manera diferente. Por lo tanto, estar equipado de manera diferente casi implica la existencia de
diferencias relevantes para la respuesta, algunas de las cuales quizás estén relacionadas con
un juicio no documentado.
Las limitaciones que hacen impracticable la 'restricción' se aplican igualmente a la 'coincidencia'.
3.2.2 Enfoque 2: Igualación de Atributos por Análisis.
El segundo enfoque para eliminar el sesgo debido a la confusión es el indicado por el flecha
vertical en la Figura 8. El objetivo es estimar la 'corrección' μ B□ - μ Bc y agregarla a la observable
μ Bc y así obtener una estimación μ B□ ; esto es lo que serían los μ de las carreteras B si tuvieran
los atributos relevantes para la respuesta de las carreteras A. Ahora que todos los atributos re-
levantes para la respuesta de las carreteras B son los mismos que los de las carreteras A, se
puede argumentar justificadamente que μ Bc es también lo que μ en las carreteras A sería si
tuvieran dos pies de arcén pavimentado, no cuatro. Para ilustrar, si en las carreteras B el prome-
dio velocidad era de 75 km/h y en las carreteras A era de 80 km/h, la corrección sería una esti-
mación de la cambio en la frecuencia esperada de accidentes si la velocidad en las carreteras B
fuera de 80 km/h, no de 75 km/h. voy a referirse a este enfoque como 'Corrección por análisis'.
La corrección se deriva de dos esenciales elementos: una. Información sobre los atributos rele-
vantes para la respuesta de las unidades en las poblaciones A y B; b. Conocimiento de cómo μ
de los caminos en B podría cambiar en respuesta a un cambio en estos atributos relevantes para
la respuesta.
Groenlandia et al. (1999) dicen que “ha habido una enorme cantidad de trabajo dedicado a ajus-
tes analíticos por confusión. Con algunas excepciones, estos métodos se basan en distribuciones
de covariables observadas en las poblaciones comparadas. Tales métodos funcionarán con éxito
controlar los factores de confusión solo en la medida en que se miden y empleado en el análisis.
Luego, también, muchos métodos emplean modelos paramétricos en alguna etapa, y su éxito
depende, pues, de la fidelidad del modelo a la realidad”. (pág. 35); y más tarde “La método más
común para evitar problemas de datos dispersos es imponer restricciones paramétricas en la
regresión del resultado sobre el tratamiento y las covariables; .Sin embargo, teórico Los resulta-
dos indican que ningún enfoque puede resolver completamente los problemas de datos disper-
sos, en la medida en que la muestra el tamaño siempre limitará el número de grados de libertad
disponibles para el ajuste de covariables y prueba de modelos”. (pág. 36) En seguridad vial, el
arte de estimar la magnitud de la corrección (lo que Greenland et al.
llamar el 'ajuste analítico') que se requiere para controlar la confusión en la sección transversal
observacional estudios parece ser en gran medida terra incognita. No es la ambición de este
documento mapear este territorio inexplorado. Sin embargo, desarrollar una apreciación de la
tarea y los obstáculos para su éxito, se requiere una exploración conceptual. Indicar en qué con-
siste la 'corrección por análisis' enfoque en la seguridad vial podría implicar, usaré nuevamente
el ejemplo del ancho de la banquina pavimentada, partiendo de lo que es simple pero poco rea-
lista, y agregando capas de complejidad para gradualmente acercarse a la realidad.
29 Suponga inicialmente que las carreteras A son las mismas que las carreteras B en todos los
atributos relevantes para la respuesta 1 .
Si es así, no se necesita corrección y la ordenada del cuadrado completo izquierdo en la Figura
8 ( μ Bc ) puede ser utilizado legítimamente para estimar cuáles serían los choques/milla-año en
las carreteras A si tuvieran 2' arcenes pavimentados (la ordenada del círculo no observado 1).
Agregue la Capa 1. A continuación, suponga que los caminos en A (aquellos con arcenes pavi-
mentados de cuatro pies) tienen la mismos atributos relevantes para la respuesta que las carre-
teras en B (aquellas con arcenes pavimentados de dos pies) 2 , excepto que en las carreteras B
la velocidad media es de 75 km/h mientras que en las carreteras A es de 80 km/h. la tarea es
Estime cuál sería μ Bc si en las carreteras de B la velocidad promedio fuera de 80 km/h. Para
esto necesitamos saber cómo cambia el μ en este tipo de carretera en función 3 de la velocidad
media. conocimiento de esto tipo a veces se puede extraer de la investigación publicada. La
siguiente observación general 4 Puede ser hecho: O1. Para corregir las diferencias en un atributo
relacionado con la respuesta, uno debe tener conocimiento de la función que dice qué cambio
en la respuesta es causado por un cambio en el atributo. Tal el conocimiento proviene de los
resultados de la investigación.
Agregue la Capa 2. Suponga ahora que en el grupo A hay algunos caminos con una velocidad
promedio de 80 km/h y algunas con 90 km/h mientras que en el grupo B hay algunas carreteras
con 70 km/h y algunas con 75 km/h El tamaño de la corrección dependerá de si las carreteras
de 70 km/h van a ser 'corregido' a 80 km/h o a 90 km/h. En definitiva, la corrección dependerá
de la elección del maridaje para los que no hay motivos claros 5 . Para eludir este tipo de dificultad
uno tiene que traer ambos grupos de caminos a algún valor de atributo común. Así, por ejemplo,
si se eligió una velocidad promedio de 80 ser este valor común, se calcularía una corrección para
aquellos caminos en A donde el promedio la velocidad es de 90 km/h y se calcula otra corrección
para todas las carreteras de B. Así, el remedio es use dos correcciones en lugar de una como se
muestra en la Figura 9 con las dos flechas. la flecha hacia abajo corrige μ At para llevar todos
los caminos A a algún valor común de la(s) variable(s) relevante(s) para la respuesta. los la flecha
hacia arriba corrige μ Bc para que todos los caminos B tengan el mismo valor común. el incon-
fundible comparación es ahora entre μ A□ y μ B□. El precio de aplicar dos correcciones en lugar
de una es el inevitable aumento de la varianza de esta comparación 6 .
1 Los atributos que vienen a la mente pueden ser la cantidad de tráfico, el entorno (urbano o
rural), las condiciones climáticas, el usuario de la vía características (distribución de edad, sexo,
ingresos o educación), antigüedad de la carretera, terreno, mantenimiento invernal, etc.
2 Es decir, la distribución edad-género-ingreso de los conductores, la ocupación de los vehículos,
la mezcla de autos y camiones y su antigüedad y el tráfico durante todas las horas del día son
los mismos en las carreteras A y B, solo el número diario de vehículos es diferente.
3 Por 'función' me refiero a una representación causal de cómo cambian los accidentes espera-
dos en una carretera cuando la velocidad promedio es cambió. Se excluye el tipo de relación que
se podría obtener al comparar algunos caminos con velocidad promedio X con otras vías con
velocidad media Y.
4 Etiquetaré las observaciones generales con O1, O2, etc.
5 Excepto si los choques/milla-año son proporcionales a la velocidad promedio, lo que no parece
ser el caso.
6 La característica adicional de la estrategia de dos correcciones es que el efecto de seguridad
dependerá del valor común elegido. Esto no es necesariamente una desventaja.
30 Figura 9. Las dos 'correcciones'.
Como antes, para estimar las dos correcciones se necesita tener información sobre los puntos
importantes.
atributos relevantes para la respuesta de Roads A y Roads B, así como estar en posesión de
investigaciones basadas en conocimiento sobre la función causa-efecto de cómo cambia la fre-
cuencia esperada de accidentes cuando cambian los atributos relevantes para la respuesta.
Agregue la Capa 3. Hasta ahora, las carreteras de cada grupo diferían solo en la velocidad pro-
medio y se asumió que existe un conocimiento basado en la investigación de la función que
vincula la frecuencia de choque y la velocidad promedio.
Supongamos ahora que las carreteras A difieren de las carreteras B también en que tienden a
estar más cerca de las zonas urbanas.
áreas Tal atributo de 'ubicación' podría influir en la seguridad de varias maneras, por más com-
pleto notificación de accidentes, por menor tiempo de respuesta de los servicios médicos de
emergencia, por diferencias en el edad, género, ingresos de los usuarios de la vía, por diferencias
en el consumo de alcohol, etc. No es probable que uno tener conocimiento de la relación funcio-
nal que vincula la frecuencia de los accidentes y la 'ubicación'. A Es posible que ni siquiera exista
una relación estable (transferible) de este tipo 1 . Sin embargo, sin tal función las correcciones
no se pueden estimar. Así, por lo general, O2. Incluso si uno tiene datos sobre un atributo rela-
cionado con la respuesta, el requisito correspondiente puede faltar una relación funcional. En
ese caso, no se puede aplicar ninguna corrección y el no se puede explicar la confusión debida
a tal atributo.
Una dificultad añadida es que aunque conociéramos las funciones μ ( velocidad media) y μ (ubi-
cación de la carretera) uno no puede asumir que la función conjunta μ ( velocidad promedio,
ubicación de la carretera) es algo simple compuesto de las dos funciones constituyentes
separadas. En general, O3. La corrección por confusión requiere el conocimiento de una función
multivariable que vincule μ a todos los atributos importantes relacionados con la respuesta (va-
riables). En seguridad vial, tales funciones actualmente no existe.
Agregue la capa 4. Otro paso hacia el realismo en el ejemplo del ancho del arcén pavimentado
es asumir que existen variables relacionadas con la respuesta que se sabe que son importantes
(p. ej., distribución de edad de los usuarios de la carretera o fricción de la superficie de la carre-
tera) sobre el cual nuestro conjunto de datos es mudo. En este caso, no hay corrección corres-
pondiente se puede aplicar y se debe suponer que existe confusión.
1 Puede no existir una relación funcional estable porque el atributo urbano, suburbano o rural
refleja un paquete o atributos más fundamentales (informe de accidentes, tiempo de respuesta
de los servicios médicos de emergencia, distribuciones de edad, ingreso de género y otros ras-
gos de los usuarios de la vía pública, consumo de alcohol, etc.) y estos atributos pueden variar
de un urbano (o rural) a otra.
31 O4. Para corregir la confusión, uno debe tener datos sobre lo que se sabe que es importante
atributos relevantes para la respuesta de las unidades en A y B. Si tales datos no están disponi-
bles, confusión debe suponerse que existe.
Agregue la capa 5. Finalmente, están los atributos relevantes para la respuesta que no conoce-
mos.
Destacan entre ellas las razones por las cuales un camino terminó teniendo dos pies de pavi-
mentado hombros y otros cuatro. La influencia de estos atributos, desconocidos, insospechados,
no reconocido o indocumentado pero omnipresente, siempre estará al acecho en el fondo.
En general, O5. En la medida en que hay algunos atributos relevantes para la respuesta que no
conocemos sobre, y hay razones no documentadas para aplicar 'c' a algunas unidades pero 't' a
otras unidades, se debe suponer que existe confusión Esta fuente de confusión no se puede
corregir por.
Si bien algunas de las dificultades a las que se enfrenta el enfoque de "corrección por análisis"
tal vez podrían tratarse si tuviéramos datos mucho más ricos y un conocimiento mucho mejor del
requisito funcional relaciones, algunos obstáculos parecen insuperables. Las dificultades insupe-
rables son dos.
En primer lugar, en el contexto de la seguridad vial siempre será difícil argumentar que el juicio
de profesionales para implementar 't' o 'c' no fue influenciado por la historia pasada de choques
o casi accidentes, por consideraciones basadas en una familiaridad con el sitio y sus circunstan-
cias que no se puede ver en los datos, o por algún atributo relevante de respuesta ahora irreco-
nocible. los La segunda dificultad (aparentemente) insuperable es que generar confianza en la
'corrección por enfoque de análisis, uno tendría que proporcionar evidencia empírica de que μ
A□ es lo que los μ caminos B sería si tiene los atributos relevantes para la respuesta elegidos y
hombros de dos pies y el μ B□ es cerca de lo que sería el μ en las carreteras A si tienen los
atributos relevantes para la respuesta elegidos y hombros de cuatro pies. Esto implica que habría
que encontrar caminos que realmente deberían estar equipados con 't' como son los caminos en
A, pero permaneció equipado con 'c' por algún capricho del destino que es completamente sin
relación con ningún posible atributo relevante para la respuesta. No puedo pensar en algo tan
natural.
experimentos Por lo tanto, no puedo ver una manera de verificar empíricamente que la 'correc-
ción' está cerca de lo que debería ser En resumen, en los estudios observacionales transversales
en los que se comparan las unidades que tienen 'c' con unidades que tienen 't', existirá confusión
a menos que se elimine por 'restricción o emparejamiento' o por 'análisis'. La opción de eliminar
la confusión por 'restricción y coincidencia' es limitado por el problema de los "datos escasos" y
por el de los atributos relacionados con la respuesta desconocida. los posibilidad de 'corrección
por análisis' está circunscrita por las dificultades O1 a O5 enumeradas arriba.
3.2.3 ¿Se pueden igualar los atributos usando modelos de regresión paramétrica? Supon-
gamos ahora que en lugar del enfoque de 'dos correcciones' descrito en la sección 3.2.2, uno
utilizará los datos sobre choques y atributos para estimar dos modelos de regresión, uno para
las carreteras A y otra para caminos B. Una vez hecho esto, se podría: a. especificar un conjunto
de valores de atributos → b.
calcule los choques/año pronosticados para un camino de A y (usando los mismos valores de
atributo) para un camino de B → c. comparar las dos predicciones y así, → d. estimar el efecto
de seguridad de reemplazar arcenes de dos pavimentados por arcenes pavimentados de cuatro
pies para una carretera con el atributo especificado valores.
32 Esta es, en esencia, una versión de 'igualación de atributos' discutida en 3.2.2. llamaré este
es el enfoque de 'ecualización por regresión'. La pregunta es cuáles son las fortalezas y limita-
ciones del uso del enfoque de igualación por regresión para eliminar el sesgo de confusión
cuando se hace uso de datos observacionales de secciones transversales? Para responder a
esta pregunta haré uso de las observaciones O1 a O5 del apartado anterior (3.2.2).
La primera observación general en la sección 3.2.2 (O1) fue que para corregir las diferencias en
un atributos relacionados con la respuesta entre las unidades del grupo A y las unidades del
grupo B que uno debe tener conocimiento de qué cambio en la respuesta es causado por un
cambio en el atributo. En la sección 3.2.2, el Se asumió que la relación funcional necesaria se
basaba en el acervo de hallazgos de la investigación.
acumulado a lo largo del tiempo. Cuando se utiliza el enfoque de ecualización por regresión, se
supone que la relación funcional requerida es el propio modelo de regresión - el resultado de
ajustar un ecuación a los datos de las unidades en el grupo.
El atractivo de este enfoque es que uno no necesita rastrear, dominar y evaluar los datos exis-
tentes.
investigación acumulada para establecer lo que se sabe; que el modelo estimado proporciona la
necesitaba una función de causa-efecto a la manera de 'deus ex machina'. La misma caracterís-
tica de la El enfoque de 'ecualización por regresión' también parece cuidar el O2, que a veces,
incluso si los datos acerca de un atributo relacionado con la respuesta está disponible, el cono-
cimiento de la correspondiente sin confundir Falta la relación funcional. 1 Desafortunadamente,
esta forma automática por la cual una regresión proporciona las relaciones funcionales necesa-
rias es también una fuente de gran debilidad. confiando exclusivamente en la forma funcional y
parámetros estimados del modelo de regresión que fue ajustado al conjunto de datos específico
en cuestión, uno está esencialmente ignorando todo lo que se sabe de investigaciones previas
sobre tales relaciones funcionales 2 . Es como si no existiera ningún conocimiento además lo
que afirma el modelo de regresión actual y como si uno pudiera estar seguro de que cualquiera
que sea el El modelo actual afirma que está lo suficientemente cerca de la verdad, incluso si va
en contra de lo que otros encontraron o lo que comúnmente se conoce. Ninguna suposición es
aceptable. Primero, descartar todo conocimiento fuera del conjunto de datos que se examina
está en desacuerdo con la tradición de la ciencia. En la ciencia, el conocimiento.
es una cuestión de acumulación, y la clave para confiar en alguna afirmación sobre la realidad
es la consistencia con la que se puede obtener. En segundo lugar, la experiencia con modelos
de regresión en carretera la seguridad nos dice que diferentes investigadores tienden a encontrar
diferentes funciones para las mismas variables 3 . Eso Es difícil saber cuál de las diversas rela-
ciones está cerca de reflejar causa y efecto.
Por lo tanto, no puede estar seguro de que cualquier modelo de regresión estimado específico
represente de manera confiable la función causal necesaria necesaria para lograr la igualación
de atributos.
A primera vista, el enfoque de 'ecualización por regresión' también se ocupa de O3: la necesidad
tener una función multivariable que vincule μ con todos los atributos relacionados con la res-
puesta ; el resultado de un regresión siempre hace que μ sea una función de todas las variables
retenidas. Por desgracia, esto no es una función.
encontrado por la investigación acumulada para describir consistente y adecuadamente un fenó-
meno, ni es el función sugerida por una teoría plausible. Es una función que es seleccionada por
el modelador y es 1 Cuando se usa el enfoque de 'ecualización por regresión', para cada atributo
(variable) que se retiene en el modelo siempre hay una relación funcional correspondiente.
2 Esta debilidad podría desaparecer si los modelos de regresión fueran completamente bayesia-
nos, y si se hiciera uso de modelos 'informativos'.
antecedentes que encarnan todo el conocimiento acumulado.
3 Como lo ejemplifican los modelos Coleman-Stewart versus Mengert.
33 basado en la evidencia limitada y generalmente difusa de un solo conjunto de datos. Como
resultado, a menudo es un prototipo simple elegido del pequeño repertorio y compuesto por adi-
tivos o multiplicativos bloques de construcción que en sí mismos son funciones simples, gene-
ralmente de una sola variable. tal La función se puede considerar como una aproximación de la
serie de Taylor de primer orden de la función subyacente desconocida.
función. Como tal, si la función subyacente no es lineal, la aproximación es adecuada solo para
valores cercanos al punto en el que se centra la serie de Taylor, pero no es aplicable a lo largo
del rango de variación variable que normalmente se encuentra en las poblaciones reales de uni-
dades. Por lo tanto, la corrección por confusión que se basa en tal aproximación de primer orden
puede ser ampliamente fuera de la marca.
La pregunta global abordada en este documento es si las regresiones cuando se basan en la
sección transversal los datos pueden apoyar la interpretación de causa y efecto. Mientras no se
responda la pregunta uno no puede asumir que lo hacen o que no lo hacen. Una parte de lo que
se describió como debilidad de el enfoque de igualación por regresión en los párrafos anteriores
se basa en la suposición de que, en seguridad vial, tales regresiones por lo general no logran
captar la causa y el efecto. Si fuera cierto lo contrario, las debilidades identificadas desaparece-
rían.
En la sección 3.2.2, señalé en O4 que: “Para corregir la confusión, uno debe tener datos sobre
lo que se sabe que son atributos relevantes para la respuesta de las unidades en A y B”. lo mismo
es verdadero para el enfoque de igualación por regresión. En la medida en que sabemos de la
existencia de algún atributo relevante para la respuesta que no se usa en la ecuación de regre-
sión 1 , su omisión será un fuente de confusión tal como lo es cuando el enfoque de 'corrección
por análisis' de la sección 3.2.2 es usó. Así, por ejemplo, si los usuarios de las carreteras A
diferían en edad, ingresos o consumo de alcohol de los usuarios de carreteras B, y si la edad,
los ingresos o el BAC no fueran variables en la regresión, entonces la igualación por regresión
los resultados del enfoque se confundirán de la misma manera que los resultados basados en el
el enfoque de 'corrección por análisis' sería; uno no sabrá si la diferencia de seguridad que los
modelos indican se debe al ancho del arcén pavimentado o a diferencias de edad, riqueza o
hábito de beber De manera similar, al igual que en 3.2.2, se debe suponer que cuando la 'ecua-
lización por regresión' se utiliza el enfoque, puede haber algunos atributos relevantes para la
respuesta que ni siquiera conocemos sobre. Destacan las oscuras razones para aplicar 'c' a
algunas unidades y 't' a otras unidades. Sólo como en 'ecualización por análisis' (sección 3.2.2,
O5), esta fuente de confusión no se puede eliminar a partir de estudios observacionales trans-
versales mediante el enfoque de 'ecualización por regresión'.
Al resumir 3.2.2, señalé que la posibilidad de eliminar la confusión por el El enfoque de 'correc-
ción por análisis' está circunscrito por las observaciones etiquetadas O1 a O5.
Las limitaciones O4 y O5 se aplican al enfoque de 'ecualización por regresión' sin modificaciones.
A primera vista, las limitaciones O1, O2 y O3 parecen aliviarse con el enfoque de regresión.
Sin embargo, esta primera impresión probablemente sea incorrecta. La confianza en un único
conjunto de datos y la 1 Se puede omitir un atributo porque no se dispone de datos sobre él.
Además, incluso si los datos sobre una variable son disponible puede terminar no siendo utilizado
en la regresión. La razón para no usar una variable en una regresión es porque su asociación
con el resultado no está clara, porque su rango de variación es pequeño, porque el parámetro
estimación no se considera estadísticamente significativa, porque está fuertemente correlacio-
nada con otras variables, etc.
la omisión de dicha variable también será una fuente de confusión.
34 el desprecio de todo el conocimiento acumulado es probable que sea el resultado de una
'ecualización por regresión' menos confiable que lo que se puede lograr con el 'enfoque de co-
rrección por análisis'.
3.2.4 Varias poblaciones o niveles de tratamiento.
Hasta ahora, la discusión se limitó a la circunstancia en que dos grupos de unidades y por lo
tanto, solo se compararon dos tratamientos. ¿Qué pasa con la comparación de varios tratamien-
tos? niveles, o incluso un tratamiento graduado continuamente? La situación que se muestra en
la Figura 9 donde dos poblaciones de unidades y dos tratamientos se comparan permanece
prácticamente sin cambios cuando el la comparación es N>2 poblaciones correspondientes a
N>2 niveles de tratamiento. Usando lo anterior ejemplo, suponga que preguntamos sobre el
efecto del ancho del arcén pavimentado y que los datos son disponibles en caminos rurales de
dos carriles con arcenes pavimentados de 2', 4' y 6'. La situación está representada en la figura
10.
Figura 10. Tres niveles de 'tratamiento'.
Como antes, los cuadrados negros indican lo que se puede observar o estimar. el tamaño de la
Las flechas indican la corrección necesaria para llevar cada grupo de caminos al mismo conjunto
de caminos especificados.
rasgos relevantes para la respuesta. Los cuadrados vacíos muestran cuáles son los μ de los
conjuntos de carreteras que se muestran en la eje horizontal sería si todos tuvieran los mismos
rasgos específicos relevantes para la respuesta. El efecto de el arcén pavimentado debe juzgarse
por la relación entre los cuadrados vacíos. Para eliminar El sesgo de confusión requiere la capa-
cidad de predecir cuál sería el μ de cada conjunto de unidades si todos tenían un conjunto espe-
cífico de rasgos. Por lo tanto, las observaciones O1 a O5 hechas anteriormente, se aplican sin
modificación cuando el número de poblaciones y niveles de tratamiento, N, es mayor a 2.
De manera similar, aplicable a N>2 es la discusión en 3.2.3 sobre la fuerza y las limitaciones de
confiar modelos de regresión paramétrica para lograr la 'ecualización por regresión'.
3.3 Consistencia de los hallazgos.
En la discusión hasta ahora, el enfoque estaba en el juicio de causa y efecto en un solo estudio
observacional transversal. En última instancia, la justificación de la causalidad descansa en una
acumulación de confianza y de convicción justificada que se basa en una consistencia de los
hallazgos como los estudios se acumulan. Recuérdese, por ejemplo, que la solución científica al
problema fundamental de la causalidad inferencia era asumir que las observaciones obtenidas
consistentemente en el pasado se repetirían en 35 el experimento actual si las condiciones per-
manecieran sin cambios. El mismo mecanismo de confianza edificio se aplica si uno reemplaza
la frase 'observaciones obtenidas consistentemente' con la frase 'estimaciones del efecto obte-
nidas consistentemente'. Por lo tanto, una de las consideraciones clave en el examen de la cau-
salidad y el efecto del tratamiento no es la defensa de las conclusiones extraídas en un estudio
único de un conjunto de datos específico, sino más bien el examen de la consistencia de los
hallazgos obtenido en todos los estudios del mismo tratamiento.
La mayoría podría estar de acuerdo en que la causalidad tiene que ver con la formación de
expectativas justificables; en nuestro caso, expectativas sobre el efecto de seguridad de los tra-
tamientos. La mayoría también podría estar de acuerdo en que el La formación de expectativas
justificadas se basa en la regularidad con la que se comprueba que se produce un determinado
efecto.
seguir una determinada causa. Esta es la razón por la cual la consistencia de los hallazgos en
todos los estudios del mismo tratamiento es uno de los sellos distintivos de una relación causal
1 . La consistencia de los hallazgos es un requisito necesario (pero no un condición suficiente.
Es decir, si los hallazgos de estudios separados del mismo tratamiento difieren ampliamente se
puede afirmar que no se puede considerar con justicia ninguna creencia de causalidad. Si los
hallazgos de diferentes los estudios son consistentes, entonces todos pueden estar igualmente
confundidos. Sin embargo, en este circunstancia es al menos posible que, el juicio de causalidad
pueda ser justificado.
La noción de "coherencia de los hallazgos" requiere mayor aclaración. Como se discutió en Sec-
ción 2, un estudio observacional siempre involucra varias unidades que difieren en sus atributos.
Está completamente posible, incluso probable, que el efecto del tratamiento 't' relativo a 'c' de-
penda de la atributos de cada entidad tratada. Sin embargo, en la mayoría de los estudios del
tipo antes-después, por lo general el se informa el "efecto promedio del tratamiento" 2 . Este
promedio está por encima de las entidades tratadas en el estudio.
Debido a que las unidades en el estudio X pueden tener diferentes atributos de las unidades en
el estudio Y, el promedio efecto del tratamiento de los dos estudios por lo general será diferente,
incluso si sus resultados son totalmente coherente.
Para ilustrar, suponga que se aplica un tratamiento a la intersección 'I' donde, sin la tratamiento,
se esperan 5 choques/año, y también a la intersección 'J' donde, sin tratamiento, 50 se esperan
accidentes/año. Suponga que el tratamiento resultó en reducciones de 0.22 choques/año en 'I' y
0,71 accidentes/año en 'J'. Estos pueden parecer inconsistentes si se asume que el dos reduc-
ciones deben ser iguales o que las reducciones deben ser proporcionales a los choques espera-
dos sin tratamiento. Sin embargo, si es cierto que el efecto del tratamiento es reducir los choques
por 0.1× (accidente esperado/año) 0.5 , luego el 0.22 y 0.71 luego las dos reducciones estimadas
en accidentes/año son totalmente consistentes.
1 Cuando el Cirujano General (1964) afirmó que fumar causa cáncer, se aplicaron las siguientes
reglas ad hoc para juzgar la causalidad: usó: 1. Fuerza de la asociación (lo que significa que
alguna medida estadística de asociación es fuerte).
2. Efecto dosis-respuesta (cuanto más factor causal, mayor el efecto).
3. Sin ambigüedad temporal. (La enfermedad sigue a la exposición al factor de riesgo).
4. Consistencia de los hallazgos. (Varios estudios producen resultados similares).
5. Plausibilidad biológica. (La hipótesis tiene sentido en vista de lo que se sabe en biología). 6.
Coherencia de evidencia (Alguna combinación de 4 y 5).
7. Especificidad . (El factor causal causa esta enfermedad, y esta enfermedad se debe a este
factor causal).
Muchas de estas normas no tienen nada que ver con cuestiones de seguridad vial. Sin embargo,
alguna adaptación de 1,2 (cuando corresponda), y de 4 y 5 sería oportuno y deseable.
2 Rubin (1974) dice que “Una definición obvia del efecto causal 'típico'. para M ensayos es el
promedio (media) efecto causal”.
36 También se deduce que cuando el efecto de seguridad de un tratamiento es un atributo de
función, el el "efecto promedio del tratamiento" puede tener un significado poco claro. En el ejem-
plo ilustrativo el promedio el efecto de seguridad sería una reducción de (0,22+0,71)/2=0,46 ac-
cidentes/año; esto no se aplica a ya sea la intersección 'I' o 'J', ni a una intersección con la fre-
cuencia promedio de accidentes de (5+50)/2 (ya que allí se debe esperar una reducción de 0,52
choques/año).
Por lo tanto, el requisito de que los hallazgos sean consistentes no significa que uno deba esperar
el mismo efecto promedio del tratamiento en dos estudios de antes y después del mismo trata-
miento. solo significa que cuando se aplica un tratamiento a unidades con atributos idénticos , el
efecto debe ser el mismo.
Porque, si no fuera así, no habría motivos para esperar cuál podría ser el efecto de un trata-
miento.
De ello se deduce que para examinar los hallazgos de dos estudios de antes y después en busca
de consistencia, uno debe mostrar que las unidades en ambos estudios tenían atributos muy
similares 1 , o uno debe saber cómo el tratamiento El efecto depende de los atributos de las
unidades en cada estudio y explica las diferencias. Este tiene tres implicaciones importantes para
la realización de estudios de antes y después.
• En cada estudio de antes y después, se debe anotar y publicar cuáles son las respuestas rele-
vantes.
atributos de las unidades tratadas.
• Se debe tomar nota de las estimaciones del efecto para cada grupo de unidades con similar
atributos relacionados con la respuesta (y solo entonces determinar el 'efecto promedio del tra-
tamiento').
• Uno debe investigar las estimaciones del efecto de dependencia funcional sobre la respuesta
relevante atributos Por las razones ya mencionadas, no se puede decir fácilmente si el trata-
miento promedio efecto encontrado de un estudio antes-después es consistente con los hallaz-
gos de un estudio de corte transversal - tenía unidades diferentes, el efecto promedio del trata-
miento habría sido diferente. Sin embargo, si se conocían los atributos de las unidades en el
estudio de antes y después, y se utilizaron los mismos atributos en el modelo del estudio
transversal, entonces la consistencia de los hallazgos obtenidos en los dos tipos de estudio po-
dría ser examinado.
Finalmente, cuando se examina la consistencia de los resultados de dos estudios transversales,
particularmente aquellos basados en el enfoque de igualación por regresión, la consistencia
puede ser examinada con bastante facilidad. Todo lo que hay que hacer es comprobar si, en
circunstancias similares, los dos los estudios predicen efectos similares.
En resumen, la consistencia en los resultados de los estudios de investigación basados en datos
sobre el efecto de un el tratamiento es una condición necesaria (pero no suficiente) para susten-
tar el juicio de causalidad.
Desafortunadamente, las estimaciones del "efecto promedio del tratamiento" en los estudios de
antes y después no pueden ser directamente comparados cuando el efecto del tratamiento de-
pende de los atributos de las unidades tratadas.
De ello se deduce que la publicación del efecto medio estimado del tratamiento no es una base
suficiente para juzgar la consistencia y, por lo tanto, un impedimento para los juicios de causali-
dad. Ser capaz de Examinar si los hallazgos de estudios separados de antes y después son
consistentes, se debe conocer la atributos de las unidades tratadas y también cómo el efecto del
tratamiento depende de estos atributos.
1 En todo esto, también se debe tener en cuenta la precisión con la que se mide el efecto de
seguridad. Así, por ejemplo, si un cierto tratamiento se aplica a varias entidades con atributos
idénticos, los resultados son consistentes cuando la varianza de seguridad estimaciones sobre
estas entidades es igual a la varianza de la estimación.
37 Por el contrario, la consistencia o su ausencia son fáciles de establecer a partir de los resul-
tados de la sección transversal.
estudios precisamente por la razón de que en tales estudios los atributos de las unidades que
tienen 'c' y aquellos que tienen 't' son conocidos.
Por lo tanto, nuestra discusión conduce a una desafiante yuxtaposición de dos realidades nega-
tivas.
Mientras que los juicios de causalidad cuando se basan en aplicar primero 'c' y luego 't' a las
unidades (como en estudios de antes y después) son más fáciles de defender que juicios simila-
res cuando se basan en una comparación de unidades que se encontró que tenían 'c' y aquellas
que tenían 't' (como en los estudios transversales), el juicio que los hallazgos de dos estudios
sean consistentes es más fácil para estudios transversales y más difícil para los estudios de
antes y después. El conocimiento de causa y efecto es esencial para una acción eficiente.
El progreso hacia dicho conocimiento es posible si se cumplen al menos dos condiciones: una.
Los juicios de causa y efecto pueden respaldarse en cada estudio del efecto de un tratamiento
y, b. A medida que se acumulan los estudios, se encuentra que sus hallazgos son consistentes.
38 4. CASOS Y PREOCUPACIONES La oración "Si hago X, entonces es probable que Y siga"
es lo que guía la acción racional. Eso refleja la creencia en un vínculo de causa y efecto entre X
e Y. Los datos transversales a menudo se utilizan para llegar a tales creencias causales. En este
capítulo examinaré varios estudios donde esto ha sido hecho. Algunos de estos estudios ocupa-
ron un lugar destacado en importantes debates que influyeron tanto investigación y política de
seguridad; algunos se utilizan para guiar la práctica de la ingeniería. mi propósito es ilustrar los
escenarios, los argumentos, las convicciones y las dudas.
4.1 Peltzman y otros sobre el efecto Reglamento de seguridad del automóvil.
El artículo histórico de Peltzman (Peltzman 1975) todavía se cita 1 . Proporciona un oportunidad
de examinar el método por el cual una creencia causal (que la seguridad del automóvil las regu-
laciones adoptadas alrededor de 1966 no tuvieron efecto sobre los accidentes fatales). Nuestro
interés aquí es no en la veracidad de la conclusión, sino en el método utilizado para llegar a ella.
Porque el hallazgo fue controvertido, el trabajo de Peltzman ha sido examinado y comentado por
muchos. Esto hace que un material particularmente rico para el examen de lo que fue criticado y
por qué.
Un economista se inclina a pensar en el riesgo de accidente como un elemento del costo aso-
ciado con viajes; un costo como, digamos, el gasto de tiempo o el costo del combustible. En el
economista concepción, el conductor, un homo economicus, negociará entre los diversos ele-
mentos de costo asociados con los viajes y decidirse por esa mezcla que maximiza la utilidad.
Compensación, maximización de la utilidad y el equilibrio están cerca del núcleo de esta visión
del mundo. Por lo tanto, es natural para Peltzman (que es un economista) suponer que la fabri-
cación de vehículos menos dañinos podría inducir en el conductor más 'conducción intensidad',
principalmente una mayor velocidad y quizás incluso un mayor consumo de alcohol. La conse-
cuencia de esta 'adaptación del comportamiento' sería compensar parcial o totalmente el bene-
ficio de vehículos más seguros. Para por esta razón se llama 'comportamiento de compensación'.
El propósito del trabajo de Peltzman fue estimar la medida en que el supuesto comportamiento
compensatorio anulaba el efecto de la regulación que producido vehículos más seguros. En ge-
neral, fue un intento de estimar el efecto de seguridad de un tratamiento - siendo aquí el trata-
miento la regulación de la seguridad del automóvil y el consiguiente uso de vehículos más segu-
ros. El efecto de seguridad de los tratamientos se puede estimar usando 'antes-después' o enfo-
ques de 'sección transversal'; Peltzman usó ambos.
4.1.1. La parte antes-después (serie de tiempo) del estudio de Peltzman.
La esencia de un estudio antes-después es usar datos antes del tratamiento para predecir qué
han ocurrido durante el período posterior al tratamiento si no se hubiera aplicado el tratamiento
2 . Peltzman equipado un modelo multivariable para los datos antes del tratamiento y usó el
tratamiento independiente posterior variables en el modelo para predecir 'lo que habría sucedido'.
Después de un razonamiento detallado, Peltzman postuló el modelo de forma reducida 3 R=f(P,
Y, T, A, S, K, u) donde R=tasa de accidentes fatales por 1 Este interés continuo no está tanto en
su hallazgo principal (alegando que el efecto de todos los costos de seguridad del automóvil
estándares introducidos después de 1966 fue nulo) como en la noción de 'comportamiento com-
pensatorio' o 'adaptación' - el ser humano Tendencia a aumentar el comportamiento de riesgo
cuando se cree que el riesgo ha disminuido.
2 El término usado para una predicción de algo que habría sucedido bajo alguna condición que
de hecho no sucedió.
materializarse es 'contrafactual'. El término se utilizará más adelante.
3 Por lo general, la teoría económica que compone un modelo se escribe como un sistema de
relaciones (ecuaciones y desigualdades) entre variables tales que una variable que está en el
lado derecho de algunas relaciones puede estar en el lado izquierdo lado de la mano de otro.
Ocasionalmente, a través de manipulación y aproximación algebraica, es posible reescribir este
sistema de relaciones para que las variables del lado izquierdo de las relaciones nunca aparez-
can en el lado derecho. Este 39 milla del vehículo; f es alguna función, P=costo asegurado del
accidente; Y=ingreso; T=tendencia secular; A=intoxicación alcohólica; S=velocidad de conduc-
ción; K=edad del conductor; yu=factores aleatorios. 1 Estimaciones de la Los valores de las va-
riables independientes para cada año durante 1947-1974 fueron compilados de varios fuentes y,
en el proceso, se tuvo que hacer una variedad de suposiciones y ajustes 2 . Datos para se utilizó
el período 'antes de la regulación' 1947-1965.
El eje central del enfoque de Peltzman era un modelo de regresión que expresaba R como una
función de P, Y, T, A, S y K. Luego, alimentando este modelo con los valores 'después de la
regulación' de P, Y, T, A, S y K 3 predicciones contrafactuales de cuál habría sido la tasa de
accidentes en el período 'después de la regulación' si no hubiera habido cambios en los están-
dares de seguridad de los automóviles. Peltzmann compara estas predicciones contrafactuales
con las R observadas para el período 'después de la regulación'.
Dado que se encontró que las predicciones contrafácticas eran muy similares a las del período
posterior observadas R's, Peltzman concluyó que las nuevas normas para vehículos no tenían
ningún efecto sobre la seguridad.
Para construir el modelo de regresión Peltzman asumió que la función 'f' de las variables P, Y, T,
A, S y K es multiplicativo 4 (R β P β Y β e β T .
0 = 1 2e 3 ). Así, por ejemplo, para el promedio de y muertes urbanas por milla Peltzman encon-
tró: 0,172 0,884 0,074 0,359 1,843 0,827 0 R = β PAG - y mi - TAREA _ En tal expresión multi-
plicativa los exponentes son 'elasticidades' 1 . Así, según este modelo particular, un aumento del
1% en P (costo asegurado del accidente) hace una disminución del 0,172% (ver es más o menos
lo que se entiende por 'forma reducida'. En el artículo de Peltzman, la teoría de la que se deriva
la forma reducida nunca se especifica. La frase 'forma reducida' se refiere únicamente al uso que
hace Peltzman del juicio profesional acerca de lo que podrían ser variables importantes para
incluir en una ecuación modelo (multiplicativa), 1 La siguiente es una ilustración del razonamiento
de Peltzman: “ He optado por ver los accidentes automovilísticos como el subproducto de un
actividad de consumo ordinario (intensidad de conducción). Por lo tanto, busco explicar los pa-
trones de accidentes como la resultante de fuerzas que cambiar la demanda de conducción
arriesgada o cambiar el costo de tener un accidente. Un análisis del costo para un conductor de
tener un accidente se complica por el hecho de que los componentes importantes de este costo
por lo general están asegurados. Si las compañías de seguros no ajustar las primas a la luz de
la experiencia de accidentes de los conductores en particular, los costos asegurados derivados
de un accidente no disuadirían conducción arriesgada. Sin embargo, voy a asumir una califica-
ción de experiencia suficientemente precisa y extensa por parte de las aseguradoras para un
asegurado.
conductor espere incurrir en una parte de los costos asegurados asociados con su conducción
riesgosa. Si esto es así, entonces la frecuencia y la severidad de los accidentes debe reducirse
por cualquier cosa que aumente el costo creado en un accidente. Representaré estos costos
mediante un índice de costos directos de accidentes (es decir, daños a la propiedad y atención
médica) multiplicado por un factor de carga del seguro (la proporción de primas a los beneficios
pagados). Es decir, si el seguro fuera simplemente un método de pago de un accidente a plazos,
el El conductor "asegurado" sería responsable tanto del daño causado por un accidente como
del costo de administrar el cobro y pago de estos daños; Estoy suponiendo que una parte de
estos costes se cobra de hecho a los conductores asegurados. Simplificar el trabajo empírico,
voy a ignorar el hecho de que algunos conductores se autoaseguran y que, en consecuencia, los
cargos de carga del seguro puede ser irrelevante para su comportamiento”. (pág. 684 -5) 2 Así,
por ejemplo, 'A' se midió por el consumo de licores destilados por persona mayor de 15 años; 'S'
fue el estimado velocidad promedio fuera de las horas pico en caminos rurales no interestatales;
Se supuso que 'T' era una línea recta; 'K' era la razón de 15- Conductores de 25 años y mayores
de 25, etc.
3 El término 'contrafactual' no debe tomarse para indicar que algo es contrario a los hechos. Más
bien, debería connota algo que de hecho no se materializó. Una predicción contrafactual es sobre
lo que se habría tenido R no ha habido cambios en las normas de seguridad de los automóviles.
Por lo tanto, es una predicción sobre un estado que nunca existió. los La razón para introducir
este término problemático es que todo el artículo se basará en lo que los filósofos llaman el 'teoría
contrafáctica de la causalidad'.
4 Si este fuera un modelo de forma reducida genuino obtenido algebraicamente de un conjunto
de ecuaciones simultáneas que capturan un teoría, la forma funcional (aditiva, multiplicativa, etc.)
reflejaría la teoría subyacente. la forma funcional postulado por Peltzman no tiene ningún vínculo
con una teoría subyacente. Es un 'modelo cuasi reducido'. Por lo tanto, no hay razón para pensar
que la forma funcional utilizada por Peltzman es una descripción apropiada o una aproximación
exitosa del fenómeno de la accidentalidad mortal.
40 signo menos) en R (tasa de accidentes mortales); un aumento del 1% en S (velocidad) genera
un aumento del 1,8% en la tasa de accidentes, etc Dado el razonamiento impulsado por la teoría
económica que guió la elección de las variables, los muchos suposiciones hechas en la definición
de las variables, la naturaleza de las variables (que son promedios para todos los EE. UU.), las
inexactitudes inherentes a los datos disponibles, los ajustes a la datos que había que hacer, el
número limitado de variables utilizadas para representar este complejo fenómeno, la ausencia
de cualquier razón (aparte de la conveniencia o la tradición) para la forma de modelo multiplica-
tivo, la correlación inherente entre la mayoría de las variables y el 'tiempo' variable (T), etc., mi
inclinación habría sido invocar el principio habitual de que "la correlación no es causalidad” 2 y,
sobre esta base, desconfiar de cualquier interpretación causal. Peltzman, sin embargo, mostró
no dude en hacer interpretaciones causales detalladas y específicas 3 de los resultados de la
regresión.
Así, por ejemplo, al comentar sobre la relación entre el ingreso (Y) y la tasa de accidentes (R)
Peltzman dice que: “Cada concepto de ingreso empleado 4 tuvo una correlación parcial positiva
con las tasas de mortalidad y estuvo acompañado de un fuerte efecto de tendencia negativa 5 .
Aparentemente, gran parte de este comportamiento a corto plazo es coherente con la respuesta
del conductor a los cambios en los precios sombra del ocio. mientras que la velocidad variable
puede captar parte de esta respuesta, ignora específicamente la mayor parte del tráfico y no
captura todos los riesgos inducidos por un aumento en el precio del ocio (por ejemplo, el paso
más frecuente de otros coches)." 6 P.692. De esta manera, la correlación estadística se toma
como un reflejo de comportamientos tomados del léxico de los economistas. Del mismo modo:
“…los resultados anteriores parecen generalmente consistente con un régimen en el que la res-
puesta inmediata más barata a un inesperado aumento de los ingresos es aumentar la intensidad
de la conducción, especialmente cuando no hacerlo implica una sacrificio de las oportunidades
de obtener ingresos. (La presunción aquí es que las desviaciones del ingreso de la tendencia
son inesperados.) El fuerte efecto de tendencia negativa puede interpretarse como un reflejo, en
parte, una respuesta a más largo plazo a los cambios permanentes en los ingresos, mediante la
cual los ajustes de, por 1 En lenguaje económico, la elasticidad es el cambio porcentual en una
variable causado por un cambio porcentual en otra variable. Así, por ejemplo, si Q denota la
cantidad comprada y P denota el precio, la elasticidad precio de la demanda es (PQ) (dQ dP) .]
2 “Que correlación no es causalidad es quizás lo primero que hay que decir”. Esta es la frase de
apertura que describe el término CAUSACIÓN aportado por GA Barnard a la Encyclopedia of
Statistical Sciences (Volumen 1, John Wiley and Sons, 1982, 387-389).
3 Las conclusiones causales de esta parte del artículo, en la que se utilizó el modelo de regresión
para el período previo a la regulación desarrollados, se refieren únicamente al comportamiento
del conductor en el período anterior a la regulación; el objetivo era captar cómo reaccionan los
conductores a los cambios en los ingresos y costos de los accidentes por la elección de la velo-
cidad y el consumo de alcohol.
4 Renta permanente per cápita, Consumo personal per cápita,., Ingreso del trabajo por adulto en
edad de trabajar (utilizado en regresión).
5 Es decir, un coeficiente de regresión positivo para Y siempre estuvo acoplado con una cons-
tante negativa para T. Dado que, en Datos de Peltzman, el ingreso (Y) fue aumentando con el
tiempo (T), el coeficiente de regresión s de Y y T estarán correlacionados; un aumento en uno
causará una disminución en el otro. Sin embargo, en lugar de atribuir esto al hecho de que sus
datos son para un período de ingresos que generalmente aumentan con el paso del tiempo,
Peltzman favorece y interpretación del comportamiento económico.
6 Al tratar de descifrar la jerga profesional, Peltzman puede haber querido decir algo como esto:
un aumento en los ingresos implica que el conductor valora ahora más el tiempo de ocio y, por
lo tanto, para ganar ese tiempo ahora más valioso, conduce más rápido y pasa a otros con más
frecuencia. Uno puede preguntarse: ¿Es cierto, por ejemplo, que las personas con mayores in-
gresos manejan más rápido, correr más riesgos y sufrir más accidentes? Porque, si no, todo el
edificio se derrumbará. De hecho, creo que la la evidencia empírica existente apunta en la direc-
ción opuesta. ¿Refleja un cambio en la elección de la velocidad el mayor valor colocamos en el
ocio a medida que aumentan nuestros ingresos o, en general, refleja un viaje más suave y un
mejor manejo que el los vehículos más nuevos ofrecen? ¿Es cierto que en períodos de estanca-
miento o decrecimiento de los ingresos medios la velocidad ha disminuido? Todos estas son
preguntas que se pueden responder. Cuando no se les pregunta ni responde, el modelo es poco
más que un privado opinión.
41 ejemplo, el diseño de los vehículos está hecho para reducir los costos que implica el aumento
permanente de la conducción intensidad." pags. 693.
Para mí, desde una distancia de treinta años, y sin la perspectiva o la fe del economista, este
tipo de argumento parece estar más cerca de una opinión culturalmente predispuesta que de una
inferencia comprobada empíricamente. Lanzando el desapego científico al viento, Peltzman se
involucra a lo largo del documento en especulaciones libres sobre causa y efecto; conjetura ca-
balga sobre suposiciones montadas sobre intuiciones y conjeturas. Para entender el de Peltzman
predisposición tal vez sea necesario transformarse en un estado de ánimo en el que la noción
de utilidad la maximización de los consumidores dio lugar a una rica teoría que tiene un papel
fundamental en la economía y ha tenido éxito en muchos casos en la predicción de la dirección
del cambio. Es sobre la base de esto tipo de teoría que Peltzman forma sus expectativas sobre
el signo de los coeficientes de regresión. Está la misma fe en la teoría económica que está en la
raíz de sus creencias causales e interpretación de coeficientes de regresión. El problema es que
una explicación que sea consistente con la economía la teoría se puede encontrar para casi
todos los hallazgos, como se ilustra en las citas anteriores.
Por lo tanto, es importante señalar dónde parece estar la econometría en el tema de causalidad.
Harvey (1990) abordó la cuestión de la siguiente manera: “El concepto de causa y efecto es
fundamental en cualquier ciencia. Sin embargo, cuando no es posible Para llevar a cabo un ex-
perimento controlado, se vuelve muy difícil producir evidencia convincente de que realmente
existe una relación de causa y efecto. Este es casi invariablemente el caso en economía, y como
resultado, el enfoque tradicional en econometría ha sido establecer un modelo sobre la base de
la teoría económica anterior. No sólo se supone que se cumple una relación de causa y efecto,
sino que, además, también se da por conocida la dirección de la causalidad.
Suponga, por simplicidad, que un sistema contiene solo dos variables, x e y. Dado que una causa
y la relación de efecto puede ser en una sola dirección, digamos de x a y, la única pregunta que
queda es si tal relación existe realmente. El enfoque más común para responder esta pregunta
es hacer una regresión de y t sobre x t y probar el coeficiente de x t para la 'significación' 1 . Sin
embargo, un alto correlación entre dos conjuntos de observaciones no experimentales no cons-
tituye evidencia de una relación entre las variables subyacentes. Además, el problema de la co-
rrelación espuria permanece incluso si se impone alguna estructura dinámica en el modelo to-
mando y para depender de la corriente y valores pasados de x Por lo tanto, aunque se supone
desde el principio que y no puede causar x, hay ninguna forma de establecer una relación causal
entre x e y sobre la base de los datos solo.
Dadas las limitaciones impuestas por los datos no experimentales, no es descabellado conside-
rar que ajustar un modelo de regresión es principalmente un ejercicio de medición. que existe
una relacion en realidad no se cuestiona, pero se da por sentado sobre la base de la teoría
económica. En estos circunstancias, las pruebas de significación ya no se usan para juzgar si
una relación existe entre dos variables. Lo más importante es el efecto medido de una variable
en otro. Si bien este enfoque es la base de gran parte de la construcción de modelos economé-
tricos, sufre de la desventaja de que se deposita una cantidad desmesurada de fe en el conoci-
miento previo de teoría económica. Además, significa que ciertas características no comproba-
bles se están poniendo en un modelo, violando así un principio importante de la investigación
científica.
1 El subíndice t se refiere al tiempo ya que el libro de Harvey trata sobre el análisis econométrico
de series de tiempo.
42 La necesidad de examinar los supuestos que subyacen a un modelo econométrico estimado
a partir de datos no experimentales.
Los datos de series temporales han llevado al desarrollo del concepto de causalidad. La idea de
la causalidad se remonta a Wiener, pero Granger la formalizó por primera vez. Se toman dos
reglas básicas para aplicar. La primera es que el futuro no puede predecir el pasado. Por lo tanto,
la causalidad estricta sólo puede ocurrir con el pasado provocando el presente o el futuro. En
segundo lugar, se supone que sólo tiene sentido discutir causalidad para un grupo de variables
estocásticas. Entonces se dice que una variable x 'causa' una variable y si tener en cuenta los
valores pasados de x permite hacer mejores predicciones para y, todas las demás cosas siendo
igual. Esta noción de causalidad es puramente estadística y no corresponde a ninguna definición
aceptable de causa y efecto en el sentido filosófico. En cambio, se refiere a más concepto limi-
tado de previsibilidad.” (págs. 303-304).
La principal conclusión de Peltzman (que la regulación de la seguridad del automóvil no redujo
la tasa de accidentes) no tiene interés aquí. Lo que interesa es la creencia incuestionable de que
un La regresión basada en una serie temporal de datos se puede interpretar en un modo de
causa-efecto como una cuestión de curso; la creencia de que los matices de los coeficientes de
regresión pueden y deben asignarse a algunos mecanismo de causa y efecto; que es suficiente
que estos mecanismos sean ampliamente plausibles en a la luz de las suposiciones que los
economistas tienden a hacer, sin tener que ser separadamente corroborado; que no es necesario
considerar explicaciones plausibles alternativas y las relaciones correspondientes no necesitan
estar representadas en el modelo. Nuestro interés está en esto.
fe sorprendente; la fe en el poder de la regresión no sólo para desarrollar una teoría cuando es
correcta, sino también, hasta cierto punto, para corroborar la corrección de la propia teoría 1 .
Por lo que sé, y por lo que escribió Harvey, este tipo de fe en el poder de la regresión va en
contra del tenor de la mayoría de la literatura científica y estadística. Sin embargo lo és posible
que fuera común entre economistas y econometristas a mediados de los años setenta.
Así, por ejemplo, al escribir sobre la especificación del modelo, Kennedy (Kennedy 1992) dice
que: “En un momento 2 Los econometristas tendían a suponer que el modelo proporcionado por
la teoría económica representaba con precisión el mecanismo del mundo real que genera los
datos, y vio su papel como uno de proporcionando 'buenas' estimaciones para los parámetros
clave de ese modelo”. Se refiere a esta visión de econometría como "obsoleta" y dice: "Ahora se
reconoce generalmente que los modelos econométricos son 'falsos' y no hay esperanza ni pre-
tensión de que a través de ellos se encuentre la 'verdad'”. (pág. 73.) Es más fácil decir lo que los
modelos econométricos no pueden hacer que lo que pueden hacer. kennedy (al discutir la espe-
cificación del modelo) piensa que la aceptación de un modelo econométrico depende de si
“puede decirse que corresponde a los hechos” . Es el 'análisis de especificación' actividad que
se supone que dice qué significa 'corresponder a los hechos' y, por lo tanto, identificar qué es un
modelo correctamente especificado. Pero la especificación del modelo es algo así como un arte,
y las pruebas de errores de especificación por lo general equivalen sólo a una búsqueda de
formas en que los datos disponibles apuntan a alguna señal de problemas potenciales 3 . Por lo
tanto, uno puede preguntarse: ¿Es cierto que un modelo correctamente especificado, que co-
rresponde a los hechos, permite predecir el efecto de cambiar el valor de un 1 La teoría corrobo-
rada aquí es la del 'comportamiento compensatorio'.
2 Kennedy parece fijar esto a mediados de 1970.
3 Se pueden probar las variables omitidas, la forma funcional incorrecta, la autocorrelación, etc.
Para obtener detalles, consulte, por ejemplo, LG Godfrey, Pruebas de especificación errónea en
econometría, Monografías de la Sociedad Econométrica No. 16, Cambridge University Press,
1988.
43 ¿variable? 1 Esta pregunta no parece plantearse explícitamente 2 . Porque la corrección de
especificación se prueba solo por correspondencia con los hechos, sospecho que la respuesta
debe ser: "Nosotros no sé si un modelo especificado correctamente permite predecir el efecto de
cambiar el valor de una variable”. Si es así, ¿para qué se puede usar un modelo correctamente
especificado? citas de kennedy Theil como diciendo: “Los modelos son para ser usados, pero no
para ser creídos”. El uso de un modelo debe eventualmente implica responder a la pregunta:
“¿Qué pasará si? Si no se puede creer la respuesta, el modelo no sirve. ¿Significa el aforismo
de Theil que Peltzman no debería haber creído el conclusión a la que llegó? 4.1.2. Análisis de
sección transversal de Peltzman.
En la sección transversal de su artículo, Peltzman usó datos de 1961 a 1971 para 48 estados.
Pregunta si en aquellos estados donde en el período posterior a la regulación hubo una mayor
proporción de automóviles más nuevos (automóviles con los dispositivos de seguridad exigidos
por la normativa) las tasas de mortalidad fueron menores de lo que cabría esperar. En este aná-
lisis, Peltzman enfrentó un difícil desafío. La tasa de accidentes fatales, la cantidad de viajes, la
demografía del conductor, el stock de carreteras, el uso de alcohol, etc., todo cambió con el paso
del tiempo y difería entre los estados. los desafío era dar cuenta del efecto sobre la tasa de
accidentes fatales de todos esos factores causales y luego para ver si las diferencias 'inexplica-
das' restantes mostraban alguna relación con el factor de interés: la proporción de automóviles
con la seguridad recién exigida dispositivos 3 . Esta es una circunstancia típica de los estudios
transversales; uno tiene que dar cuenta de la influencia de muchos factores causales de "moles-
tias 4 " con el fin de aislar el efecto de uno (o pocos) factor(es) de interés. Para los factores de
'molestias', Peltzman postuló el modelo: β 1 β 2 β 3 β 4 β 5 β 6 β 7 β 8 β 9 β 10 0 D = β (FC) (SL)
(U/R) (UD) (RD) (A) (K) (YD) (E/N) (PA) donde D=muertes de tránsito/100.000 habitantes;
FC=consumo de combustible per cápita; SL=límite de velocidad en los principales caminos rura-
les; U/R=relación entre conducción urbana y rural; UD=millas de viaje en vehículo/vía urbana;
RD=millas de viaje en vehículo/carretera rural; A=consumo de licor destilado per cápita; K=pro-
porción de jóvenes ya los viejos conductores; YD=ingreso personal disponible per cápita; Rela-
ción E/N de lo ganado a lo no ganado ingreso; PA precio del accidente.
Como en el modelo de regresión anterior, Peltzman explicó cuidadosamente la intención detrás
de cada variables 5 . También como en el modelo anterior, se tuvieron que hacer concesiones
entre qué datos se 1 Esto es, esencialmente, a lo que equivalen los contrafactuales como los
utilizados por Peltzman; hay que creer que si Los Ingresos, el Costo de Accidentes, la Velocidad,
etc. cambiaron, como lo hicieron, entonces, lo que el modelo predice se habría materializado.
(Los La Enciclopedia de Filosofía de Stanford dice: “La idea básica de las teorías contrafácticas
de la causalidad es que el El significado de una afirmación causal singular de la forma 'Evento c
causó evento e' se puede explicar en términos de contrafactual condicionales de la forma 'Si c
no hubiera ocurrido, e no habría ocurrido'. En nuestro caso el condicional contrafactual es 'si no
hubiera regulación de automóviles, entonces se habría producido la predicción del modelo).
2 Kennedy considera la prueba de causalidad (Granger) solo brevemente (p. 68) y alude a las
deficiencias de esta concepto. Godfrey solo ofrece una breve "explicación de la ausencia de una
discusión sobre verificaciones basadas en series de tiempo para 'causalidad'…”p. 198.
3 El desafío se vio agravado por la dificultad de separar los efectos de la edad del automóvil per
se y la efecto estrechamente correlacionado de los cambios de diseño debido a la regulación
motivada por la seguridad.
4 Los factores molestos son aquellos que no son objeto de investigación pero que están presen-
tes, varían de una entidad a otra y de vez en cuando, y seguramente afectarán la variable de
resultado. En los estudios epidemiológicos a menudo se les llama 'confundidores'.
5 Por lo tanto, por ejemplo, FC es un indicador de las millas recorridas por vehículos, U/R tiene
en cuenta las diferencias de estado a estado en las áreas urbanas y urbanas.
tasas de mortalidad rural, etc.
44 se cree que representa un factor causal y qué datos se podrían tener. Además, se tomaron
decisiones sobre qué variable incluir y cuál no 1 ; se hicieron suposiciones acerca de las mate-
máticas expresión elegida para representar el fenómeno, etc.
Algunas variables utilizadas en el modelo de sección transversal, cuando se suman en todos los
estados, son la lo mismo que utilizó Peltzman para el modelo de regresión 'antes' descrito en la
sección 4.1.1.
Por lo tanto, si el modelo de regresión 'antes' y el modelo de regresión de sección transversal
fueran correctos representacin del proceso de ocurrencia de accidentes fatales se debe esperar
que la regresin coeficientes de variables similares (Costo de Accidentes, Límite de Velocidad,
Consumo de Alcohol, Ingresos, Jóvenes Conductores) sería similar. Esto, sin embargo, no re-
sultó ser el caso. En su crítica, Joksch (Joksch 1976) muestra las comparaciones en la Tabla 5.
Tabla 5. Basado en la Tabla 2 de Joksch (1976) Coeficientes de regresión 'Antes' de Peltzman
Modelo de sección transversal de Peltzman (Serie temporal) Modelo 1961-1963 1964-1966
Coste del accidente -0,17 0,15 0,23 Ingreso 0,88 -0,81 -0,66 Alcohol 0,36 0,17 0,04 Velocidad
1,84 0,76 0,89 Conductores jóvenes 0,83 0,23 0,12 Peltzman interpretó los coeficientes de re-
gresión como elasticidades. Así, por ejemplo, en el Se cree que el modelo 'antes' (serie temporal)
de un aumento del 1 % en los 'Ingresos' causa un aumento del 0,88 % en la tasa de accidentes
fatales por milla. Y, sin embargo, en el modelo de sección transversal, el mismo aumento del 1%
Se cree que los 'ingresos' provocan una disminución del 0,81 % en la tasa de mortalidad por
población. porque un aumento en la tarifa por milla implica un aumento en la tarifa por población,
estos dos resultados (y la mayoría de los otros resultados en la Tabla 5) son mutuamente incon-
sistentes; ambos no pueden ser verdad. Estas Las inconsistencias reflejan en parte la precisión
estadística limitada de los coeficientes de regresión y principalmente las muchas deficiencias de
los tipos de modelos utilizados por Peltzman (datos pobres y agregados, uso de una función
matemática que no se conoce para describir adecuadamente el fenómeno, ausencia de variables
importantes que no están incluidas en el modelo, uso de variables proxy que sólo débilmente
corresponden a la causa, etc.). Independientemente de lo que causó las inconsistencias entre la
regresión coeficientes, está claro que no se puede confiar en ellos. Si un coeficiente de regresión
puede ser positivo o negativos, grandes o pequeños (como están en la Tabla 5), es mejor guardar
silencio sobre la causa y el efecto.
Nuestra investigación es sobre la pregunta: “¿cuándo se puede dar un significado de causa y
efecto a los resultados? derivado de los datos de la sección transversal? Aplicado al trabajo de
Peltzman esto se traduce en: “¿Puede su coeficiente de regresión puede interpretarse como
elasticidades? Un buen augurio sería que la regresión los coeficientes de las series de tiempo
'antes' y los modelos de 'sección transversal' fueron similares. Ya que son no, uno debe concluir
que una interpretación de causa y efecto de los coeficientes de regresión de Peltzman no está
garantizado.
Sin embargo, en el centro del trabajo de Peltzman había una cuestión diferente. preguntó si la
regulación de seguridad automotriz afectó las tasas de accidentes. Su conclusión fue que: “La
única afirmación que puede ser presentado con confianza es que la regulación de la seguridad
del automóvil no ha afectado la tasa de mortalidad en las carreteras.
1 No está claro por qué se consideró que variables como la topografía, la precipitación, la latitud,
etc. no eran importantes.
45 Ni las series temporales ni los datos transversales permiten ninguna otra conclusión”. 1 Para
él las series temporales y los modelos transversales no eran más que herramientas para generar
contrafactuales. la comparacion de los predicciones contrafactuales generadas por ambas he-
rramientas a las tasas reales de accidentes llevaron a Peltzman a su conclusión. Si los modelos
que no pueden apoyar las predicciones causales para el efecto de independiente Las variables
aún pueden producir buenas predicciones contrafactuales que son útiles para alcanzar la causa-
efecto.
conclusiones sobre los tratamientos es una pregunta abierta. Sería un buen augurio si diferentes
modelos, incluso cuando no capturan las relaciones de causa-efecto en su nivel atómico, condu-
cen consistentemente a conclusiones similares sobre el efecto de un tratamiento. Si esto era
cierto puede ser a juzgar por el debate que siguió a la publicación del artículo original de Peltz-
man.
4.1.3 El debate subsiguiente.
Lo que ahora se llama el 'efecto Peltzman' se convirtió en tema de acalorado debate. El debate
fue impulsado tanto por la curiosidad científica como por los intereses de aquellos que estaban
a favor de la seguridad vial regulación o desconfiaban de la regulación por parte del gobierno 2 .
Crandall y Graham (Crandall y Graham 1984) describieron la historia del debate así: “Siguió una
controversia animada y emotiva. HC Joksch (1976), Paul MacAvoy (1976) y Richard Nelson
(1976) criticaron la metodología de Peltzman pero no ofrecieron nuevas estimaciones.
Peltzman (Peltzman 1976) respondió con refutaciones incisivas. Leon Robertson (1977) produjo
resultados diferentes con un modelo revisado, pero Peltzman (1977) y Glenn Blomquist (1981)
argumentan que las revisiones son ad hoc e inconsistentes con un modelo de elección racional
del conductor. Óscar Cantú (1980) ha replicado los hallazgos de Peltzman con una base de datos
construida de forma independiente, pero Graham y Garber (1984) han demostrado que los re-
sultados de Peltzman son sensibles a plausible cambios en las especificaciones.” Por supuesto,
no es inusual ni sorprendente encontrar que la opinión de la investigación está dividida, particu-
larmente cuando, al acecho en el fondo es una diferencia ideológica (o política) entre aquellos
en ven la intervención del gobierno como a menudo necesaria y aquellos para quienes la regu-
lación es a menudo injustificado. Lo perturbador es que todos los protagonistas usaron el mismo
tipo de datos y métodos y Todavía podría llegar a conclusiones muy diferentes. Aún más pertur-
bador es el hecho de que ni el recopilación y análisis de datos adicionales, ni el debate parecía
haber reducido las diferencias de opinión. La posición original de Peltzman permaneció sin mo-
dificaciones.
Hoy en día, después de Kuhn y Feyerabend, no es posible adherirse a una visión purista de que
Las controversias científicas generalmente se resuelven yendo al laboratorio y replicando o re-
futando los resultados de los demás. Sin embargo, para avanzar hacia una mejor explicación y
Para que la comprensión sea posible, uno debe insistir en que ". algún principio o conjunto de
principios son especificado para comparar teorías rivales contra un trasfondo evidencial dado.
Tales principios 1 La declaración de apertura de su sección 'Resumen y Conclusiones'.
2 El trabajo de Joksch y Robertson fue apoyado por el Instituto de Seguros para la Seguridad en
las Carreteras, un proponente de Reglamento de seguridad del automóvil. Peltzman es ahora un
académico adjunto del Cato Institute, cuya declaración de misión incluye: “…principios estadou-
nidenses tradicionales de gobierno limitado, libertad individual, libre mercado y paz”.
46 (son) frecuentemente referidos como metodología.” (Newton-Smith 1981)(p. 4) . El principio
que tengo en mente es uno muy básico: • Principio: Cuando se aplica la misma metodología al
mismo tipo de datos (la misma “antecedentes probatorios”), se debe llegar a conclusiones simi-
lares.
Cuando esta condición no se cumple, cuando algunos afirman que sus datos muestran que un
metal se expande cuando se calienta mientras que otros mantendrán que sus datos muestran
que se encoge, entonces hay algo anda mal con los datos y/o el método de medición.
En la refutación de Pelzman a Robertson (Peltzman 1977). El primer punto se refiere a la posibi-
lidad de verificación. Peltzman lo dice sin rodeos: "No analista experimentado de datos debería
sorprenderse con el resultado (de Roberson) , ya que la edición selectiva de datos motivados
solo por el descontento con un resultado particular casi siempre se puede perseguir para éxito."
(pág. 673). Incluso si se descarta la acusación de edición de datos tendenciosa, ciertamente es
cierto que sería muy difícil comprobar (y replicar) los datos utilizados para el análisis de regresión
por un investigador en particular. Todo el ensamblaje de datos de múltiples fuentes requiere una
miríada de juicios.
hacerse. Peltzman implica que el resultado del proceso de ensamblaje de datos es sensible a
estos juicios que son esencialmente idiosincrásicos y por lo tanto desafían la verificación y la
replicación.
Si los resultados o la investigación dependen crucialmente del proceso de preparación de datos,
y el proceso no se puede verificar su corrección, entonces la replicación y verificación de los
resultados de la investigación es una imposibilidad práctica. De hecho, como el lector verá a lo
largo de la Sección 4: una. Los resultados obtenidos por otros nunca se verifican; b. Los autores
tienden a recopilar y analizar sus propios datos mediante métodos de su propia elección.
C. Dado que se premia la originalidad y los avances metodológicos, cada nuevo estudio tiende
a diferir de todos los estudios previos en detalles importantes (variables utilizadas, forma funcio-
nal elegida, estructura de error asumida, etc.). Esto dificulta la comparación; d. Por las mismas
razones (originalidad e innovación), los autores tienden a creer en sus propios hallazgos.
y encontrar deficiencias en los métodos o datos de otros, especialmente si encuentran lo contra-
rio.
Señalé anteriormente que para que el progreso hacia una mejor explicación y comprensión sea
posible se debe insistir en que cuando se aplica la misma metodología al mismo tipo de datos,
uno debe llegar a conclusiones similares. En un entorno de investigación en el que ni los datos
ni el método son fácil de comparar y acumular, el progreso será lento.
El otro punto destacado se refiere al papel de la teoría. Peltzman utiliza una construcción teórica
sobre el comportamiento de las personas -teoría de la elección racional- que lo guía en la deci-
sión que variables a incluir en la ecuación de regresión, y le permite (en muchos casos) visualizar
qué el signo de un coeficiente de regresión debería ser. Así, por ejemplo, Peltzman sostiene que
racionalmente elegir conductores que después de una fecha determinada no tuvieron más reme-
dio que comprar vehículos que cumplieran con los los nuevos estándares de seguridad respon-
derán al vehículo más seguro tomando más riesgos. Él llama al riesgo 'intensidad de conducción'
y supone un aumento en la intensidad de conducción que se manifiesta por aumentos en veloci-
dad, emociones, tal vez más beber y conducir. De esta manera, la teoría de la elección racional
motiva la elección de variables para la regresión; en el caso de Peltzman la inclusión en el ecua-
ción de regresión de velocidad y consumo de alcohol. Si la teoría es correcta y más segura los
automóviles inducen a los conductores a tomar más riesgos, entonces uno debería ver un au-
mento en los no ocupantes 47 (peatones, ciclistas, etc.) muertes. De esta manera, la teoría tam-
bién apunta a consecuencias comprobables.
Peltzman critica a Robertson por la ausencia de teoría en su artículo diciendo que “ su (de Ro-
bertson) se centran casi por completo en el resultado empírico, más que en el análisis económico
(¿teoría?) que lo motivó”. (p.673) “El lector buscará infructuosamente en su (de Robertson ) para
una alternativa a mi marco teórico (de Peltzman) que informa sus regresiones. Esta falta de una
teoría articulada alternativa conduce inevitablemente a formidables Dificultades en la interpreta-
ción de los resultados estadísticos. No se nos dice si, o por qué motivo, cualquier resultado par-
ticular es consistente con las expectativas previas. Nos quedamos con acertijos sin resolver por
ejemplo, por qué más motocicletas en la carretera salvan la vida de los ocupantes pero matan a
los peatones. Robertson nos haría concluir que la regulación no solo ha salvado la vida de los
ocupantes sino también la de peatones . En ausencia de cualquier teoría plausible que sugiera
este resultado, creo que estamos obligados ser considerablemente escéptico.” (p.675) Este ar-
gumento es indicativo de dos puntos de vista de regresión o dos prototipos de regresión.
modelado: Tipo A, ejemplificado por el artículo de Peltzman, en el que la elección de variables
independientes es basado en una teoría preexistente 1 . En este enfoque no se pregunta por la
causalidad. La causalidad preexiste dentro de la teoría asumida que especifica cuáles son las
variables que provocan el cambio y en en qué dirección cambiará la variable dependiente como
resultado de una manipulación o cambio en las variables independientes; la única pregunta es
sobre la magnitud del efecto, es decir, el tamaño del coeficiente de regresión. Si los coeficientes
de regresión estimados concuerdan en signo con lo que la teoría anticipó, esto parece ser tomado
como una indicación de que el modelo está correctamente especificado y que uno puede usar el
modelo para predecir el efecto del cambio o intervención.
El tipo B (del que se acusa a Robertson) no se basa en una teoría totalmente articulada. Eso por
lo general presupone la existencia de algún entendimiento general (quizás basado en la intuición
e investigaciones anteriores) sobre qué variables podrían estar relacionadas con el fenómeno a
predecir.
La inclusión o exclusión de una variable se basa en ese entendimiento y en criterios estadísticos
(Fuerza de la correlación con el resultado, importancia de la estadística t, correlación débil con
otros variables explicativas) que en un juicio de causa. Por la vista tipo B del modelo de regresión
uno puede anticipar la dirección en la que la variable explicativa afectará a la dependiente varia-
ble. Sin embargo, dado que no se puede recurrir a una teoría rígida, uno puede y encontrará una
plétora de mecanismos plausibles para explicar cualquier resultado. La ecuación del modelo es-
timado, resultados esperados y sorprendentes, a menudo se consideran una representación de
una realidad hasta ahora menos conocida; una indicación de una posible estructura de causa y
efecto descubierta por medios que son estadísticos en naturaleza.
1 Según Hogarth (2004) “La palabra “teoría” puede considerarse como una descripción de una
creencia o condición expectativa que le permite a uno tomar acciones en el mundo o hacer de-
claraciones sobre “cómo son las cosas”." la mayoría teorías del comportamiento (el tema de gran
parte de la economía, la sociología y la psicología), se ocupan de los tipos de acciones la gente
toma en ambientes específicos. Por lo tanto, estas teorías son declaraciones condicionales de
(a) qué tipo de personas toman (b) qué tipo de acciones en (c) qué tipo de entornos. Según el
Concise Oxford Dictionary, una teoría es:” una suposición o un sistema de ideas destinado a
explicar algo, especialmente uno basado en principios generales independiente de la cosa a
explicar.
48 Si se pudiera suponer que la teoría detrás del modelo tipo A es correcta (y si alguna condicio-
nes adicionales mantenidas) uno se sentiría atraído por este tipo siempre que sea posible. el
peligro es que si la teoría es débil, incompleta o incorrecta, la investigación se dirigirá en direc-
ciones que son demasiado estrechos y hacia resultados, quizás, falaces, incluso tontos. Las an-
teojeras de un teoría asumida puede proteger del investigador el mundo real que se refleja en
los datos y puede impedir que la realidad sea revelada y descubierta. De este modo, • Cuando
la teoría es débil, incompleta o posiblemente incorrecta, podría ser más rentable centrarse en el
modelado de tipo B, lo que permite que los datos guíen el descubrimiento.
Para ilustrar esta elección en el contexto del artículo de Peltzman, considere la crítica contenido
en Nelson (1976): “ Dado que Peltzman asume explícitamente que los conductores se ven esti-
mulados a ser más "asuntos de riesgo" por la legislación, e implícitamente asume que la legisla-
ción es la única diferencia entre los dos períodos, es llevado a algunos argumentos que, para
alguien no tan comprometido con estas presunciones, puede parecer extraño. Comienza afir-
mando que su análisis predice directamente el cambio en composición de muertes y daños rela-
cionados con accidentes. Como resultado de los nuevos dispositivos de seguridad, los
conductores estaban motivados para conducir de manera más arriesgada, pero solo compensa-
ron parcialmente la mayor seguridad.
Los peatones y la propiedad, sin embargo, fueron los perdedores. Luego busca otra evidencia
de "aumento de la asunción de riesgos", y sugiere que esto podría manifestarse en una conduc-
ción más rápida, en una mayor propensión de los jóvenes a conducir, y una creciente propensión
a conducir después de beber. Él encuentra ninguna evidencia real para una conducción más
rápida. Él encuentra evidencia de que más jóvenes conducen y conducir ebrio (aunque no sigo
del todo su argumento numérico con respecto a un aumento propensión de los jóvenes, en com-
paración con las personas mayores, a conducir). El punto implícito, por supuesto, es que estas
tendencias fueron causadas directamente por la legislación.
Qué argumento más peculiar. Si uno no entraba en el estudio con las anteojeras particulares de
Peltzman, y vio los datos que Peltzman ha descubierto, podría haber preguntado el analista, con
una mente bastante abierta manera: ¿Por qué el aumento en la conducción de adolescentes y
la conducción en estado de ebriedad (que parecen plausiblemente conectados con el aumento
de muertes de peatones y daños a la propiedad)? En la búsqueda de los factores detrás de estos
desarrollos, el investigador podría haber mirado una serie de variables, pero dudo seriamente si
hubiera puesto mucho peso en la posibilidad de que la razón principal fuera la nueva legislación
de seguridad automotriz. Sin la legislación, ¿la incidencia de conductores jóvenes y ebrios la
conducción ha sido significativamente menor? ¿Sería un ataque efectivo contra el aumento de
las muertes de peatones? y daños a la propiedad para prohibir los cinturones de seguridad y los
dispositivos de seguridad para automóviles relacionados? Había muchas cosas además de los
cinturones de seguridad que eran diferentes en el período posterior a 1965.
En comparación con el período anterior, la era posterior a 1965 (hasta 1970) fue de alto nivel de
empleo.
y prosperidad La "fuera de tendencia". aumento de los accidentes notificados no fatales bien
podría resultar parcialmente del aumento de la fracción de coches nuevos (algo que Peltzman
incorpora explícitamente en otros regresiones). El aumento de muertes de peatones, que destaca
Peltzman, seguramente necesita más análisis completo que le da al problema. Aunque parte del
aumento puede deberse a Hábitos de conducción más peligrosos, algunos de ellos podrían de-
berse al efecto no lineal de más peatones, a más coches, o a su interacción. Demográficamente,
la enorme población posterior a la Segunda Guerra Mundial cohorte de nacimiento estaba lle-
gando a la mayoría de edad, y uno puede dudar de que el aumento asociado en la cultura juvenil,
y los efectos que podría haber tenido en la seguridad del automóvil, se capta adecuadamente
por el coeficiente de tamaño de Peltzman de grupo Esta fue una era de drogas, alcohol y rebelión
juvenil, por razones que los economistas los modelos pueden no captar muy bien. Ciertamente,
Peltzman ni siquiera trató de lidiar seriamente con el 49 razones. Estaba la guerra de Vietnam y
sus influencias internas. ¿Podría esto haber estado relacionado al fenómeno en cuestión? No
sé, pero la "desviación de la tendencia" obviamente no puede ser atribuido a la "legislación de
seguridad" hasta el efecto de estos otros factores si se evalúa cuidadosamente. Uno de Mis
colegas bromearon sugiriendo que el caso Peltzman podría conservarse si nuestra aventura en
Vietnam podría atribuirse al hecho de que nos sentimos más seguros conduciendo y queríamos
compensar.
. Pero creo que he hecho el punto. (pág. 65-66) El punto de sentido común que plantea Nelson
es que el compromiso doctrinario de Peltzman con una teoría económica simplista (enfoque tipo
A) le impidió ver que los cambios en el consumo de alcohol, el exceso de velocidad, más con-
ducción por parte de los jóvenes, etc. es más probable que sean el resultado de muchas
corrientes y tendencias sociales complejas que de un ajuste que maximiza la utilidad a la pre-
sencia en el automóvil de un cinturón de seguridad o de una columna de dirección plegable. Las
anteojeras de un incompleto la simple teoría oscurecía una realidad compleja.
Por otra parte, la ausencia de teoría que defina el enfoque B, lo priva de una clara criterio por el
cual se puede hacer una atribución de causa. Lo que uno ve son coeficientes de regresión.
algunos de los cuales pueden estar de acuerdo con la intuición o la comprensión previa y otros
que no. A coeficiente de regresión con un signo inesperado por lo general se puede explicar
fácilmente como reflejando no una causa sino una variable oculta, una interacción desatendida,
algunos datos no disponibles, etc.
Y aquí está el problema; si en el modelado tipo B se debe dudar del significado causa-efecto de
un coeficiente de regresión inesperado uno debe igualmente dudar del mensaje de un coeficiente
de regresión con un signo esperado y por lo tanto la posibilidad de interpretación causal de toda
la empresa.
El debate sobre el 'efecto Peltzman' no terminó en 1977. Escribiendo en 2003, Sobel y Nesbit
(Sobel y Nesbit 2003) resumió el debate así: “ Aunque los resultados de Peltzman no son deci-
sivos, sus hallazgos respaldan en última instancia la existencia 1 de Comportamiento compen-
satorio. Mejoras y variaciones del estudio de Peltzman han sido ofrecidas por numerosos econo-
mistas, a menudo produciendo resultados que sugieren poco o ningún comportamiento compen-
satorio. Ambas cosas Robertson (1977) y Graham y Garber (1984) revisan el modelo de Pelzman
y encuentran opuestos resultados. Peltzman (1977), sin embargo, responde a las críticas de
Robertson, argumentando que las revisiones a su modelo no son consistentes con el supuesto
de racionalidad del conductor. Graham y Garber, usando especificación y control alternativos
para el tamaño del vehículo, sin seguro contra fallas y el mayor uso de motocicletas, encuentra
que el desempeño es consistente con las proyecciones de ingeniería de menor muertes totales
2 .
Los resultados. no se han acercado más al consenso en las últimas dos décadas. Chirinko y
Harper (1993), utilizando datos de series de tiempo sobre muertes, encuentra evidencia de algún
comportamiento compensatorio mientras que Risa (1994), usando datos de lesiones y fatalida-
des de Noruega, encuentra que los efectos de compensar comportamiento más que negar los
beneficios. Varios otros estudios que utilizan datos de accidentes encuentran resultados mixtos.
resultados sobre el comportamiento de compensación, y en su mayoría solo ligeramente signifi-
cativos, si es que lo son.
A diferencia de estos estudios, una tendencia más reciente es utilizar datos sobre lesiones o
reclamaciones de seguros por marca o modelo específico de automóvil, comparándolo con las
características de seguridad del modelo. Peterson y Hoffer (1994), por ejemplo, encuentra que
las tasas de lesiones y las reclamaciones de seguros nunca mejoran, y suelen empeorar signifi-
cativamente, para los modelos equipados con bolsas de aire. Lund y Hazelbaker (1993), 1 La
afirmación de Peltzman no se trata de la existencia de un comportamiento compensatorio; su
existencia se presume sobre la base de teoría económica. La afirmación de Peltzman se refiere
a la magnitud de la conducta compensatoria, es decir, que es más o menos completa negado el
efecto de seguridad de la regulación del automóvil.
2 Es decir, exactamente la conclusión opuesta a la de Peltzman.
50 sin embargo, no están de acuerdo con ese resultado y citan lo que creen que es una prepon-
derancia de evidencia lo que sugiere que no hay cambios en el comportamiento del conductor.
Por lo tanto, incluso con este enfoque alternativo de datos, no se ha llegado a un consenso. Debe
quedar claro a partir de los resultados mixtos resumidos anteriormente que un la respuesta defi-
nitiva está lejos de ser clara”. págs. 6-7.
No es realmente necesario describir el mérito del argumento y el contraargumento. los El men-
saje general es claro. Hace unos treinta años, la pregunta sobre el efecto de seguridad de los
automóviles se planteó la legislación. Muchos investigadores han tratado de responder a la pre-
gunta utilizando variantes de la misma herramienta: un modelo econométrico multivariable ba-
sado y los datos agregados disponibles para alimentarlo.
Dependiendo de los detalles de los datos y el modelo, diferentes investigadores llegaron a dife-
rentes estimaciones y conclusiones. Se debe concluir que, en este caso, no se podría resolver
la cuestión de qué El cambio en las muertes por accidentes de tránsito fue causado por la regu-
lación de la seguridad del automóvil usando multivariable.
modelos econométricos.
4.1.4 La Moraleja de la Historia de la “Regulación de Seguridad Automovilística”.
Como se indicó anteriormente, nuestro interés no está en la cuestión de cómo las normas de
seguridad de los automóviles seguridad afectada, sino en la cuestión de si los modelos econo-
métricos multivariables basados en los datos agregados permiten la interpretación de causa y
efecto. Por lo tanto, es interesante examinar si los mismos modelos econométricos ya revisados,
así como algunos adicionales, produjo estimaciones consistentes para el efecto de variables ta-
les como ingresos, costos de accidentes, alcohol Consumo, Velocidad, etc. Si los coeficientes
de regresión se encuentran más o menos consistentes, toma esto como un buen augurio; una
señal de que diversos datos muestran aproximadamente el mismo efecto de un variable. Sin
embargo, si el coeficiente de regresión estimado de la misma variable se encuentra en todo el
mapa, concluiremos que el: una. el efecto de la misma variable es diferente en cada estudio y
entorno o, b. la herramienta (modelado econométrico multivariable de datos agregados) no pro-
dujo estima una representación fiable del fenómeno.
En cualquier caso, no se puede atribuir ningún significado de causa-efecto a los resultados de
tal estudio.
A continuación se muestran las estimaciones del coeficiente de regresión para variables y mo-
delos seleccionados.
Tabla 6 . Estimaciones de parámetros para variables seleccionadas Ácido.
Costo Ingreso Alcohol Velocidad Tráfico Densidad Joven Conductores Peltzman (1975) Serie
temporal 1,2,4 -0,17 0,88 0,36 1,84 0,83 Peltzman (1975) Sección transversal 61-63 1,3,4 0,15 -
0,81 0,17 0,76 0,23 Peltzman (1975) Sección transversal 64-66 1,3,4 0,23 -0,66 0,04 0,89 0,12
Graham (1983) Serie temporal 5 -1,916 1,032 2,472 20,52 Crandall (1983) 4,6 1,062 0,2941
0,7325 Zlatoper (1991) Sección transversal 5 -0,002 2,646 0,363 7,242 -0,735 Chirinko Harper
(1993), Serie temporal 2,4 -0,810 -0,634 1,053 -0,112 1Basado en Joksch (1976), 2 Accidentes
fatales/Milla vehicular, 3 Muertes de tránsito /Población, 4 Formulario de modelo multiplicativo
(log-lineal), 5 Formulario de modelo aditivo lineal, 6 Muertes de ocupantes/año.
Independientemente de si se utilizó una forma de modelo multiplicativa (log-lineal) o aditiva (li-
neal) utilizado, si un coeficiente de regresión es positivo en un estudio y negativo en otro, esto
es una señal segura de problemas Este problema se presenta en las variables Costo de Acci-
dentes, Ingresos y Conductores Jóvenes.
51 Alcohol y Speed tienen en todos los estudios coeficientes de regresión positivos 1 . con algo
de cautela uno puede examinar y comparar las magnitudes de los coeficientes de regresión para
el multiplicativo modelos Así, por ejemplo, el coeficiente de regresión para el alcohol en el modelo
de sección transversal de Peltzman es 0.04 mientras que en Chirinko y Harper es 1.053 2 . Esto
también es una señal de problemas ya que un estudio indica que un aumento de más del 1% en
muertes y el otro solo un poco más del 0% por incremento porcentual en la variable Alcohol.
Los intentos sucesivos de modelado econométrico multivariable por parte de varios investigado-
res no responder a la pregunta qué reducción en las muertes de tránsito fue causada por la
seguridad del automóvil regulación. La investigación no condujo a un consenso sobre la existen-
cia y la magnitud de la compensación comportamiento; y no arrojó ecuaciones que permitan
predecir cuál será el cambio en las muertes causado por un cambio en variables como Velocidad,
Alcohol, Ingresos, etc. Es como si algunos encontraran que metal se expande cuando se calienta,
mientras que otros llegaron a la conclusión de que se contrae, y todo el experimento desorden
dejado en el piso del laboratorio, con todos publicando y creyendo sus propios resultados, y nadie
pregunta si el método de medición utilizado por todos es bueno.
4.2 Lave y otros sobre el límite de velocidad La Sección 4.1 trataba sobre el desafío de Peltz-
man a la opinión del sentido común de que los vehículos más seguros lograr menos muertes. Un
desafío similar a la sabiduría recibida fue lanzado en 1985 por Charles Lave (Lave y A.). Afirmó
que "la varianza no mata la velocidad". (pág. 1159). Como Sobel y Nesbit (2003) señaló: “El
Santo Grial en la investigación económica es encontrar un modelo teóricamente sólido que pre-
dice un resultado contraintuitivo…” (p.2) 4.2.1 Hallazgos de Lave.
Como otros antes que él, Lave depositó su confianza en el poder de la regresión para cuantificar
las causas.
Su variable dependiente fue la tasa de letalidad (FR, fatalidades/10 8 millas del vehículo). El
independiente las variables fueron promedios estatales para: 1. Velocidad promedio; 2. Percentil
de velocidad 85; 3. exceso de velocidad citaciones/100 conductores por año; 4. una medida de
Acceso al Hospital. Para cada tipo de carretera y año (seis tipos de carreteras y dos años natu-
rales, lo que da como resultado doce modelos estimados) tenía entre 18 a 47 puntos de datos.
Las ecuaciones del modelo de Lave eran lineales aditivas 3 . La ecuación de regresión final
(Ecuación de Lave 2) es: 1 Es pertinente señalar aquí que toda la siguiente sección gira en torno
a un hallazgo de que, en una regresión similar esfuerzo de modelado, el coeficiente de regresión
de la velocidad fue negativo y esto dio lugar al 'hallazgo' de que la velocidad no es relacionados
con accidentes mortales.
2 El hecho de que Peltzman use muertes de ocupantes/ 10 5 población mientras que Chirinko y
Harper usan vehículo motorizado muertes de ocupantes.10 8 millas del vehículo deberían hacer
muy poca diferencia. En Peltzman el consumo de alcohol es el de licores destilados por personas
mayores de 15 años; Chirinko y Harper hablan de “consumo per cápita de alcohol” que puede
ser una variable algo diferente si incluye vino y cerveza. Fridstrøm e Ingebrigtsen (1991)(Frids-
trøm and Ingebrigtsen 1991) muestran diferencias sustanciales en los coeficientes de regresión
asociados con Venta de cervezas, vinos y licores.
3 Ni Lave ni ningún otro autor cuyo trabajo haya sido mencionado hasta ahora dan razones para
su elección de forma funcional. Y, sin embargo, las conclusiones a las que lleguen pueden de-
pender crucialmente de esta elección, una elección que todos hacen.
por razones no reveladas. Escribiendo en el Handbook of Econometrics, Lau (1986, p. 1516-8)
(Lau 1986) escribe: “Históricamente, las primeras formas de funciones algebraicas se eligieron
por su facilidad de estimación. Casi siempre un la forma funcional elegida es lineal en paráme-
tros, después de una transformación de la variable dependiente si es necesario. … 52 (Citas /
Conductor) (Acceso al hospital) FR (Velocidad promedio) (Percentil 85 de velocidad - Velocidad
promedio) 3 4 1 2 + β + β = α + β + β ecuación 4 Para evitar usar la misma variable (Velocidad
promedio) en dos términos de la ecuación. 4 Lave también estimó: (Citas / Conductor) (Acceso
al hospital) FR (velocidad media) (percentil 85 de velocidad) * 4 * 3 * 2 * 1 * + β + β = α + β + β
ecuación 5 Naturalmente, el percentil 85 y el promedio de una distribución siempre son alta-
mente positivos .
correlacionado. Y por lo tanto la ecuación transformada. 5 solo acentúa el problema de colinea-
lidad en la ecuación.
4. Por lo tanto, reportaré los coeficientes de regresión seleccionados para la ecuación. 4.
Tabla 7. Coeficientes de regresión seleccionados para Eqn. 4.
Promedio Velocidad ( β 1 ) Velocidad Variabilidad β2 _ β 3 β 4 R 2 Número de Estados norte
Interestatal rural 1981 -0,5 0,176 0,036 -7,75 0,624 41 Arterial Rural 1981 -1.3 0.677 0.0122
0.915 0.237 46 Recolector Rural 1981 -0.1 0.011 0.0041 -8.61 0.019 41 Autopista Urbana 1981
-0.5 0.281 0.041 -0.286 0.193 18 .
Lave estimó los coeficientes de regresión β 2 a β 4 cuando la velocidad promedio no se utilizó
como variable. Si la Velocidad Media se incluyera entre las variables, su coeficiente de regresión
sería que se enumeran en ( β 1 ). Porque β 2 es positivo en 11 de 12 casos y β 1 es negativo en
10 de los 12 modelos estimados, Lave concluyó que es la variabilidad de la velocidad (medida
por la diferencia percentil 85 y la velocidad media) y no la velocidad media lo que importa. En En
apoyo de esta evidencia basada en la regresión, Lave aduce algunos hallazgos de investigación
adicionales. Aparte de su apoyo agregado es empírico y proviene de Solomon (Solomon 1964)
y Cirillo (Cirillo JA. 1968) quien descubrió que la tasa de participación en accidentes aumenta
dramáticamente para los vehículos que conducen más lento o más rápido que la velocidad me-
dia. Otra parte del apoyo es teórico y viene de un pecado de mi juventud (Hauer 1971) donde
muestro que la frecuencia de los adelantamientos experimentados Finalmente, por facilidad de
cálculo e interpretación y por razones estéticas (comúnmente elegidos son) iii y = Σ f ( X ) α (1.1)
o = Σ iii g ( y ) f ( X ) α (1.2).” Un ejemplo de ec. 1.1 es la forma funcional lineal ampliamente
utilizada en la que f(X i )=X i (usado por Lave y otros). Un ejemplo de ec. (1.2) es la forma fun-
cional logarítmica doble en la que g(y)=ln(y) y f(X i )=lnX i .(utilizado por Peltzman y otros) ….
formas funcionales del tipo en ecuaciones. (1.1) y (1.2) pueden interpretarse como aproximacio-
nes de primer orden a cualquier función arbitraria en la vecindad de algún XX 0 y esa es una de
las razones por las que tienen una moneda tan amplia. Sin embargo, las funciones lineales,
aunque pueden aproximarse a la función subyacente, razonablemente bien para pequeños cam-
bios en las variables independientes, frecuentemente no funcionan muy bien…” Nunca funcionan
bien cuando la función subyacente es fuertemente no lineal y X no está cerca de X o . Esta crítica
ciertamente se aplica a Lave (1985) en el que, por ejemplo, el valor medio de (percentil 85 -
Velocidad media) es de aproximadamente 5 pero varía de 2.7 a 9.0 y la citación/conductor varía
de 24 a 193 y donde generalmente se piensa que la posibilidad de una fatalidad aumentar con
la cuarta potencia de la velocidad.
53 por vehículos que van más lento o más rápido que la velocidad mediana aumenta de una
manera muy similar a la 'Curva de Salomón'. Especulé allí que la frecuencia de adelantamiento
podría ser el mecanismo lo que explica los hallazgos de Salomón. Así, para Lave, el problema
con la velocidad parecía ser su variabilidad (falta de coordinación), no su magnitud. Si es así,
según Lave, el apropiado la respuesta política debe ser medidas que reduzcan la variabilidad de
la velocidad, no esfuerzos para cambiar la velocidad distribución a velocidades menores, man-
teniendo su varianza.
El tema de causa y efecto vuelve a estar en el centro del escenario. Como Peltzman y otros antes
que él, Lave se inclinaba a creer que lo que uno encuentra por regresión multivariable puede ser
se lee como causa y efecto. En este caso, la principal interpretación causal es que si se actúa
para reducir el diferencia entre el percentil de velocidad 85 y la velocidad media, es probable que
se obtenga una reducción en la tasa de accidentes fatales en la dirección y quizás la magnitud
predicha por la correspondiente coeficientes de regresión. Además, también con base en el signo
y la magnitud de la regresión coeficientes, Lave argumenta que si uno reduce la velocidad pro-
medio sin reducir la dispersión de velocidad, es posible que no se reduzca la tasa de accidentes
mortales.
La dificultad obvia con la conclusión de Lave (que reducir la velocidad sin reducir la variabilidad
de la velocidad no disminuye las fatalidades) es que niega no solo la sabiduría convencional sino
también las leyes de la naturaleza en las que se basa la sabiduría convencional. La extensión de
la lesión depende sobre la capacidad del cuerpo humano para resistir el impacto y la deformación
causados por un choque y éstos, a su vez, están determinados por las leyes de la física. Real-
mente no es posible argumentar que la El daño al cuerpo humano que es causado por el impacto
y la deformación no están relacionados con la energía.
disipado en un choque o al cambio en el momento de las masas involucradas. Energía y cantidad
de movimiento son funciones de la velocidad. Por lo tanto, los resultados de la regresión de Lave
no sólo van en contra de sabiduría convencional, también parecen negar hechos físicos y médi-
cos que pocos pregunta. Solo puedo pensar en dos formas de cuadrar la afirmación de Lave con
las realidades de la mundo físico. Una sería si la velocidad en el momento del impacto fuera
completamente independiente de la velocidad a la que viajaba el vehículo unos segundos antes
del impacto; no es muy plausible conjetura, especialmente no para choques de un solo vehículo
1 . Otra sería si los que manejan rápido estuvieron involucrados en menos colisiones que los que
conducían, digamos, a la velocidad media. Desde la oportunidad de una colisión que resulte en
fatalidad aumenta aproximadamente con la cuarta potencia de la velocidad, la compensar la re-
ducción en la frecuencia de colisiones para aquellos que van rápido tendría que ser absurda-
mente largo. Por lo tanto, no puedo pensar en circunstancias en las que el resultado de Lave
pueda ser cierto.
4.2.2 Los comentaristas.
Siguió de nuevo un animado debate, gran parte del mismo en el número de septiembre de 1989
del American Revista Económica. Fowles y Loeb (Fowles y Loeb PD 1989) argumentaron que el
modelo de Lave puede haber omitido muchas variables importantes 2 . También piensan que su
modelo podría ser “frágil 1 Existe alguna evidencia (Farmer 2003) de que la relación entre el
cambio de velocidad antes del impacto (Delta-V) y el límite de velocidad es mucho más débil de
lo que cabría esperar. Por lo tanto, si el límite de velocidad y la velocidad media son fuertemente
correlacionada, la conjetura podría considerarse plausible.
2 ¿Qué pasa si, por ejemplo, aquellos estados donde las velocidades son más diversas también
tienen menos tráfico? Como es sabido, en la mayoría de los tipos de carreteras, la tasa de acci-
dentes disminuye a medida que aumenta el flujo de tráfico. Por lo tanto, si se incluyera una
medida de la densidad del tráfico en el modelo esto podría haber alterado los hallazgos de Lave.
¿Qué pasaría si fuera cierto, por ejemplo, que cuanto más alcohol haya en el asiento del con-
ductor? sangre, más diversa y extrema tiende a ser su velocidad? Si es así, ¿qué fue interpretado
por Lave como el efecto de la variación de la velocidad puede, de hecho, reflejar diferencias en
el contenido de alcohol en la sangre? 54 con respecto a la especificación del modelo” 1 Para
examinar estos temas, Fowles y Loeb construyeron un modelo de los suyos También era lineal-
aditivo. La variable dependiente fue el número de muertes en un estado y las variables indepen-
dientes fueron: 1. La existencia de un sistema de inspección de vehículos de motor en el estado,
2. Velocidad promedio ponderada de vehículos de movimiento libre en carreteras interestatales,
3.
Diferencia ponderada entre el percentil 85 y la velocidad media de los vehículos en movimiento
libre en carreteras interestatales, 4. Edad mínima para beber cerveza, 5. Consumo per cápita de
cerveza, 6. 10 8 millas recorridas por vehículos, 7. Acceso al hospital, 8. Millas de carretera, 9.
Densidad de población, 10. Proporción de conductores entre 18 y 24 años, 11. Población en el
estado, 12. Variable ficticia para 'Western Estados'. Los autores encontraron que "las variables
de 'velocidad' y 'variabilidad de la velocidad' tienen coeficientes que son positivos y (estadística-
mente) significativos”. Dijeron que: “ Los resultados son excediendo estable a través de un con-
junto bastante extenso de especificaciones de modelo 2 lo que lleva a creer que los resultados
son ciertamente plausibles. Estos resultados están en fuerte desacuerdo con Lave ”. (Énfasis
añadido p.917-918).
En el mismo número de American Economic Review, Levy y Asch (Levy y Asch 1989) examinó
los resultados de Lave a la luz de su propio modelo. Sus datos de sección transversal fueron
para 50 estados en el año 1985. La variable dependiente fue Fatalidades de vehículos de motor
interestatales por Conductor. Las variables independientes fueron: 1. Millas de vehículos inter-
estatales/conductor, 2. Ingreso per cápita, 3. Proporción de conductores masculinos, 4. Propor-
ción del kilometraje por carretera que es municipal, 5. Conducción legal edad, 6. Consumo de
alcohol per cápita, 7. Promedio estatal de velocidad de conducción promedio para varios tipos
de vías, 8. percentil 85 - velocidad media, 9. producto de 8×9.
El modelo preferido fue nuevamente lineal y aditivo. Levy y Asch encontraron que cuando La
variable 9 (el producto de la velocidad y la variabilidad de la velocidad) no está incluida en el
modelo “velocidad media tiene un efecto positivo aunque (estadísticamente) insignificante. El
efecto de la varianza (más precisamente variabilidad de la velocidad) es positiva y significativa”.
(pág. 914). Sin embargo, cuando la 'interacción variable' (9) está incluida en el modelo, “Su coe-
ficiente es positivo (0.0038) y significativo al 0,05 (mientras que los coeficientes de la velocidad
media (-0,027) y la varianza de la velocidad (-0,21) volverse negativo y significativo)…” (p. 915).
Sobre esta base concluyen que: “…Lave's argumento está incompleto. La falta de coordinación
sí implica mayor riesgo. El grado en que lo hace, sin embargo, depende de la velocidad media;
y la velocidad media también contribuye al riesgo a un ritmo que depende de la varianza.” Es
difícil abstenerse de comentar aquí, una vez más, sobre la asombrosa fe en el poder de regre-
sión. Levy y Asch intentaron modelar muertes en la carretera interestatal sistema. Usaron como
variables independientes una variedad de variables disponibles, pero a menudo solo vagamente.
estadísticas agregadas pertinentes. Uno puede preguntarse, por ejemplo, qué tan cerca está el
ingreso per cápita en el estatal (que era una de las variables), refleja el ingreso per cápita de
quienes utilizan la interestatal sistema en ese Estado (los camioneros, los viajeros fuera del es-
tado, etc.); uno puede preguntarse, por ejemplo, qué tan directo es el nexo de causalidad entre
la proporción de vías en el estado que se clasifican como municipales (también una variable
utilizada en la regresión) y muertes en las carreteras interestatales; uno puede cuestionar el pa-
pel de la velocidad promedio estatal y la variabilidad de la velocidad para varios tipos de carre-
teras (la principal variables independientes de interés) como una 'causa' de fatalidades interes-
tatales. Sin embargo, la principal prueba de 1 La fragilidad del modelo generalmente significa
que la conclusión que se extrae depende de la suposición que hace el investigador sobre el
modelo; suposiciones sobre qué tipo de función matemática se debe usar para representar el
fenómeno a mano; supuestos sobre qué variables deben incluirse en el modelo y cuáles no, etc.
2 Se han probado diez modelos aditivos lineales. Estos diez modelos difieren en las variables
incluidas y excluidas.
55 la credibilidad de uno viene cuando Levy y Asch agregan al modelo la variable de 'interacción'
(promedio velocidad) × (variabilidad de la velocidad). Usando los coeficientes de regresión dados
por Levy y Asch, muestro en Figura 11 cómo la adición a 'Muertes de vehículos de motor inter-
estatales' (desinflado por conductores con licencia) depende de las variables 'Velocidad media'
y del 'percentil 85 – Velocidad media' 1 .
Figura 11. La suma de accidentes por la Velocidad y la Variabilidad de la Velocidad Estos
resultados no tienen sentido. Si fueran ciertos, uno concluiría que, cuando la velocidad la varia-
bilidad es baja 2 entonces, cuanto mayor sea la velocidad media, menor será el número de muer-
tes. Sin embargo, lo contrario estaría indicado cuando la variabilidad de la velocidad es grande.
Las dos líneas que se muestran en la Figura 11 se cruzan alrededor de 55 mph. Si esto fuera
cierto entonces, para todos los valores de velocidad media por debajo de 55 mph, menos varia-
bilidad en la velocidad, se deben esperar más accidentes fatales y lo contrario se mantiene por
encima de 55 mph. No hay indicios en el documento de que estas peculiares consecuencias de
la forma funcional elegida han sido revelados por algunos análisis exploratorios de datos. Lo más
probable es que la tontería sea directa.
consecuencia no de los datos sino de las elecciones realizadas por los investigadores: la decisión
de utilizar un modelo aditivo lineal y la decisión de utilizar como una variable el producto de la
velocidad media y la velocidad variabilidad.
Las elecciones de este tipo a menudo se hacen habitualmente. Y sin embargo, una vez que la
forma modelo fue elegido infundadamente y viendo que el coeficiente de regresión del producto
de la velocidad media y la variabilidad de la velocidad “.es positiva y significativa” Levy y Asch
no dudan en concluir que: ". la falta de coordinación tiene mayores efectos fatales a velocidades
más altas". (pág. 915). Ciertamente así es difícil comprender la intolerable ligereza con la que se
pueden hacer tales afirmaciones causales y publicado.
Snyder contribuyó a otra discusión de las afirmaciones de Lave (Snyder 1989). Su El argumento
era doble. Primero, que uno debería distinguir entre conductores lentos y rápidos usando dos
variables separadas: (velocidad percentil 85 - velocidad mediana) y (velocidad mediana- percentil
15 velocidad). Segundo, que uno debe minimizar el efecto adverso de las variables omitidas
usando 1 La ecuación es: Adición a la Tasa de Accidentes= -0.027×VELOCIDAD-0.21×(Percentil
85 -VELOCIDAD)+ 0.0038 ×VELOCIDAD × Percentil 85 -VELOCIDAD).
2 Cuando (percentil 85 - VELOCIDAD ) < 7 mph.
56 variables ficticias para 'Estado' o 'Período de tiempo' 1 . Él también utiliza un modelo aditivo
lineal en el que el la variable dependiente es 'Tasa de fatalidad en carretera/10 8 millas de vehícu-
los' en carreteras primarias rurales incluyendo interestatales. Las variables independientes son
'velocidad mediana' y las dos mencionadas desviaciones de la velocidad media. Los principales
resultados de Snyder se encuentran en la Tabla 8.
Tabla 8. Coeficientes de regresión de Snyder ecuación R 2 Mediana- 15ª Mediana 85ª -Me-
diana 1 Tres variables 0,40 0,03 0,37** 0,40* 2 Dos variables 0,41 0,38** 0,42** 3 Una variable
0,25 0,51** 4 Variables ficticias para 26 Estados 0,80 0,11 0,43** 0,26* 5 Variables ficticias para
1972, 73, 74 0,42 -0,03 0,35* 0,37* *Significativo al 0,05; ** Significativo al 0,001 Snyder concluye
que 2 “la velocidad media del tráfico es un determinante importante de la carretera muertes…” y
que “…la variación de velocidad 3 es importante solo para los vehículos más rápidos”. Él también
ve sus resultados como representación de causa y efecto y, por lo tanto, se siente libre de ofrecer
especulaciones explicaciones de sus hallazgos. Estas especulaciones (p. ej., "los vehículos len-
tos tienen más probabilidades de ser grandes (autobuses, tractocamiones, etc.) y por lo tanto
más fáciles de ver y evitar…. Los vehículos rápidos son más probablemente sea más pequeño
y conducido imprudentemente por no profesionales”. p.924) son una ilustración de la facilidad
con la que se puede explicar cualquier resultado de regresión.
4.2.3 Respuesta de Lave.
En su réplica, Lave es recalcitrante; sigue manteniendo que solo la variabilidad de la velocidad
importa y cree que: “… sus resultados (los del comentarista) son simplemente un artefacto de
agregando diferentes tipos de carreteras”. (pág. 926). El de Lave es un argumento importante y
tiene un efecto directo teniendo en cuenta la cuestión de cuándo la interpretación de causa y
efecto de los resultados de la regresión puede ser equivocado.
Lave argumenta así: “Los tipos de carreteras difieren marcadamente en sus características físi-
cas y patrones de uso y, a su vez, estas diferencias en las características provocan una diferencia
de 5:1 en la mortalidad tasa a través de los tipos de carreteras.” (p. 926) Para ilustrar lo que
causa las diferencias incluso entre carreteras aparentemente similares, como las carreteras in-
terestatales Lave menciona: "( a) las carreteras interestatales rurales son más aislado que las
carreteras interestatales urbanas, el tiempo de demora para la ayuda médica es mayor, y por lo
tanto ordinario los accidentes se convierten en fatalidades; (b) las carreteras interestatales rura-
les transportan 2,4 veces la proporción de camiones pesados, por lo que hay más interacciones
coche/camión; (c) las carreteras interestatales rurales tienen mayor recorrido longitud, más fatiga
del conductor y, por lo tanto, un 15 por ciento más de accidentes en los que el vehículo simple-
mente se sale del camino. Consciente de tales diferencias, ejecuto ecuaciones separadas en
cada tipo de carretera.
Los tres comentarios no.” (p. 926) 1 Si se vuelve a estimar un modelo de regresión después de
agregar una nueva variable, el valor de la regresión previamente estimada el coeficiente puede
cambiar. Si es así, la nueva variable es una variable omitida. El argumento de Snyder es que al
agregar dummy variables para 'Estado' o 'Período de tiempo' se minimiza el efecto no contabili-
zado de las variables omitidas.
2 Contrariamente a lo que afirma Lave.
3 Snyder realmente significa algo así como 'desviación de la velocidad media cuando es positiva'.
57 Lave explica el mecanismo por el cual los comentaristas podrían haber llegado a un conclu-
sión incorrecta de la siguiente manera: “ ¿Cómo podría ocurrir esto? Las carreteras rurales tienen
mayor mortalidad que las carreteras urbanas (por las razones estructurales citadas anterior-
mente), y las carreteras rurales tienen velocidades medias más altas que las carreteras urbanas.
Por lo tanto, combinar datos rurales y urbanos (como el comentaristas) producirá una falsa co-
rrelación positiva entre la velocidad y fatalidades.” (pág. 926) Una parte del argumento de Lave
tiene un gran mérito. Los sesgos de agregación son ampliamente reconocidos y descrito. Para
consultar una revisión reciente en el contexto de la investigación sobre seguridad vial, véase
(Davis 2004). Por un examen del sesgo de agregación en el contexto del trabajo de Lave ver
(Davis 2002). Sin embargo, El principal argumento de Lave es esencialmente cíclico. Postuló que
lo que causa mayores tasas de mortalidad en las carreteras interestatales rurales son (a) mayor
demora en la ayuda médica, (b) más camiones ergo más graves colisiones, y (c) más colisiones
de un solo vehículo que tienden a ser más graves. también asumió (en silencio), que (d) la mayor
velocidad en las carreteras interestatales rurales no es una de las principales razones por las
que los accidentes en las carreteras interestatales rurales tienden a ser fatales con más frecuen-
cia que las carreteras interestatales urbanas. (Solo cuando la suposición (d) ¿Puede Lave con-
siderar que la correlación entre la velocidad y las muertes es " espuria ".) Por lo tanto, mientras
que Lave argumenta que la correlación positiva entre la velocidad y la tasa de mortalidad que el
comentaristas encontrados es espurio, lo más que puede decir es que sería espurio si (d) fuera
cierto.
Uno no puede argumentar que (d) es verdadero asumiendo que es verdadero.
Lo más probable es que Lave tenga razón al pensar que una parte de la diferencia en las tasas
de mortalidad entre carreteras interestatales rurales y urbanas se debe a factores como (a), (b)
y (c) 1 . Si es así, lo que los comentaristas atribuido a la velocidad es, en parte, un reflejo del
efecto de todas las diferencias mencionadas que no dieron cuenta. Lave cree que sus propios
resultados son correctos porque examinó por separado cada tipo de carretera (interestatal, arte-
rial, etc.) y entorno (urbano y rural).
Sin embargo, las propias conclusiones de Lave están sujetas a las mismas críticas por las que
desacredita los hallazgos de otros. Considere, por ejemplo, su modelo para carreteras interesta-
tales rurales basado en el promedio de 41 estados.
valores para 'Velocidad media', 'Variabilidad en la velocidad', 'Citas/Conductor' y 'Hospital Acce-
so'. Para usar el propio argumento de Lave, estos 41 estados diferirán en, digamos, el promedio
de 'Porcentaje de Camiones en su sistema interestatal rural. Si es cierto que más camiones pro-
vocan más accidentes mortales (como postula Lave) y, si también es cierto que cuantos más
camiones hay en la carretera, menor es el velocidad media entonces, ceteris paribus (como les
gusta decir a los economistas) más muertes tenderían para ir con velocidades menores. De ello
se deduce que el descuido de Lave del 'Porcentaje de Camiones' como variable tienden a pro-
ducir el propio hallazgo de Lave, el hallazgo de que no hay efecto de la velocidad, incluso si en
realidad la velocidad sí lo hace.
aumentar la frecuencia y la gravedad de los accidentes. De manera similar, los estados difieren
en la proporción de conductores mayores en interestatales Los conductores mayores mueren
más fácilmente y los conductores mayores tienden a conducir más lento. Esto también podría
aparecer como una asociación entre velocidades más lentas y más muertes. Así, sin tener en
cuenta la edad como factor casual también puede inducir a error. Numerosos otros argumentos
plausibles en este sentido podría agregarse.
1 Además de estos, las principales diferencias adicionales se encuentran en la frecuencia de los
intercambios, los estándares de diseño las autopistas suelen tener medianas estrechas con una
barrera mediana y una sección transversal de bordillo y cuneta + barandilla; rural las autopistas
tienden a tener medianas más anchas, a menudo sin una barrera en la mediana, menos baran-
das, etc.), iluminación, etc.
58 Por lo tanto, es justo decir que los propios resultados de Lave sufren el mismo tipo de confu-
sión por lo que culpa a sus comentaristas. Si los resultados de los comentaristas pueden ser
incorrectos, también pueden ser su. La categorización de Lave (por tipo de carretera y configu-
ración) es insuficiente para dar cuenta de posibles variables de confusión como la cantidad de
tráfico de camiones, la edad de los usuarios de la vía y otras; por lo tanto no asegura que los
coeficientes de regresión de 'Velocidad' y de 'Variabilidad de la velocidad' puedan ser interpre-
tado en un sentido de causa y efecto.
¿Qué sería entonces suficiente? Esta cuestión necesita ser discutida exhaustivamente en su
propia y no como un aparte de una anécdota histórica. Sin embargo, es claro que la posibilidad
de llegar a conclusiones erróneas a menudo está presente en el trabajo no experimental, espe-
cialmente cuando el los datos se agregan en medias y no se tiene en cuenta el efecto de las
variables importantes. Tambien es claro que tales amenazas a la validez no son fáciles de evitar.
El hábito de agregar datos en medios requiere una posdata interesante para esta porción de
historia de la investigación (que fue iniciada por Lave en 1985 y finalizada por su refutación en
1989). Esta basado sobre un trabajo de Rodríguez (1990). Sin recurrir a ningún dato o suposición,
Rodríguez muestra por lógica matemática que mientras la probabilidad de morir en un accidente
sea una no lineal función de la velocidad, la tasa de mortalidad de un Estado será función de la
velocidad media y de la velocidad variación, incluso si cada conductor estaba siempre solo en la
carretera y, por lo tanto, la variabilidad de la velocidad tenía nada que ver con la ocurrencia de
accidentes. Es decir, una ecuación de regresión correcta tendrá ambas medias la velocidad y la
variación de la velocidad como variables independientes, incluso si la variación de la velocidad
no tiene un papel causal en generación de choques.
A primera vista, esto puede resultar desconcertante. ¿Cómo puede la tasa de mortalidad ser una
función de la velocidad? varianza cuando todo el mundo viaja solo por la carretera? Para expli-
carlo, suponga que la probabilidad de ser muertos en un choque aumenta con la cuarta potencia
de la velocidad 1 . Por lo tanto, si a 60 mph la probabilidad de ser muerto en un choque es un
número P, luego a 64 mph es P × (64/60) 4 = 1.29P, a 66 mph es 1.46P ya 70 mph es 1.85P.
Considere el Estado X donde la mitad de los conductores van a 64 mph y la otra la mitad a 66
mph (la variación de velocidad es pequeña). El número de muertes en el Estado X será propor-
cional a 1,29+1,46=2,73. Considere ahora el Estado Y donde la mitad de los conductores van a
60 mph y la otra mitad a 70 mph (la variación de velocidad es grande). Aquí el número de muertos
es proporcional a 1+1,85=2,85. La velocidad promedio en los estados X e Y es la misma. La
única diferencia entre los estados están en variación de velocidad; se ve que el estado con la
varianza más grande tiene el número más grande de fatalidades Sin embargo, esta aparente
dependencia de las muertes en la variación de la velocidad es solo un espejismo; eso se debe
únicamente al hecho de que la posibilidad de morir en un choque es una función no lineal de la
velocidad.
El resultado es que una ecuación de regresión perfectamente correcta contendrá la velocidad
media y la velocidad varianza como variables incluso si, en realidad, el número de muertes de-
pende solo de la velocidad y tiene nada que ver con las diferencias en las velocidades individua-
les. Así, incluso una regresión perfecta sin confusión que utiliza la velocidad media y la variación
de la velocidad como variables conduciría a la incorrecta conclusión de que la variación de la
velocidad es importante cuando no lo es. Todos los estudios que utilizan valores medios como
variables son vulnerables a este problema. La conclusión general es que si en la población de
que se extraen los datos, una covariable tiene una distribución con una media y una varianza, y
si la función que vincula la covariable y la variable dependiente no es lineal, entonces la influencia
de la La covariable no se puede representar correctamente usando en el modelo de regresión
solo la media y la varianza de esta covariable. La búsqueda de Lave y sus comentaristas - su
intento de separar el 1 Esto es, aproximadamente, lo que encuentra la investigación.
59 roles causales de la velocidad media y la variación de la velocidad- estaba condenada desde
el principio. Una onza de lógica es mejor que una libra de regresiones.
4.2.4 La moraleja de la historia 'La velocidad no mata'.
La sección 4.1 giró en torno a la regulación de la seguridad del automóvil. Sin embargo, nuestro
interés no era en el efecto de seguridad de dicha regulación, ni en la existencia o extensión de
'comportamiento compensatorio'. Nuestro interés estaba en la cuestión de si los modelos de re-
gresión multivariable que utilizan datos agregados permitió a los investigadores llegar a conclu-
siones de naturaleza causa-efecto. El histórico ida y vuelta de la investigación puesta en marcha
por Peltzman solo proporcionó el escenario y el contexto.
En la presente sección (4.2) la historia gira en torno a la cuestión política de si uno debe intentar
reducir la velocidad o reducir la variabilidad de las velocidades. Una vez más, no estamos intere-
sados en la veracidad de la afirmación causal de Lave de que sólo importa la variabilidad de la
velocidad. Nuestro interés está en el método.
(regresión multivariable) utilizada por diferentes investigadores que tenían como objetivo llegar a
la causa-efecto conclusiones.
La cuestión de la importancia relativa de la velocidad frente a la variación de la velocidad tiene
una larga historia.
Se ha debatido antes de 1985, cuando Lave presentó su artículo original y el debate continuó.
después de 1989 cuando se publicaron los comentarios y la refutación. Las cinco publicaciones
discutidas aquí, todos se basaron en datos transversales agregados y todos los autores utilizaron
lineal multivariable regresión. Llegaron a diversas conclusiones. La crítica de Lave al método del
comentarista es válido. Sin embargo, la misma crítica se aplica al propio trabajo de Lave y con
igual fuerza. Además ahí está el resultado de Rodríguez. Dado que la probabilidad de morir en
un choque depende de la velocidad en un manera altamente no lineal, uno no puede ni siquiera
esperar obtener una especificación de modelo correcta cuando la media Se utilizan la velocidad
y la varianza. Es decir, no se puede confiar en ninguno de los resultados y no se puede decir que
ninguno permitir sacar conclusiones de causa y efecto.
Como antes, desconcierta la facilidad con la que los investigadores atribuyen un significado de
causa-efecto a sus resultados de regresión. También es desconcertante la tendencia a tener
confianza en el propio resultado incluso si difiere de lo que otros han encontrado. Como se señaló
anteriormente, sería un buen augurio para la causalidad si diferentes investigadores llegaron a
conclusiones similares; por el contrario, una pretensión de haber establecido nunca se puede
considerar la causalidad si los resultados de diferentes estudios están por todas partes. En el
estudios recién revisados, los resultados están por todas partes. Y, sin embargo, las afirmaciones
que son de naturaleza causal fueron realizados por cada uno de los autores.
60 4.3 Noland sobre la infraestructura y su efecto sobre las muertes.
La cuestión de si la interpretación causal de los estudios transversales es prácticamente posible
es de importancia central para aquellos que son responsables del diseño y la operación de ca-
rreteras. La razón es que las oportunidades de hacer estudios observacionales de antes y des-
pués sobre, digamos, la el efecto de seguridad de un cambio en la curvatura horizontal, la pen-
diente del camino, el ancho del carril, la mediana de la pendiente, etc. son pocos e imperfectos.
En contraste, dada la disponibilidad de bases de datos computarizadas, las oportunidades para
abundan los estudios transversales observacionales de los mismos temas. Por eso mucho de lo
que es que se creía que se sabía sobre el efecto de seguridad de muchas características viales
importantes provino de estudios transversales observacionales. Sin embargo, si es cierto que
tales estudios no conducen a una causa-efecto conclusiones, entonces gran parte de la tradición
de seguridad vial existente debe ser cuestionada. De hecho, nuestro toda la indagación sobre
causa y efecto en regresiones multivariables sobre datos transversales es motivado por esta
misma preocupación: la preocupación de quienes diseñan y operan carreteras sobre la cimientos
de gran parte de su saber de seguridad.
Quienes diseñan y operan carreteras pueden ver el episodio histórico sobre la seguridad efecto
de la regulación del automóvil con una cierta cantidad de desapego; no incide directamente en
lo que hacen. La historia de la controversia sobre si importa la velocidad o la variabilidad de la
velocidad se acerca un poco más al hueso. Sin embargo, el mensaje de Lave todavía estaba a
nivel de política: si uno tiene como objetivo reducir la velocidad o si uno tiene como objetivo
reducir la variabilidad de la velocidad. el trabajo de noland (Noland 2003) y (2004) es de interés
directo para los ingenieros que diseñan y operan carreteras; eso habla sobre el efecto que tienen
varias 'mejoras viales' en la seguridad. Noland concluye que, en general, las mejoras de infraes-
tructura no redujeron las muertes y lesiones 1 . Esto, si es cierto, va al corazón de lo que hacen
los ingenieros.
4.3.1 El artículo de Noland sobre los 50 estados En su artículo de 2003, Noland usó datos de
series de tiempo transversales para los 50 estados de EE.
cada año entre 1984 y 1997. La variable dependiente fue la 'relacionada con el tráfico muertes'
o 'lesiones relacionadas con el tráfico' en cada año y estado. Las variables independientes fueron
de tres tipos: 1. Variables que describen la infraestructura estatal (kilómetros totales de carriles;
número promedio de carriles interestatales, arteriales y colectores, caminos con carriles de 9, 10,
11 y 12 pies para colectores y para arteriales); 2. Variables demográficas y de tendencia (pobla-
ción, porcentaje de población de 15 a 24 años y porcentaje de población mayor de 75 años, renta
per cápita y año); 3. Otras variables (ley primaria y secundaria del cinturón de seguridad, con-
sumo de alcohol per cápita, mortalidad infantil blanca, hospitales por milla cuadrada) El modelo
era de la forma 2 : Número de muertes (o lesiones) por estado y año α X 1 X β 2 .
2 β 1 = ecuación 6 1 “Los resultados refutan contundentemente la hipótesis de que las mejoras
de infraestructura han sido efectivas para reducir la muertos y heridos”. (Noland 2003, p. 599) 2
En el documento se indica una forma diferente. Sin embargo, basado en correspondencia pri-
vada, ese formulario de arriba fue en realidad usó. Es la misma forma que la utilizada por Peltz-
man y muchos otros.
61 Se requieren algunos comentarios explicativos sobre la ecuación del modelo. En este modelo
forman el la influencia de la variable 'i' está representada por el multiplicador i β i X . Para mostrar
lo que da forma a este relación implica, cómo los multiplicadores para "Lane Miles", "Porcentaje
de población mayor de 75" y el “Ingreso Per Cápita” (Modelo 2A para fatalidades) dependen del
valor de la variable que se muestra en la figura 12.
Figura 12 La forma de X β .
Si el ingreso per cápita se duplicara y todo lo demás permaneciera constante, se esperarían
muertes aumentar por un factor de 1,94 (punto 1); si, al mismo tiempo, se aumentó el número de
millas de carril en un 50% (punto 2), el número de muertes aumentaría en un factor de
1,94×1,15=2,23 etc.; cada multiplicador aplicado al producto de todos los demás multiplicadores.
Noland informó sobre varios modelos que utilizan todos los mismos datos y forma funcional.
Todos Sus modelos incluyen la infraestructura y las variables demográficas y todas están repre-
sentadas en el Misma manera. La diferencia entre los modelos radica en cómo se lleva el cinturón
de seguridad y se representan los avances de la medicina. Algunos modelos representan la in-
fluencia de los cinturones de seguridad por la tipo de ley sobre cinturones de seguridad que
prevalece en el estado (primario o secundario), mientras que otros lo representan por el variable
'porcentaje de uso del cinturón de seguridad'. Además, algunos modelos incluyen proxies para
la influencia de avances médicos (mortalidad infantil blanca y hospitales por milla cuadrada)
mientras que otros no. Una El modelo difiere de los otros cuatro en una suposición estadística
(efectos fijos versus efectos aleatorios).
62 4.3.1.1 La Variable 'Lane Miles'.
Los coeficientes de regresión de Noland para la variable 'Lane miles' en sus cinco modelos están
en Tabla 9.
Tabla 9. Estimaciones del coeficiente de regresión de Noland para la variable “Lane Miles”
Tabla 2. (A y B) Efecto fijo Modelos con Asiento- Ley del cinturón, 1984(5) a datos de 1997 Tabla
2. (C&D) Efecto fijo Modelos con "Médico Avances" variables añadidas, 1984(5) a 1997 datos
Tabla 3. Fijo Efecto con Asiento Tasa de uso de la correa (en lugar de Asiento Ley del cinturón),
1990 a datos de 1997 Tabla 3. Efecto fijo con uso del cinturón de seguridad Tasa (en lugar de
Ley) y “Médico Anticipos” variables añadido, 1990 a 1997 datos Tabla 4. Aleatorio modelo de
efecto con cinturón de seguridad Uso y "Médico Avances”, 1990 a datos de 1997 1 2 3 4 5 6 7 8
9 F 1 I 2 FIFIFIF 0.36 ±0,11 3 0.624 ±0,14 0.38 ±0,13 0.18 ±0,16 -0.29 ±0,23 0.89 ±0,27 -0.40
±0,25 0.02 ±0,30 0.43 ±0,10 1 Muertes, 2 Lesiones, 3 Noland da el estadístico t para esta celda
como 3.16. Eso se traduce en un error estándar del coeficiente de regresión= 0,36/3,16=±0,11.
Al comentar sobre el efecto de la variable 'Lane Miles', Noland dice que 1 : (A) “Las expectativas
iniciales eran que esta variable fuera significativa con signo negativo, lo que implica que las millas
de carril adicionales reducen las muertes y lesiones. (B) “Si esta variable hubiera sido insignifi-
cante, entonces esta sería una conclusión sólida en sí misma, ya que generalmente se supone
que los carriles más nuevos, que están diseñados con los estándares de diseño de ingeniería
más recientes, serán más seguro Un resultado que no mostrara un efecto significativo sería sor-
prendente. (C) Si bien los resultados son menos convincentes basados en la serie de tiempo
más corta de la tabla 3, estos resultados tienden a sugerir que las millas de carril adicionales en
realidad aumentan las muertes y también tienen un pequeño efecto positivo 2 en lesiones.” (págs.
604-605) Esta cita requiere un comentario detallado y la segmenté en A, B y C para los propósitos
de la exégesis a continuación.
Comentario sobre (A): Esperar un coeficiente de regresión negativo significaría que uno cree que
cuantas más millas de carril haya, menos muertes o lesiones habrá. ¿Por qué uno debería tener
tal “expectativa inicial”? Tal vez Noland piensa que un estado con 'más carril-millas' tiene 'más
carreteras de varios carriles' y que se espera que las carreteras de varios carriles sean más
seguras. Esto sería lógico sonido si todos los estados tuvieran aproximadamente la misma can-
tidad de millas de camino pero sus caminos diferirían en el número de carriles. Sin embargo, los
estados difieren en tamaño, cantidad de tráfico, grado de urbanización, patrón del uso de la tierra
y muchas otras circunstancias. En consecuencia, tienen diferentes longitudes en sus red de ca-
rreteras. En 1998, Alabama tenía 195 mil millas de carril, Alaska 26 mil, Arizona tenía 116 mil
etc. Estas diferencias tienen muy poco que ver con el número de carriles que tiene la vía.
Dado que, con mucho, la mayor proporción de millas de carril en los EE. UU. está siempre en el
stock de dos carriles carreteras 3 , la diferencia en la variable carril-millas que Noland ve en sus
datos refleja principalmente 1 He analizado la declaración de Noland en las partes A, B y C para
brindar claridad en la discusión posterior.
2 Noland significa coeficiente de regresión positivo.
3 Mohammedshah y Kohls (Mohamedshah y Kohls 1994) muestran 75% y 86% para los dos
estados en los que reporte.
63 diferencias en la longitud de la red vial rural de dos carriles. Por lo tanto, es difícil comprender
qué la base de la "expectativa inicial" de Noland es. Si imaginas dos estados con la misma po-
blación pero diferente en tamaño, y considere que el estado más grande tenderá a tener caminos
más largos, hay poco razón para esperar que el estado más grande tendrá menos muertes que
el más pequeño. Por lo tanto, la lo contrario de la regresión de expectativas inicial de Noland
tiene más sentido.
Comentario sobre (B): Noland da un salto lógico adicional y equipara 'más millas-carril' con 'ma-
yor proporción de millas-carril mejoradas' 1 . Tal vez se podría dar este salto si el efecto de Las
millas de carril se estimaron para cada estado por separado a partir de su propia serie temporal
de observaciones. En ese caso, el aumento de millas de carril a lo largo del tiempo significaría
de hecho una proporción creciente de caminos antiguos. Sin embargo, los datos de Noland son
un panel de 14 años de datos para 50 estados. Por lo tanto, las diferencias en 'millas de carril'
entre los 14 × 50 puntos de datos 2 utilizados en las regresiones expresan no principalmente
cómo ha aumentado el kilometraje del carril en cada estado a lo largo del tiempo, pero principal-
mente 3 cómo ha aumentado el kilometraje del carril difiere entre estados (por las muchas razo-
nes mencionadas en el párrafo anterior). Eso muy bien puede ser que un estado en el este tenga
más millas-carril que un estado de tamaño similar en el West, y, por razones históricas, las ca-
rreteras en el estado del Este serán más antiguas; 'más millas de carril' no significa 'millas de
carril más modernas'. El salto lógico es muy cuestionable.
De ello se deduce que el coeficiente de regresión para 'carril-millas' refleja la influencia de todas
las variables incluido en él pero no explicado explícitamente 4 – tamaño del estado, patrón de
uso de la tierra, industrialización, historia de desarrollo, flujo de tráfico, etc.; interpretándolo como
un proxy para 'infraestructura mejoras' o 'carreteras más modernas' no tiene sentido.
Comentario sobre (C): Noland mira los resultados en la Tabla 9 y concluye que: “estos resultados
tienden a sugieren que las millas de carril adicionales en realidad aumentan las muertes”. Dada
su conclusión general (que las mejoras de infraestructura no reducen las muertes y lesiones)
esto debe tomarse como un argumento en apoyo de su opinión de que añadir carriles a las
carreteras no es una mejora de la seguridad. Que Es decir, Noland comenta sobre un vínculo
entre una causa (añadir carriles) y un efecto (reducción de fatalidades).
La Tabla 9 contiene tres estimaciones que son positivas (0.36, 0.38 y 0.43) y dos estimaciones
que son negativos (-0.29 y -0.40). Señalé en la sección 4.1.4 que si diferentes estudios encuen-
tran que el coeficientes de regresión de la misma variable están por todo el mapa, debemos
concluir que no 1 “Por lo tanto, la variable de la milla del carril sirve como proxy para representar
estas 'mejoras' en el diseño de carreteras”. pags. 599 2 Debido a algunos datos faltantes, no
había 14 × 50 = 700 sino solo 657 puntos de datos.
3 En la fecha de Noland, el total de millas de carril cambió de 1985 a 1997 en la cantidad casi
imperceptible de 0.2%/año.
Naturalmente, por lo tanto, los coeficientes de regresión reflejan las diferencias de estado a es-
tado en lugar del crecimiento en el estado en el carril.
millas 4 Hasta ahora me he abstenido de discutir detalles estadísticos. Sin embargo, llegados a
este punto, cabe un comentario de carácter técnico.
en orden. Siguiendo el desarrollo de Hausman et al. (Hausman, Hall y Griliches 1984), Noland
utiliza un procedimiento estadístico que, dice, “tiene el beneficio adicional de dar cuenta de la
heterogeneidad en los datos” y “.permite al analista dar cuenta de la heterogeneidad entre gru-
pos”. La frase 'considerando la heterogeneidad' significa (en el presente contexto) que el modelo
representa adecuadamente el hecho de que dos estados, incluso si tuvieran el mismo los valores
de todas las variables incluidas en el modelo normalmente tendrían diferentes medias para la
variable dependiente (fallecidos o heridos). Lo que no significa tener en cuenta la heterogeneidad
es que, habiendo utilizado el modelo de Hausman, uno puede olvidarse de las variables que
faltan. Si se incluyeran en el modelo (considerar) algunas variables que son actualmente no re-
presentado en él (tamaño del estado, patrón de uso de la tierra, etc.), el coeficiente de regresión
de 'millas de carril' sería casi seguro que cambia. Como mostraré más adelante, ha cambiado
incluso cuando variables ostensiblemente irrelevantes como la la mortalidad se añadió al modelo.
64 se les puede atribuir un significado de causa-efecto. La circunstancia aquí es diferente en que
no tratar varios estudios realizados por diferentes investigadores que utilizaron datos diferentes;
tenemos un estudio en que se usó la misma base de datos y las estimaciones en la Tabla 9
difieren porque el cinturón de seguridad variable fue representada de forma variable, porque las
variables que representan los avances en la medicina fueron incluía algunos modelos pero no
en otros, y porque a veces se usaban catorce años de datos ya veces siete. Si el valor de un
coeficiente de regresión cambia sustancialmente como nuevo se agregan variables al modelo (o
se representan de manera diferente, o se establece una suposición alternativa) hechos sobre
efectos aleatorios o fijos), esto es una señal de que el modelo no contenía todos los elementos
importantes factores que afectan el fenómeno en cuestión o es sensible a las suposiciones. Uno
no puede tener confianza en el valor numérico de dicho coeficiente de regresión y no se le puede
atribuir ningún significado a eso 1 . Si un coeficiente de regresión no alcanza lo que puede lla-
marse 'estabilidad bajo condiciones variables Además, toda consideración de causalidad es pre-
matura. Coeficientes de regresión de Noland para lanemiles en el modelo de accidentes fatales
claramente no alcanzó tal estabilidad. Por lo tanto la declaración ese es el tema del 'comentario
sobre (C)', en mi opinión, no está justificado sobre la base de los resultados dado 2 .
Esto me permite enunciar otra precondición para la causalidad, para preceder a la condición
mencionado anteriormente en la sección 4.1.4.
• Si se va a considerar un coeficiente de regresión para la interpretación causal, debe exhibir el
Propiedad de 'estabilidad bajo suma de variables'.
La consecuencia práctica de esta condición previa es que el investigador debe comprobar hasta
qué medida en que la introducción de nuevas variables afecta los coeficientes de regresión esti-
mados anteriormente. Solamente cuando un coeficiente de regresión alcanza la estabilidad se
puede decir que, dados los datos disponibles, el forma del modelo asumida y los supuestos es-
tadísticos realizados, es el coeficiente de regresión utilizable.
Esto todavía no justifica que se hagan juicios causales (ya que el coeficiente de regresión podría
cambiar si se disponía de datos sobre variables adicionales o si se utilizaba un formulario modelo
diferente).
Sin embargo, la 'estabilidad bajo la suma de variables' es una precondición para que un juicio
causal sea entretenido Nuestra preocupación es con la legitimidad de las interpretaciones de
causa-efecto de la regresión.
coeficientes Porque la cantidad de 'millas de carril' difiere de un estado a otro por una variedad
de razones (tamaño, uso del suelo, geografía, etc.) y porque los cambios en las millas de carril a
lo largo del tiempo son muy pequeños, los coeficientes de regresión de Noland para la variable
carril-millas reflejan principalmente la relación de estado a estado.
diferencias Por lo tanto, no importa cuál sea el valor del coeficiente de regresión de Noland, es 1
Así, por ejemplo, cuando se tuvo en cuenta la influencia de los cinturones de seguridad mediante
la 'ley del cinturón de seguridad' y se utilizaron datos de 1984-1997, el coeficiente de regresión
fue de +0,36±0,11; cuando estaba representado por el 'porcentaje de uso del cinturón de segu-
ridad' y los datos de 1990-1997 eran utilizó el coeficiente de regresión cambiado a -0,29±0,23.
2 Un examen de los coeficientes de regresión de Noland para lesiones (sobre los cuales dice
que hay un "pequeño efecto” ) no aumenta la perspicacia o la confianza de uno. En algunos
casos el coeficiente de regresión para lesiones es mayor que para las víctimas mortales, en otros
es menor y no se pueden excusar las diferencias únicamente por la precisión estadística. Consi-
derar por ejemplo, la diferencia entre 0,62±0,14 en la columna 2 de la Tabla 9 y 0,18±0,16 en la
columna 4. Si bien es posible que diferencia se debe a una precisión de estimación limitada, es
más probable que la diferencia se deba a la adición de la variable 'avances médicos' a la regre-
sión. De manera similar, ¿qué se puede hacer con el hecho de que en la columna 5 el coeficiente
es -0,29±0,23 para muertes mientras que es 0,89±0,27 para heridos? sesenta y cinco No puedo
decir mucho acerca de la acción de reemplazar caminos estándar más bajos con caminos están-
dar más altos o sobre el efecto de las “mejoras de infraestructura”. Sin embargo, incluso si la
variable pudiera ser de alguna manera vinculado a las mejoras de infraestructura, los coeficientes
de regresión de Noland no pasan reunión; claramente no cumplen con el criterio de 'estabilidad
bajo adición de variables'. Por lo tanto, La afirmación de Noland de que la variable de milla de
carril es de alguna manera un indicador de mejoras en la carretera diseño y que, en este sentido,
se puede hacer la afirmación causal de que “ millas de carril adicionales en realidad aumentar
las muertes” no es, en mi opinión, compatible.
Noland podría haber argumentado que al construir más caminos, al hacer que viajar sea más
rápido y al Al hacer las carreteras más acogedoras, se están promoviendo patrones de uso del
suelo que, a la larga, conducen a más viajes y que más viajes conducen a más muertes y lesio-
nes. En este sentido es ciertamente cierto (pero no inesperado) que, a la larga, la construcción
de más y mejores carreteras aumenta el número de automóviles y muertes relacionadas con
camiones. Si Noland hubiera discutido sobre el vínculo entre las carreteras y los viajes en auto-
móvil y entre viajes en automóvil y accidentes, un coeficiente de regresión positivo para la varia-
ble carril-millas habría sido un resultado natural y esperado. Sin embargo, eso no es sobre lo que
escribe Noland; habla sobre las diferencias entre la infraestructura más antigua y la más nueva
en características como “la curvatura horizontal, la anchura de los arcenes, la separación de
carriles con medianas y la presencia de peligros en la carretera” (p. 599). Los estándares moder-
nos en estas características son lo que Noland tiene en mente cuando hablando de "mejoras en
el diseño de carreteras" (para las cuales las millas de carril de carretera son supuestamente un
apoderado).
Después de discutir el efecto de seguridad de las 'millas de carril', Noland presenta argumentos
similares sobre las otras variables de infraestructura (el 'número promedio de carriles' para inter-
estatales, arteriales y colectores, el 'porcentaje de millas de carril por clase funcional', y 'el ancho
promedio de carril por clase funcional'). Así, por ejemplo, sobre el promedio de carriles dice que
“los estados con más los carriles (en promedio) interestatales y arteriales tendrán más lesiones”.
(p.605) y que “un aumento en el número de carriles en las vías colectoras conduce a más muertes
y posiblemente a una pequeña reducción (insignificante) de lesiones.” De aquí extrapola diciendo
que “Normalmente es supone que el aumento de la capacidad de la carretera (agregando carri-
les) aliviará la congestión y reducirá accidentes Esto implicaría que esperamos coeficientes ne-
gativos en todas estas variables. Estas los resultados sugieren que este no es el caso y que los
carriles agregados (en promedio) son (sic) probablemente perjudicial para la seguridad general”.
Una exégesis de estas y otras afirmaciones similares seguiría el terreno ya cubierto; repetiría los
mismos recelos y no conduciría a nuevos conocimientos.
Se ha dedicado mucho espacio a la discusión detallada de si uno puede entretener a un inter-
pretación causa-efecto de los resultados de la regresión de Noland. Argumenté que sus coefi-
cientes de regresión son inestables y, por lo tanto, es posible que ni siquiera comiencen a plan-
tearse cuestiones sobre causa-efecto. yo también argumentó que las variables que utilizó Noland
no reflejan principalmente mejoras en las carreteras, adiciones, etc. y, por lo tanto, no se pueden
utilizar para responder a la pregunta. Es hora de seguir adelante y discutir una faceta importante
de la tesis de Noland, a saber, que el efecto de la infraestructura las mejoras en la seguridad
deben buscarse a nivel agregado de todo el sistema; que conclusiones obtenidos de evaluacio-
nes de seguridad proyecto por proyecto o sitio por sitio pueden (y lo hacen) inducir a error.
El principal argumento de Noland a favor del uso de datos agregados a nivel estatal es “que
puede capturar efectos tales como la migración de puntos negros que podrían perderse poten-
cialmente usando la desagregación datos." (Noland 2003), (pág. 602). Este es un argumento de
peso que merece un examen detallado. Para claridad, se discuten los problemas de impacto en
todo el sistema y los problemas de agregación por separado a continuación.
66 4.3.1.2 Impactos en todo el sistema.
La opinión de Noland es que los enfoques de ingeniería convencionales tienden a ". ignorar el
comportamiento reacciones a las mejoras de seguridad que pueden contrarrestar los objetivos
de reducción de fatalidades”. (pág. 599) . 1 el ejemplo que da es que “si una carretera de dos
carriles se amplía a cuatro carriles, lo que podría reducir el riesgo de colisiones frontales, pero
también puede dar lugar a que muchos conductores viajen a mayor velocidades, lo que poten-
cialmente no conduce a ganancias en seguridad”. (pág. 599). 2 Ciertamente es cierto que los
proyectos de mejora de carreteras pueden causar cambios en la velocidad elección, en la vigi-
lancia y la activación, en el flujo de tráfico, etc. Se sabe que estos cambios afectan la seguridad
y la no siempre se limitan al sitio del proyecto o sus inmediaciones. También es cierto que, a lo
largo y en su conjunto, las mejoras viales afectarán los patrones de actividad y uso de la tierra,
y por lo tanto, afectan la exposición (millas de viaje y toneladas de carga), la elección del modo,
la propiedad del automóvil, etc.
Estas también podrían llamarse 'adaptaciones conductuales'. Sin embargo, este término es qui-
zás demasiado confinamiento cuando uno pretende describir los cambios en los patrones de
producción, consumo, vivienda y estilo de vida que provienen de la inversión en transporte. Sin
embargo, es evidente que un efecto de seguridad a largo plazo y en todo el sistema de las me-
joras viales no será el mismo que el efecto de seguridad específico del sitio. 3 Una ilustración
clásica de la posible diferencia entre la seguridad local y la de todo el sistema.
efectos está en el trabajo de Lave y Elias (Lave y Elias 2002). En 1987 muchos estados aumen-
taron la velocidad límite en porciones del sistema interestatal de 55 mph a 65 mph. La mayoría
de las muchas evaluaciones concluyó que donde se aumentó el límite de velocidad, aumentaron
las muertes. Lave y Elias discutieron que: “Estas evaluaciones comparten un problema común:
solo miden los efectos locales de la cambio. Pero el cambio debe ser juzgado por sus efectos en
todo el sistema. En particular, el nuevo 65 mph límite permitió a las patrullas de carreteras del
estado cambiar sus recursos de la aplicación de la velocidad en el interestatales a otras activi-
dades de seguridad y otras carreteras, un cambio que muchos jefes de patrulla de carreteras
habían abogó por Si los jefes estaban en lo correcto, la nueva asignación de recursos de patrulla
debería conducir a una reducción de las tasas de mortalidad en todo el estado. Del mismo modo,
la oportunidad de conducir más rápido en las carreteras interestatales debería alejar a los
conductores de otras carreteras más peligrosas, nuevamente, generando 4 problemas en todo
el sistema consecuencias." (Pi).
Además del descuido de las adaptaciones conductuales, Noland señala otro común deficiencia
de estudios de efecto local. “Otros factores, principalmente cambios en la combinación de edades
demográficas de la población, aumento del uso del cinturón de seguridad, reducción del consumo
de alcohol per cápita y las mejoras en la tecnología médica son responsables de la tendencia a
la baja en el total de muertes accidentes. al analizar el efecto de seguridad del cambio de infra-
estructura es necesario controlar para el cambio en (tales) factores exógenos.” (p. 610). Noland
incorporó todos estos factores en su modelo de regresión.
1 Volvemos al comportamiento de compensación de Peltzman, ahora en el contexto de las me-
joras viales.
2 Este ejemplo no está bien elegido, porque la adaptación de la velocidad se reflejaría en los
resultados de un sitio específico.
estudio antes-después. Para ser un ejemplo de ignorar las "reacciones conductuales", uno ten-
dría que argumentar que cuanto mayor sea la la velocidad en la carretera mejorada se extendió
a las carreteras vecinas.
3 También es claro que en el contexto de cambios en los patrones de producción, consumo,
habitación y estilo de vida que provienen de la inversión en transporte, las repercusiones en la
seguridad son solo una de las consecuencias a considerar, y no una de las principales.
uno en eso.
4 Si bien es probable que aumentar el límite de velocidad en una autopista atraiga algunos viajes
desde las carreteras superficiales cercanas, no es probable que tenga un efecto en todo el es-
tado. El concepto de efecto 'en todo el sistema' debe definirse con cuidado.
67 No hay duda de que los efectos locales generalmente diferirán de los efectos de todo el sis-
tema.
Tampoco se puede dudar de la importancia de determinar el efecto de las intervenciones en todo
el sistema. los La pregunta general es ¿por qué medios se pueden investigar los efectos causales
a largo plazo y en todo el sistema? de intervenciones. La pregunta específica de interés en este
documento es si se puede hacer usando datos agregados de sección transversal (junto con se-
ries de tiempo) 1 para estimar los coeficientes de regresión de un 'cuasi de forma reducida 2 '.
Respondí la pregunta específica del artículo de Noland de 2003 en la sección 4.3.1.1. Noland
apuntó para determinar el impacto de las mejoras viales (como la adición de carriles, la amplia-
ción de carriles y mejores estándares de diseño) en muertes o lesiones en todo el estado. porque
sus variables independientes (por ejemplo, número de millas-carril) reflejan principalmente las
diferencias de estado a estado (en tamaño, tráfico, etc.) que son no representada en el modelo,
uno no puede pensar en estas variables independientes como un proxy para 'mejoras'. Además,
los coeficientes de regresión de Noland son inestables y por lo tanto no pueden ser un punto de
partida para la interpretación causa-efecto.
No es el objetivo de este artículo discutir la cuestión general de “¿por qué medios se puede
investigar los efectos a largo plazo y en todo el sistema de las intervenciones? Sin embargo,
algunos comentarios están en orden. Las mejoras viales provocarán cambios en la distancia que
recorren las personas, la frecuencia lo hacen, por qué modo o rutas, etc. Los planificadores de
transporte tienen un elaborado arsenal de herramientas para predecir tales cambios en todo el
sistema en los viajes. Los analistas de seguridad saben cómo la seguridad de un camino o la
intersección cambia a medida que cambia el tráfico. Así, la caja de herramientas del planificador
y de la seguridad analista, cuando se usa en tándem, tal vez pueda producir estimaciones de
cambios en todo el sistema que reflejen los cambios en la población, el uso del suelo, la realiza-
ción de viajes y la red de transporte y su desempeño.
En términos más generales, para investigar los efectos de las intervenciones en todo el sistema
se requiere una comprensión y representación de qué causa el cambio en qué. Para ilustrar,
suponga que uno desea rastrear el efecto de seguridad en todo el sistema de convertir un deter-
minado tramo de carretera de dos a cuatro carriles. Ciertamente es posible utilizar el conoci-
miento y los modelos de planificación del transporte para estimar el impacto de tal cambio en
varios otros enlaces de la red. Estos son los tipos de relaciones estructurales que necesitan ser
representadas en un modelo si ha de haber una esperanza de vincular causa y efecto a nivel de
todo el sistema 1 . Es difícil entender por qué uno puede esperar capturar estas complejidades
causales por una sola ecuación, una ecuación cuya forma matemática es postulado sin justifica-
ción, y en el que sólo se representan las variables fácilmente disponibles; por qué uno puede
creer tan fácilmente en el significado de causa-efecto de la regresión resultante coeficientes
4.3.1.3 Problemas de agregación Al intentar detectar los efectos de las mejoras viales en todo el
sistema, Noland utiliza el totales y promedios. Por lo tanto, por ejemplo, las muertes o las millas
de carril son totales para todo el estado; variables como el ingreso per cápita o la mortalidad
infantil blanca son promedios estatales. Peltzman, Lave 1 Es decir, datos agregados a grupos
como estados o condados en lugar de unidades naturales como intersecciones o tramos de ca-
rretera homogéneos.
2 Un modelo de forma reducida se deriva por manipulación algebraica de un conjunto de ecua-
ciones y desigualdades que intentan capturar un fenómeno tal que las variables en el lado iz-
quierdo de estas expresiones no aparecen en su lado derecho lado. Un modelo de forma redu-
cida aún representa el fenómeno (o teoría) que representan las relaciones originales.
Ecuaciones de modelo como las utilizadas por Peltzman, Lave y Noland, incluso si se les llama
de forma reducida, en realidad no representan un conjunto subyacente de ecuaciones y desigual-
dades. Son meras aproximaciones de primer orden (mediante un Taylor serie) de una función
multivariable general.
68 y sus comentaristas también utilizaron datos agregados para el modelado. Cuando se utilizan
datos agregados la unidad de observación (un estado, un condado) es grande 2 . En epidemio-
logía, el término utilizado es "nivel de población".
o estudios 'ecológicos'. En contraste con el nivel de población, se encuentra el enfoque de regre-
sión.
que utiliza datos desagregados 3 . En el modelado desagregado la unidad es atómica, natural y
pequeña. En epidemiología la unidad de observación es un individuo y el término utilizado es
'nivel individual' estudiar. En seguridad vial, la unidad de observación puede ser un segmento de
carretera específico (intersección o enfoque de intersección) que es homogéneo en el tráfico y
otras características.
Incluso a nivel desagregado, no se puede evitar por completo el uso de promedios. Así, por
ejemplo, a Para representar el flujo de tráfico se utiliza comúnmente la AADT (Annual Average
Daily Traffic) que, por definición, es un promedio 4 . De manera similar, en las curvas verticales
el valor de la variable pendiente cambia continuamente y un segmento de carretera tendría que
ser muy corto para que un solo valor de calificación lo describa eso. Si se selecciona una unidad
de tiempo (por ejemplo, un año), las variables como la precipitación son promedios.
En el contexto de la seguridad vial, y quizás en general, se piensa en las causas como eventos
específicos o acciones. Por esta razón, si uno puede hablar significativamente sobre el efecto
causal de un promedio, es es sólo como un compuesto de los efectos causales sobre las unida-
des del conjunto cuyo promedio es arreglado. Así, por ejemplo, puede haber un efecto causal de
ampliar un carril de un segmento de carretera de 10 a 11 pies o de 11 a 12 pies 5 . Si un estado
tuviera 10,000 millas-carril de caminos de 10', 20,000 de caminos de 11' y 70,000 millas-carril de
caminos de 12' (el ancho de carril promedio es de 11.6') y si 5000 millas-carril de los caminos de
10' se ampliaron a 11' (de modo que ahora el promedio estatal era 11.65'), el efecto causal de
este cambio en el ancho de carril promedio para todo el estado proviene de la ampliación espe-
cífica de la 5000 millas específicas de camino de 10' a 11'.
Hay dos problemas con los intentos de usar una respuesta promedio como indicación de la
causa.
El primero es el de diluir y debilitar el nexo causal. Para ilustrar, ampliar 5000 millas de carril de
10' a 11' y la ampliación de 2500 millas-carril de 10' a 12' equivale al mismo cambio en ancho de
carril promedio pero un efecto de seguridad muy diferente 6 . Esto debilita la fuerza de la asocia-
ción entre causa y efecto, hace que sea más difícil de detectar y estimar, y hace que es menos
útil para la aplicación práctica. El segundo problema es puramente práctico. Para usar el anterior
ejemplo, la ampliación de 5000 millas de carretera es un gran proyecto y sería relativamente
tarea sencilla diseñar un estudio de antes y después para estimar el efecto de este cambio. En
Por el contrario, sería casi imposible detectar estadísticamente un cambio de 0.05 'en el carril
promedio ancho cuando la variable de respuesta es el total de accidentes en todo el estado.
Sin embargo, los problemas debidos al uso de datos agregados en estudios ecológicos (a nivel
de población) correr mucho más profundo. Peltzman, Lave y Noland utilizaron un estado como
unidad de análisis, por lo tanto lo suyo son los estudios ecológicos. Los sesgos potenciales en
los estudios ecológicos son bien conocidos y ampliamente 1 Para ejemplos de modelos de se-
guridad vial estructural ver, por ejemplo, (Gaudry y Lasarre 2000). Para un contexto de causali-
dad ver (Perla 2000).
2 En epidemiología, el término estudio de 'nivel de población' es común.
3 En epidemiología, el término estudio de 'nivel individual' es común.
4 Hay intentos de acortar el período de promediación y utilizar, por ejemplo, caudales horarios.
Sin embargo, incluso esto es un promedio. Dado que el flujo se define como un promedio, el
promedio es inevitable.
5 O tal vez de 10 a 12 pies si no es lo mismo que la suma del cambio de 10' a 11' y 11' a 12'.
6 Parece que si bien la ampliación de 10 a 11 pies reduce sustancialmente los accidentes, hay
un mínimo en alguna parte cerca de 11.5 'y una mayor ampliación puede ir en detrimento de la
seguridad (en caminos rurales de dos carriles).
69 discutido en la literatura 1 . Debido al gran potencial de sesgo y error en tales estudios, la Se
ha acuñado la frase falacia ecológica y se utiliza en los libros de texto 2 . Un ejemplo frecuente-
mente citado de la falacia ecológica está en la obra clásica del eminente sociólogo del siglo XIX
E. Durkheim (1897), quien recopiló datos sobre la frecuencia de los suicidios y la composición
religiosa de los europeos.
provincias Descubrió que las provincias con mayor proporción de protestantes que de católicos
tenían índices generales de suicidio más altos y llegó a la conclusión de que los protestantes
tienen más probabilidades de cometer suicidio que católicos. Sólo tenía estadísticas agregadas
sobre suicidios y no sabía si los que tomaban sus vidas eran protestantes o católicas. Es muy
posible que los católicos que viven en un provincia predominantemente protestante encontraron
la vida difícil y estaban más inclinados a tomar sus propias vida. Esto habría revertido el hallazgo
de Durkheim. También es posible que las provincias con una mayoría protestante eran más po-
bres por una variedad de razones históricas y esto, en lugar de la denominación religiosa condujo
a más suicidios. Tales circunstancias también habrían cambiado El hallazgo de Durkheim 3 . La
preocupación clave de los comentaristas de los estudios ecológicos es que lo que parece cierto
para el grupo (el agregado) puede no ser cierto para las unidades individuales de las cuales el
se forma el grupo.
Ya hemos encontrado una manifestación del problema de agregación en la sección 4.2.3, cuando
Lave pensó que sus críticos estaban obteniendo estimaciones sesgadas porque agregaron los
datos sobre todas las clases de carretera en lugar de examinar la relación velocidad-accidente
por separado para cada clase de carretera funcional (como lo hizo Lave). Lave mostró cómo esta
agregación sobre todas las clases de carreteras podría conducir a un resultado que es lo contra-
rio de lo que pensaba que era la verdad. También comenté cómo la propia agregación de Lave
sobre tramos de carretera que difieren, por ejemplo, en el porcentaje de tráfico de camiones,
podría conducir a un sesgo similar. En este sentido, los sesgos de agregación, confusión y omi-
sión las variables están relacionadas.
En su estudio ecológico seminal en el que la unidad de observación era un condado, Fridstrøm
e Ingebrigtsen (Fridstrøm e Ingebrigtsen 1991) describen así el peligro de la agregación: “ Entre
las objeciones más obvias al enfoque adoptado en este artículo está el problema de error de
agregación, o la falacia "ecológica" en palabras de Robinson (1950). Cuando la causa la conexión
es entre unidades a nivel micro (digamos, individuos, hogares, empresas o vehículos), sacar
conclusiones de correlaciones parciales en datos agregados es inapropiado. Esta objeción se
aplica a varias de las relaciones estimadas en nuestro modelo, más crucialmente, quizás, a la
efectos del alcohol Como no sabemos la proporción de accidentes en los que el alcohol puede
haber desempeñó un papel, ni la proporción de millas de vehículos recorridas por conductores
ebrios, cualquier inferencia hecha acerca de tal conexión es en gran medida sin fundamento. No
se puede confiar en él hasta que sea confirmado por datos desglosados relevantes”. (pág. 374)
Una ilustración dramática del sesgo de agregación es la llamada paradoja de Simpson. un ver-
dadero El ejemplo en el contexto de la seguridad vial se toma de los datos de Persaud 1 , Retting
y Lyon (2003). los dos columnas más a la derecha de la Tabla 10 muestran que, después de la
instalación de bandas sonoras en la línea central, los accidentes con heridos por milla-año dis-
minuyeron en cada uno de los seis estados que se muestran. Y sin embargo, cuando los datos
fueron 1 La colección de artículos de Greenland y otros que escriben en el American Journal of
Epidemiology es una buena punto de partida para la lectura (Greenland y Robins 1994b), (Pian-
tadosi 1994), (Cohen 1994), (Greenland y Robins 1994a). En su revisión del sesgo ecológico,
Greenland y Robins (Greenland y Robins 1994b) escribieron una sección sobre “Conceptos erró-
neos en la regresión ecológica”.
2 Así, por ejemplo, Kelsey et al. (1986) dicen que las “Conclusiones inapropiadas respecto a las
relaciones a nivel individual nivel basado en datos ecológicos son frecuentemente referidos como
la falacia ecológica.” (pág. 207) 3 Como lo discute Selvin (1958).
70 agregado sobre todos los estados (última fila en la Tabla 10) se indica lo contrario. Este sor-
prendente pero El resultado completamente correcto no tiene nada que ver con la confusión, las
variables que faltan, la elección inadecuada de forma funcional y otras fuentes comunes de
sesgo. Es sólo el resultado (y por lo tanto uno de los peligros) de agregación 2 .
Tabla 10. Datos de antes y después sobre la reducción de choques luego de la instalación
de franjas sonoras en la línea central (basado en en la Tabla 1 en Persaud et al, 2003) Milla-
años Lesión Estado Choques Choques/milla-año Antes Después Antes Después Antes Después
colorado 118,37 84,55 262 183 2,21 2,16 Delaware 8,37 21,29 16 38 1,91 1,78 Maryland 91,44
32,56 55 12 0,60 0,37 Minnesota 518,44 96,90 156 24 0,30 0,25 Oregón 22,84 4,62 20 3 0,88
0,65 Washington 166,49 173,27 116 109 0,70 0,63 Totales 925,95 413,19 625 369 0,67 0,89
Noland menciona la crítica de Lave al uso de datos agregados 3 en el análisis de accidentes. Sin
embargo, el cree (creo que equivocadamente) que la técnica de regresión estadística que utilizó
puede obviar la problemas inherentes al uso de datos agregados para la caracterización de causa
y efecto.
Los comentarios anteriores no deben interpretarse en el sentido de que los estudios que utilizan
datos agregados son inútil. Estudios de seguridad vial en los que la respuesta y las variables
independientes son totales o promedios sobre un conjunto grande y no homogéneo de unidades
puede servir útilmente para estimular investigar conjeturas no examinadas hasta ahora o generar
hipótesis sobre posibles efectos imprevistos. Sin embargo, debido a las muchas formas posibles
en que ciertos efectos pueden obtener en tales estudios, sus hallazgos por sí solos no son base
suficiente para los juicios de causa y efecto.
Además, los comentarios anteriores no deben interpretarse en el sentido de que las variables
que reflejan los promedios de conjunto no son útiles en el modelado multivariante cuando los
datos sobre carreteras específicas Se utilizan segmentos o intersecciones. El opuesto es verdad.
Cuando se utiliza una serie temporal de datos para cada unidad, variables como el uso del cin-
turón de seguridad o el consumo de alcohol que cambian con el tiempo deben ser representado.
De manera similar, cuando las unidades difieren en variables espaciales como la densidad hos-
pitalaria promedio o intensidad de la aplicación, estos también deben tenerse en cuenta.
4.3.2 El artículo de Noland sobre 102 condados de Illinois.
En su artículo de 2004, Noland y Oh usan datos de carreteras y accidentes para carreteras man-
tenidas por el estado.
y datos sociodemográficos para cada uno de los 102 condados de Illinois en los cuatro años
1987-1990. los El examen de este artículo me permitirá hacer algunos puntos generales que no
se han planteado antes. los 1 Persaud llamó mi atención sobre este ejemplo.
2 Para algunos números podemos tener a/b<A/B yc/d<C/D y sin embargo
(a+c)/(b+d)>(A+C)/(B+D). Por ejemplo, 1/5<2/8 y 6/8<4/5 y todavía 7/13>6/13. Este ejemplo está
tomado de (Malinas y Bigelow 2004) quienes brindan una discusión de la paradoja de Simpson.
3 Se refiere a la crítica de Lave donde mostró que agrupar todas las clases de carreteras funcio-
nales juntas (como Noland ha hecho) puede llevar a conclusiones incorrectas “sobre variables
clave de política” (p. 602).
71 La ecuación del modelo aquí es la misma que en el artículo de Noland de 2003 (ver Eqn. 6).
Muertes y Total Los accidentes son las variables dependientes. Las variables independientes
relacionadas con la infraestructura son: 1. Total millas de carril, número medio de carriles, 2.
Ancho medio de carril, 3. Ancho medio de banquina exterior, 4, Curvas horizontales por milla, 5.
Ángulo medio de deflexión de la curva horizontal 1 y 6. Curvas verticales por milla. Las variables
socioeconómicas son: 1. Población, 2. Renta per cápita y 3. Porcentaje población en los tramos
de edad de 15-24, 25-34 y 65+. Este estudio difiere del anterior en que: 1. la unidad de agregación
es más pequeña (condado en lugar de estado); 2. Hay más detalles disponibles sobre variables
de infraestructura; 3. Datos sobre consumo de alcohol, mortalidad infantil y hospitales por milla
cuadrada que estaban disponibles a nivel estatal no se usaron en este documento; 4. El tiempo
la serie es mucho más corta (cuatro en lugar de catorce años); 5. En lugar de una única variable
de tendencia temporal utilizados en el estudio de 2003, aquí se utilizaron tres coeficientes anua-
les. Algunas de sus regresiones los coeficientes para los seis modelos estimados se encuentran
en la Tabla 11.
Tabla 11. Coeficientes de regresión seleccionados de las Tablas 1 y 2.
sin anual coeficientes, población, cohorte de ingresos y edad Con coeficientes anuales pero sin
población, ingresos y cohortes de edad Con coeficientes anuales, población, ingresos y Cohorte
de edad variable A 1 F 2 AFAF 1 Total de millas de carril 0,22±0,14 3 -0,13±0,51 -0,02±7,4 -
0,85±0,57 0,03±0,13 -0,82±0,58 2 Número medio de carriles 0,03±0,41 1,21±1,73 1,21±0,44
3,33±1,90 1,25±0,44 2,95±1,93 3 carril medio ancho 0,07±0,32 2,56±1,34 0,22±0,31 2,85±1,36
0,18±0,31 2,94±1,39 4 Media horizontal ángulo de desviación -0,17±0,30 -0,30±1,25 -0,14±0,29
0,25±1,24 -0,18±0,29 -0,08±1,37 5 Ingresos por cápita -0,33±0,27 0,27±0,16 1 Número de acci-
dentes; 2 número de muertes; ±1 error estándar Se discutieron los coeficientes de regresión para
la variable 'Total de millas de carril' (fila 1) exhaustivamente sobre la base del documento de
2003 anterior. Dado que varían mucho y son imprecisos, aquí como allá, poco debe decirse sobre
su base. Lo mismo ocurre con los coeficientes de regresión para el ángulo de desviación hori-
zontal en la fila 4.
Por el contrario, los coeficientes de regresión para el 'Número medio de carriles' (fila 2) parecen
transmitir un mensaje coherente. El mensaje es que los condados con más caminos de varios
carriles tienden a tener más accidentes. ¿Qué significa eso? Hay una buena razón por la cual un
condado tiene más carreteras de varios carriles que otra. La razón es que sus caminos necesitan
transportar más tráfico. Naturalmente, con más tráfico vienen más accidentes. Dado que la can-
tidad de tráfico en un condado no es entre las variables usadas en la regresión, no hay manera
de decir cuánto de la asociación entre los accidentes en un condado y el número promedio de
carriles en el condado se debe al tráfico y cuánto debido a otras variables (como el número de
carriles). Este es un ejemplo clásico de un 1 Noland y Oh usan el ángulo de deflexión en lugar
del radio de curvatura afirmando que cuanto mayor sea el primero, menor será el último. Esto no
es estrictamente cierto. Cualquier radio de curvatura se puede ajustar a un ángulo de desviación
dado. Sin embargo, es cierto que, como cuestión de asociación estadística, cuanto mayor es el
ángulo de deflexión, más corto tiende a ser el radio.
72 variable oculta 1 . En el lenguaje intuitivo de las relaciones causales en el que una flecha
indica el dirección de causalidad, la realidad es más probable que en la Figura 13. Hay un vínculo
causal claro de 'cantidad de tráfico' a 'número de carriles' y otro vínculo causal de 'cantidad de
tráfico' a 'número de accidentes'. También podría haber un vínculo causal entre el 'número de
carriles' y el 'número de accidentes'. La regresión solo observa las relaciones dentro de la elipse.
Ya que la 'cantidad de tráfico' variable no está en los datos, la regresión no puede representar
su influencia en el número de accidentes directamente. Lo hace de forma indirecta, a través de
la variable 'número de carriles'. Por lo tanto, los El coeficiente de regresión de 'número de carriles'
refleja en parte (principalmente) la influencia de la 'cantidad de tráfico'. Pensar que este coefi-
ciente de regresión refleja la influencia causal del 'número de La variable de carriles es un error.
Figura 13. Dirección de causalidad La siguiente fila en la Tabla 11 es sobre el ancho medio
del carril. La indicación es que un aumento del 1% en ancho de carril promedio se asocia con un
aumento de alrededor del 0,2% en el total de accidentes y tal vez 2.5%-3% de aumento en muer-
tes. ¿Cómo podría surgir tal asociación? Noland da un explicación causal plausible: cuanto más
ancho es el carril, más rápido uno puede estar inclinado a conducir y acelerar se sabe que au-
menta la gravedad de los choques. Una explicación alternativa es la siguiente.
Los estándares de diseño de carreteras son impulsados principalmente por la cantidad de tráfico
que la carretera está destinada a transporte y por la 'velocidad de diseño' de la carretera. El
ancho de los carriles en el momento del diseño suele ser determinado por una tabla de búsqueda
en la que la fila es para 'Velocidad de diseño' y la columna para la 'Volumen de tráfico del año de
diseño'. Así, por ejemplo, en Ontario si la velocidad de diseño es de 120 km/h y AADT>4000, se
construyen carriles de 3,75 m (12,3'); si la velocidad de diseño = 80 km/h y 1000<AADT<2000,
se construyen carriles de 3,0 m (9,8'). La cadena de causalidad en la Figura 14 es más complejo
que el de la Figura 13. El ancho del carril es 'causado' por los estándares y hábitos de la carretera.
Tráfico futuro de diseño y velocidad de diseño. Estos afectan la ocurrencia de accidentes de
manera tortuosa; la 1 En su clásico sobre el “Uso y abuso de la regresión” (Box 1966) Box llama
variables que influyen en el resultado pero no incluidos en la regresión 'latente' o 'al acecho'. Un
ejemplo simple proviene de un libro de texto introductorio de Freedman, Pisani, Purves y Adhi-
kari. (bajo el título “asociación no es causalidad ” ) : “ Para niños en edad escolar, zapato el
tamaño está fuertemente correlacionado con las habilidades de lectura. Sin embargo, aprender
nuevas palabras no hace que los pies crezcan.
En cambio, hay un tercer factor involucrado : años. A medida que los niños crecen, aprenden a
leer mejor y superan sus Zapatos. (En la jerga estadística. la edad es un factor de confusión)”.
cantidad de tráfico Número de carriles Número de accidentes ? 73 El volumen de tráfico futuro
previsto suele estar estrechamente relacionado con el volumen de tráfico real que se materializa
una vez que se construye la carretera, mientras que la velocidad de diseño se correlaciona con
la velocidad real en usar. La velocidad real ahora está sujeta a tres influencias: la velocidad de
diseño a través de su selección de la curvatura y la distancia visual a lo largo del camino, el
ancho del carril y la cantidad real de tráfico en el la carretera. Aún así, la velocidad real y el
volumen de tráfico están fuera de la elipse de regresión. Por lo tanto, ¿cuál ve desde dentro de
la regresión, la asociación del ancho del carril con los accidentes, de ninguna manera puede ser
tomado como representante de un nexo causal. Para tener un modelo causal habría que decir
cómo lane el ancho afecta la velocidad real y cómo la velocidad y el volumen reales afectan los
accidentes.
Figura 14. Una red de causalidad más compleja El resultado es que, una vez más, no es solo
o principalmente el efecto causal del ancho del carril que el transmite el coeficiente de regresión;
es también (quizás principalmente) la cantidad de tráfico y la velocidad.
Habiendo revisado los documentos de 2003 y 2004, un punto adicional merece mención. En el
documento de 2004 los coeficientes de regresión para la variable 'ingreso per cápita' es -
0.33±0.27 para accidentes totales y 0.27±0.16 para fatalidades (fila 5 en la Tabla 11). En el mo-
delo 2003 lo mismo variable tuvo un coeficiente de regresión de 0,95±0,12 para muertos y
0,95±0,23 para heridos. Desde que sería una subversión de la noción de causalidad afirmar que
en 2003 los accidentes dependían de ingreso de una manera y en 2004 de otra, estos resultados
son claramente inconsistentes. Como se ha señalado en todo momento, los modelos que dan
resultados inconsistentes no permiten interpretaciones de causa-efecto.
Aun así, en consonancia con su trabajo de 2003, Noland concluye que: “Los resultados tienden
a respaldar la hipótesis de que la mayoría de las variables de infraestructura (con algunas ex-
cepciones) no tienen efecto sobre las muertes y falla cuando se controlan los cambios demográ-
ficos”. (pp. 525,52 6) “Las dos excepciones son el número medio de carriles y el ancho exterior
medio de la banquina”. (pág. 530). Del mismo modo, Noland concluye que: "Nuestros resultados
sugieren que algunos cambios en la infraestructura en realidad han llevado a aumento de acci-
dentes y muertes. En particular, los aumentos en el número de carriles parecen (sic) asociarse
con un aumento de muertes y accidentes, y los aumentos en el ancho de los carriles están aso-
ciados con un aumento de las muertes”. y que: “Claramente, estos resultados desafían algunas
suposiciones sobre la Monto anticipado de ancho de carril de tráfico Número de accidentes ?
Velocidad de diseño Velocidad real Cantidad real de Tráfico 74 beneficios de varias 'mejoras' de
seguridad vial.” (p. 632). Creo que ahora debería ser obvio.
que sobre la base de los datos, el método y los resultados de Noland, no se pueden respaldar
tales afirmaciones.
4.4 El Medio no es el Mensaje.
Sea lo que sea lo que McLuhan quiso decir con su enigmática afirmación de que el medio es el
mensaje, a menudo se interpreta (quizás erróneamente) en el sentido de que la cubierta, el em-
balaje o el herramienta son más importantes que el contenido de la idea. Peltzman, Lave, Noland,
todos usaron el mismo medio –un enfoque econométrico de forma cuasi reducida para el mode-
lado de regresión– para transmitir su mensaje. yo Me gustaría asegurarme de que mi examen
crítico y detallado de este medio no se interprete como restando valor a su mensaje central. Su
mensaje central también es común a los tres investigadores; es que la gente se adaptará a las
circunstancias cambiantes. Peltzman pensó que la gente adaptado a vehículos más seguros
cambiando su intensidad de conducción (velocidad, beber y conducir, etc.).
Lave, en su trabajo posterior sobre el efecto del límite de velocidad de 55 mph, argumentó que
viajar en el sistema interestatal menos atractivo indujo a algunos a hacer más uso del acceso no
limitado menos seguro caminos y que la nueva velocidad provocó un cambio en la mano de obra
policial a la sistema interestatal. Por lo tanto, según su argumento, el efecto de seguridad del
límite de velocidad reducido es no se limita únicamente a la red de carreteras interestatales.
Noland argumentó de manera similar que mientras un sitio por sitio análisis puede mostrar alguna
intervención para mejorar la seguridad, el efecto de todo el sistema puede ser totalmente dife-
rente. La adaptación puede tomar la forma de cambios en la velocidad, en la ruta de viaje, en la
vigilancia, etc.
Por tanto, cuando se trata de estimar el efecto de una intervención sobre la seguridad, corres-
ponde a al investigador recordar que la adaptación puede existir. El medio elegido por Peltzman,
Lave y Noland puede ser deficiente; sobre este debate continuará. Su mensaje central, sin em-
bargo, es muy importante.
Hasta ahora, revisé solo algunas regresiones ecológicas prominentes (a nivel de población) mo-
delos Quizá lo que me hizo dudar de la posibilidad de interpretaciones causa-efecto en el los
estudios a nivel de población de Peltzman, Lave y Noland no serán tan agudos para los estudios
a nivel de unidad que no sufren los problemas de agregación de datos. Por lo tanto, el examen
de algunos niveles de unidad Se procede a realizar estudios en los que la unidad de observación
sean los tramos de carretera.
4.5 Algunos modelos a nivel de unidad para carreteras.
La pregunta central es, como antes, si los resultados obtenidos por regresión multivariada el uso
de datos transversales puede sustentar interpretaciones de causa-efecto. Los diversos concep-
tos Las dificultades que dan lugar al escepticismo se discutieron anteriormente. Sin embargo, la
prueba de la budín es en parte empírico: ¿producen estos estudios resultados suficientemente
precisos, son los resultados consistentes sobre diferentes conjuntos de datos, son sensibles a
los métodos de modelado y suposiciones, y son resultados obtenidos de regresiones transver-
sales en línea con hallazgos basados sobre los datos antes y después del tratamiento.
Se revisaron varios estudios de regresión a nivel de unidad sobre pasos a nivel de ferrocarril-
carretera anteriormente en la Sección 2. En esta sección, el historial de algunos estudios de
regresión a nivel de unidad de Se examinarán los segmentos 75 4.5.1 Modelos a nivel de uni-
dad para caminos rurales de dos carriles En un importante proyecto de investigación (Vogt y
Bared 1998b; Vogt y Bared 1998a) el objetivo fue desarrollar modelos de predicción de acciden-
tes que tengan en cuenta elementos de diseño de carreteras como ancho de carril, tipo de arcén,
curvatura horizontal o grado. La ecuación del modelo elegido fue: y β mi β 1 x 1 e β 2 x 2 .
0 = ecuación _ 7 donde y ˆ es la estimación de la frecuencia media de accidentes, las β s son la
regresión estimada coeficientes y la x representan variables tales como ancho de carril, ancho
de arcén, grado promedio, densidad de entrada, grado de curva, etc. Los datos fueron de Min-
nesota (1694 accidentes que ocurrieron en cuatro años en unas setecientas millas de carretera)
y Washington (1706 accidentes ocurridos en tres años en unas quinientas millas de carretera).
Algunos de los resultados se encuentran en la Tabla 12 .
Tabla 12. Coeficientes de regresión ( β ) con base en la Tabla 22 del informe completo y la
Tabla 3 en papel.
Carril de distribución Ancho Hombro Ancho Entrada de coches Densidad . Calificación 1.Minne-
sota -0,20±0,04 -0,08±0,01 0,009±0,003 . 0,25±0,06 2.Washington +0,07±0,05 -0,04±0,03
0,012±0,002 . 0,08±0,02 3. Combinado veneno -0,09±0,03 -0,06±0,01 0,010±0,002 . 0,10±0,02
4. Negativo combinado. Compartimiento. -0,08±0,04 -0,06±0,01 0,010±0,002 . 0,11±0,03 El signo
del coeficiente de regresión Lane Width para Washington es inesperado. En Minnesota, las ca-
rreteras con atributos idénticos pero carriles más anchos tendían a tener menos accidentes mien-
tras que lo contrario fue cierto para las carreteras en Washington. ¿Fue uno de los que adoptó
el 'Factor de reducción de accidentes' interpretación, uno concluiría que ampliar un carril reduce
la frecuencia de accidentes en Minnesota pero lo aumenta en Washington.
Los autores atribuyeron esta anomalía en parte a las diferencias en la correlación entre ancho
de carril y arcén que fue -0.06 en Minnesota y +0.11 en Washington 1 . Otro La posible explica-
ción mencionada por los autores fue que las carreteras en Minnesota tenían en su mayoría grava
arcenes mientras que en Washington los arcenes estaban mayormente pavimentados. En algún
momento del análisis la los autores decidieron combinar los datos de los dos estados 2 y esto
hizo que la anomalía fuera invisible.
(Tenga en cuenta que, naturalmente, todos los β en la tercera fila ('combinada') de la Tabla 12
están entre los β en las dos primeras filas. Es por eso que la anomalía desaparece.) La anomalía
percibida puede tener varias causas. Parte de la explicación podría ser la precisión limitada de
los coeficientes de regresión. Debido a que los errores estándar que se muestran en la Tabla 12
son bastante pequeños, uno no puede razonablemente atribuir la diferencia entre -0.20 y +0.07
a estimar la imprecisión 3 . Otra parte de la explicación es que la forma funcional elegida (Ec. 7)
puede que no se aproxime bien al efecto conjunto de 'Ancho de carril' y 'Ancho de arcén'. Tercero,
un se mencionó una variable faltante importante (si el arcén está pavimentado o no); si fuera
incluidos, el modelo podría tener un mejor sentido de los datos. En cuarto lugar, algunos podrían
argumentar que hay podría haber diferencias entre Washington y Minnesota (en clima, cultura
de conducción, topografía 1 Debido a que las variables están correlacionadas, las estimaciones
del coeficiente de regresión también lo están. Así, por ejemplo, eran los problemático +0.07 para
β Lane Width para reducirse, esto forzaría un aumento en el -0.04 del β Shoulder Width . Porque
reducir un problema aumentaría el otro, las correlaciones relativamente débiles no son la expli-
cación probable.
2 Se utilizó un factor de multiplicación para distinguir un estado del otro.
3 El error estándar de la diferencia -0.20-0.07=0.27 es solo de √(0.04 2 +0.05 2 )=±0.06.
76 y similares) que hace que los carriles más anchos sean beneficiosos para la seguridad en
Minnesota y perjudiciales para la seguridad.
Washington. Quinto, como siempre es cierto, hay razones por las que algunas carreteras tienen
carriles de diez pies y otros tienen carriles de once o doce pies. Los caminos más angostos
pueden haber sido diseñados y construidos en épocas anteriores y, por lo tanto, difieren de los
caminos más anchos en las muchas formas en que las regiones se desarrollaron antes con prác-
ticas de diseño más antiguas difieren de las regiones desarrolladas más tarde con un diseño más
nuevo hábitos en su lugar. Las carreteras con carriles más angostos tienden a llevar menos
tráfico y por lo tanto tienen menos mantenimiento invernal, caídas de borde más grandes, más
equipo agrícola, usuarios con menos ingresos, diferentes patrones de consumo de alcohol, etc.
La influencia de tales factores causales no es explícita en la ecuación del modelo. Sin embargo,
su presencia e influencia se expresa a través de la variables que resultan estar en la ecuación
del modelo, siendo 'Lane Width' una de esas variables.
Por lo tanto, lo que tomamos como el efecto de 'Lane Width' es en parte, y hasta un punto des-
conocido, el efecto de todos los factores causales antes mencionados. Cambiando de ancho de
carril no se cambia de calzada ingresos de los usuarios, patrones de consumo de alcohol, prác-
ticas de diseño anteriores o mantenimiento actual estándares Esta es la razón por la que no se
puede calcular simple y automáticamente el efecto del ancho del carril por usando el coeficiente
de regresión para Lane Width. Esta es también, en parte, la razón por la cual la regresión coefi-
ciente para la misma variable puede diferir de un estado a otro.
Hay variables adicionales para las que Washington y Minnesota tienen diferentes coeficientes de
regresión. Por lo tanto, en la Tabla 12, se estimó que el 'Ancho de hombro' en Minnesota tenía
dos veces el efecto y 'Grado' tres veces el efecto en Washington. Estos grandes aparentes las
diferencias tienen causas similares a las mencionadas anteriormente; precisión estadística limi-
tada, una forma funcional asumida que puede no representar bien el fenómeno, variables que
pueden ser falta en el modelo, etc.
Los datos recopilados por Vogt y Bared se volvieron a analizar 1 unos años más tarde (Hauer
2001). Este nuevo análisis también implicó una exploración detallada de la necesidad de cambiar
el funcionamiento forma asumida en la ecuación. 7. Este nuevo análisis ofrece una rara oportu-
nidad de examinar cómo la regresión los resultados pueden cambiar cuando se utilizan los mis-
mos datos pero se hacen diferentes suposiciones de modelado. En el curso del nuevo análisis
resultó, por ejemplo, que el modelo de Vogt-Bared predice muy pocos accidentes para segmen-
tos con carriles de 10 y 12 pies y demasiados accidentes para segmentos con carriles de 11 pies.
Es decir, que la forma funcional e β Lane width × Lane Width utilizada por Vogt y Bared que no
puede tener un mínimo no puede ajustar bien los datos que indican la presencia de un mínimo.
Los resultados para el ancho de carril de los modelos originales de la Tabla 12 y el nuevo análisis
se puede ver en la Figura 15.
1 De acuerdo con el estado actual de la técnica, Vogt y Bared supusieron que el parámetro de
sobredispersión no depende de la longitud de los segmentos. Investigaciones posteriores de-
mostraron que esta suposición puede dar un peso indebido a los cortos segmentos en la estima-
ción de parámetros. Es por esto que se volvió a analizar la misma base de datos.
77 Figura 15. Comparación de resultados de V&B y Hauer La impresión que deja la Figura
15 es que los hallazgos no son lo suficientemente consistentes para ser de orientación para la
acción práctica. Si la inconsistencia se debe a variables faltantes, mal elegidas forma modelo, o
posiblemente una diferencia real en el efecto del ancho del carril entre Minnesota y Washington,
estos hallazgos no permiten anticipar cómo podría cambiar la seguridad como resultado de un
cambio en el ancho del carril.
El problema se resolvería aquí si no fuera por la existencia de una regresión adicional modelos
basados en diferentes datos de sección transversal. Zeger et al. (Zegeer et al. 1987) utilizaron
datos sobre unas 5000 millas de carreteras de dos carriles de siete estados 1 y cinco años de
accidentes. Agrupando todo datos 2 Zegeer et al. representó el efecto del ancho del carril por el
factor multiplicativo de 0.88 Lane ancho _ Esto es aproximadamente lo mismo 3 que e -0.12×An-
cho de carril . Los hallazgos de Zegeer se mostrarían en la Figura 15 como una línea ligeramente
por debajo de la etiqueta 'B&V Combined'. La evidencia adicional proviene de Hadi et al. (Hadi
et al. 1995a) y (Hadi et al. 1995b) que utilizaron datos sobre unas 4200 millas de carreteras
rurales de dos carriles en Florida. En su modelo, el efecto del ancho del carril está representado
por el factor multiplicativo de e -0.086 × ancho de carril que coincide virtualmente con la línea
'V&B Combined' en Figura 15.
Parece entonces que hay un núcleo de congruencia entre los varios hallazgos y también diversi-
dad sustancial. La congruencia está entre los hallazgos de Hadi et al. para Florida, el Vogt y
Bared resultados al combinar datos de Minnesota y Washington, y Zegeer et al.
1 Los estados son Alabama, Michigan, Montana, Carolina del Norte, Utah, Washington y Virginia
Occidental.
2 Una investigación posterior de Ng y Hauer (Ng y Hauer 1989) reveló que “Bajo condiciones
similares, diferentes los estados tienen diferentes números promedio de accidentes por milla-
año” (p.4). Porque los estados también difieren en el ancho de vía de sus vías, no se puede saber
en qué medida los coeficientes de regresión reflejan el efecto del ancho del carril o el efecto de
otras diferencias de estado a estado.
3 La función γX β X mi β X = mi = . Por lo tanto, la forma funcional utilizada por Zegeer et al es
la misma que la utilizada por Vogt y Bared y Hadi et al. Además, e β = 1 + β + β 2 2!.Cuando β
es pequeño e β es aproximadamente igual a (1+ β ). Por lo tanto, e -0.12×Ancho de carril es
aproximadamente lo mismo que 0.88 Ancho de carril .
78 resultados para los datos agrupados de siete estados. La diversidad es de dos tipos. Primero,
hay grandes diferencias inexplicables entre los resultados de Minnesota, Washington y Florida.
En segundo lugar, hay es una gran diferencia entre los resultados en los que la función supuesta
era e β X y la función revisada modelo usando los mismos datos usando una función que puede
tener un mínimo. Las muchas suposiciones hace en el modelado (qué variables usar, qué forma
funcional elegir, qué estructura de error por la que optar, etc.) puede ser en parte responsable
de la diversidad de hallazgos 1 . Actualmente mi opinión es este: • Es posible que la estructura
subyacente de causa-efecto de la ocurrencia del accidente fenómeno podría ser revelado a tra-
vés de análisis de regresión a nivel de unidad de sección transversal datos. Para lograr este
objetivo, es necesario eliminar las principales fuentes de diversidad inexplicable.
Si bien uno puede esperar que a través de futuras investigaciones cuidadosas, creativas y per-
sistentes esto podría hacerse eventualmente, el historial discutido en esta sección y el concepto
Las dificultades discutidas en la sección 3 no dan mucho lugar para el optimismo.
4.5.2 Un modelo a nivel de unidad para carreteras de varios carriles En comparación con las
carreteras de dos carriles, los modelos de regresión multivariable para carreteras de varios ca-
rriles son escaso. Por lo tanto, uno no puede comparar los hallazgos de muchos modelos y eva-
luar la consistencia de resultados. Sin embargo, todavía es posible examinar los resultados de
los modelos a la luz de lo que conocido o esperado.
Hauer et al. (2004) utilizó datos de ciento veinte millas de cuatro carriles urbanos segmentos de
carretera no divididos en Washington en los que se encuentran unos 900 fuera de la carretera y
5300 en la carretera accidentes ocurridos durante los años 1993 a 1996. Un resultado típico (para
el total de accidentes en la carretera) es la ecuación 8 donde, y es la estimación del número
esperado de accidentes por año en un lado de el camino, X=AADT/10,000, D Ε grado de curva,
ST es tipo de hombro, SWC es ancho de hombro categoría, PC es una curva vertical pico-cresta,
VS es una curva vertical valle-sag y TWLTL es bidireccional- carril de giro a la izquierda y ∀ año
un parámetro de escala anual.
1 Noland y Karlaftis (2004) (Noland y Karlaftis 2004) llegan a conclusiones similares.
79 ( ) y Longitud del segmento para la predicción X e [2e 0.037(%Camiones)] [e 0.059D] (Límite
de velocidad) e/ (50.000 si PDO, 150 si Lesión, 2000 si Total) (0,803 si TWLTL está presente y
1 en caso contrario) [1 0.022(Ancho de carril 11')] [si ST 'Bordillo' o 'Pared' entonces 1.18, de lo
contrario 1 0.044(SWC 1)] (1,26 si PC, 1,75 si VS, 1 en caso contrario) mi 0.027 (Número de
entradas comerciales) 1.860 0.159X 0.071%Camiones) 0.265D 3.058 3.058 Límite de velocidad
/30 1.108 (Longitud del segmento en los datos del modelo) = × × + × + ° × × × + − × = + − × × +
× ⎡ ⎣ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢ ⎤ ⎦ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥ − − − ° − × − α año ecuación . 8 Se hizo un intento de moldear
la forma del modelo para que pueda ajustarse al mensaje de los datos. Esto es por qué la forma
matemática de los bloques de construcción es relativamente compleja y por qué el modelo consta
de componentes multiplicativos y aditivos. Sólo aquellas variables que exhibieron un relación
sistemática con la ocurrencia de accidentes se incorporaron en los modelos. Algunos hallazgos
son los que cabría esperar y otros bastante inesperados.
Por lo tanto, por ejemplo, mientras que para los accidentes fuera de la carretera la variable 'Por-
centaje de camiones' no tuvo influencia, para los accidentes de tránsito, se encontró que la rela-
ción en la Figura 16 refleja los datos.
Figura 16. Multiplicador para la variable 'Porcentaje de camiones' Los datos indican que
cuanto mayor sea la proporción de camiones en el flujo de tráfico, al menos hasta aproximada-
mente 10%, menos accidentes en la carretera parecen ocurrir en carreteras urbanas de cuatro
carriles en Washington. Dado que el hallazgo es inesperado tanto en dirección como en tamaño
1 , la mente buscará Explicaciones: tal vez las carreteras con muchos camiones difieren de las
carreteras con pocos camiones en aspectos que no 1 Un flujo de tráfico sin camiones tiene el
doble de accidentes que un flujo con diez por ciento de camiones.
80 representado en el modelo, tal vez donde los camiones son numerosos, las velocidades son
menores, etc.
especulaciones reflejan la intuición correcta de que hay muchas explicaciones posibles (razones,
causas) para la relación encontrada por regresión al lado de la que resulta estar en el modelo
ecuación. Es en la constitución psicológica humana que nos inclinamos a buscar tales causas y
explicaciones cuando un hallazgo no está de acuerdo con la expectativa 1 pero está feliz de
aceptar sin cuestionar lo que está en línea con nuestras creencias anteriores. Nuestra predispo-
sición psicológica no debe oscurecerse buen juicio. Claramente, uno no puede considerar los
hallazgos que están de acuerdo con las expectativas como capturar una relación causal y, al
mismo tiempo, considerar los hallazgos inesperados como no causales.
Otro resultado inesperado en Hauer (2004) se encuentra en la Figura 17. La relación que se
muestra es una buen ajuste a lo que indican los datos 2 . Si se atribuyera a esta curva una causa-
efecto, es decir, una llevaría a concluir que, en este tipo de vías, aumentar el límite de velocidad
en el rango de 30 a 50 mph rango reducirá los accidentes. A los que se oponen a los límites de
velocidad les gustaría ver esta interpretación los datos. Sin embargo, en realidad, lo más proba-
ble es que la dirección de la causalidad vaya en la dirección opuesta.
Es decir, las personas conducen más rápido cuando sienten menos riesgo y los ingenieros deci-
den cuál es la velocidad.
los límites deben basarse en lo que los conductores muestran como una velocidad prudente. No
es que aumentar la velocidad límite salva accidentes es que una carretera donde el riesgo parece
menor tiende a tener mayor límite de velocidad (al menos en el rango de 30 a 50 mph).
Figura 17. Multiplicador de la Variable 'Límite de Velocidad'.
Otro punto a recordar es que la gravedad del accidente no depende de la velocidad indicada.
límite sino en el cambio de velocidad antes de la colisión (Delta-V). Las reconstrucciones de
accidentes muestran que Delta-V solo se ve ligeramente afectado por el límite de velocidad,
como se muestra en la Figura 18 (basado en Farmer (2003)).
De ello se deduce que la variable en la regresión (límite de velocidad) tiene solo un vínculo causal
débil con el fenómeno y la relación encontrada representa una variedad de factores casuales, no
principalmente de velocidad.
1 La disonancia cognitiva es un fenómeno psicológico que hace referencia al malestar que se
siente ante una discrepancia entre lo que ya sabe o cree, y nueva información o interpretación.
2 El ajuste es bueno para las seis categorías de límite de velocidad de 25 a 50 mph. Hay un
repunte en los datos de los pocos tramos con 55 mph.
81 Figura 18. El eslabón débil entre Delta-V y Speed Limit Las siguientes observaciones se
hacen en la sección 'Lecciones' de Hauer (2004): “Se obtuvieron varios resultados inesperados.
Frecuencia de accidentes parece disminuir como límite de velocidad aumenta o a medida que
aumenta la proporción de camiones; hay más accidentes de tráfico en secciones tangentes que
en la mayoría de las curvas horizontales, las carreteras con arcenes más anchos tienen más
accidentes, etc. Si se supone que los datos son correctos y el proceso de modelado está libre de
errores, la pregunta central es esta: ¿Cuáles de los muchos resultados obtenidos reflejan una
relación causa-efecto y cuáles reflejan simplemente una asociación estadística cuyas razones
pueden ser complejas? .Recuerde que los modelos multivariantes de este tipo se utilizan a me-
nudo para obtener 'Modificación de accidentes Factors' como si tal interpretación de causa y
efecto estuviera permitida. Una de las lecciones de este proyecto es que tal práctica está abierta
a cuestionamiento. La 'cuestión central' antes mencionada no es siendo abordado por cualquiera
de los programas de investigación de seguridad financiados en curso. Y sin embargo, si se deja
sin resolver, gran parte de la investigación que actualmente está financiada por la FHWA y el
NCHRP está en peligro de produciendo resultados inutilizables y potencialmente dañinos.
Es difícil imaginar que nada de la asociación encontrada en los datos entre la frecuencia de
accidentes y, digamos, el grado de la curva, el arcén y el ancho del carril o el tipo de curva
vertical, refleja la causa y efecto. Las asociaciones encontradas aquí pertenecen a vías urbanas
de cuatro carriles sin dividir y son muy diferente a las creencias establecidas durante décadas
de investigación sobre caminos rurales de dos carriles.
Por lo tanto, se debe considerar la posibilidad de que estos dos tipos de vías difieran sustancial-
mente en cómo su seguridad depende de su geometría. Un programa de estudio con datos de
otros Estados y el uso de una variedad de enfoques de investigación está en orden”.
82 4.5.3 Modelos de regresión y funciones de modificación de accidentes El objetivo decla-
rado del proyecto Vogt & Bared (1998) discutido en la sección 4.4.1 era estimar la frecuencia
esperada de accidentes (la variable dependiente, y ˆ ) de un segmento de carretera como función
de sus atributos 1 (las 'variables independientes', x). Aun así, los autores pensaron que la El
modelo se puede utilizar para determinar cuántos accidentes se evitarán si se utilizan atributos
como el carril.
o el ancho de los hombros se cambian. En la sección titulada “Factores de reducción de acci-
dentes”, Vogt y Bared dice que: “Una forma de medir el efecto de una variable es calcular cuánto
sería la media cambiaría si la variable aumentara en una unidad. El factor de reducción de acci-
dentes es 1 100 [ mi 1 ] mi 100 e yo yo yo β x _ β (x 1) − − = ⎥⎦ ⎤ ⎢⎣ ⎡ − − + . Esta cantidad es el
negativo del porcentaje cambio." (pág. 21) En esto, Vogt y Bared siguen la autoridad de Miaou y
Lum (Miaou 1994) quienes usan un modelo de regresión que desarrollaron de manera similar
“para estimar la reducción esperada en camiones accidentes causados por mejoras en algunos
elementos de diseño geométrico…”, (pp. 13- 14) . La práctica de usar los resultados de la regre-
sión para calcular los 'Factores de reducción de accidentes' es casi universal, como puede de-
ducirse de los influyentes trabajos de Zegeer et al. (Zegeer et al. 198), Haddi et al. (1995) y
muchos otros.
Este es el quid de la cuestión. Existe la cautela estadística elemental y de larga data que 'corre-
lación no es causalidad' y existe un escepticismo científico generalizado acerca de la interpreta-
ción de ecuaciones de regresión como indicaciones de causa y efecto. También hay amplio evi-
dencia empírica respaldada por los muchos ejemplos revisados en detalle en este informe que
la cautela estadística está bien fundada y el escepticismo científico justificado. y sin embargo el
La tradición econométrica en la investigación de la seguridad vial es una de disposición incues-
tionable 2 para utilizar los resultados de regresiones basadas en datos transversales para pre-
decir el efecto de las manipulaciones.
El escepticismo sobre la posibilidad de atribuir significado causal a las relaciones encontradas
por regresión que utiliza datos transversales no significa que los resultados sean inútiles, o que
Nunca se puede captar el efecto causal de algunas variables. Las relaciones encontradas por
regresión son bueno para estimar cuántos accidentes se espera que ocurran en los tramos de
carretera sobre los cuales el la información requerida para alimentar el modelo está disponible.
La relación encontrada por tales regresiones también puede servir como inspiración y desenca-
denante para futuras investigaciones. ¿Por qué en multicarril urbano las carreteras no divididas
las curvas suaves son más seguras que las secciones tangentes, los segmentos con un límite
de velocidad de 50 mph ¿Son más seguras que las secciones donde hay 30 mph, etc.? Si bien
las preguntas surgen de una regresión que 1 El esfuerzo de investigación fue realizado por la
Administración Federal de Carreteras para proporcionar las predicciones necesarias para el mo-
delo interactivo de diseño de seguridad vial 2 Es difícil entender la seducción de la expresión
matemática como la Eqn. 7. Tal vez sea el terminología de variables 'independientes' a la derecha
y variable 'dependiente' a la izquierda que es responsable de esto predisposición injustificada a
'calcular' cómo cambia lo que es dependiente cuando alguien incide en un cambio en la variable
independiente. Después de todo, incluso la Segunda Ley de Newton (F=m×a) no implica que al
cambiar la aceleración (a) uno puede cambiar la cantidad de fuerza (F). Citando a Bunge (1979)
“ .sería difícil asignar a las matemáticas el tarea de dar cuenta de las conexiones causales. La
productividad (en el sentido de que algún efecto es producido por alguna causa) es ausente de
las matemáticas. ” (p. 45) 83 Si se utilizan datos transversales, las respuestas provendrán de una
investigación enfocada realizada por otros medios. Está mi opinión que: • Mejores datos y prác-
ticas de modelado podrían reducir la diversidad inexplicable de hallazgos aumentando así la
confianza en algunas interpretaciones de causa-efecto. Sin embargo, en la actualidad, la supo-
sición habitual e incuestionable de que las ecuaciones obtenidas por regresión son máquinas
matemáticas que se pueden utilizar para calcular simplemente el efecto de las manipulaciones
es no justificable 84 5. RESUMEN Mucho se ha dicho en las cuatro secciones precedentes. Una
mente más disciplinada podría haber Dijo lo mismo con menos palabras y más claridad. Pero,
en su defecto, será el papel de la Sección 5 para exprimir la esencia de una narración incoherente
en un recipiente más pequeño.
La pregunta es si es posible dar interpretaciones de causa-efecto a los resultados de regresiones
utilizando datos sobre accidentes y atributos de una sección transversal de unidades (segmentos
de carretera, intersecciones, condados, estados, etc.). La pregunta es de importancia práctica
por dos razones. Primero, conocimiento sobre las consecuencias de seguridad de las decisiones
de diseño sobre características tales como horizontal la curvatura, el grado de la carretera, el
ancho del carril, las pendientes medianas provienen principalmente de tales regresiones. de he-
cho esto es a menudo la única forma en que se puede determinar el efecto de seguridad de estas
características. Otro La razón es que la orientación sobre cuestiones importantes de política 1 se
basa habitualmente en regresiones que utilizan datos de la sección transversal.
Muchos de los que estudian la seguridad vial asumen rutinariamente que si uno pone la sección
transversal disponible datos en la tolva de un software de regresión estadística apropiado, lo que
sale es un ecuación que se puede utilizar para calcular el efecto de seguridad de algún cambio
en el 'independiente variables'. Por qué esta creencia es tan común es un misterio porque con-
currente con ella existe la STATS 101 advierte que 'correlación no es causalidad', la advertencia
de que 'no hay causalidad sin manipulación' y también la opinión generalizada de que los resul-
tados de las regresiones cuando se basan en No se puede confiar en que los datos de sección
transversal representen relaciones causales. Esta tensión entre lo que se asume rutinariamente
y la duda sobre la validez de la misma suposición es el eje alrededor que gira este informe.
Sección 2.
En esta sección examiné la pregunta general antes mencionada en el contexto de un estudio de
caso.
¿Qué se puede aprender de la historia de la investigación sobre el efecto de seguridad de reem-
plazar los crossbucks? con luces intermitentes en un paso a nivel de ferrocarril-carretera? Varios
modelos de regresión y varios antes-después los estudios se introdujeron en la evidencia. Se
encontró que un modelo de regresión era totalmente inconsistente con lo que se comprobó re-
petidamente en todos los estudios de antes y después. Los otros modelos de regresión llevaron
a resultados diversos. Los estudios de antes y después llevaron a estimaciones similares del
efecto de seguridad. Este caso-historial dio lugar a algunos puntos generales.
1. Hay muchas diferencias bien conocidas entre los estudios transversales y antes-después.
Sin embargo, rara vez se destaca una diferencia. Una ecuación de regresión basada en la sec-
ción transversal los datos son una función de atributos (variables). Por lo tanto, cuando se utiliza
para calcular el efecto de seguridad de un cambio en algún atributo, esto también suele ser una
función de los atributos. así es como debe ser porque uno debe asumir que, generalmente, el
efecto de un tratamiento depende de los atributos del unidad tratada. Sólo cuando el efecto de-
pende débilmente de todos los atributos puede ser descrito por uno número. Por el contrario, un
estudio de antes y después en el que se aplica algún tratamiento en varios sitios por lo general ,
2 produce un solo número, una estimación del ' efecto de seguridad promedio 1 '. Tenía unidades
con 1 ¿La regulación de seguridad del automóvil redujo los accidentes? ¿Es la 'Velocidad' o la
'Variación de la velocidad lo que importa? Hacer caminos construidos para mejores estándares
mejoran la seguridad? 2 Rara vez es factible tener datos para un número suficiente de sitios
tratados para permitir la estimación del efecto de seguridad por atributos 85 Si se hubieran tra-
tado diferentes atributos, este efecto de seguridad promedio sería un número diferente. Sigue
que las estimaciones del efecto de seguridad obtenidas mediante un estudio de antes y después
tienen dos inconvenientes: • Las estimaciones tenderán a diferir de un estudio a otro debido a
que los atributos de las unidades tratadas en cada estudio son diferentes.
• Cuando un médico contempla el tratamiento de una unidad específica, es la seguridad esperada
efecto en esta unidad que es de interés. Este propósito es bien atendido por una ecuación que
expresa el efecto de seguridad en función de los atributos de la unidad. Conocimiento de lo que
es el promedio el efecto de seguridad que podría tener sobre las unidades cuyos atributos no se
conocen es menos útil.
2. En los modelos de regresión revisados, y en todos los demás modelos de regresión que co-
nozco, el funcional la dependencia del efecto de seguridad en los atributos es un subproducto no
premeditado de la ecuación elegida por el modelador por razones que no tienen nada que ver
con cómo el efecto de seguridad de algún cambio depende de los atributos de la unidad tratada.
Por lo tanto, no debe sorprender que tal Las ecuaciones no logran captar cómo el efecto de
seguridad del cambio depende de los atributos.
• Lo que parecía ser una ventaja genérica del enfoque de regresión para el efecto de seguridad
estimación - su capacidad automática para hacer efecto de seguridad en función de los atributos
- puede ser sólo una ilusión seductora; todo depende de si la regresión captura adecuadamente
un relación causa-efecto.
• Si se van a usar modelos de regresión para estimar el efecto de seguridad del cambio en los
atributos, esto debe tenerse en cuenta cuando se elige la ecuación del modelo.
3. Los modelos de regresión examinados en la Sección 2 predicen en circunstancias idénticas
un muy efecto de seguridad diferente para la conversión de crossbucks a flasher. Y, sin embargo,
la piedra angular de la causalidad es la creencia de que en circunstancias idénticas el mismo
trato tendrá el mismo efecto.
Si es así, tomados en conjunto, los modelos examinados fallan esta prueba de causalidad.
• La consistencia de los resultados (efectos) es una piedra de toque importante para la causali-
dad. Si modelos producidos por regresiones basadas en datos transversales no producen resul-
tados consistentes, uno no se puede decir que capten una relación causal. Si no se puede decir
si una causa se ha capturado la relación, los modelos no se pueden utilizar para predecir el efecto
de seguridad de un cambio.
4. La consistencia de los resultados como piedra de toque de la causalidad se aplica no solo a
las comparaciones de regresión resultados del modelo, sino también a las comparaciones entre
los resultados de las regresiones y los estudios de antes y después.
Si bien uno de los modelos de regresión examinados en la Sección 2 era claramente incompatible
con los modelos existentes estudios de antes y después, lo más que se puede decir sobre el otro
modelo de regresión examinado es que su los resultados no son inconsistentes con los de los
estudios de antes y después existentes. El punto general es que • Las estimaciones del "efecto
de seguridad promedio" de los estudios de antes y después no se pueden comparar fácilmente
con resultados de regresiones cuando los atributos de las unidades tratadas en el estudio antes-
después no se conocen.
1 El promedio es sobre todos los sitios tratados incluidos en el estudio.
86 • De ello se deduce que la utilidad de los estudios de antes y después mejoraría mucho si:
una. Sabíamos los atributos de las unidades en el estudio antes-después y, b. Sabíamos cómo
el efecto de seguridad depende de estos atributos.
5. Es necesario resaltar otra diferencia importante entre los estudios de antes y después y los
transversales.
Cuando se compara la seguridad de una unidad antes y después del tratamiento, la unidad sigue
siendo la misma; es básicamente el mismo camino o intersección, utilizado por el mismo tipo de
personas, en el mismo lugar, clima, etc. Lo que puede cambiar materialmente es el flujo de trá-
fico, la precipitación, los límites de notificación de accidentes y similares. Por lo tanto, es razona-
ble esperar que uno pueda dar cuenta de lo que materialmente ha cambió del período 'antes' al
período 'después'. En cambio, en un estudio transversal se compara unidades 'con atributo A' y
diferentes unidades 'con atributo B'. Ahora bien, la continuidad proporcionada por el falta el co-
nocimiento de que 'la unidad sigue siendo la misma'. Por lo tanto, uno puede estar menos seguro
de que no hay diferencias importantes y no explicadas entre el 'con atributo A' y 'con atributo B'
unidades; diferencias sobre las que no hay información, y cuya existencia puede que ni siquiera
sospeche. Además, existe la sensata suposición de que las unidades tienen el atributo A y no B
por buenas razones, y que estas razones no se conocen completamente y son difíciles de expli-
car.
Seccion 3.
En esta sección intento proporcionar una base conceptual para la discusión de la causa y efecto
En esto me guié por los escritos de Rubin-Holland y Greenland-Robins. los El 'problema funda-
mental de la inferencia causal' sobre el efecto de un tratamiento es que es imposible tratar y no
tratar simultáneamente la misma unidad y por lo tanto es imposible observar cómo la misma
unidad respondería tanto al tratamiento como al no tratamiento. La solución científica a esto El
problema es suponer que los resultados obtenidos antes, en condiciones idénticas pero sin tra-
tamiento, se obtendría si no se hubiera aplicado el tratamiento cuando se hizo. La solución del
estadístico es tratar algunas unidades de una población y dejar las unidades restantes sin tratar.
tanto para el científico y el estadístico la creencia subyacente es que: • La respuesta de una
unidad a un tratamiento está determinada por sus atributos relevantes para la respuesta.
Las unidades con atributos relevantes para la respuesta idénticos tendrán respuestas idénticas
a tratamiento.
Cuando el investigador no tiene control sobre la asignación de unidades al tratamiento, como
ocurre en estudios de observación, el enfoque del estadístico falla y el razonamiento del científico
que necesita ser seguido. Considere primero un estudio observacional de antes y después. Para
que la inferencia causal siga la Paradigma científico, lo que debe mostrarse es que mediante el
uso de valores observados del pasado (y complementando esto con información sobre cómo
algunas circunstancias relevantes para la respuesta han cambió del período 'antes' al 'después')
es posible predecir lo que sucedería sin tratamiento en el período 'después'.
• Si y cuándo lo que se predice para una unidad y lo que se observa en ella se puede demostrar
que estar repetida y suficientemente cerca uno del otro es una pregunta empírica que puede ser
respondido a través de un programa de indagación.
• Dado que en la investigación sobre seguridad vial aún no se ha elaborado un programa de
investigación de este tipo, llevado a cabo, todavía no es posible decir si en los estudios observa-
cionales de antes y después, 87 los juicios de causalidad pueden estar bien fundamentados en
el paradigma de un 'científico observacional'.
Pero la perspectiva de éxito es excelente.
Considere a continuación un estudio observacional transversal sobre el efecto de seguridad del
cambio de del estado 'c' al estado 't' en el que las unidades que tienen 'c' se comparan con otras
unidades que tienen 't'.
Ahora, la suposición que se justifica es que las unidades que tienen 't' habrían respondido a 'c'
en de la misma manera que las unidades que tienen 'c'. Para justificar esta suposición, uno debe
poder demostrar que las unidades que tienen 'c' tienen los mismos atributos relevantes para la
respuesta que las unidades que tienen 't'.
Hacerlo es difícil por razones tanto prácticas como conceptuales. La razón habitual por la que
uno unidad tiene 'c' (digamos, crossbucks) y otra tiene 't' (digamos, intermitentes) es que difieren
en algunos atributos de respuesta (digamos, tráfico). Por lo tanto, es prácticamente difícil encon-
trar unidades con 'c' que tengan los mismos atributos relevantes para la respuesta que las uni-
dades con 't'. Incluso si esta dificultad práctica pudiera ser superar uno debe preguntarse por qué
entre los que parecen tener atributos similares relevantes para la respuesta, algunos tienen 'c' y
otros 't'? La sospecha debe ser que alguien juzgó una unidad más adecuada para 'c' y el otro
para 't'. Si este juicio no careciera de base, entonces los atributos relevantes para la respuesta
de unidades con 'c' y unidades con 't' no son lo mismo. Las conclusiones es que • Para estudios
transversales observacionales en seguridad vial, no puedo pensar en un análisis empírico pro-
grama de estudio para demostrar que las unidades que tienen 'c' responderían a t' en el de la
misma manera que lo hicieron las unidades que tenían 't'. Tampoco parece posible demostrar
que algunos las unidades que tienen 'c' y algunas unidades que tienen 't' tienen la misma res-
puesta relevante atributos Hasta que se diseñe y se lleve a cabo con éxito un programa de estu-
dios de este tipo, tener poca confianza en la afirmación de causa-efecto cuando se basa en una
sección transversal observacional estudios.
El resto de la Sección 3 trata sobre cómo disminuir la amenaza del sesgo de confusión en estu-
dios transversales observacionales. Un enfoque sería seleccionar unidades con 'c' y unidades
con 't' para tener atributos relevantes para la respuesta muy similares. Por las razones mencio-
nadas anteriormente, en la investigación en materia de seguridad vial, es probable que esto no
sea práctico. El otro enfoque es tener en cuenta las diferencias.
en atributos relevantes para la respuesta entre unidades con 'c' y unidades con 't' por análisis.
para hacerlo requiere conocimiento de una. ¿Cuáles son los atributos relevantes para la res-
puesta de las unidades con 'c' y las unidades con 't'? b. Conocimiento de cómo cambiaría la
respuesta de cada unidad en función del cambio en un atributos relevantes para la respuesta.
Si el conocimiento en 'a' y 'b' estuviera disponible, se podría aplicar una 'corrección' a lo obser-
vado frecuencias de accidentes que traen unidades con 'c' y unidades con 't' a un conjunto común
de respuestas relacionadas atributos Hay muchos obstáculos en esta ruta. Primero, para corregir
por confundir uno debe tener datos sobre lo que se sabe que son importantes atributos relevantes
para la respuesta de las unidades con 'c' y con 't'. Si tales datos no están disponibles, se debe
suponer que existe confusión. Segundo, incluso si uno tuviera los datos, corregir la confusión
requiere el conocimiento de un multivariable función que vincula la respuesta (frecuencia de ac-
cidentes) con todos los atributos importantes relacionados con la respuesta (variables). En se-
guridad vial, tales funciones actualmente no existen. Por último, están las respuestas relevantes
atributos que no conocemos. Entre ellas destacan las razones por las cuales una unidad terminó
teniendo 'c' y otra 't'. La influencia de estos atributos, desconocidos, 88 insospechados, no reco-
nocidos o indocumentados pero omnipresentes, siempre estarán al acecho en el antecedentes.
De este modo, • Si no hay datos sobre lo que se sabe que son los atributos relevantes de res-
puesta de las unidades con 'c' y las unidades con 't', incluidas las que explican por qué una unidad
tiene 'c' y otra 't', o si la función que vincula la respuesta a todos los atributos relevantes para la
respuesta no es conocida, debe juzgarse que existe confusión.
Si bien algunas de las dificultades a las que se enfrenta el enfoque de "corrección por análisis"
tal vez podrían ser superado si tuviéramos datos mucho más ricos y un conocimiento mucho
mejor del requisito funcional relaciones, algunos obstáculos parecen insuperables. Los obstácu-
los aparentemente insuperables son dos. En primer lugar, en el contexto de la seguridad vial
siempre será difícil argumentar que el juicio de profesionales para implementar 't' o 'c' no fue
influenciado por la historia pasada de choques o casi accidentes, por consideraciones basadas
en una familiaridad con el sitio y sus circunstancias que no se puede ver en los datos, o por algún
atributo relevante de respuesta ahora irreconocible. los La segunda dificultad aparentemente in-
superable es que para generar confianza en la 'corrección por enfoque de análisis uno tendría
que proporcionar evidencia empírica de que la corrección es aproximadamente correcta. Esto
implica que uno tendría que encontrar unidades que realmente deberían ser equipado con 't' pero
permaneció equipado con 'c' por algún capricho del destino que es completamente sin relación
con ningún posible atributo relevante para la respuesta. No puedo pensar en tales experimentos
naturales.
Por lo tanto, no puedo ver una manera de verificar empíricamente que la 'corrección' está cerca
de lo que debería ser.
Queda por preguntar si se pueden igualar los atributos usando regresiones paramétricas.
Suponga que uno usará los datos sobre fallas y atributos para estimar dos regresiones modelos,
uno para unidades con 'c' y otro para unidades con 't'. Una vez hecho esto, se podría: a.
especificar un conjunto de valores de atributos comunes → b. calcule los choques/año previstos
para las unidades con 'c' y de unidades con 't' usando los valores de atributos comunes → c.
comparar las dos predicciones y por lo tanto → d. estimar el efecto de seguridad de reemplazar
'c' por 't' para una unidad con el especificado valores de atributos comunes. Llamaré a esto el
enfoque de 'ecualización por regresión'. La pregunta es cuáles son las fortalezas y limitaciones
de usar el enfoque de igualación por regresión para eliminar el sesgo de confusión cuando se
hace uso de datos transversales observacionales? Noté que para corregir las diferencias en los
atributos relacionados con la respuesta entre las unidades con 'c' y unidades con 't' uno tiene que
saber qué cambio en la respuesta es causado por un cambio en el atributo. En En general, la
relación funcional necesaria se basa en el acervo de hallazgos de investigación acumulados.
tiempo extraordinario. Cuando se utiliza el enfoque de ecualización por regresión, se supone que
el La relación funcional requerida es el propio modelo de regresión: el resultado de ajustar una
ecuación a los datos de las unidades del grupo. El atractivo de este enfoque es que uno no
necesita buscar, dominar y evaluar la investigación acumulada existente para establecer lo que
se sabe; que el modelo estimado proporciona la función necesaria a la manera de 'deus ex ma-
china'. Desafortunadamente, esta forma automática por la cual una regresión proporciona las
relaciones funcionales necesarias es también una fuente de gran debilidad. Al confiar exclusiva-
mente en la forma funcional y estimada parámetros del modelo de regresión que se ajustó al
conjunto de datos específico en cuestión, uno es esencialmente sin tener en cuenta todo lo que
se sabe de investigaciones previas sobre tales relaciones. es como si no existía conocimiento
además de lo que afirma el modelo de regresión actual y como si uno pudiera ser seguro de que
todo lo que afirma el modelo actual está lo suficientemente cerca de la verdad, incluso si va
contra lo que otros encuentran o lo que comúnmente se conoce. En la ciencia, el conocimiento
es una cuestión de 89 acumulación, y la clave de la confianza en alguna afirmación sobre la
realidad es la consistencia con que se puede obtener. La experiencia con modelos de regresión
en seguridad vial nos dice que diferentes los investigadores tienden a encontrar diferentes fun-
ciones para las mismas variables. Por lo tanto uno no puede ser seguro de que cualquier modelo
de regresión estimado específico representa de forma fiable la función causal necesarios para
lograr la igualación de atributos.
Dije antes que para corregir la confusión uno debe tener datos sobre lo que se sabe que es
atributos relevantes para la respuesta de las unidades en 'c' y unidades con 't'. Lo mismo es cierto
para el enfoque de igualación por regresión. En la medida en que sabemos de la existencia de
algunos atributo relevante para la respuesta que no se utiliza en la ecuación de regresión, su
omisión será un fuente de confusión tal como lo es cuando se utiliza el enfoque general de "co-
rrección por análisis".
De manera similar, se debe suponer que cuando se usa el enfoque de 'ecualización por regre-
sión', hay puede haber algunos atributos relevantes para la respuesta que ni siquiera conocemos.
Destacados son los oscuras razones para aplicar 'c' a algunas unidades y 't' a otras unidades.
Así como en general 'ecualización por análisis' esta fuente de confusión no puede eliminarse de
la observación estudios transversales por el enfoque de 'ecualización por regresión'. En suma, •
El atractivo del enfoque de 'ecualización por regresión' es la conveniencia. las variables en el
modelo se supone que son los atributos relevantes para la respuesta; la ecuación del modelo es
se supone que es la función que vincula los atributos a la respuesta.
• Las desventajas del enfoque de 'ecualización por regresión' son que las variables de No se
puede suponer que el modelo incluya todas las principales variables relevantes para la respuesta
y que la ecuación del modelo, cuando no se basa en el conocimiento acumulado, no puede asu-
mirse ser la mejor función que vincula los atributos con la respuesta.
El último tema discutido en la Sección 3 fue el de la consistencia. En la cuenta final, el La justifi-
cación de la causalidad se basa en una acumulación de confianza y de convicción justificable
que es basado en una consistencia de los hallazgos a medida que se acumulan los estudios. Por
lo tanto, una de las consideraciones clave en el examen de la causalidad y el efecto del trata-
miento no es la defensa de las conclusiones extraídos en un solo estudio de un conjunto de datos
específico, sino más bien el examen de la consistencia de los hallazgos obtenidos en todos los
estudios del mismo tratamiento.
La consistencia de los hallazgos es una condición necesaria (pero no suficiente). Es decir, si los
hallazgos por estudios separados del mismo tratamiento difieren ampliamente se puede afirmar
que ninguna creencia de causalidad puede ser justamente entretenido. Sin embargo, incluso si
los hallazgos de diferentes estudios son consistentes, aun así, todos pueden estar igualmente
confundidos. Sin embargo, cuando los resultados son consistentes es al menos posible que el
juicio de causalidad pueda ser justificado.
El requisito de que los hallazgos sean consistentes no significa que se deba esperar que mismo
efecto promedio del tratamiento en dos estudios de antes y después del mismo tratamiento. solo
significa que cuando se aplica un tratamiento a unidades con atributos idénticos, el efecto debe
ser el mismo.
Porque, si no fuera así, no habría motivos para esperar cuál podría ser el efecto de un trata-
miento.
De ello se deduce que para examinar los hallazgos de dos estudios de antes y después en busca
de consistencia, uno debe muestran que las unidades en ambos estudios tenían atributos muy
similares, o uno debe saber cómo el tratamiento El efecto depende de los atributos de las unida-
des en cada estudio y explica las diferencias. Este tiene tres implicaciones importantes para la
realización de estudios de antes y después.
90 • Primero, uno debe tomar nota de los atributos relevantes para la respuesta de las unidades
tratadas.
• En segundo lugar, se debe tomar nota de las estimaciones del efecto para cada grupo de uni-
dades con similar atributos relacionados con la respuesta (y solo entonces determinar el 'efecto
promedio del tratamiento').
• En tercer lugar, se deben investigar las estimaciones del efecto de dependencia funcional sobre
la respuesta relevante.
atributos Por las razones ya mencionadas, no se puede decir fácilmente si el tratamiento prome-
dio el hallazgo del efecto de un estudio de antes y después es consistente con los hallazgos de
un estudio transversal.
Sin embargo, ¿se conocían los atributos de las unidades en el estudio antes-después y los mis-
mos atributos se utilizaron en el modelo de un estudio transversal la consistencia de los resulta-
dos obtenidos en los dos tipos de estudio podrían ser examinados. Finalmente, cuando los ha-
llazgos de dos estudios transversales son examinados para verificar su consistencia, particular-
mente aquellos basados en el enfoque de igualación por regresión, la consistencia se puede
examinar con bastante facilidad. Todo lo que hay que hacer es comprobar si para circunstancias
similares los dos estudios predicen efectos similares.
En suma, el conocimiento de causa y efecto es esencial para una acción eficiente. Progreso
hacia tal conocimiento es posible si se cumplen al menos dos condiciones: una. Los juicios de
causa y efecto pueden respaldarse en cada estudio del efecto de un tratamiento y, b. A medida
que se acumulan los estudios, se encuentra que sus hallazgos son consistentes.
Sección 4.
En esta sección examiné una serie de episodios importantes en los que los datos transversales
se utilizaron para llegar a conclusiones causales.
El primer episodio comienza con un artículo de Peltzman. Su punto de partida fue económico.
teoría: la suposición de que las personas se comportan para equilibrar los costos y beneficios
percibidos. Esto llevó él postulara que el beneficio de tener vehículos más seguros sería parcial
o totalmente compensado por comportamiento de mayor riesgo ('compensación'). El siguiente
paso fue reunir datos para probar este postulado. Los datos son siempre desordenado. Como no
hay estadísticas sobre cómo se comporta la gente, tuvo que usar una variedad de sustitutos
agregados; consumo de alcohol en todo el estado, velocidad promedio fuera de las horas pico
en carreteras no interestatales carreteras, etc. Tampoco fue posible escribir fácilmente un con-
junto de ecuaciones simultáneas en el espíritu de tradición econométrica, ecuaciones sobre, di-
gamos, cómo el aumento de los ingresos afecta la cantidad de viajes, consumo de alcohol o
speed; qué cantidad del viaje adicional se refleja en el uso de diferentes carreteras; cómo la
velocidad es una función del tipo de camino y la cantidad de viaje, etc. Por lo tanto, sin ningún
razón obvia, Peltzman escribió una función multiplicativa de todas las variables que pensó podría
ser importante y para el cual se podrían encontrar datos, y procedió a estimar la incógnita pará-
metros ¿Por qué debería ser posible captar la esencia de lo que es un fenómeno complejo tal
procedimiento? Para una mente no instruida en la práctica econométrica, la priorización de las
perspectivas de el éxito parecería mínimo. De hecho, las propias estimaciones de parámetros de
Pelzman resultaron ser a menudo inconsistente y a veces peculiar. Cuando otros investigadores
investigaron la misma pregunta, utilizando datos y procedimientos similares llegaron a conclusio-
nes diversas. Y, sin embargo, había una incuestionable creencia de todos que las ecuaciones de
regresión de este tipo pueden interpretarse en un modo de causa-efecto como un cosa normal;
que los matices de los coeficientes de regresión pueden y deben asignarse a algunos mecanismo
de causa y efecto; que es suficiente que estos mecanismos sean ampliamente plausibles en a la
luz de las suposiciones que los economistas tienden a hacer, sin tener que ser separadamente
91 corroborado; que no es necesario considerar explicaciones plausibles alternativas y las rela-
ciones correspondientes no necesitan estar representadas en el modelo. Esta fe en el poder de
regresión no sólo para desarrollar una teoría cuando es correcta, sino también, hasta cierto
punto, para corroborar que la corrección de la teoría misma fue sostenida por todos a pesar del
hecho de que cada participante sabía que otros, utilizando la misma técnica, llegaron a diferentes
conclusiones sobre el mismo pregunta y que muchos de sus coeficientes de regresión no eran
consistentes con lo que otros tenían fundar. Tal fe y hábito no es lo que contribuye al progreso
de la ciencia.
El argumento y el contraargumento dieron lugar a las siguientes observaciones: 1. Es difícil com-
probar los datos preparados para su uso en el análisis de regresión por otra persona.
Por lo tanto, • Los resultados obtenidos por las regresiones rara vez (¿nunca?) se replican o
verifican.
Los autores tienden a recopilar sus propios datos y hay una prima en mostrar dónde se hizo una
mejora en lo que otros han hecho y en el uso de avances recientes en estadística metodología.
Por lo tanto, • Cada nuevo estudio tiende a diferir de estudios previos en detalles importantes
(variables utilizadas, forma funcional elegida, estructura de error asumida, etc.). Esto dificulta la
comparación.
Las mismas razones (búsqueda de originalidad y avances estadísticos recientes) facilitan a los
autores creer en sus propios hallazgos y descartar los hallazgos de otros.
• En un entorno de investigación en el que ni los datos ni el método se comparan fácilmente, los
resultados no son compatibles y no se pueden acumular, el progreso será lento.
2. Hay dos prototipos de modelos de regresión. Tipo A en el que la causalidad preexiste dentro
la teoría asumida, como en Peltzman. La teoría especifica cuáles son las variables que provocan
el cambio.
y en qué dirección cambiará la variable dependiente como resultado de una manipulación. los La
cuestión no es de causa sino de la magnitud del efecto. El modelado tipo B se ejemplifica me-
diante el trabajo de Lave y Noland y todos los modelos a nivel de unidad en seguridad vial. Aquí
uno no se fía en una teoría preexistente. Si bien uno puede anticipar la dirección en la que la
explicación variable afectará a la variable dependiente, no se puede recurrir a una teoría rígida.
los ecuación de regresión estimada, que produce resultados esperados y sorprendentes, a me-
nudo se considera ser una representación de una realidad hasta ahora menos conocida; una
indicación de una posible causa y- estructura de efecto descubierta por medios que son de na-
turaleza estadística.
Si la teoría detrás del modelo de regresión tipo A fuera correcta, uno se sentiría atraído por usarla.
cuando sea posible. El peligro es que si la teoría es débil, incompleta o incorrecta, entonces la
investigación se dirigirá en direcciones demasiado estrechas y hacia resultados que son, quizás,
falaz, incluso tonto. Las anteojeras de una supuesta teoría pueden ocultar al investigador la ver-
dadera mundo que se refleja en los datos y puede impedir que la realidad brille, que sea revelado
y descubierto.
• Cuando la teoría es débil, incompleta o posiblemente incorrecta, podría ser más rentable cen-
trarse en el modelado de tipo B, lo que permite que los datos guíen el descubrimiento.
92 Por otra parte, la ausencia de teoría que defina el enfoque B, lo priva de una clara criterio por
el cual se puede hacer una atribución a la causa. Lo que uno ve son coeficientes de regresión.
algunos de los cuales pueden estar de acuerdo con la intuición o la comprensión previa y otros
que no. A coeficiente de regresión con un signo inesperado se puede explicar fácilmente como
que no refleja un causa sino una variable al acecho, una interacción descuidada, algunos datos
no disponibles, etc. Y aquí está la frotar: • Si uno debe dudar del significado de causa-efecto de
un coeficiente de regresión inesperado, uno igualmente debe dudar del mensaje causal de un
coeficiente de regresión con un signo esperado y por tanto de toda la empresa.
3. Para que la explicación y la comprensión sean posibles, se debe insistir en un principio simple.
Eso requiere que • Cuando se aplica el mismo tipo de método al mismo tipo de datos, se debe
llegar a conclusiones similares.
Si esta condición no se cumple, si algunos pueden afirmar que sus datos muestran que un metal
se expande cuando calienta mientras que otros pueden mantener que sus datos muestran que
se encoge, entonces hay algo mal con los datos y/o el método.
En conclusión, la saga de la “Reglamento de Seguridad Automovilística” es una historia de inten-
tos sucesivos en el modelado econométrico multivariable de varios investigadores que no logra-
ron responder la cuestión de qué reducción en las muertes de tráfico fue causada por la regula-
ción de la seguridad del automóvil.
La investigación no condujo a un consenso sobre la existencia y la magnitud del 'comportamiento
compensatorio'; y no arrojó ecuaciones que permitan predecir qué cambio en las muertes se
producirá por un cambio en variables como Velocidad, Alcohol, Ingresos, etc. Es como si algunos
encontraran ese metal se expande cuando se calienta, mientras que otros llegaron a la conclu-
sión de que se encoge, y todo el lío experimental se quedó en el piso del laboratorio, con todos
publicando y creyendo sus propios resultados, y nadie pregunta si las medidas y el método utili-
zado por todos son buenos.
El segundo episodio comienza con un estudio de Lave , quien también lanzó un desafío para
recibir sabiduría al afirmar que "la variación no mata la velocidad". Según el signo y la magnitud
de su coeficientes de regresión, Lave argumentó que si uno reduce la velocidad promedio sin
reducir la dispersión de velocidades, puede no haber reducción en la tasa de accidentes fatales.
De nuevo un animado siguió el debate. Cada comentarista usó sus propios datos para sacar sus
propias conclusiones, generalmente negando lo que Lave ha encontrado. Pero Lave se mantuvo
recalcitrante diciendo (con razón) que los resultados por otros están equivocados, siendo un
artefacto de agregación sobre diversas categorías viales. Agregación los artefactos y sesgos son
ampliamente conocidos y descritos. Se puede demostrar que el propio Lave Las conclusiones
están sujetas a la misma crítica con la que desacredita los hallazgos de otros. Está por lo tanto,
es justo señalar que • La posibilidad de llegar a conclusiones erróneas suele estar presente en
las prácticas no experimentales.
trabajo, especialmente cuando los datos se agregan sobre una población de unidades en pro-
medios, ocultando así el efecto de variables importantes.
93 En este episodio, todos los autores utilizaron datos transversales agregados en regresión
lineal multivariable.
Llegaron a diversas conclusiones. Como se señaló anteriormente, sería un buen augurio para la
causalidad si diferentes investigadores llegaron a conclusiones similares; Por el contrario • No se
puede considerar una afirmación de causalidad si los resultados de diferentes estudios sobre el
mismo problema están por todas partes.
A pesar de la obvia diversidad de hallazgos, cada uno de ellos hizo afirmaciones que son de
naturaleza causal.
los regresores.
Como en el episodio de Peltzman, la facilidad con la que los regresores atribuyen significado de
causa-efecto a sus resultados es asombroso. También es desconcertante la tendencia a tener
confianza en el propio resultado.
incluso si difiere de lo que otros encontraron usando medios similares. A pesar del evidente fra-
caso de regresiones sucesivas para discernir lo que es correcto y lo que no, parece posible con-
siderar resultados de la regresión como árbitro de la verdad incluso si, como en el caso de la
velocidad y las lesiones, parecen volar en contra de la física newtoniana.
En el tercer episodio revisado , Noland desafió la sabiduría recibida de que los caminos se cons-
truyen para los estándares más altos son más seguros. Él también usó regresiones basadas en
datos agregados para presentar su caso.
A diferencia de las afirmaciones de Peltzman y Lave, que fueron debatidas públicamente por
otros, las afirmaciones de Noland no fueron seguidos por una discusión abierta. Por lo tanto, el
mérito de su argumento tenía que ser examinado a la luz de su propio trabajo.
Usando datos para los estados de EE. UU., Noland encuentra, por ejemplo, que la variable 'carril-
millas' generalmente tiene un coeficiente de regresión positivo. Sobre esta base, extrae la con-
clusión causal de que “estos resultados tienden a sugerir que las millas de carril adicionales en
realidad aumentan las muertes”. Él sigue esta lógica.
Saltar por otro acto de fe diciendo que " la variable carril-milla sirve como un proxy para repre-
sentar estas 'mejoras' en el diseño vial”. De esta manera, por la sola fuerza de voluntad, la esta-
dística asociación entre carril-millas y muertes que existe en sus datos se transforma en la con-
clusión causal de que la acción de construir caminos mejorados no reduce e incluso puede au-
mentar las muertes.
La pregunta que debemos hacernos es ¿por qué los estados con más millas de carril tienden a
tener más muertes? Georgia es casi diez veces más grande que Nueva Jersey, tiene tres veces
más millas de carril y el doble tantas muertes, pero ambos tienen aproximadamente la misma
población. De dos estados con la misma población pero diferente en tamaño, el estado más
grande tenderá a tener caminos más largos y también más muertes Pero el tamaño del estado
no entraba en la ecuación de Noland. Tampoco el grado de urbanización, patrones de uso de la
tierra, o muchas otras variables que pueden estar en la raíz de la asociación. Fuera de todo las
posibles razones de la asociación entre lane-miles y fatalities Noland selecciona el que él lo
favorece y lo imbuye de un significado causal que conduce a conclusiones políticas.
Noland también ve en sus datos una asociación positiva entre el número de carreteras de varios
carriles en un condado y el número de accidentes. Sobre esta base “ cuestiona la política de
aumentar muchos carreteras de dos carriles a carreteras de cuatro carriles por razones de segu-
ridad” . La razón por la que un condado tiene más carreteras de varios carriles que otra es que
sus carreteras necesitan transportar más tráfico. Naturalmente, con más tráfico vienen más ac-
cidentes. Dado que la cantidad de tráfico en un condado no está entre los variables utilizadas en
la regresión de Noland, no hay forma de saber cuánto de la asociación se debe 94 al tráfico y
cuánto debido a otras variables (como el número de carriles). Esto es de nuevo un clásico.
instancia de una variable al acecho; causa se asigna incorrectamente a una variable que es
visible y no a la verdadera causa acecha en el fondo.
Una vez más sorprende la insoportable ligereza con que se establece una asociación estadística.
convertidos en creencias causales y recomendaciones de política; por el vaivén misterioso que
resultado de un análisis de regresión tiene sobre la mente.
Señalé anteriormente que si diferentes estudios encuentran que los coeficientes de regresión del
mismo variables están en todo el mapa, no se les debe atribuir un significado de causa-efecto.
los circunstancia aquí es que no nos ocupamos de varios estudios realizados por diferentes in-
vestigadores que utilizan datos diferentes; tenemos un estudio en el que se utilizó la misma base
de datos en varios modelos.
Noland basa su conclusión causal en cinco coeficientes de regresión para la variable carril-milla
(0,36, 0,38, 0,43, -0,29 y -0,40) de cinco regresiones. Las estimaciones difieren porque en su
regresiones, la variable del cinturón de seguridad se representó de forma variable, las variables
representan los avances en medicina se incluyeron en algunos modelos pero no en otros, y por-
que a veces catorce años de Se utilizaron datos y, a veces, siete. Si el valor de un coeficiente de
regresión cambia sustancialmente a medida que se agregan nuevas variables a un modelo, esto
es una señal de que el modelo no contenía todas las factores importantes que afectan el fenó-
meno en cuestión. Si es así, uno no puede tener confianza en el valor numérico de tal coeficiente
de regresión y no se le puede atribuir ningún significado. Un mínimo El requisito es que a medida
que se agregan variables a un modelo, el cambio en las estimaciones previas coeficientes de
regresión es pequeño. De este modo, • Si un coeficiente de regresión no alcanza lo que puede
llamarse 'estabilidad bajo condiciones variables Además, la atribución de significado causal es
prematura.
Los coeficientes de regresión de Noland para carriles-millas en el modelo de accidentes fatales
claramente no alcanzaron tal estabilidad.
Noland destaca el punto importante de que el efecto de las mejoras de infraestructura en la se-
guridad debe buscarse a nivel de todo el sistema; que las conclusiones obtenidas de proyecto
por proyecto o sitio por- las evaluaciones de seguridad del sitio pueden (y lo hacen) inducir a
error. La pregunta general es ¿por qué medios se puede investigar los efectos causales de las
intervenciones en todo el sistema y a largo plazo. La pregunta específica aquí es si se puede
hacer usando datos de panel de corte transversal para estimar los coeficientes de regresión de
una sola ecuación modelo.
Para responder a la pregunta general hay que reconocer que las mejoras viales provocarán cam-
bios en cuándo, dónde, con qué frecuencia, por qué modo o rutas viaja la gente. Transportación
los planificadores tienen un elaborado arsenal de herramientas para predecir tales cambios en
los viajes en todo el sistema. La seguridad los analistas saben cómo cambia la seguridad de una
carretera o intersección a medida que cambia el tráfico. Por lo tanto, la kit de herramientas del
planificador y del analista de seguridad, cuando se utiliza en tándem, tal vez puede producir
estimaciones de cambios en todo el sistema que reflejan cambios en la población, el uso de la
tierra, la realización de viajes y red de transporte y su funcionamiento. Estas son las relaciones
estructurales que necesitan representarse en un modelo si se espera vincular la causa y el efecto
a nivel de todo el sistema.
Para responder a la pregunta específica, debería ser obvio que uno no puede esperar capturar
el complejidades antes mencionadas por una ecuación comodín, una ecuación la forma mate-
mática de que se elige sin fundamento y en el que solo se representan variables fácilmente dis-
ponibles.
95 Peltzman, Lave, sus comentaristas y Noland utilizan como datos promedios o totales para
grandes conjuntos como un país, un estado o un condado. Estos son 'nivel de población' o Es-
tudios "ecológicos". Los sesgos potenciales en los estudios ecológicos son bien conocidos. de-
bido a la gran potencial de sesgo y error en tales estudios se ha acuñado la frase falacia ecológica
y se utiliza en los libros de texto. La preocupación clave es que lo que parece cierto para el grupo
(la 'población') puede no ser cierto para las unidades individuales de las que se compone el
grupo. Así, por ejemplo, cuando Los comentaristas de Lave agregaron los datos de todas las
clases de caminos en lugar de examinar el accidente de velocidad.
relación por separado para cada clase de camino funcional (como hizo Lave) alcanzaron conclu-
siones potencialmente incorrectas.
Una ilustración dramática del sesgo de agregación es la llamada paradoja de Simpson de que
se da un ejemplo real de seguridad vial en la Sección 4. Mientras que las franjas sonoras de la
línea central se vieron para reducir los accidentes en cada estado, parecían aumentar los acci-
dentes cuando el total de todos los estados era consideró. Este sorprendente pero completa-
mente correcto resultado no tiene nada que ver con confundir, variables faltantes, elección inade-
cuada de la forma funcional y otras fuentes comunes de sesgo. Está sólo el resultado (y por lo
tanto uno de los peligros) de la agregación.
Peltzman, Lave, sus comentaristas y Noland llegaron a conclusiones causales utilizando regre-
siones sobre datos agregados.
• Por las muchas razones discutidas, uno debe dudar de la validez de las conclusiones causales.
alcanzado por Peltzman, Lave, sus comentaristas y Noland. De hecho, en estos históricos epi-
sodios uno no puede encontrar apoyo para la posibilidad de que tales datos y métodos puedan
ser utilizado de forma fiable para apoyar las creencias causales.
Esto no significa que las regresiones que utilizan datos agregados no sean de utilidad.
• Estudios de regresión de seguridad vial en los que la respuesta y las variables independientes
son Los totales o promedios de conjuntos de unidades grandes y no homogéneos pueden ser
útiles para estimular la investigación de conjeturas no examinadas hasta ahora o para generar
hipótesis sobre posibles efectos imprevistos. Sin embargo, los hallazgos de tales estudios por sí
solos no son base suficiente para los juicios de causa y efecto.
¿Pueden los estudios de regresión a nivel de unidad tener éxito cuando los estudios de re-
gresión a nivel de población, estando sujetos a las dificultades de la agregación, han fallado?
Para examinar los resultados de esta pregunta Se examinaron varios estudios que utilizan datos
sobre segmentos de carretera homogéneos. Uno de esos estudios fue de Vogt y Bared. A partir
de su análisis de regresión parecía, por ejemplo, que por lo demás idénticas caminos, los cami-
nos con carriles más anchos tendían a tener menos accidentes en Minnesota pero más acciden-
tes en Washington (ver Figura 19). Si alguien interpretara esto como una indicación de causa y
efecto, sería significaría que se espera que ampliar un carril reduzca la frecuencia de accidentes
en Minnesota, pero aumentarlo en Washington.
Esta anomalía puede tener varias causas: a. Precisión de estimación limitada; b. Un funcional
forma de la ecuación de regresión que no se ajusta a los datos; C. Una variable que se sabe que
falta (si el arcén estaba pavimentado o no); d. La posibilidad de una diferencia real en el efecto
de ancho de carril entre Washington y Minnesota; mi. O, como siempre es cierto, inexplicable,
por razones 96 por qué algunos caminos tienen carriles de diez pies y otros tienen carriles de
once o doce pies. volví a analizar los mismos mismos datos utilizando diferentes suposiciones
de modelado y el resultado también se muestra en Figura 19.
Figura 19. Comparación de resultados de V&B y Hauer La impresión es que los hallazgos no
son lo suficientemente consistentes y no permiten anticipar cómo podría cambiar la seguridad
como resultado de un cambio en el ancho del carril. vendría el tema descansar aquí si no fuera
por los hallazgos de modelos de regresión adicionales (por Zegeer y por Hadi) que coinciden
virtualmente con la línea 'V&B Combined' en la Figura 19. Parece entonces que, en este caso, •
Hay un núcleo de congruencia entre los varios hallazgos y también una diversidad sustancial.
Los modelos de regresión a nivel de unidad para carreteras de varios carriles son escasos. Por
lo tanto uno no puede comparar los hallazgos de muchos modelos y evaluar la consistencia de
los resultados. Sin embargo, todavía es posible examinar los hallazgos del mismo modelo a la
luz de lo que se sabe o se espera.
Hauer et al. usó datos sobre segmentos de carreteras urbanas de cuatro carriles sin dividir en
Washington. Alguno los hallazgos fueron los esperados, mientras que otros fueron sorprenden-
tes. Así, por ejemplo, inesperado es el hallazgo de que los accidentes disminuyen a medida que
aumenta la proporción de camiones en el flujo de tráfico. Igualmente sorprendente es el resultado
es que cuanto más alto es el límite de velocidad, menos son los accidentes. Si alguien atribuyera
esto a causa y efecto, se llegaría a la conclusión de que, en este tipo de carretera, aumentar la
velocidad límite en el rango de 30 a 50 mph reducirá los accidentes.
Cuando un hallazgo no está de acuerdo con las expectativas, nos inclinamos a buscar causas y
explicaciones fuera de la regresión, pero están felices de aceptar sin cuestionar lo que está en
línea con nuestras creencias anteriores. No se debe permitir que esta predisposición psicológica
oscurezca juicio. Claramente, uno no puede considerar los hallazgos que están de acuerdo con
las expectativas como capturando un relación causal y, al mismo tiempo, considerar los hallazgos
inesperados como no causales.
La pregunta es esta: ¿Cuál de los muchos resultados obtenidos en una regresión refleja una
causa-efecto? relación, y que reflejan meramente una asociación estadística cuyas razones pue-
den ser ¿complejo? Esta pregunta no está siendo abordada por ninguna de las investigaciones
de seguridad financiadas en curso.
97 programas Y, sin embargo, si no se resuelve, gran parte de la investigación actualmente fi-
nanciada por la FHWA y NCHRP está en peligro de producir resultados inutilizables y potencial-
mente dañinos.
De momento mi opinión es esta: • Es posible que la estructura subyacente de causa-efecto de la
ocurrencia del accidente fenómeno podría ser revelado a través de análisis de regresión a nivel
de unidad de sección transversal datos. Para lograr este objetivo, es necesario eliminar las prin-
cipales fuentes de diversidad inexplicable.
Si bien uno puede esperar que a través de futuras investigaciones cuidadosas, creativas y per-
sistentes esto podría hacerse eventualmente, el historial discutido en esta sección y el concepto
Las dificultades discutidas en la sección 3 no dan mucho lugar para el optimismo.
El objetivo declarado del proyecto Vogt y Bared era estimar el accidente esperado frecuencia de
un segmento de carretera en función de sus atributos. Aun así, los autores pensaron que la El
modelo se puede utilizar para determinar cuántos accidentes se evitarán si se utilizan atributos
como el carril.
o el ancho de los hombros se cambian. Al hacerlo, siguen los pasos de muchos. De hecho, el La
práctica de usar los resultados de la regresión para calcular los 'Factores de reducción de acci-
dentes' es casi universal. Y, sin embargo, existe la antigua y elemental advertencia estadística
de que "la correlación es no causalidad', existe el escepticismo científico generalizado acerca de
la interpretación de la regresión ecuaciones como indicaciones de causa y efecto, existen todas
las dificultades enumeradas en la Sección 3, y existe la amplia evidencia empírica apoyada por
los muchos ejemplos revisados en meticuloso detalle en la Sección 4, a saber, que la cautela
estadística está bien fundada y el escepticismo científico justificado. Y, sin embargo, la tradición
econométrica en la investigación de la seguridad vial es incuestionable.
disponibilidad para usar los resultados de regresiones basadas en datos transversales para pre-
decir el efecto de manipulaciones. es mi opinion que • Los datos mejorados a nivel de unidad y
la práctica de modelado podrían reducir la diversidad no explicada de los hallazgos aumentan
así la confianza en algunas interpretaciones de causa-efecto. Sin embargo, en presente, la su-
posición habitual e incuestionable de que las ecuaciones obtenidas por regresión son máquinas
matemáticas que se pueden utilizar para calcular el efecto de las manipulaciones no es justifica-
ble.
Esto completa el resumen de los principales temas discutidos en las Secciones 1 a 4 y establece
el escenario para extraer algunas conclusiones generales.
98 6. CONCLUSIONES La pregunta era si uno puede llegar a creencias causa-efecto justifica-
bles sobre la base de datos observacionales de sección transversal, en particular cuando la he-
rramienta de análisis elegida es multivariable regresión.
La experiencia pasada indica una persistente falta de éxito. Los fracasos de los esfuerzos pasa-
dos y sus raíces fueron ilustradas por la historia de varias investigaciones que utilizaron la regre-
sión para dibujar conclusiones acerca de la causa y su efecto. El tema de estos episodios histó-
ricos fue diverso: Estimar el efecto de seguridad de cambiar el dispositivo de advertencia en los
pasos a nivel de una vía férrea; Preguntar sobre el efecto de seguridad de las normas de segu-
ridad del automóvil; examinando al familiar importancia de la velocidad y su variación en la cau-
salidad de accidentes; Preguntar si las mejoras viales reducir los choques; Investigar el efecto
del ancho del carril en la frecuencia de accidentes; Modelando la seguridad de carreteras de
varios carriles. Resultó que cuando diferentes investigadores examinaron la misma pregunta por
con el mismo tipo de datos y método, se llegó a conclusiones diversas, incluso contradictorias.
los la magnitud y el signo de los coeficientes de regresión fue inconsistente entre los estudios y,
a menudo, incluso entre modelos usando los mismos datos. Los resultados en línea con las
expectativas fueron aceptados como válidos y los contrarios a las expectativas explicados. Mi
conclusión principal es que: • La consistencia de los resultados (efectos) es una piedra de toque
importante para la causalidad. Si las regresiones basados en datos transversales
observacionales no producen resultados consistentes, ya que actualmente, no se puede decir
que capten una relación causal. Si uno no puede decir si se ha capturado una relación causal,
los modelos de regresión no se pueden utilizar para predecir el efecto de seguridad de un cambio.
La fuente de la dificultad es esta: cuando algo sobre una unidad ha cambiado, si hay fue una
intervención o algún tratamiento (como en un estudio antes-después), entonces uno puede usar
varios significa predecir cuál habría sido la respuesta de esa unidad si no hubiera habido ningún
cambio.
Se puede verificar empíricamente si la predicción es generalmente buena y cuándo para las
unidades en las que un Se solicitó un cambio similar, pero aún no se implementó. Así, para la
observación antes-después estudios es posible proporcionar una base empírica aceptable para
las creencias de causa-efecto. En estudios que utilizan datos transversales no hay cambio, tra-
tamiento o intervención; la comparación es entre unidades que tienen el atributo 'c' y otras uni-
dades que tienen el atributo 't'. ahora uno tiene para mostrar que las unidades que tienen 'c'
habrían respondido a 't' de la misma manera que las unidades se encontró que 't' lo hizo. Esto
es difícil de hacer porque la razón habitual por la que una unidad tiene 'c' y otro tiene 't' es que
difieren en atributos relevantes para la respuesta. No puedo pensar en un empírico forma de
demostrar lo que hay que mostrar.
Puede ser posible corregir los factores de confusión en los estudios que utilizan secciones trans-
versales observacionales.
datos. Para calcular la corrección se requiere el conocimiento de los atributos relevantes para la
respuesta de todos unidades y el conocimiento de cómo la respuesta de cada unidad depende
de estos atributos. Resulta que: • Si no hay datos sobre cuáles son los atributos de las unidades
que se sabe que son relevantes para la respuesta con 'c' y las unidades con 't', incluidos los
atributos que explican por qué una unidad tiene 'c' y otra 't', o si la función que vincula la respuesta
a todos los atributos relevantes para la respuesta es no conocida, debe juzgarse que existe con-
fusión.
99 También se puede intentar corregir la confusión comparando un modelo de regresión para
unidades con 'c' y otro para unidades con 't'.
• El atractivo de este enfoque es la conveniencia. Se supone que las variables en el modelo ser
los atributos relevantes para la respuesta; se supone que la ecuación del modelo es la función
vinculación de atributos a la respuesta. Las desventajas de este enfoque son que el No se puede
suponer que las variables del modelo de regresión implican todos los principales o incluso atri-
butos conocidos relevantes para la respuesta y que la ecuación del modelo, cuando no se basa
en conocimiento acumulado por la investigación, no puede asumirse como la mejor función que
vincula atributos a la respuesta.
Existe una distinción importante entre los estudios a nivel de población y a nivel de unidad. En
los datos de estudios a nivel de población son 'totales' y 'promedios' que son agregados sobre
conjuntos de muchas unidades (p. ej., países, estados, condados); en los estudios a nivel de
unidad, los datos son para unidades individuales (por ejemplo, un conductor, una intersección,
un segmento de carretera). Además de las dificultades que aquejan a todos regresiones en datos
transversales de observación, los estudios a nivel de población están sujetos a una problema
adicional: cuando la agregación es sobre unidades que difieren en atributos relevantes para la
respuesta, el La respuesta 'total' o 'promedio' puede diferir, incluso ser opuesta, a las respuestas
de individuos unidades.
• Peltzman, Lave, sus comentaristas y Noland utilizaron datos agregados a nivel de población
datos. En estos episodios históricos no se encuentra apoyo para la posibilidad de que tales datos
y los métodos se pueden usar de manera confiable para respaldar las creencias causales.
• Vogt, Bared, Hauer, Zegeer, Hadi y muchos otros llevaron a cabo regresiones en cruz datos de
sección a nivel de unidad. A menudo hay un núcleo de congruencia entre varios hallazgos y
también una diversidad sustancial. Es posible que la estructura causa-efecto subyacente de el
fenómeno de ocurrencia de accidentes podría ser revelado a través de una regresión a nivel de
unidad análisis de datos transversales observacionales. Para lograr este objetivo, las principales
fuentes de la diversidad actualmente inexplicable necesita ser eliminada. La señal del éxito será
si el futuro los estudios arrojarán resultados similares. Si bien uno puede esperar que a través
de cuidadosos, creativos y investigación futura persistente esto podría lograrse, el historial dis-
cutido y el Las dificultades conceptuales revisadas no me dan mucho terreno para el optimismo.
• En la actualidad, la suposición incuestionable que se hace habitualmente de que las ecuaciones
obtenidas por Las regresiones en datos transversales observacionales son máquinas matemáti-
cas que pueden ser utilizado para calcular el efecto de las manipulaciones no es justificable.
Todo esto no debe interpretarse en el sentido de que las regresiones sobre datos transversales
observacionales no sirven de nada; sus resultados pueden estimular la investigación de conjetu-
ras no examinadas hasta ahora y para generar hipótesis sobre posibles efectos no previstos.
En general, en la investigación sobre seguridad vial, el enfoque econométrico cuando se aplica
a datos transversales de observación no fue un éxito. Una gran cantidad de esfuerzo no produjo
resultados convincentes. Esto debería conducir a un nuevo examen de la estrategia general de
investigación. Está 100 cierto que los datos de la sección transversal de observación deberían
ser una fuente importante de seguridad vial conocimiento. En la medida en que la tradición eco-
nométrica resultó inútil, las tradiciones alternativas y los enfoques deben ser examinados en
busca de inspiración. El enfoque econométrico consiste en arrojar todos datos disponibles en la
tolva del software de regresión y espero que el software desenredar la compleja red causal. Al
parecer, esto no es fácil de hacer. Por lo tanto, uno podría intentar el enfoque alternativo que
limita las muchas fuentes de variación, como es la tradición de epidemiología observacional.
Espero que las personas de la persuasión econométrica y los encantados por el la sofisticación
matemática y la elegancia en las que se basa el análisis de regresión moderno criticar enérgica-
mente las opiniones expresadas aquí. Espero que las carencias que hay se revelará en el debate
que seguramente seguirá. También espero que el documento y el debate ayudar a dirigir la in-
vestigación sobre seguridad vial en direcciones rentables.
REFERENCES
1. Box GEP (1966) Use and abuse of regression. Technometrics 8 (4):625-629.
2. Bunge M. 1979. Causality and modern science. New York: Dover Publications.
3. Cirillo JA. (1968) Interstate system accident research: study II, Public Roads 1968;
35(3): 71-75. Public Roads 35 (3):71-75.
4. Cohen BL (1994) In defence of ecologic studies for testing a linear-no threshold theory.
American Journal of Epidemiology 139 (8):765-768.
5. Coleman J and Stewart GR (1976) Investigation of accident data for railroad-highway
grade crossings. TRR 611:60-67.
6. Crandall RW and Graham JD (1984) Automobile safety regulation and offsetting
behaviour: Some new empirical estimates. The American Economic Review 74 (2):328-
331.
7. Davis GA (2000) Accident reduction factors and causal inference in traffic safety studies:
a review. Accid.Anal.& Prev. 32:95-109.
8. Davis GA (2002) Is the claim that 'variance kills' an ecological fallacy? Accid.Anal.&
Prev. 34:343-346.
9. Davis GA (2004) Possible aggregation biases in road safety research and a mechanism
approach to crash modeling. Accid.Anal.& Prev. 36 (6):1119-1127.
10. De Finetti B. 1974. Theory of probability: A critical introductory treatment. London:
Wiley.
11. Durkheim E. 1897. Le suicide. Paris: F. Alcan.
12. Farmer CM (2003) Reliability of police-reported information for determining crash and
injury severity. Traffic Injury Prevention 4:38-44.
13. Fowles R and Loeb P.D. (1989) Speeding, coordination and the 55-mph limit: comment.
The American Economic Review 79 (4):916-921.
14. Fridstrøm L and Ingebrigtsen S (1991) An aggregate accident model based on pooled,
regional time-series data. Accid.Anal.& Prev. 23 (5):363-378.
15. Gaudry M, Lasarre S. 2000. Structural road accident models.Elsevier.
16. Greenland S and Robins JM (1986) Identifiability, exchangeability, and epidemiological
confounding. International Journal of Epidemiology 15:413-419.
102
17. Greenland S and Robins JM (1994a) Accepting the limits of ecologic studies. American
Journal of Epidemiology 139 (8):769-771.
18. Greenland S and Robins JM (1994b) Invited commentary: Ecologic studies-biases,
misconceptions, and counterexamples. American Journal of Epidemiology 139 (8):747-
760.
19. Greenland S, Robins JM, and Pearl J (1999) Confounding and collapsibility in causal
inference. Statistical Science 14 (1):29-46.
20. Hadi MA et al (1995a) Estimating safety effects of cross-section design for various
highway types using negative binomial regression. TRR 1500:169-177.
21. Hadi, M. A., Wattleworth, J. A., Aruldhas, J., Chow, L-F., and Gan, C-T. Relationship of
highway design standards to accidents, injuries and fatalities. 1995b.
22. Harvey AC (1990) The econometric analysis of time series. Phillip Allan.
23. Harwood, D. W., Council, F., Hauer, E., Hughes, W., and Vogt, A. Prediction of the
expected safety performance of rural two-lane highways. 2000. McLean, VA.
24. Hauer, E. Re-estimation of models for two-lane rural road segments. 2001.
www.roadsafetyresearch.com.
Ref Type: Report
25. Hauer E (1971) Accidents, overtaking and speed control. Accid.Anal.& Prev. 3:1-13.
26. Hauer E (1991) Should STOP YIELD? Matters of method. ITE Journal 69 (9):25-32.
27. Hauer E, Council FM, and Mohamedshah YM (2004) Safety models for urban four-lane
univided road sagments. TRR.
28. Hausman J, Hall BH, and Griliches Z (1984) Econometric models for count data with an
application to the patents-R&D relationship. Econometrica 52 (4):909-938.
29. Hitz, J. S. Rail highway crossings resource allocation procedure-User's guide. Second
edition. 1986.
30. Hogarth, R. M. The challenge of representative design in psychology and economics.
2004. Universidad Pompeu Fabra. Working Paper 758.
Ref Type: Report
31. Holland PW (1986) Statistics and causal inference. Journal of the American Statistical
Association 81 (396):945-960.
32. Joksch HC (1976) Critique of Sam Peltzman's study. Accid.Anal.& Prev. 8:129-137.
103
33. Kelsey JL, Thompson WD, Evans AS. 1986. Methods in observational epidemiology.
New York: Oxford University Press.
34. Kennedy P. 1992. A guide to econometrics. Cambridge, Mass.: MIT Press.
35. Lau LJ (1986) Functional forms in econometric model building. Handbook of
Econometrics, vol. Griliches, Z. and Intriligator, M.D.North-Holland.
36. Lave, C and A. The 55 mph speed limit: variance kills, not speed. Department of
Ecoomics, University of California, Irvine.
37. Lave, C and Elias, P. Did the 65 mph speed limit save lives? 2002. Washington, D.C.
38. Levy DT and Asch P (1989) Speeding, coordination and the 55-mph limit: Comment. The
American Economic Review 79 (4):913.
39. MacAvoy.P.W. (1976) The regulation of accidents. Auto safety regulation: The cure of
the problem, vol. Manne,H.G.; Miller,R.L.Thomas Horton and Daughters.
40. Malinas, G. and Bigelow, J. Simpson's paradox. 2004.
Ref Type: Internet Communication
41. Mengert, P. Rail-highway crossing hazard prediction research results. 1980.
42. Miaou, S-P. The relationship between truck accidents and geometric design of road
sections: Poisson versus Negative Binomial regression. 1994.
43. Mohamedshah YM and Kohls AR, "Accident rates using HSIS," Public Roads, 1994, 44-
47.
44. Nelson RR (1976) Comments on Peltzman's paper on automobile safety regulation. The
regulation of accidents, vol. Manne,H.G.; Miller,R.L.Thomas Horton and Daughters.
45. Newton-Smith WH. 1981. The rationality of science. London and New York: Routledge
& Kegan Paul.
46. Neyman J (1923) On the application of probability theory to agricultural experiments.
Essay on Principles. Section 9. Statistical Science 5:463-472.
47. Ng, J. C. N. and Hauer, E. Accidents on rural two lane roads:differences between seven
states. 1989.
48. Noland RB (2003) Traffic fatalities and injuries: the effect of changes in infrastructure
and other trends. Accid.Anal.& Prev. 35:599-611.
104
49. Noland, R. B. and Karlaftis, M. G. Policy recommendations for accident models: Are the
results specification-sensitive. Annual Meeting CD-ROM. 2004. Washington, D.C. TRB
2004 Annual Meeting.
50. Noland RB and Oh L. (2004) The effect of infrastructure and demographic change on
traffic-related fatalities and crashes: a case study of Illinois county-level data.
Accid.Anal.& Prev. 36:525-532.
51. Park Y-J and Saccomanno, F. F. Collision frequency analysis using tree-based
stratification. Compendium of papers CD-ROM. 2005a. Washington, D.C. 84th Annual
Meeting of the Transportation Research Board.
52. Park Y-J and Saccomanno, F. F. Evaluating factors affecting safety at highway-railway
grade crossings. Compendium of papers CD-ROM. 2005b. Washington, D.C. 84th
Annual Meeting of the Transportation Research Board.
53. Pearl J. 2000. Causality. Cambridge: Cambridge University Press.
54. Peltzman S (1977) A reply to Robertson. Journal of Economic Issues 11:672-678.
55. Peltzman S (1975) The effects of automobile safety regulation. The Journal of Political
Economy 83 (4):677-726.
56. Peltzman S (1976) The effects of automobile safety regulation. Accid.Anal.& Prev. 8:139-
142.
57. Persaud, B. N., Retting, R., and lyon, C. Crash reduction following installation of
centerline rumble strips on rural two-lane roads. 2003. Insurance Institute for Highway
Safety.
58. Piantadosi S (1994) Invited commentary: Ecologic biases. American Journal of
Epidemiology 139 (8):761-764.
59. Robertson LS (1977) A critical analysis of Peltzman's 'The Effects of Automobile Safety
Regulation'. Journal of Economic Issues 11:587-600.
60. Rodriquez RJ (1990) Speed, speed dispersion and the highway fatality rate. Southern
Economic Journal 57 (2):349-356.
61. Rosenbaum P.R. 1985. Observational studies. New York: Springer Verlag.
62. Rubin DB (1974) Estimating causal effects of treatments in randomized and
nonrandomized studies. Journal of Educational Psychology 66 (5):688-701.
105
63. Rubin DB (1977) Assignment of treatment group on the basis of a covariate. Journal of
Educational Statistics 2:1-26.
64. Rubin DB (1978) Bayesian inference for causal effects: the role of randomization. The
annals of statistics 6 (1):34-58.
65. Rubin DB (1980) Discussion of "Randomization analysis of experimental data:The Fisher
randomization test. BY D. Basu.". Journal of the American Statistical Association
75:591-593.
66. Rubin DB (1990) Formal modes of statistical inference for causal effects. Journal of
Statistical Planning and Inference 25:279-292.
67. Saccomanno, F. F and Lai, X. Model for evaluating counter-measures at highway-railway
grage crossings. Compendium of papers CD-ROM. 2005. Washington, D.C. 84th Annual
Meeting of the Transportation Research Board.
68. Selvin HC (1958) Durkheim's suicide and problems of empirical research. American
Journal of Sociology 63:607-619.
69. Snyder D (1989) Speeding, coordination and the 55-mph limit: Comment. The American
Economic Review 79 (4):922-925.
70. Sobel, R. S. and Nesbit, T. M. Automobile safety regulation and the incentive to drive
recklessly:Evidence from NASCAR. 2003. Department of Economics, West Virginia
University.
71. Solomon, D. Accidents on main rural highways related to speed, driver, and vehicle.
1964.
72. Surgeon General of the United States. Smoking and Health. 1964. US. Government
Printing Office.
73. Tarko, A. P., Eranky, S., and Sinha K.S. Methodological considerations in the
development and use of crash reduction factors. Preprint CD. 2004. 77th Annual Meeting
of the Transporation Research Board.
74. Vogt A and Bared J (1998a) Accident models for two-lane rural segments and
intersections. TRR 1635:18-29.
75. Vogt, A. and Bared, J. Accident models for two-lane rural segments and intersections.
1998b. McLean, VA.
76. Zegeer, C. V., Reinfurt, D., Hummer, J., Herf, L., and Hunter, W. Safety effects of crosssec-
tion
desing for two-lane roads. I. 1987.
106
77. Zegeer CV et al (198) Safety effects of cross-section desing for two-lane roads. TRR
1195:20-32.
101 REFERENCIAS 1. Recuadro GEP (1966) Uso y abuso de la regresión. Tecnometría 8
(4):625-629.
2. Bunge M. 1979. Causalidad y ciencia moderna. Nueva York: Publicaciones de Dover.
3. Cirillo JA. (1968) Investigación de accidentes del sistema interestatal: estudio II, Public Roads
1968; 35(3): 71-75. Vía Pública 35 (3):71-75.
4. Cohen BL (1994) En defensa de los estudios ecológicos para probar una teoría lineal sin um-
bral.
Diario americano de epidemiología 139 (8): 765-768.
5. Coleman J y Stewart GR (1976) Investigación de datos de accidentes para ferrocarril-carretera
pasos a nivel. TRR 611:60-67.
6. Crandall RW y Graham JD (1984) Regulación y compensación de la seguridad del automóvil
comportamiento: algunas nuevas estimaciones empíricas. The American Economic Review 74
(2): 328- 331.
7. Davis GA (2000) Factores de reducción de accidentes e inferencia causal en estudios de se-
guridad vial: una revisión. Acid.Anal.& Prev. 32:95-109.
8. Davis GA (2002) ¿Es la afirmación de que 'la variación mata' una falacia ecológica?
Ácido.Anal.& Anterior 34:343-346.
9. Davis GA (2004) Posibles sesgos de agregación en la investigación de seguridad vial y un
mecanismo enfoque del modelado de choques. Acid.Anal.& Prev. 36 (6):1119-1127.
10. De Finetti B. 1974. Teoría de la probabilidad: un tratamiento introductorio crítico. Londres:
Wiley.
11. Durkheim E. 1897. Le suicide. París: F. Alcan.
12. Farmer CM (2003) Confiabilidad de la información reportada por la policía para determinar
accidentes y gravedad de la lesión. Prevención de Lesiones de Tránsito 4:38-44.
13. Fowles R y Loeb PD (1989) Exceso de velocidad, coordinación y el límite de 55 mph: comen-
tario.
The American Economic Review 79 (4): 916-921.
14. Fridstrøm L e Ingebrigtsen S (1991) Un modelo agregado de accidentes basado en datos
agrupados, datos de series temporales regionales. Acid.Anal.& Prev. 23 (5):363-378.
15. Gaudry M, Lasarre S. 2000. Modelos estructurales de accidentes viales. Elsevier.
16. Greenland S y Robins JM (1986) Identificabilidad, intercambiabilidad y datos epidemiológicos
confuso Revista Internacional de Epidemiología 15:413-419.
102 17. Greenland S y Robins JM (1994a) Aceptando los límites de los estudios ecológicos.
Americano Revista de Epidemiología 139 (8): 769-771.
18. Greenland S y Robins JM (1994b) Comentario invitado: estudios ecológicos: sesgos, con-
ceptos erróneos y contraejemplos. Revista americana de epidemiología 139 (8): 747- 760.
19. Greenland S, Robins JM y Pearl J (1999) Confusión y colapsabilidad en causas inferencia.
Ciencia Estadística 14 (1):29-46.
20. Hadi MA et al (1995a) Estimación de los efectos de seguridad del diseño de sección trans-
versal para varios tipos de carreteras usando regresión binomial negativa. TRR 1500: 169-177.
21. Hadi, MA, Wattleworth, JA, Aruldhas, J., Chow, LF. y Gan, CT. Relación de normas de diseño
de carreteras para accidentes, lesiones y muertes. 1995b.
22. Harvey AC (1990) El análisis econométrico de series de tiempo. Felipe Allan.
23. Harwood, DW, Council, F., Hauer, E., Hughes, W. y Vogt, A. Prediction of the Desempeño de
seguridad esperado de las carreteras rurales de dos carriles. 2000. McLean, VA.
24. Hauer, E. Reestimación de modelos para segmentos de carreteras rurales de dos carriles.
2001.
www.roadsafetyresearch.com .
Tipo de referencia: Informe 25. Hauer E (1971) Accidentes, adelantamientos y control de veloci-
dad. Acid.Anal.& Prev. 3:1-13.
26. Hauer E (1991) ¿Debería DEJAR DE RENDIR? Cuestiones de método. Revista ITE 69 (9):
25-32.
27. Hauer E, Council FM y Mohamedshah YM (2004) Safety models for urban four-lane segmen-
tos de carretera univididos. TRR .
28. Hausman J, Hall BH y Griliches Z (1984) Modelos econométricos para datos de conteo con
un aplicación a la relación patentes-I+D. Econométrica 52 (4):909-938.
29. Hitz, JS Procedimiento de asignación de recursos de cruces de autopistas ferroviarias: guía
del usuario. Segundo edición. 1986.
30. Hogarth, RM El desafío del diseño representativo en psicología y economía.
2004. Universidad Pompeu Fabra. Documento de Trabajo 758.
Tipo de referencia: Informe 31. Holland PW (1986) Estadística e inferencia causal. Diario de la
Estadística Americana Asociación 81 (396):945-960.
32. Joksch HC (1976) Crítica del estudio de Sam Peltzman. Acid.Anal.& Prev. 8:129-137.
103 33. Kelsey JL, Thompson WD, Evans AS. 1986. Métodos en epidemiología observacional.
Nueva York: Oxford University Press.
34. Kennedy P. 1992. Una guía de econometría. Cambridge, Mass.: MIT Press.
35. Lau LJ (1986) Formas funcionales en la construcción de modelos econométricos. manual de
Econometría, vol. Griliches, Z. e Intriligator, MD North-Holland.
36. Lave, C y A. El límite de velocidad de 55 mph: la variación mata, no la velocidad. Departa-
mento de Economía, Universidad de California, Irvine.
37. Lave, C y Elias, P. ¿Salvó vidas el límite de velocidad de 65 mph? 2002. Washington, DC 38.
Levy DT y Asch P (1989) Exceso de velocidad, coordinación y el límite de 55 mph: Comentario.
los Revisión económica estadounidense 79 (4): 913.
39. MacAvoy.PW (1976) La regulación de los accidentes. Regulación de seguridad automotriz:
La cura de el problema, vol. Manne, HG; Miller, RL Thomas Horton e hijas.
40. Malinas, G. y Bigelow, J. La paradoja de Simpson. 2004.
Tipo de referencia: comunicación por Internet 41. Mengert, P. Resultados de la investigación de
predicción de peligros de cruce de carreteras y trenes. 1980.
42. Miaou, ESP. La relación entre los accidentes de camiones y el diseño geométrico de la ca-
rretera.
secciones: Poisson versus regresión binomial negativa. 1994.
43. Mohamedshah YM y Kohls AR, "Tasas de accidentes usando HSIS", Public Roads , 1994,
44- 47.
44. Nelson RR (1976) Comentarios sobre el artículo de Peltzman sobre la regulación de la segu-
ridad del automóvil. los reglamento de accidentes, vol. Manne, HG; Miller, RL Thomas Horton e
hijas.
45. Newton-Smith WH. 1981. La racionalidad de la ciencia. Londres y Nueva York: Routledge y
Kegan Paul.
46. Neyman J (1923) Sobre la aplicación de la teoría de la probabilidad a los experimentos agrí-
colas.
Ensayo sobre los principios. Sección 9. Ciencia Estadística 5:463-472.
47. Ng, JCN y Hauer, E. Accidentes en caminos rurales de dos carriles: diferencias entre siete
estados 1989.
48. Noland RB (2003) Muertes y lesiones por accidentes de tránsito: el efecto de los cambios en
la infraestructura y otras tendencias. Acid.Anal.& Prev. 35:599-611.
104 49. Noland, RB y Karlaftis, MG Recomendaciones de políticas para modelos de accidentes:
¿Están los resultados sensibles a la especificación. CD-ROM de la Reunión Anual. 2004. Wa-
shington, D.C. TRB Reunión Anual 2004.
50. Noland RB y Oh L. (2004) El efecto de la infraestructura y el cambio demográfico en Muertes
y choques relacionados con el tráfico: un estudio de caso de datos a nivel de condado de Illinois.
Acid.Anal.& Prev. 36:525-532.
51. Park YJ and Saccomanno, FF Análisis de frecuencia de colisión utilizando estratificación.
Compendio de trabajos CD-ROM. 2005a. Washington, DC 84.º anual Reunión de la Junta de
Investigación del Transporte.
52. Park YJ and Saccomanno, FF Evaluación de los factores que afectan la seguridad en la
autopista-ferrocarril pasos a nivel. Compendio de trabajos CD-ROM. 2005b. Washington, D.C.
84 Reunión Anual de la Junta de Investigación de Transporte.
53. Pearl J. 2000. Causalidad. Cambridge: Prensa de la Universidad de Cambridge.
54. Peltzman S (1977) Una respuesta a Robertson. Revista de Asuntos Económicos 11:672-678.
55. Peltzman S (1975) Los efectos de la regulación de la seguridad del automóvil. El diario de
política Economía 83 (4):677-726.
56. Peltzman S (1976) Los efectos de la regulación de la seguridad del automóvil. Acid.Anal.&
Prev. 8:139- 142.
57. Persaud, BN, Retting, R. y lyon, C. Reducción de accidentes después de la instalación de
franjas sonoras centrales en caminos rurales de dos carriles. 2003. Instituto de Seguros de Ca-
rreteras La seguridad.
58. Piantadosi S (1994) Comentario invitado: Sesgos ecológicos. revista americana de Epide-
miología 139 (8):761-764.
59. Robertson LS (1977) Un análisis crítico de 'The Effects of Automobile Safety' de Peltzman
Regulación'. Revista de Asuntos Económicos 11:587-600.
60. Rodríguez RJ (1990) Velocidad, dispersión de la velocidad y tasa de fatalidad en las carrete-
ras. Meridional Revista Económica 57 (2): 349-356.
61. Rosenbaum PR 1985. Estudios observacionales. Nueva York: Springer Verlag.
62. Rubin DB (1974) Estimación de los efectos causales de los tratamientos en estudios aleato-
rizados y estudios no aleatorizados. Revista de Psicología Educativa 66 (5): 688-701.
105
63. Rubin DB (1977) Assignment of treatment group on the basis of a covariate. Journal of
Educational Statistics 2:1-26.
64. Rubin DB (1978) Bayesian inference for causal effects: the role of randomization. The
annals of statistics 6 (1):34-58.
65. Rubin DB (1980) Discussion of "Randomization analysis of experimental data:The Fisher
randomization test. BY D. Basu.". Journal of the American Statistical Association
75:591-593.
66. Rubin DB (1990) Formal modes of statistical inference for causal effects. Journal of
Statistical Planning and Inference 25:279-292.
67. Saccomanno, F. F and Lai, X. Model for evaluating counter-measures at highway-railway
grage crossings. Compendium of papers CD-ROM. 2005. Washington, D.C. 84th Annual
Meeting of the Transportation Research Board.
68. Selvin HC (1958) Durkheim's suicide and problems of empirical research. American
Journal of Sociology 63:607-619.
69. Snyder D (1989) Speeding, coordination and the 55-mph limit: Comment. The American
Economic Review 79 (4):922-925.
70. Sobel, R. S. and Nesbit, T. M. Automobile safety regulation and the incentive to drive
recklessly:Evidence from NASCAR. 2003. Department of Economics, West Virginia
University.
71. Solomon, D. Accidents on main rural highways related to speed, driver, and vehicle.
1964.
72. Surgeon General of the United States. Smoking and Health. 1964. US. Government
Printing Office.
73. Tarko, A. P., Eranky, S., and Sinha K.S. Methodological considerations in the
development and use of crash reduction factors. Preprint CD. 2004. 77th Annual Meeting
of the Transporation Research Board.
74. Vogt A and Bared J (1998a) Accident models for two-lane rural segments and
intersections. TRR 1635:18-29.
75. Vogt, A. and Bared, J. Accident models for two-lane rural segments and intersections.
1998b. McLean, VA.
76. Zegeer, C. V., Reinfurt, D., Hummer, J., Herf, L., and Hunter, W. Safety effects of crosssection
desing for two-lane roads. I. 1987.
106
77. Zegeer CV et al (198) Safety effects of cross-section desing for two-lane roads. TRR
1195:20-32.

8 Causa&EfectoSeccionTransversal&SeguridadVial DRAFT.pdf

  • 1.
    CAUSA Y EFECTOEN ESTUDIOS OBSERVACIONALES DE LA SECCIÓN TRANSVERSAL SOBRE LA SEGURIDAD VIAL Ezra Hauer, 2005 1. INTRODUCCIÓN 2. ILUSTRACIÓN DE TEMAS EN CRUCES CAMINO-FERROCARRIL A NIVEL 2.1 Cómo medir el 'Efecto de seguridad' 2.2 Examen de la consistencia de las estimaciones del efecto de seguridad 3. CAUSA, EFECTO, CONFUSIÓN Y CONSISTENCIA 3.1 Definición de causa y efecto 3.2 Confusión e intercambiabilidad en estudios transversales observacionales de seguridad vial. 3.3 Consistencia de los hallazgos 4. CASOS E INQUIETUDES 4.1 Peltzman y otros sobre el efecto regulación seguridad del automóvil 4.2 Lave y otros sobre el límite de velocidad 4.3 Noland sobre la estructura y efecto sobre las muertes 4.4 El medio no es el mensaje 4.5 Algunos modelos a nivel de unidad para caminos 5. RESUMEN 6. CONCLUSIONES Referencias
  • 2.
    1. INTRODUCCIÓN Gran partede la investigación sobre seguridad vial1 gira en torno de la causa. Es decir, deseamos aprender qué cambio en la seguridad resultará de algún tratamiento2. En muchas otras discipli- nas, el conocimiento de este tipo proviene de experimentos. El aspecto clave de un experimento es que uno puede cambiar deliberadamente el valor de solo unos pocos factores mientras man- tiene todos los demás factores constantes, o neutralizar el efecto de todos los demás factores mediante la aleatorización. En seguridad vial, la experimentación de este tipo es muy rara; el conocimiento tiene que ser extraído de 'estudios observacionales'; es decir, interpretando los datos que se pueden encontrar. Los estudios observacionales de seguridad vial son de dos tipos: • 'antes-después'. Cuando algún cambio o tratamiento se aplicó a un grupo de unidades. El cambio en el historial de accidentes y en los atributos de estas unidades desde antes del tratamiento hasta después del tratamiento se utilizan para estimar el cambio en la seguridad que se debe al tratamiento. • 'transversal'. Cuando los atributos y el historial de accidentes de las unidades, algunos en- contrados con tratamiento (atributo) X y algunos encontrados con el tratamiento (atributo) Y, se utilizan en un intento de estimar el efecto de seguridad de la diferencia de trato (o atributo) en la pregunta. La distinción principal entre estos dos tipos de estudio observacional es que en un estudio antes- después 'tratamiento' significa que algo ha cambiado de 'antes' a 'después', mientras que en un estudio transversal el elemento de cambio no está presente, sólo existe una diferencia contem- poránea en algún atributo de interés que podría haber sido diferente y, por lo tanto, se denomina vagamente "tratamiento". Se cree que el experimento aleatorio es el estándar de oro que permite la relación causa-efecto. interpretación. Reconociendo que en muchas disciplinas y circunstancias 4 la experimentación y aleatorización no son factibles, el estudio observacional de antes y después es quizás el siguiente en el 1 La seguridad de una unidad es el número de accidentes, por gravedad, que se espera que ocurran en ella por unidad de tiempo. Una unidad puede ser una intersección señalizada, un segmento de carretera, un conductor, una flota de camiones, etc. Generalmente por “tratamiento” nos referimos a una intervención de algún tipo, un cambio en alguna característica de diseño o, de manera más general, un cambio en un factor que puede causar un cambio en la seguridad de la unidad. Como será obvio, también usaremos la palabra 'tratamiento' en el sentido de 'diferencia en atributo o característica'. Eso es si una unidad recibirá la función X y otra característica de la unidad Y, se dice que las dos unidades han recibido un tratamiento diferente. En nuestra perspectiva el tratamiento es la causa y nos preguntamos por su efecto. Esto es lo contrario de ver algún evento. por ejemplo, un accidente) que ocurra y preguntar sobre su causa. 3 Rosenbaum (1995) (Rosenbaum PR 1985) dice que “Un estudio observacional es una investi- gación empírica de tratamientos, políticas o exposiciones y los efectos que causan, pero se dife- rencia de un experimento en que el investigador no puede controlar la asignación de tratamientos a los sujetos. (pág. vii). Luego enfatiza que “Un estudio sin el tratamiento no es ni un experimento ni un estudio observacional” (p.1). Sin embargo, él también debe permitir una amplia interpreta- ción de la palabra 'tratamiento' ya que uno de sus ejemplos es un estudio sobre el tabaquismo y las enfermedades del corazón en el que el atributo de cuánto fumó una persona en el pasado se interpreta como 'tratamiento'. Así, los límites entre 'tratamiento', 'atributo' y 'exposición' no están del todo claros.
  • 3.
    4 En cienciassociales, educación, economía, epidemiología, medicina, etc. 4 línea de respetabilidad en términos de permitir interpretaciones de causa-efecto 1 . Si la sección transversal observacional estudios pueden conducir a conclusiones de causa-efecto es un tema de controversia. Mientras que algunos afirman que “No hay causalidad sin manipulación” 2 otros no excluyen la posibilidad 3 . La cuestión de si la interpretación causal de los estudios transversales es del todo posible es de importancia central para la seguridad vial. La razón es que las oportunidades de hacer observa- ciones antes y después estudios sobre, digamos, el efecto de seguridad del cambio en la curva- tura horizontal, grado de carretera, carril ancho, mediana pendiente, etc. son pocos e imperfec- tos. Esto es así, en parte, porque cuando se reconstruye una carretera por lo general, se cambian varios de sus atributos a la vez y es difícil asignar el resultado a cualquier único factor causal. Además, la reconstrucción de una carretera a menudo la modifica hasta tal punto que no puede considerarse la misma unidad después de la reconstrucción. Por el contrario, las oportunidades de los estudios transversales observacionales son abundantes. Esta es la razón por la que gran parte de lo que se piensa que es El conocimiento sobre el efecto de seguridad de muchas carac- terísticas viales importantes provino de la sección transversal de observación. estudios. Sin embargo, si es cierto que tales estudios no pueden conducir a conclusiones de causa-efecto, entonces gran parte de la tradición existente debe ser cuestionada. Si bien el tema es de importancia central para la seguridad vial, ha recibido escasa atención. atención. Por lo que sé, se emitió por primera vez en Hauer (1991) 4 , quien señaló que los resultados de beforeafter Los estudios tienden a diferir de los estudios transversales. En tales casos, uno o ambos métodos dan resultados incorrectos. Tarko et al. (2004) argumentó a favor de dibujar causa-efecto conclusiones de los estudios transversales. Davis (2000) revisó exhaus- tivamente la información existente literatura relevante sobre la inferencia causal tal como se aplica a la seguridad vial. Destacó que para dibujar conclusiones de causa-efecto a partir de datos de sección cruzada, la posibilidad de confusión debe ser eliminado y que esto requiere información sobre por qué un sitio recibió el tratamiento 'X' y otro recibió el tratamiento 'Y'. Mien- tras que en 2000 Davis era levemente optimista 5 sobre la posibilidad para controlar la confusión en estudios transversales, más recientemente Davis (Davis 2004) expresó duda de que se pue- dan superar los sesgos de agregación inherentes a los estudios transversales. En suma, una parte del conocimiento que pasa de la investigación a la práctica se basa en con- clusiones extraídas de estudios transversales. No está claro, en este momento, en qué circuns- tancias esta información puede interpretarse como representación de causa y efecto. En conse- cuencia, el principal propósito de este informe es examinar el tema de causa y efecto en la sec- ción transversal observacional 1 Rubin (1974) expresa este sentimiento de la siguiente manera: “… dada la elección entre los datos de un experimento aleatorio y un estudio no aleatorizado equivalente, uno debe elegir los datos del experimento…. Sin embargo, lo haremos desarrollar la posición de que los estudios no aleatorios, así como los experimentos aleatorios, pueden ser útiles para estimar efectos causales del tratamiento”. Págs. 688-689. 2 Holland (1986) atribuye esto a D. Rubin, uno de los principales pensadores de la interpretación causa-efecto de Datos estadísticos. 3 Al hablar de la teoría de la causalidad inferida Pearl (2000) dice que “… la dirección de las influencias causales puede determinarse a menudo sin recurrir a la información cronológica.
  • 4.
    (Aunque, cuando estédisponible, cronológico información puede simplificar significativamente la tarea de modelado.)”, p.43. 4 Refiriéndose a un informe de investigación en el que se hizo una declaración sobre la superio- ridad del enfoque de antes y después Hauer (1991) dice que: "La pregunta es si el enfoque de investigación antes y después es mejor, en general, que el enfoque transversal "y que" Esta pregunta sería de poco interés si ambos enfoques de investigación condujeran a resultados si- milares. conclusiones. Esto, sin embargo, no parece ser el caso”. pags. 26 5 “…no es inconcebible que un sistema experto, por ejemplo, pueda incorporar el conocimiento de ingeniería existente en un manera racional y aun así conducir a una selección sin confusión”. pags. 106. 5 estudios sobre seguridad vial. Para hacer obvia la relevancia práctica del problema y el asunto tangible, en la próxima sección usaré el dispositivo de un estudio de caso. 6 2. UNA ILUSTRACIÓN DE LOS PROBLEMAS EN EL CASO DEL FERROCARRIL PASOS A NIVEL La pregunta práctica es esta: si realizo alguna 'acción', ¿qué puedo esperar que tenga su efecto de seguridad? ¿ser? Es decir, en el arte práctico de la gestión de la seguridad vial nos interesan las relaciones entre las acciones (p. ej., reemplazar los cruces con luces intermitentes en un paso a nivel) y su esperada efecto de seguridad (reducción de accidentes). En el capítulo introductorio pregunté, algo abstractamente, si los resultados derivados de los datos de la sec- ción transversal se pueden utilizar para dicha orientación de causa-efecto. En En este capítulo quiero ilustrar el tejido rico y problemático de este tema en el contexto de una campo de acción específico: el de elegir dispositivos de advertencia para los pasos a nivel de ferrocarril y carretera. 2.1 Cómo se puede medir el 'Efecto de seguridad'. Se entiende bien cómo se mide el efecto de seguridad en un estudio observacional de antes y después. Predecimos cuál habría sido la seguridad de las entidades tratadas en el período 'después del tratamiento' si se hubieran dejado sin tratar. Para ello utilizamos el historial de accidentes de las entidades tratadas de la período 'antes del tratamiento' y conocimiento de cómo sus atributos (por ejemplo, flujo de tráfico) cambiaron de el período 'antes' al 'después'. Luego comparamos la predicción de lo que habría sido en el período 'después' si no hubiera habido tratamiento, a qué accidentes se materializaron en el período 'después' con el tratamiento en su lugar. Esta compa- ración puede ser en forma de diferencia: δ = (qué seguridad habría sido sin tratamiento) – (qué seguridad había con tratamiento); o en forma de proporción: θ = (qué seguridad había con el tratamiento)/ (qué seguridad habría sido sin tratamiento). los estimaciones de δ o θ pueden servir como guía para responder la pregunta original: si implementar algún tratamiento (acción) ¿cuál podemos esperar que sea su efecto? En un estudio observacional que utiliza datos transversales, el efecto de seguridad se estima bastante diferentemente. Para dilucidar, considere el estudio de Coleman y Stewart (1976) sobre la seguridad de pasos a nivel ferrocarril-carretera. Usaron datos transversales de 37,230 pasos a nivel en 15 estados para ajustarse al modelo de regresión rela- tivamente simple: C log (Trenes/día) CCC wd,3 10 ancho,0 ancho,1 ancho,2 (Trenes/día) Acci- dentes/año = 10 (Vehículos/día) (Trenes/día) ecuación 1 Se estimaron los coeficientes de regre- sión C wd,o, …, C wd,3 para tres tipos de dispositivos de advertencia (wd=Puertas Automáticas, Intermitentes o Crossbucks) y para cuatro condiciones (urbano de vía única o rural y urbano o rural de vía múltiple). Utilizando los coeficientes de regresión estimados y la ecuación. 1 uno puede trazar gráficos y comparar frecuencias de accidentes previstas en condiciones idénticas (número de vías, escenario, trenes/día y vehículos/día) pero con diferentes avisadores.
  • 5.
    Considere, por ejemplo,las frecuencias de accidentes pronosticadas en la Figura 1. 7 Figura 1. Predicciones del modelo para Crossbucks y Flashers Con, digamos, 10.000 vehículos de carretera/día, 10 trenes/día, una sola vía férrea y cruces ubicados en un área ur- bana, se espera que un cruce promedio con 'Crossbucks' tenga 0.182 accidentes/año y se espera que un cruce promedio cuando esté equipado con 'Flashers' tenga 0.234 accidentes/año. Parecería natural hacer de esto la base para la anticipación de lo que sería el "efecto de seguri- dad". ser cuando un tipo de dispositivo de advertencia es reemplazado por otro 1 . El efecto de segu- ridad de reemplazar crossbucks por luces intermitentes podría medirse por la diferencia δ = 0.234-0.182 como el aumento de 0,052 accidentes/año o, alternativamente, por la relación θ =0,234/0,182=1,26 (que se puede leer como 26% aumento de accidentes/año) 2 . Estas medidas alternativas de efecto de seguridad se basan ambas en la misma información y ambas podrían servir de orientación. Dado que en seguridad vial la razón mide ( θ ) se encuentra más común- mente, se usará aquí para representar el efecto de seguridad 3 . En lo que sigue, la relación (Frecuencia prevista de accidentes con Y)/(Accidente previsto con X) se denotará por θ X a Y . Cuando para un conjunto dado de atributos θ X a Y <1, el efecto del cambio de X a Y es disminuir frecuencia de accidentes 4 . En la ilustración anterior, el efecto de seguridad estimado cuando se basa en datos de sección transversal fue obtenido ajustando primero una o más ecuaciones de regresión a los datos y luego usando estos ecuación para predecir cuál sería el efecto de seguridad ( δ o θ ) bajo dos condiciones específicas. En principio, si los datos transversales son tan abundantes que la cate- gorización en todas las variables relevantes para la seguridad es factible que se pueda prescindir del paso de regresión. Entonces uno compararía el número promedio de accidentes/cruce de dos celdas que tienen los mismos valores de variables relevantes para la seguridad y difieren en tratamiento. En la práctica de la seguridad vial, esta opción rara vez es práctica; variables rele- vantes para la seguridad son muchos y, por lo tanto, las celdas no contienen suficientes datos para una estimación confiable. Las regresiones son utilizado para aliviar el 'problema de datos escasos'. 1 En el capítulo 3 se proporciona una definición más sistemática de 'efecto de seguridad'. 2 La legitimidad de interpretar la diferencia en las predicciones con lo que se espera que sea la consecuencia del cambio es cuestionado por muchos. Sin embargo, el examen de tal legitimidad es uno de los propósitos de esta indagación. Por lo tanto, hasta el final de la investigación se debe permitir el uso de la diferencia en las predicciones para estimar el cambio. 3 Rubin (1990, p.283)( Rubin 1990) define el 'efecto causal del tratamiento' de la misma manera, es decir, por δ o θ . Argumenta que θ puede ser la mejor medida cuando se piensa que δ es proporcional al número esperado de accidentes . ('rendimiento' en su contexto). 4 (1- θ X → Y )× 100 es el 'porcentaje de reducción' debido al cambio de X a Y. 8 Habiendo aclarado cómo se puede derivar el efecto de seguridad de los resultados de una observación estudio transversal, ahora podemos examinar las siguientes preguntas empíricas. Hizo antes-después Los estudios sobre el efecto de seguridad de los dispositivos de advertencia en los pasos a nivel de ferrocarril y carretera tienden a producir estimaciones consistentes del
  • 6.
    'efecto de seguridad'?¿Los estudios transversales tendieron a producir "seguridad" consistente? estimaciones del efecto? ¿Son consistentes los resultados de los estudios de antes y después con los de estudios transversales? ¿estudios? Estas y otras cuestiones similares se examinan a continuación. 2.2 Examen de la consistencia de las estimaciones del efecto de seguridad Cada curva en la Figura 1 es la representación de la ecuación. 1. El θ Crossbuck toFlashers es la relación de dos de tales ecuaciones; en la ecuación del numerador las constantes de regresión C son para wd=Intermitentes y en el denominador para wd=Crossbucks. Después de introducir las condicio- nes específicas (urbano, único vías, volúmenes de trenes) el θ Crossbucks to Flashers es (en este caso) una función del flujo de tráfico vial únicamente. Cómo los Coleman-Stewart θ Crossbucks to Flashers y θ Crossbucks to Gates dependen del tráfico vial diario flujo (AADT) para Vía Única &Urbano y Vía Múltiple &Rural se muestra en la Figura 2 y Figura 3. Figura 2. Ratios θ de accidentes previstos para Vía Única, Urbana, 10 trenes/día 9 Figura 3. Ratios θ de accidentes previstos para Vía Múltiple, Rural, 10 trenes/día Cuando se usa de esta manera, el modelo de Coleman-Stewart implica que en vías urbanas de vía única cruces (Figura 2) con más de aproximadamente 1000 vehículos de carretera por día, más colisiones son esperado con 'Flashers' que cuando se usan 'Crossbucks' ( θ Flashers to Crossbucks >1). Apro- ximadamente el se indica lo contrario para condiciones rurales de múltiples vías (Figura 3). Nota de Coleman y Stewart que estos resultados son inesperados y dicen que “Pueden ser necesarias variables adicionales en estos casos para explicar completamente los patrones de ocurrencia de accidentes” (p. 62). Una de las razones por las que estos resultados (de la regresión multivariable utilizando la sec- ción transversal datos) se consideraron "inesperados" fue que eran contrarios a los resultados de algunos antes-después estudios. Los principales resultados de varios estudios de antes y después se resumen en la Tabla 1 y se elaboran en la Tabla 2. Las celdas sombreadas dan las proporciones θ obtenidas en cinco estudios de antes y después. Tabla 1. Estimaciones de θ de estudios antes y después (sesgados) adaptados de Hauer y Persaud (1987) Autor California PUC Morrisey Coleman Eck y Halkias Farr y Hitz Año de publicación 1974 1981 1982 1985 1985 No. de cruces 1552 2994 NA 7734 5903 Crossbucks a Flashers 0.36 0.35 0.29 0.31 0.30 Crossbucks a Gates 0.12 0.16 0.18 0.16 0.17 Intermitentes a puertas 0,34 0,36 0,31 0,28 0,28 Todas estas estimaciones, por coherentes que parezcan, se inflan sistemáticamente debido a errores no corregidos. sesgo de selección 1 . Un estudio en el que se eliminó este sesgo proporcionó los resultados en la Tabla 2 . 1 El sesgo de selección surge cuando la decisión de cambiar de un tipo de dispositivo de adver- tencia a otro está parcialmente motivada por la ocurrencia de accidentes en un sitio y los mismos accidentes también se utilizan en la cuenta de accidentes 'antes'. los el sesgo tiene sus raíces en el fenómeno de la regresión a la media. En el momento en que se realizaron estos estudios la existencia de el sesgo de selección no fue ampliamente apreciado. 10 Tabla 2. Estimaciones de θ de un estudio antes-después sin sesgo adaptado de Hauer y Persaud (1987) Conversiones Crossbucks a Intermitentes Crossbucks a Gates Intermitentes toGates Nº de Conversiones 891 1037 934 Estimación sesgada 0,30 0,21 0,40 Estimación im- parcial 0,49 0,32 0,55 ¿Qué se puede decir acerca de estos resultados? Primero, se debe tener en cuenta que hay una diferencia rara vez notada entre θ de antes-después estudios y el θ de
  • 7.
    regresiones basadas endatos transversales. Cada estudio de antes y después arrojó un estima- ción única del efecto de seguridad θ . Este es un efecto de seguridad promedio con un promedio sobre el tratado sitios Por el contrario, el modelo de un estudio transversal hace que θ sea una función de varios atributos. Eso es muy probable que θ sea una función de los atributos de las entidades tratadas 1 . Si es así, el θ obtenido de un estudio antes-después, siendo un promedio sobre una cierta colección de sitios, depende de la mezcla específica de atributos de las entida- des 'tratadas'; una combinación diferente de entidades tratadas producir un θ diferente . Por lo tanto, las estimaciones del efecto de seguridad obtenidas mediante un estudio de antes y des- pués han dos deficiencias. Una es que incluso si cada estudio de un determinado tratamiento o acción pudiera dar muy estimaciones precisas, las estimaciones de θ promedio tenderían a diferir de un estudio a otro porque la los sitios en cada estudio diferirían 2 . La otra deficiencia es que en la medida en que el sitio para el cual algún tratamiento es contemplado por un médico tiene atributos específicos, el θ promedio basado en un Es posible que el estudio de antes y después no se aplique a este sitio. Por lo tanto, las estimaciones del efecto de seguridad cuando se deri- van de un El estudio antes-después es útil en la práctica solo si el efecto de seguridad depende solo débilmente del sitio. atributos 3 A este respecto, la regresión basada en datos transversales parece tener una ventaja sobre un estudio antes-después. La segunda observación es que, en este caso, no importa cuál sea la mezcla de los tratados entidades en los estudios de antes y después, los resultados en la Tabla 1 y la Tabla 2 no son consistentes con los resultados en la Figura 2 y la Figura 3. De ello se deduce que, en este caso, uno o ambos tipos de estudio no pueden ser confiable. La tercera observación que se puede hacer es que los resultados (sesgados) de los cinco antes- después Los estudios en la Tabla 1 son bastante consistentes y es probable que lo sigan siendo incluso si la regresión-tomean Se eliminó el sesgo de cada uno. Si es así, se puede especular que en los cinco estudios de antes y después, las conversiones se realizaron en sitios con atri- butos similares o el efecto de seguridad no realmente no dependen fuertemente de los atributos de los cruces tratados, contrariamente a lo que podría ser inferido de las Figuras 2 y 3 Esto arroja una doble duda sobre los resultados de la regresión. Las estimaciones de θ basados en los modelos de Coleman-Stewart parecen incorrectos y la manera en que θ depende de el volumen de vehículos y trenes es sospechoso. Lo que parecía ser una ventaja genérica de la regresión- 1 Uno debe apresurarse a agregar que puede ser una función no solo de las variables en el modelo sino quizás de las variables actualmente no representado en el modelo. 2 Suponga, por ejemplo, que cuando AADT<500 tener carriles de 12' en lugar de carriles de 9' disminuye los accidentes por un factor de 0,95 pero cuando AADT>2000 la disminución es por un factor de 0,67 como se indica en Harwood et al. (pág. 30) (Harwood et al. 2000). Si es así, un estudio de antes y después de dicha ampliación de carriles, que incluye en su mayoría carreteras de bajo volumen, encontraría θ de aproximadamente 0,95, pero si el es- tudio incluyera principalmente segmentos de carretera de mayor volumen, estimaría θ de alrede- dor de 0,67 3 En principio, es posible hacer que θ sea una función de atributos también en un estudio de antes y después. Sin embargo, en la práctica la número de entidades en las que se aplica un tratamiento rara vez es suficiente para hacer tales distinciones. 11 enfoque de sección transversal - su capacidad automática para hacer que θ sea una función de atributos - puede, en este caso, sea sólo una ilusión.
  • 8.
    Esto lleva ala cuarta observación. Para ser justos, el estudio transversal de Coleman-Stewart se hizo principalmente para predecir las frecuencias esperadas de accidentes; no estaba destinado a ser utilizado para la estimación de θ . Sin embargo, su modelo (Eqn. 1) se puede tomar para implicar que, θ = 10 Δ C 0 (Vehículos/ día) Δ C 1 (Trenes/día) Δ C 2 (Trenes/día) Δ C 3 log 10 (Trenes/día) , donde Δ es la diferencia entre los coeficientes de regresión apropiados. La forma funcional de esta expresión matemática no refleja un esfuerzo deliberado para encontrar cómo θ depende de atributos de los cruces. Simplemente se sigue algebraicamente de la elección de la forma modelo hecha por Coleman-Stewart para otros fines. En resumen, se puede concluir que el modelo de Coleman-Stewart condujo a estimaciones de θ que son inconsistente con los resultados de varios estudios de antes y después, y que implica relaciones entre θ y atributos de cruce que son sospechosos. La pregunta es si otra regresión los estudios sobre datos transversales obtuvieron mejores resultados. Para responder, algunos modelos de sección transversal adicionales de se puede examinar la seguridad de los pasos a nivel. El siguiente estudio de regresión que se examinará es el de Mengert (1980), quien utilizó datos sobre más de 200,000 cruces públicos en los EE. UU. El "accidente básico" resultante fórmula de predicción' (Hitz 1986) para 'Crossbucks' es: 0,616 (hp 1) 0,0077 ms 0,1 (ht 1) 0,0 (hl 1) 0.1336 0,209 tm 0.3334 e e mi mi 0.2 edición 0.2 0.2 a 0.002268 ct 0.2 − × − × − × − × − × × × × × ⎟⎠ ⎞ ⎜⎝ ⎛ + × ⎟⎠ ⎞ ⎜⎝ ⎛ × + = × ecuación _ 2 En este, 'a' es accidentes/año; 'c' el promedio de vehículos de carretera/día; 't' el tren promedio movimientos/día; 'mt' el número de pistas princi- pales; 'd' trenes directos por día durante el día; 'hp' es 1 si la carretera está pavimentada y 2 si no; 'ms' es la velocidad máxima del horario; 'ht' es una 'carretera factor de tipo; y 'hl' es el número de carriles de la autopista. Al igual que en Coleman y Stewart se separan Se estimaron modelos para cruces 'crossbucks', 'flashers' y 'gates'. Los modelos para 'intermitentes' y 'puertas' tienen una forma funcional que es similar a la ecuación. 2 pero con sus específicas coeficientes de regresión. Usando estos tres modelos, la dependencia de θ en las variables seleccionadas es representado a continuación. 12 Figura 4. Cómo varían las relaciones θ con el flujo de vehículos Figura 5. Cómo varían las relaciones θ con el flujo del tren 13 Figura 6. Cómo varían las proporciones θ con el número de pistas principales Figura 7. Cómo varían las relaciones θ con la velocidad del tren En el modelo de Mengert, θ depende débilmente del 'volumen del vehículo' y del 'volumen del tren', pero depende en gran medida de los atributos 'número de vías principales' y 'velocidad máxima del horario'. Una puede imaginar fácilmente una mezcla de atributos de cruces en un estudio de antes y después de tal manera que, si Mengert los resultados fueran verdaderos, entonces se obtendrían las estimaciones de la Tabla 1 y la Tabla 2. Por lo tanto, los lo más que se puede decir es que los resultados del estudio de regresión transversal de Mengert no son inconsistente con las estimaciones de los estudios de antes y después en la Tabla 1 y la Tabla 2. 1 . Esto, sin embargo, es lo máximo que se puede decir. En general, cuando no se conocen los atributos de las entidades tratadas, no se puede decir si los θ de los estudios transversales confirman o niegan los θ del antes-después estudios. Por otro lado, las diferencias entre los modelos Coleman-Stewart y Mengert son demasiado grandes para atribuirse a errores de esti- mación; los resultados de estos dos modelos son inconsistentes. 1 Es interesante notar que en el Modelo de asignación de recursos (Hitz, 1986, pp. 54-57) en el que los modelos de Mengert se utilizan para predecir el número de accidentes, los resultados de los estudios antes y después se utilizan para estimar la seguridad efecto de los dispositivos de
  • 9.
    advertencia. Es comosi no se confiara en los resultados de la sección transversal para la esti- mación del efecto de seguridad. 14 Saltando a través de la división de casi tres décadas, Park, Saccomanno y Lai recientemente presentó tres artículos, tres modelos de regresión diferentes, todos utilizando los mismos datos 1 . Los tres artículos asumen, descaradamente 2 , que lo que uno encuentra por regresión en datos de sección transversal puede ser utilizado para predecir la implementación de contrame- didas de efecto de seguridad 3 . En el primer artículo, Saccomanno y Lai (2005) utilizaron el análisis factorial para formar cinco grupos de cruces Después de eso, un modelo de regresión como el de la ecuación. Se ajustaron 3 a cada grupo. A diferencia de Coleman, Stewart y Mengert, quienes ajustaron ecuaciones separadas a cruces con crossbucks, flashers y gates, Saccomanno y Lai hacen de 'Warning Device' una variable dentro la ecuacion. Otra diferencia es que mientras Coleman, Stewart y Mengert eligieron una forma modelo que permite que la dependencia del tráfico de carreteras y trenes sea altamente no lineal (ver, por ejemplo, la Figura 1 y la ecuación. 2) Saccomanno, Lai (y luego Park) eligieron una ecuación modelo que no puede representar tal no linealidad. Los coeficientes de regresión relevantes se encuentran en la Tabla 3. AccidentFrequency (RoadTraffic TrainTraffic)e β 1,wd (WarningDevice) β 2 (RoadSpeed). + = × ecuación 3 Tabla 3. Coeficientes de regresión de Saccomanno y Lai (2005, p.19) Grupo 1 2 3 4 5 β 1, Puertas 0 0 0 0 0 β 1,Crossbucks 0,87 0,78 1,21 1,28 1,53 β 1, intermitentes 0,63 * * * 0,91 * No estadísticamente significativo Parecería que para cruces en el Grupo 1 aquellos con cruces tienen e 0.87 =2.39 veces el número de accidentes como cruces con puertas. Reemplazar crossbucks con puertas entonces parecen reducir los accidentes por un factor de 1/2.39=0.42. (La estimación imparcial de antes-después estudios mostrados en la Tabla 2 fue 0.32). Los cru- ces con intermitentes tienen e 0.63 =1.88 veces el número de accidentes con puertas y una actualización de luces intermitentes a puertas parecería reducir los accidentes por 1/1,88=0,53. (La estimación imparcial en la Tabla 2 fue 0,55). Los cruces con intermitentes tienen 1,88/2,39=0,79 veces los accidentes de cruces con crossbucks. (La estimación imparcial en la Tabla 2 era 0. 49.) Si estas diferencias reflejan las deficiencias del modelo, la imprecisión del antes y el después estimaciones o el hecho de que los cruces en la Tabla 2 eran diferentes de los cruces en el Grupo 1 no se puede decir De hecho, para los cruces en el Grupo 5, los números son bastante diferentes. Aquellos con los crossbucks tienen 4,62 veces más accidentes que los cruces con puertas (en comparación con 2,39 1 La base de datos fue el inventario de pasos a nivel, exposición y frecuencia de colisión para 10,449 pasos públicos en Canadá durante 1993- 2001 2 Así, en la página 8 de Saccomanno y Lai (2005) los autores dicen que: “Si la contramedida resulta en cambios en ya sea la pertenencia al grupo o la variable que se encontró significativa en el modelo de predicción, estimar el número esperado de colisiones antes y después de la contramedida”. 3 El siguiente comentario curioso está en Park y Saccomanno (2005a): “. intentamos establecer una estadística relación entre colisiones y diversos factores de ingeniería (es decir, contramedi- das) sin inferir causalidad. estos modelos son útiles en el apoyo a la toma de decisiones con la evaluación del tratamiento rentable para contramedidas específicas”. (p.3) ¿Por qué predecir cuál será el efecto de implementar una contramedida no equivale a cau- salidad? aclarado.
  • 10.
    15 en elGrupo 1), los cruces con luces intermitentes tienen 2,48 veces el número de accidentes con puertas y por lo tanto los cruces con luces intermitentes tienen 2,48/4,62=0,53 veces los accidentes de los cruces con cruces En el segundo artículo, Park y Saccomanno (2005b) intentan rectificar lo que ven como una fracaso común de los modelos de regresión para producir estima- ciones sensibles del efecto de contramedida 1 . Como en el primer documento, la mejora espe- rada reside en un enfoque de dos pasos. El primer paso es dividir los cruces en grupos sensibles por sus atributos, utilizando una estructura de árbol binario. los El segundo paso es, como antes, ajustarse a un modelo de regresión como el de la ecuación. 3. La innovación está en que las agrupaciones obtenidas en el primer paso actúan como variables cuya finalidad es captar posi- bles interacciones complejas. Cuando estos términos de interacción no están incluidos en la ecuación del modelo y variables como Se omiten 'Clase de carretera' y 'Velocidad de carretera', por lo que se reemplazan los crossbucks con luces intermitentes. Se estima que reduce los choques a 0.11 de su número (¡una reducción del 89%!). Este resultado exagerado puede tomarse como evidencia de que cuando las variables importantes no están representadas en una regresión, no se puede confiar con el propósito de estimar el efecto de seguridad de la acción. Sin embargo, cuando el términos de interacción se incluyen en la ecua- ción de regresión, los resultados cambian. Así, por ejemplo, si se supone que la conversión de crossbucks a flashers se lleva a cabo en 'Otros' caminos el accidente la reducción se estima en sólo un 28% mientras que en 'Carreteras Arteriales/Colectoras o Locales' sería 75%. El tercer artículo (Park YJ y Saccomanno 2005a) se basa en el primero en ese apartado Se ajustan modelos de regresión 2 a varios grupos homogéneos de cruces y a partir del segundo papel en el que se utiliza el mismo algoritmo de árbol binario para agrupar los cruces. Solo cruce de atributos que no se pueden cambiar (por ejemplo, clase de carretera o región) se utilizaron para la agrupación con la esperanza de que esto eliminaría el efecto de estos atributos en la regresión 3 . Los resultados de interés aquí están en la tabla 4. 1 “. los modelos actuales de predicción de colisiones para pasos a nivel tienden a tener una estructura simple y están mal especificados en términos de importantes factores de contramedi- das. Como tales, tienen un uso limitado en el apoyo a la toma de decisiones para el desarrollo y evaluación de contramedidas”. (pág. 2) 2 Por alguna razón que no se explica, en el segundo artículo se consideró apropiado un modelo Binomial Negativo, pero En el tercero se utilizó el modelo de Poisson. 3 Si bien la técnica de agrupación es nueva, la idea es similar a la que hicieron Coleman y Stewart en 1976 cuando ajustaron modelos separados para 12 grupos de cruce por ubicación (urbana o rural), vías (únicas o múltiples) y dispositivo de advertencia (crossbucks, intermitentes o puertas). dieciséis Tabla 4. Multiplicadores de conversión basados en coeficientes de regresión de Park y Saccomanno (2005, Tablas 3 y 4) y de la Tabla 2. Crossbucks a Intermitentes Crossbucks a puertas Todas las variables de control 0,18±0,01 0,06±0,01 Solo relacionado con la carretera Variables de control 0,22±0,02 0,06±0,006 Solo re- lacionados con el ferrocarril Variables de control 0,15±0,01 0,05±0,005 Modelos convencionales que contienen control atributos tales como clase de carretera, número de vías, etc. No relacio- nadas con ferrocarriles o carreteras Variables de control 0,19±0,01 0,05±0,005 Arterial o Colector 0,22±0,03 0,06±0,01 Otras Carreteras con Múltiples Pistas 0,31±0,08 0,11±0,02 Carreteras Lo- cales con Sencillo Pista 0,21±0,02 0,09±0,02 Modelos para cuatro cruce de clases clasificado por control atributos Otros caminos con solo pista 0,26±0,14 0,34±0,36 De la Tabla 2 Sin sesgo
  • 11.
    Antes-Después 0,49 0,32± un error estándar La parte superior de la Tabla 4 es para modelos de regresión de modelos convencionales en los que la carretera y los atributos del carril (como el ancho de la superficie o el ángulo de vía) se introdujeron como variables; la mitad parte es para modelos de regresión en cuatro clases de cruces y la última fila es de la Tabla 2. Considerando la magnitud de los errores estándar, las estimaciones en las partes superior y media de La tabla 4 son bastante similares. Se puede concluir que las estimaciones son poco sensibles a la inclusión o exclusión de las variables Carretera y Ferrocarril (y de clasificación). Como se ha señalado anteriormente, los tres artículos usaban los mismos datos y el mismo formulario modelo. Aún así, dependiendo de cuál se usaron las variables, qué técnica de agru- pación se implementó y qué distribución se seleccionó (Poisson o Binomial Negativo), se obtuvo una variedad de resultados. Además, colectivamente, estos estimaciones son diferentes de las obtenidas por Coleman-Stewart, por Mengert, y en estudios antes-después. Un breve resumen de los hallazgos del estudio de caso puede ser útil: 1. Los estudios de antes y después del efecto de seguridad de los dispositivos de advertencia parecen haber arrojado resultados consistentes (incluso si sesgados). 2. El inconveniente de un estudio de antes y después es que, por lo general, solo se obtiene un efecto de seguridad "promedio". estimado. Si el efecto de seguridad depende de hecho de los atributos de la unidad tratada, como es Es prudente suponer que el conocimiento únicamente del "efecto promedio" ofrece poca orien- tación para acción práctica cuando el objetivo es aplicar un tratamiento donde hará el mayor bien. 3. Si el efecto de seguridad depende de los atributos de las entidades tratadas, no se puede decir si los resultados de un estudio de antes y después son consistentes con los resultados de otro estudio sin que: una. conocimiento de los atributos de las entidades en el estudio antes-después y 17 b. conocimiento de cómo el efecto de seguridad depende de estos atributos. 4. Los estudios de regresión basados en datos transversales produjeron resultados muy varia- dos. Se puede concluir que la predicción del efecto basada en el modelo de Coleman-Stewart es tan diferente de lo que se ha encontrado en los estudios de antes y después que probablemente estén equivocados. Sin embargo, uno no puede decir por qué están equivocados. Los resultados de Mengert no son inconsistentes con lo que muestra el antes y el después. Incluso cuando se utilizó la misma base de datos y el mismo modelo forma asumida, como en los artículos de Saccomanno, Lai y Park, se obtuvieron resultados muy variados. obtenido. No se puede decir cuánto de esto refleja el hecho de que el mismo trato cuando apli- cado a diferentes sitios producirá diferentes resultados y cuánto se debe a la supuestos hechos en el proceso de modelado o las deficiencias de los datos. En conjunto, los resultados obtenidos por regresión sobre datos transversales no inspiran confianza. Está difícil saber qué resultado creer. 5. Ni Coleman, Stewart ni Mengert pretendían que sus resultados se usaran para predecir el efecto de las contramedidas. Por el contrario, Saccomanno, Lai y Park (y muchos otros) hacen de la predicción del efecto de la contramedida la piedra angular de su regresión trabajar. Este estudio de caso no apoya mucho la esperanza de que tal programa de la investigación dará resultados. Este estudio de caso es solo una anécdota y sus conclusiones no deben generalizarse.
  • 12.
    Sin embargo, laimpresión es que los modelos de regresión, cuando se basan en datos transver- sales, pueden conducir a a resultados que no inspiran confianza. El hecho de que el θ obtenido de alguna regresión modelos parece depender de los atributos de las entidades tratadas, y por lo tanto es atractivo en aplicaciones prácticas, puede ser algo así como una ilusión; no es más que un subproducto de las suposiciones hecho por el modelador sobre la forma funcional de la ecuación del modelo y sobre qué variables están representados en ella. Hacer que el efecto del tratamiento sea una función del atributo de las unidades tratadas, como ha sido intentado por Saccomanno, Lai y Park es importante y debe continuarse. Hay una gran diferencia entre los estudios de antes y después y las regresiones basadas en datos transversales que no surgieron naturalmente en la discusión anterior y, sin una mención de lo cual, esta sección estaría incompleta. Cuando se compara la seguridad de una unidad antes y después del tratamiento, la unidad sigue siendo la misma (es básicamente el mismo camino o intersección, utilizado por el mismo tipo de personas, en el mismo lugar, clima, etc.). Por lo tanto, es razonable esperar que uno puede dar cuenta de lo que ha cambiado desde el período 'antes' al período 'después'. En cambio, en una sección transversal estudio uno compara entidades 'con atributo A' (digamos, crossbucks) a diferentes entidades 'con atributo B' (digamos, luces intermitentes). La unidad proporcionada por el conocimiento de que 'la unidad sigue siendo la misma' se aplica ahora. No se puede estar seguro de que después de tener en cuenta las diferencias acerca de qué tenemos datos (tráfico y volúmenes de trenes, número de vías, etc.) no hay otra sistemática diferencias sobre las entidades 'con A' y 'con B' sobre las que no hay información. Hay la sospecha omnipresente de que las entidades tienen atributo A pero no B por una buena razón y que estos las razones no se conocen completamente y son difíciles de explicar en un modelo de regresión. Así, por ejemplo, un grado el cruce puede tener luces intermitentes y no crossbucks porque tenía un historial previo de accidentes, tal vez debido a las quejas de los usuarios de la carretera que sufrieron cuasi accidentes, debido a la existencia de un listado de prioridades basado en alguna fórmula, etc.; ninguno de estos es fácil de capturar en una regre- sión. 18 Habiendo presentado los muchos problemas dentro del marco tangible de la seguridad en los pasos a nivel, el El próximo paso es examinar lo que la literatura científica tiene que decir sobre el tema de causa-efecto en estudios observacionales. 19 3. CAUSA, EFECTO, CONFUNDIMIENTO Y CONSISTENCIA El concepto de causa es res- baladizo. Algunas de las dificultades pueden evitarse distinguiendo entre dos cuestiones diferen- tes: Pregunta A: ¿Cuál es el efecto de seguridad de un tratamiento (una causa)? Pregunta B: ¿Cuáles son las causas de ciertos eventos (p. ej., las causas de los camiones grandes)? fallas 1 )? Cualesquiera que sean las dificultades para responder a la pregunta B, no son motivo de preocupación; aquí hacemos una pregunta A. Especificamos qué causa (tratamiento) es de inte- rés y preguntamos sobre su efecto. Si bien es claro qué 'causa' nos interesa, la definición de 'efecto' requiere un cuidado considerable. 2 3.1 Definición de causa y efecto. La preocupación por la validez de las inferencias causales basadas en datos es común a muchos disciplinas: educación , medicina, sociología , etc. Naturalmente, mucho se ha escrito sobre el tema. El marco de discusión que se utilizará a continuación fue proporcionado por Holland (1986). Sus méritos son rigor y claridad y por tanto la promesa de que pueda adaptarse a las circunstancias de la seguridad vial investigar. Sea 'U' una población de entidades y 'u' una entidad específica de esta población. Porque por 'efecto' entendemos el resultado de un cambio en la naturaleza o magnitud de una causa, y el
  • 13.
    cambio es siemprede algo a otra cosa, necesitamos especificar (al menos) dos designaciones de causa, decir 't' y 'c' 3 . Cada entidad u está asociada con un valor Y(u) - la 'variable de res- puesta'. De este modo, Y t (u) es el valor de la variable de respuesta que se observaría si la entidad u estuviera expuesta a la causa ty Y c (u) es el valor que se observaría en la misma unidad si estuviera expuesta a la causa c. El efecto de la causa t en relación con la causa c en la entidad u se describe completamente comparando 4 Y t (u) y Y c (u). Rubin (1990) llama a esto el 'efecto causal a nivel de unidad'. El “Problema Fundamental de la Inferencia Causal” 5 es que normalmente es imposible tanto tratar y no tratar la misma unidad 6 y por lo tanto es imposible observar 7 en u tanto Y t (u) como Y c (u). 1 Usaré los términos 'accidente', 'choque' y 'colisión' para significar lo mismo. 2 Seguiré la notación y exposición de Holland (1986) quien se refiere a su descripción como el Modelo de Rubin para Inferencia causal basada en Rubin (1974; Rubin 1977; Rubin 1978; Rubin 1980) un formalismo que apareció por primera vez en la literatura estadística en Neyman (1923). 3 En el artículo de Holland, 't' puede connotar tratamiento y 'c' control. Sin embargo, es importante no precipitarse y no pensar en 'c' como grupo de control. En este punto, 'c' es una causa o un tratamiento, al igual que 't'. 4 Las medidas comúnmente usadas del efecto causal para una entidad son Y t (u)-Y c (u) y Y t (u)/Y c (u), (ver, por ejemplo, Rubin 1990). 5 Holanda (1986), página 947. 6 El ejemplo de Holland es un nuevo programa para enseñar matemáticas a estudiantes de cuarto grado que luego son evaluados al final del año. Cierto alumno de cuarto grado podría estar expuesto a este nuevo programa o no, pero no ambas cosas. Por lo tanto, para cualquier u, se puede medir directamente Y t (u) o Y c (u). 7 Dado que Y t (u) o Y c (u) deben permanecer inobservados y, sin embargo, ambos son nece- sarios, uno de ellos es del tipo hipotético naturaleza de lo que se observaría si se hubiera produ- cido una acción cuando, de hecho, no se produjo: un contrafactual. Groenlandia et al. (1999) explican: “Un ejemplo típico es el de McMahon y Pugh, quienes afirman que '. una asociación puede clasificarse como presuntamente causal cuando se cree que, de haberse alterado la causa, se habría producido el efecto. 20 Holland dice que hay dos soluciones generales a este problema fundamental; el cientifico solución y la solución estadística. Él describe la solución científica así: “Por ejemplo, al estudiar cuidadosamente el comportamiento de una pieza de equipo de laboratorio, un científico puede llegar a creer que el valor de Y c (u) medido en un momento anterior es igual al valor de Y c (u) para el experimento actual. Todo lo que tiene que hacer ahora es exponerte a ti. y mide Y t (u) y ha superado el Problema Fundamental de la Inferencia Causal. Tenga en cuenta, sin embargo, que este científico hipotético ha hecho una homogeneidad no comprobable suposición. Mediante un trabajo cuidadoso, puede convencerse a sí mismo y a los demás de que esta suposición es correcto 1 , pero nunca puede estar absolutamente seguro.” (pág. 947) El “supuesto de homogeneidad no comprobable es que el valor de Y c (u) observado en el pasado es lo que el valor de Y c (u) sería si se hubiera observado en el presente si se aplicara 'c' en lugar de 't'.
  • 14.
    La solución estadísticadescrita por Holland es desviar la atención del efecto a nivel de unidad (de la causa t en la entidad u relativa a la causa c) al 'efecto promedio' de la causa t relativa a la causa c cuando el promedio es sobre todas las entidades de la población U. Rubin (1990) llama a esto el 'típico efecto casual a nivel de unidad" o "efecto causal a nivel de población". La idea central es que algunas entidades de U son tratados y permiten la estimación del valor esperado E{Y t (u)} mientras que las entidades restantes de U se dejan sin tratar y permiten estimar E{Y c (u)}. El efecto promedio T se describe entonces comparando E{Y t (u)} y E{Y c (u)}. Así como la solución científica depende de una suposición no comprobable, también lo hace la estadística. solución. Aquí la suposición no comprobable es que la respuesta promedio a t de las entidades tratadas es ¿Cuál sería la respuesta promedio a t de todas las entidades en U si se tratara 2 , y que el promedio respuesta a c de las entidades no tratadas es cuál sería la respuesta promedio a c de todas las entidades en U, todos habían quedado sin tratamiento 3 . Así como el científico, el estadístico nunca puede estar seguro que esta suposición es correcta. Sin embargo, mediante un trabajo cuidadoso (que implica decidir qué entidades son tratados y cuáles no) el estadístico puede convencerse a sí mismo y a otros de que la suposición está justificado. En la "solución estadística", la plausibilidad de la suposición no comprobable se basa en aleato- rización y/o emparejamiento. Ambos requieren que el experimentador tenga control sobre qué unidad cambió.' …la alteración de la condición antecedente (causa) y el posterior cambio en el resultado (efecto) son contrario a lo que de hecho se observó; es decir, son contrafactuales ”. (pág. 30) 1 La “suposición de homogeneidad” de los científicos es la creencia de que “el valor de Y c (u) medido en un momento anterior es igual a cuál sería el valor de Y c (u) para el experimento actual”. Esto también es un contrafactual como es obvio si uno lo reformula para decir: “que el valor de Y c (u) medido en un momento anterior es el que se obtendría en el presente experi- mente si se aplicó la causa 'c' en lugar de la causa 't'. Parece ser el mismo tipo de homogeneidad contrafactual suposición que podría hacer un analista en un estudio de antes y después, la creen- cia de que los accidentes "antes del tratamiento" materializarse en el período 'después del trata- miento', si la entidad no ha sido tratada. El problema es que el científico en el al laboratorio le resultaría más fácil convencerse a sí mismo y a los demás de que la suposición es correcta que al Analista de antes y después. Las razones de la diferencia son obvias; el laboratorio permite el control de las condiciones y replicación con poca aleatoriedad, el entorno de observación no. 2 La suposición sería claramente incorrecta si las entidades se seleccionan para el tratamiento porque es más probable que responder a ella que las entidades dejadas sin tratar. 3 La suposición sería claramente incorrecta si la selección para el tratamiento estuviera motivada por el historial de accidentes de las entidades y no se tuvo en cuenta la regresión a la media. 21 recibe tratamiento y cuál no. Con aleatorización, cuando las entidades de U se asignan a t o c independientemente de sus atributos (incluida la variable de respuesta), uno puede esperar que ambos tratados y las entidades no tratadas son representativas de la población U. Con em- parejamiento, cuando los pares pueden se forman que son idénticos en los atributos 1 , y uno del par se asigna a t, se obtiene la plausibilidad por los mismos motivos. La creencia fundamental subyacente de la aleatorización y el emparejamiento estrategias es que la respuesta de una unidad a un tratamiento está determinada por algunos de sus atributos: el atributos relevantes para la respuesta, y que las unidades con atributos relevantes para la respuesta idénticos tendrán respuestas idénticas al tratamiento (ya sea 'c' o 't').
  • 15.
    Cuando el estadísticono tiene control sobre la asignación de entidades a t o c, como es cierto en los estudios observacionales, la pregunta sigue siendo la misma: ¿Es cierto que la respuesta (promedio) a t de las entidades tratadas es cuál sería la respuesta (promedio) a t de todas las entidades en U si tratados, y que la respuesta promedio a c de las entidades no tratadas es cuál sería el promedio respuesta a c de todas las entidades en U, ¿habían quedado todas sin trata- miento? Sin embargo, ahora los medios por contestarla afirmativamente faltan. Holland (1986) remite al lector a otras fuentes para su posterior examen. En palabras de Holland , “las inferencias causales proceden de los valores observados. y de supuestos que abordan el Problema Fundamental de la Inferencia Causal pero que por lo general son no comprobable.” (pág. 948). Para progresar uno tiene que hacer la pregunta de seguimiento: ¿Qué hace que el suposiciones no comprobables tan plausibles que el científico o estadístico puede "convencerse a sí mismo y otros” que la suposición es correcta? Holland no persigue esta pregunta para el científico excepto para decir que "La ciencia ha progresado mucho utilizando este enfoque” y que “…es un lugar común en la vida cotidiana como bien” (p. 947). Es útil indagar un poco más. ¿Qué justifica realmente la creencia del científico de que “el valor de Y c (u) medido en un momento anterior” es igual a lo que sería el valor de Y c (u) ahora bien, ¿no se había aplicado la 't'? La justificación parece descansar en la experiencia de que siempre que los cien- tíficos midieron Y c (u) en momentos anteriores (o hicieron mediciones repetidas de cantidades bajo circunstancias similares), los valores medidos eran todos iguales (dentro del error de me- dida). Aunque esto no significa necesariamente que el patrón pasado persistiría siempre, es en- teramente justificable creer que así sería. La creencia en la 'homogeneidad de la naturaleza' es una base respetable de creencias causales. Como se mencionó anteriormente, la justificación de Holland (y Rubin) de la suposición no com- probable sobre el que descansa la solución estadística deriva de la aleatorización (es decir, la independencia entre la decisión de asignar entidades a la causa 'c' o 't' y los atributos relevantes para la respuesta de estos entidades.) Esto difiere de la justificación del científico de varias ma- neras. Primero, el científico estimación de Y c (u) se basa en experiencias del pasado (o de otro tiempo) mientras que el estadístico utiliza la experiencia contemporánea de entidades dejadas sin tratar. En segundo lugar, la suposición del científico está en el nivel de una sola unidad (o de unidades casi idénticas) mientras que la suposición del estadístico se refiere a promedios sobre un conjunto (grande) de diferentes unidades. En tercer lugar, la "homogeneidad de la suposición de la naturaleza es que, en el ambiente controlado del laboratorio, hay razón para cree que si en la unidad u Y c (u) se obtuvo en un momento también se obtendría en otro momento. 1 En sentido estricto, sólo deben ser evaluados aquellos atributos que tienen algo que ver con la respuesta al tratamiento. considerado en el emparejamiento. Estos se denominarán atributos 'relevantes para la respues- ta'. 22 La creencia de la “homogeneidad de la naturaleza” del estadístico parece ser que dos con- juntos de entidades que tienen la misma distribución de atributos 1 se puede esperar que tengan la misma respuesta promedio a causa 'c'. La comprensión de que todos los conceptos de causalidad requieren una homogeneidad no com- probable. suposición y que las suposiciones de homogeneidad del científico y del estadístico son diferentes y tener diferentes justificaciones es liberador. Crea la oportunidad y la licencia para buscar y enunciar medios adicionales para justificar los supuestos de homogeneidad, medios que pueden
  • 16.
    adecuarse a larealidad de estudios observacionales. La justificación del estadístico de la supo- sición de homogeneidad se basa en la capacidad de decidir qué entidad obtiene 'c' y cuál obtiene 't'. En los estudios observacionales esto no es posible. Sin embargo, a un nivel más fundamental, la justificación del estadístico es que (debido a aleatorización y/o emparejamiento) es razonable creer que las entidades con 'c' tienden a tener los mismos atributos relevantes para la respuesta que aquellos con 't'. Quizá haya medios por los cuales uno pueda proporcionar a los estudios observacionales una justificación que se basa en una 'igualdad de respuesta relevante' argu- mento de los atributos. De manera similar, puede ser posible hacer autostop en los faldones del abrigo del científico. cuyo supuesto de homogeneidad era que si Y c (u) se obtenía en el pasado también sería obte- nido en el futuro. Por lo tanto, la pregunta es si se puede afirmar y justificar la homogeneidad suposiciones para estudios observacionales de antes y después y estudios transversales obser- vacionales. Considere primero un estudio observacional en el que se aplica un tratamiento a las unidades. El momento de la el tratamiento define, para cada unidad, un período de pretratamiento y de postratamiento. Llámalo un estudio observacional antes-después. Imagine un experimento de laboratorio para determinar el coeficiente de Expansión térmica de una barra de metal. Se trata de medir la longitud de la varilla antes y después calentar y quizás aplicar algunas correcciones para tener en cuenta los cambios de temperatura y presión en el laboratorio. La idea es que la longitud de la varilla antes del experimento, después de la corrección por Las diferencias de temperatura y presión entre el tiempo "antes de calentar" y "después de calentar" son cuál sería la longitud de la barra en el momento 'después del calentamiento' si la barra se dejara sin calen- tar. Siguiendo el ejemplo del científico, lo que debe mostrarse para los estudios observacionales de antes y después es que al usar valores observados del pasado (y al complementar esto con información sobre cómo algunas circunstancias relevantes han cambiado desde el período 'an- tes' al período 'después') es posible predecir el valor de Y c (u) para el período 'después'. Si fuera posible demostrar que el los valores predichos y medidos de Y c (u) están repetidamente cerca uno del otro en una variedad de circunstancias, entonces el 'científico observacional' tendría las bases necesarias para 'convencer a sí mismo y a los demás” que esta marca del supuesto de homogeneidad está justificada. Sería un justificación similar a la del científico que (después de 'correcciones' por cambios) lo que ha sido observados en el pasado se observarían en el pre- sente si no se aplicara ningún tratamiento. Si y se puede demostrar que los valores pronosticados y observados de Y c (u) están 'repetidamente cerca uno del otro' otro' es una pregunta empírica que puede ser respondida a través de un programa de investigación. por cuanto en investigación sobre seguridad vial aún no se ha emprendido un programa de investigación de este tipo, aún no es posible decir si en estudios observacionales de antes y después con unidades tratadas, los juicios de causalidad puede estar bien fundamentado en el paradigma de un 'científico obser- vacional'. Pero la perspectiva de éxito es excelente. Considere a continuación un estudio sobre el efecto de seguridad del cambio de 'c' a 't' en el que las unidades que tienen 'c' se comparan con otras unidades que tienen 't'. Llámalo un cruce observacional. 1 Solo la distribución de atributos que afectan la respuesta de las entidades a la causa c debe ser la misma. 23 estudio de sección. En esta circunstancia, la creencia de que si nada más cambiara el pasado se parecería a el presente no sirve. Ahora, la suposición que se justifica es que las unidades que
  • 17.
    se encuentra quetienen 't' han respondido a 'c' de la misma manera que las unidades que tienen 'c'. Para justificarlo hay que invocar la misma creencia fundamental sobre la que descansa la solución estadística; es decir, que la respuesta de un unidad a 'c' o 't' está determinada por sus atributos relevantes para la respuesta (y que las unidades con los atributos idénticos relevantes para la respuesta tienen respuestas idénticas a 'c' y 't'). En resumen, para justificar la suposición no comprobable en un estudio transversal observacional uno debe ser capaz de demostrar que las unidades que tienen 'c' tienen los mismos atributos relevantes para la respuesta que las uni- dades que tienen 't'. En estudios transversales suele ser difícil proporcionar la justificación reque- rida. Las dificultades son tanto práctico como conceptual. Para ilustrar, usaré la configuración de los pasos a nivel de ferrocarril y carretera. presentado en el Capítulo 2. Algunos cruces tienen 'crossbucks', otros tienen 'flashes' y hay razones para esto diferencia. Las razones son de dos tipos, ambas relacionadas con la práctica profesional. El primer tipo de la razón tiene sus raíces en la eficiencia económica. En general, cuanto más tráfico atiende una instalación, más caro el tratamiento 1 que recibe. En el marco específico de la seguridad en los pasos a nivel, los sitios con más tráfico de vehículos y trenes tenderá a estar equipado con la advertencia más costosa dispositivos. Crossbucks cuestan menos que las luces intermitentes que, a su vez, son menos costosas que las puertas, y las puertas son más baratos que la sepa- ración de grados. Uno debe suponer razonablemente que tanto los vehículos como los trenes el tráfico son atributos relevantes para la respuesta. Por lo tanto, es imposible afirmar que "unidades encontradas para tienen 'c' (por ejemplo, crossbucks) tienen los mismos atributos relevantes para la respuesta que las unidades que tienen 't' (digamos, intermitentes) a menos que uno pueda encontrar muchos cruces que son similares en el tráfico de trenes y vehículos pero difieren en el dispositivo de advertencia. La dificultad práctica es que, debido a la prevalencia de la sensatez práctica profesional, se encontrarán pocos cruces de este tipo. Supongamos ahora que la dificultad práctica puede superarse y que un número suficiente de cruces coincidentes en el tráfico de vehículos y trenes (y en varios otros atributos relevantes para la respuesta) como el número de vías, el entorno urbano o rural, la velocidad del tren, el triángulo visual, etc.). Ahora uno debe preguntarse por qué algunos de los cruces ostensiblemente similares tienen crossbucks y otros tienen luces intermitentes No se debe suponer que la elección se ha hecho sin razón. De lo contrario, la elección de un dispositivo de advertencia a menudo se basa en consideraciones del historial de accidentes pasados, público presión, cuasi accidentes y de un juicio profesional sobre por qué algún sitio se beneficiaría de intermitentes y otro no. En conse- cuencia, la siguiente dificultad conceptual insalvable surge: si los cruces ostensiblemente simila- res reciben diferentes dispositivos de advertencia por alguna razón, entonces uno no puede afir- mar que "las unidades que tienen 'c' tienen los mismos atributos relevantes para la respuesta que las unidades encontrado tener 't'”. Las diferencias en los atributos relevantes para la res- puesta pueden ser difíciles de identificar o describir, pero se debe suponer que existen. En resumen, para los estudios observacionales de antes y después podría sugerir un programa de investigación por que se podría establecer la confianza en el supuesto de homogeneidad no comprobable. Hay un buena oportunidad para que tenga éxito. Para estudios transversales ob- servacionales no sé cómo hacer asi que; No puedo imaginar un programa de estudio con buenas posibilidades de éxito. 1 La práctica profesional relevante se captura en estándares, directrices, garantías, etc., todos los cuales están escritos de manera que las instalaciones con más tráfico obtienen las
  • 18.
    características de diseño,marcas, dispositivos de control de tráfico y mantenimiento más caros debido a que es en instalaciones de alto uso donde el gasto puede justificarse por la seguridad y otros ahorros. 24 3.2 Confusión e intercambiabilidad en estudios observacionales de secciones transver- sales de carreteras La seguridad. La columna vertebral de la Sección 3.1 es el marco Holland-Rubin que se adapta a la circuns- tancia en la que algunas unidades fueron efectivamente tratadas. Este marco no simpatiza con el circunstancia del estudio transversal observacional en el que se encuentra que algunas unida- des tienen 'c' y se encuentra que otros tienen 't'. Dado que es el estudio transversal observacional el que está en el centro de nuestra investigación, en lo que sigue, haré uso del trabajo de otros autores que están más abierto a la posibilidad de interpretación causal en estudios transversales. El supuesto de homogeneidad para los estudios observacionales transversales 1 está estrecha- mente relacionado con la noción de 'intercambiabilidad' y de 'confusión'. En este contexto Pearl (2000) escribe: “Conceptualmente, la conexión entre confusión e intercambiabilidad es la si- guiente. Si nos comprometemos a evaluar el efecto de algún tratamiento, debemos asegurarnos de que cualquier respuesta la diferencia entre el grupo tratado y el no tratado se debe al trata- miento en sí y no (debido) a algunas diferencias intrínsecas entre los grupos que no están rela- cionadas con el tratamiento. En otra palabras, los dos grupos deben parecerse entre sí en todas las características que tienen relación con el variable de respuesta. En principio, podríamos ha- ber terminado la definición de confusión en este punto; declarando simplemente que el efecto del tratamiento no se confunde si los grupos tratados y no tratados se parecen entre sí en todas las características relevantes. Esta definición, sin embargo, es demasiado verbal en el sentido que es muy sensible a la interpretación de los términos "semejanza" y "relevancia". es menos informal, GR 2 usó el 3 giro de permutación hipotética de De Finetti ; en lugar de juzgar si dos grupos son similares, se instruye al investigador para que imagine un intercambio hipoté- tico de los dos grupos (el grupo tratado deja de ser tratado y viceversa) y luego juzgar si los datos observados en el swap se distinguirían de los datos reales.” (p. 196) Para desarrollar los puntos de vista de Greenland-Robins (GR) a los que se refiere Pearl, me basaré en el artículo de Greenland et al. {Greenland, 1999 1166 /id.) que proporciona una formalización de confuso Para evitar la duplicación, convertiré la formalización GR en la notación 'Holanda' introducido anteriormente. Mientras que el punto de partida tanto para Holland-Rubin como para Greenland et al. es lo mismo -el enfoque contrafáctico de causa y efecto- hay diferen- cias importantes entre las dos formulaciones. Holland (1986), cree en el lema “No Causation Without manipulación” y dice que: “Debido a que la experimentación es un instrumento científico y herramienta estadística y que a menudo introduce claridad en las discusiones de casos espe- cíficos de causalidad, me baso descaradamente en el lenguaje y el marco de los experimentos para el modelo de inferencia causal”. (p.946) Los experimentos siempre involucran algún trata- miento o manipulación. En Por el contrario, Groenlandia et al. (1999) basan su razonamiento en una comparación de dos poblaciones de unidades; el tratamiento 't' se aplica a las unidades de población 'A' y el tratamiento 'c' a las unidades de población 'B': una comparación transversal. 1 Que las unidades que tienen 'c' tienen los mismos atributos relevantes para la respuesta que las unidades que tienen 't'. 2 Aquí se hace referencia a un artículo de Greenland y Robins (1986). 3 (De Finetti 1974).
  • 19.
    25 Para definir'confundir' Groenlandia en al. (1999) argumentan de la siguiente manera. Supon- gamos que nuestro el objetivo es determinar el efecto del tratamiento 1 't' sobre las respuestas Y(u) de unidades en población A, relativo al tratamiento 'c', y que μ es un parámetro de la distri- bución de las respuestas Y(u). A ilustran, Groenlandia et al. (1999) dicen que “Por ejemplo, la población A podría ser una cohorte de pacientes con cáncer de mama, el tratamiento 't' podría ser una nueva terapia hormonal, 'c' podría ser un placebo terapia, y el parámetro μ podría ser la supervivencia esperada o la probabilidad de supervivencia a cinco años de la cohorte.” (pág. 32 ). Sean μ iguales a μ At si se aplica 't' a la población A y μ Ac si se aplica 'c' a la población A. El efecto causal de 't' relativo a 'c' se define en términos de una comparación entre μ At y μ Ac . Si las unidades de A se observan bajo el tratamiento 't' entonces μ At es observable o estimable; sin embargo, μ Ac entonces no se observará 2 . Sin embargo, suponga que esperamos que μ Ac sea igual a μ Bc , donde μ Bc es el valor de μ para unidades de población B con tratamiento 'c'. En el ejemplo anterior, este sería el cohorte de pacientes con cáncer de mama que reciben el placebo. Ahora se puede escribir una definición clara de confuso: “ Decimos que existe confusión si, de hecho, μ Ac ≠ μ Bc , porque entonces debe haber alguna diferencia entre las poblaciones A y B (aparte del tratamiento) que es responsable de la discrepancia entre μ Ac y μ Bc ”. (pág. 32) Para ilustrar el concepto en un entorno de seguridad vial, suponga que un conjunto de vías rurales de dos vías segmentos de carretera tiene cuatro pies de arcenes pavimentados (Carre- teras A en la Figura 8 con tratamiento 't') y otro conjunto de dichos segmentos de carretera tiene dos pies de arcenes pavimentados ((Carreteras B con tratamiento 'c'). Los cuadrados negros en la Figura 8 indican cantidades que se pueden observar (estimar). Por lo tanto, la los observables son μ At (choques/milla-año en las carreteras A que 'se encontró que tenían t') y μ Bc (choques/milla-año en las carreteras B que se 'encontró que tenían c'). La orde- nada de un círculo vacío en La Figura 8 es lo que sería μ en los caminos A si estos caminos tuvieran dos pies de arcenes pavimentados. Círculo 1 y el círculo 2 son solo dos de un número infinito de posibles posiciones del círculo. La posición de un círculo vacío es inobservable porque pertenece a una circunstancia que de hecho no existió: un contrafactual 1 Groenlandia et al. distinguir entre 'tratamiento' como agente administrado por el investigador y 'exposición' que, en medicina, generalmente se refiere a un agente de daño al que las unidades están expuestas sin ninguna premeditación por parte del investigador. Desafortunadamente, en seguridad vial, el tér- mino 'exposición' significa algo completamente diferente (por ejemplo, millas-vehículo de viaje). Para evitar confusiones, usaré 'tratamiento' para referirme a ambos tipos de agentes. 2 Este es el Problema Fundamental de la Inferencia Causal. 26 Figura 8. Aspectos básicos de una comparación transversal La idea principal es usar la cantidad observable en los caminos B (es decir, μ Bc ) para adivinar cuál es el podría ser la ordenada inobservable del círculo vacío. La comparación de μ At con μ Bc no será confundido si el número medio de choques/(milla-año) en las carreteras B (la ordenada del negro cuadrado a la izquierda, μ Bc ), es lo mismo que sería en las carreteras A si tuvieran dos pies de pavimentado hombro, no cuatro (la ordenada del círculo 1). Por el contrario, la comparación de μ At con μ Bc será confundido si el número medio de choques/(milla-año) en las carreteras B ( μ Bc ), no es lo mismo que el número de choques/milla-año sería en las carreteras A si tuvieran un arcén pavi- mentado de dos pies (la ordenada del círculo 2) . Dado que la posición del círculo es desconocida e inobservable, ¿cómo se puede juzgar si ¿Está en la posición 1 (sin confusión) o en la posición 2 (confusión)? Hay dos generales enfoques para disminuir la amenaza del sesgo 1 debido a la confusión en la sección transversal observacional
  • 20.
    estudios. Un enfoquees la ecualización de atributos ya sea por 'restricción' o por 'coincidencia'. Si las carreteras B pueden elegirse de modo que todos sus atributos relevantes para la respuesta sean los mismos que los de las carreteras Entonces uno puede creer justificadamente que la ordenada del cuadrado completo izquierdo es la misma que la ordenada del círculo. Este enfoque se muestra en la Figura 8 por la flecha horizontal entre la izquierda cuadrado completo y círculo 1. El otro enfoque es la igualación por análisis. El paso de análisis consiste de agregar una 'co- rrección' a μ Bc que tenga en cuenta las diferencias que existen en las respuestas relevantes atributos entre las carreteras A y B. La 'corrección' corresponde a la flecha vertical en la Figura 8 que va del cuadrado lleno al cuadrado vacío que tiene la misma ordenada que el círculo 2. El La ordenada del cuadrado vacío es una estimación de cuál sería el μ de las carreteras B si tuvieran todos los atributos relevantes para la respuesta de las carreteras A, excepto que tienen el tratamiento 'c'. En la Figura 8 esto ordenada es μ B□ . Si la corrección μ B□ - μ Bc es de la magnitud correcta, entonces se puede argumentar nuevamente que la comparación no se con- funde. Ambos enfoques se analizan a continuación. 1 El sesgo en la Figura 8 es la diferencia entre las ordenadas del cuadrado negro de la izquierda y la ordenada del circulo. Así, si el caso es el círculo 1, no hay sesgo; si el caso es el círculo 2 el sesgo es apreciable. 27 3.2.1 Enfoque 1: Igualación de Atributos por Restricción o Coincidencia. La igualación por restricción o emparejamiento es un intento de justificar el juicio de que el La ordenada del cuadrado completo izquierdo en la figura 8 es la misma que la del círculo 1 porque la respuesta relevante los atributos de las unidades en las poblaciones A y B son los mismos 1 . La clave entonces es hacer el unidades de la población A comparables o intercambiables con las unidades de la población B con respecto a los atributos relevantes para la respuesta (o algún índice de los mismos). La otra cara del mismo argumento es que si se piensa que las unidades en A y B difieren en algún atributo relevante para la respuesta, entonces debe juzgarse que existe confusión. En el ejemplo de la pavimentación del arcén, la pregunta es si se puede argumentar de manera convincente que las carreteras B tendrían el mismo número medio de accidentes/milla-año que las carreteras A si ambos conjuntos de las carreteras tenían el mismo ancho de arcén pavimen- tado. Para argumentar así uno tiene que saber qué atributos son probable que afecte la respuesta (choques/milla-año) y muestre que son iguales en ambos conjuntos. En este caso Los atributos relevantes para la respuesta son muchos: cantidad de tráfico, entorno urbano o rural, condiciones climáticas. condiciones, características de los usuarios de la vía, como distribuciones de edad, género, in- gresos o educación; la carretera antiguo; terreno, mantenimiento invernal, etc. Por lo tanto, la circunstancia de ancho de arcén pavimentado corresponde al círculo 2 que tiene una ordenada diferente que el cuadrado completo izquierdo. La respuesta a la La pregunta que se plantea es que, en el ejemplo del ancho de la banquina pavimentada, no se puede argumentar de manera convincente que las carreteras que tienen 't' son intercambiables con las carreteras que tienen 'c'; la confusión debe ser juzgado existir. Es decir, mediante una comparación directa, los obser- vables μ Bc y μ At uno no pueden determinar el efecto de seguridad de arcenes pavimentados de dos pies versus cuatro pies. Para hacer que las dos poblaciones sean comparables o intercambiables por 'restricción' sería necesario estratificar los caminos en A y los caminos en B en celdas que sean homogéneas en todos los variables relacionadas con la respuesta antes mencionadas y luego comparar los va- lores de la variable de respuesta (choques/milla-año) solo en las celdas correspondientes.
  • 21.
    Incluso con unnúmero modesto de variables uno encuentra rápidamente que ninguna celda con- tiene suficientes segmentos de carretera para hacer comparaciones significativas. Este es el lla- mado problema de datos dispersos 2 . Quizás por esta razón, el enfoque de restricción rara vez ha utilizado en la investigación sobre seguridad vial. Dado que en la investigación de seguridad vial el enfoque de restricción ha no ha sido ampliamente probado, puede ser prematuro pronun- ciarse sobre su promesa. Sin embargo, Groenlandia et al. (1999) dicen que en otros campos, tales métodos “a menudo son inviables o insuficientes para producir intercambiabilidad.” (pág. 35). Es probable que esto se aplique a la investigación sobre seguridad vial no solo debido a la 1 Una vez más, se debe invocar la 'creencia fundamental' de que la respuesta de una unidad a 'c' o 't' está determinada por sus atributos relevantes para la respuesta (y que las unidades con atributos relevantes para la respuesta idénticos tienen respuestas idénticas a 'c' y 't'). Sobre esto, Groenlandia et al. (1999) dicen que “Parece intuitivamente claro que si μ Ac y μ Bc difieren en- tonces (la unidades en) A y B deben diferir con respecto a los factores que afectan a μ “ . Groen- landia et al. argumentan que las diferencias entre los los atributos relevantes para la respuesta de A y B no implican confusión, “porque los efectos de las diversas covariables las diferencias pueden equilibrarse” (p. 33). Si bien tal equilibrio es una posibilidad, es muy poco probable y, en mi opinión, opinión, sin consecuencias prácticas. 2 Greenland et al (1999) dicen que: ” Los métodos de ajuste más simples comienzan con la estratificación en factores de confusión. A covariable no puede ser responsable de la confusión dentro de un estrato que es internamente homogéneo con respecto a la covariable. Esto es así, independientemente de si se utilizó la covariable para definir el estrato. Por ejemplo, género los desequilibrios no pueden confundir las observaciones dentro de un estrato compuesto única- mente por mujeres. Parecería natural, entonces, para controlar la confusión debida a los factores medidos simplemente estratificándolos a todos. Desafortunadamente, entonces uno enfrentar el conocido problema de datos dispersos: dados suficientes factores, pocos o ningún estrato tendría sujetos en ambos grupos de tratamiento, lo que hace que las comparaciones sean ineficientes o imposibles”. (pág. 35) 28 antes mencionado 'problema de datos dispersos' sino también por la dificultad añadida de que si una unidad si se encuentra para tienen 't' y otro tiene 'c', los profe- sionales pensaron que las dos unidades son diferentes y por lo tanto debe estar equipado de manera diferente. Por lo tanto, estar equipado de manera diferente casi implica la existencia de diferencias relevantes para la respuesta, algunas de las cuales quizás estén relacionadas con un juicio no documentado. Las limitaciones que hacen impracticable la 'restricción' se aplican igualmente a la 'coincidencia'. 3.2.2 Enfoque 2: Igualación de Atributos por Análisis. El segundo enfoque para eliminar el sesgo debido a la confusión es el indicado por el flecha vertical en la Figura 8. El objetivo es estimar la 'corrección' μ B□ - μ Bc y agregarla a la observable μ Bc y así obtener una estimación μ B□ ; esto es lo que serían los μ de las carreteras B si tuvieran los atributos relevantes para la respuesta de las carreteras A. Ahora que todos los atributos re- levantes para la respuesta de las carreteras B son los mismos que los de las carreteras A, se puede argumentar justificadamente que μ Bc es también lo que μ en las carreteras A sería si tuvieran dos pies de arcén pavimentado, no cuatro. Para ilustrar, si en las carreteras B el prome- dio velocidad era de 75 km/h y en las carreteras A era de 80 km/h, la corrección sería una esti- mación de la cambio en la frecuencia esperada de accidentes si la velocidad en las carreteras B fuera de 80 km/h, no de 75 km/h. voy a referirse a este enfoque como 'Corrección por análisis'. La corrección se deriva de dos esenciales elementos: una. Información sobre los atributos rele- vantes para la respuesta de las unidades en las poblaciones A y B; b. Conocimiento de cómo μ
  • 22.
    de los caminosen B podría cambiar en respuesta a un cambio en estos atributos relevantes para la respuesta. Groenlandia et al. (1999) dicen que “ha habido una enorme cantidad de trabajo dedicado a ajus- tes analíticos por confusión. Con algunas excepciones, estos métodos se basan en distribuciones de covariables observadas en las poblaciones comparadas. Tales métodos funcionarán con éxito controlar los factores de confusión solo en la medida en que se miden y empleado en el análisis. Luego, también, muchos métodos emplean modelos paramétricos en alguna etapa, y su éxito depende, pues, de la fidelidad del modelo a la realidad”. (pág. 35); y más tarde “La método más común para evitar problemas de datos dispersos es imponer restricciones paramétricas en la regresión del resultado sobre el tratamiento y las covariables; .Sin embargo, teórico Los resulta- dos indican que ningún enfoque puede resolver completamente los problemas de datos disper- sos, en la medida en que la muestra el tamaño siempre limitará el número de grados de libertad disponibles para el ajuste de covariables y prueba de modelos”. (pág. 36) En seguridad vial, el arte de estimar la magnitud de la corrección (lo que Greenland et al. llamar el 'ajuste analítico') que se requiere para controlar la confusión en la sección transversal observacional estudios parece ser en gran medida terra incognita. No es la ambición de este documento mapear este territorio inexplorado. Sin embargo, desarrollar una apreciación de la tarea y los obstáculos para su éxito, se requiere una exploración conceptual. Indicar en qué con- siste la 'corrección por análisis' enfoque en la seguridad vial podría implicar, usaré nuevamente el ejemplo del ancho de la banquina pavimentada, partiendo de lo que es simple pero poco rea- lista, y agregando capas de complejidad para gradualmente acercarse a la realidad. 29 Suponga inicialmente que las carreteras A son las mismas que las carreteras B en todos los atributos relevantes para la respuesta 1 . Si es así, no se necesita corrección y la ordenada del cuadrado completo izquierdo en la Figura 8 ( μ Bc ) puede ser utilizado legítimamente para estimar cuáles serían los choques/milla-año en las carreteras A si tuvieran 2' arcenes pavimentados (la ordenada del círculo no observado 1). Agregue la Capa 1. A continuación, suponga que los caminos en A (aquellos con arcenes pavi- mentados de cuatro pies) tienen la mismos atributos relevantes para la respuesta que las carre- teras en B (aquellas con arcenes pavimentados de dos pies) 2 , excepto que en las carreteras B la velocidad media es de 75 km/h mientras que en las carreteras A es de 80 km/h. la tarea es Estime cuál sería μ Bc si en las carreteras de B la velocidad promedio fuera de 80 km/h. Para esto necesitamos saber cómo cambia el μ en este tipo de carretera en función 3 de la velocidad media. conocimiento de esto tipo a veces se puede extraer de la investigación publicada. La siguiente observación general 4 Puede ser hecho: O1. Para corregir las diferencias en un atributo relacionado con la respuesta, uno debe tener conocimiento de la función que dice qué cambio en la respuesta es causado por un cambio en el atributo. Tal el conocimiento proviene de los resultados de la investigación. Agregue la Capa 2. Suponga ahora que en el grupo A hay algunos caminos con una velocidad promedio de 80 km/h y algunas con 90 km/h mientras que en el grupo B hay algunas carreteras con 70 km/h y algunas con 75 km/h El tamaño de la corrección dependerá de si las carreteras de 70 km/h van a ser 'corregido' a 80 km/h o a 90 km/h. En definitiva, la corrección dependerá de la elección del maridaje para los que no hay motivos claros 5 . Para eludir este tipo de dificultad uno tiene que traer ambos grupos de caminos a algún valor de atributo común. Así, por ejemplo, si se eligió una velocidad promedio de 80 ser este valor común, se calcularía una corrección para aquellos caminos en A donde el promedio la velocidad es de 90 km/h y se calcula otra corrección para todas las carreteras de B. Así, el remedio es use dos correcciones en lugar de una como se
  • 23.
    muestra en laFigura 9 con las dos flechas. la flecha hacia abajo corrige μ At para llevar todos los caminos A a algún valor común de la(s) variable(s) relevante(s) para la respuesta. los la flecha hacia arriba corrige μ Bc para que todos los caminos B tengan el mismo valor común. el incon- fundible comparación es ahora entre μ A□ y μ B□. El precio de aplicar dos correcciones en lugar de una es el inevitable aumento de la varianza de esta comparación 6 . 1 Los atributos que vienen a la mente pueden ser la cantidad de tráfico, el entorno (urbano o rural), las condiciones climáticas, el usuario de la vía características (distribución de edad, sexo, ingresos o educación), antigüedad de la carretera, terreno, mantenimiento invernal, etc. 2 Es decir, la distribución edad-género-ingreso de los conductores, la ocupación de los vehículos, la mezcla de autos y camiones y su antigüedad y el tráfico durante todas las horas del día son los mismos en las carreteras A y B, solo el número diario de vehículos es diferente. 3 Por 'función' me refiero a una representación causal de cómo cambian los accidentes espera- dos en una carretera cuando la velocidad promedio es cambió. Se excluye el tipo de relación que se podría obtener al comparar algunos caminos con velocidad promedio X con otras vías con velocidad media Y. 4 Etiquetaré las observaciones generales con O1, O2, etc. 5 Excepto si los choques/milla-año son proporcionales a la velocidad promedio, lo que no parece ser el caso. 6 La característica adicional de la estrategia de dos correcciones es que el efecto de seguridad dependerá del valor común elegido. Esto no es necesariamente una desventaja. 30 Figura 9. Las dos 'correcciones'. Como antes, para estimar las dos correcciones se necesita tener información sobre los puntos importantes. atributos relevantes para la respuesta de Roads A y Roads B, así como estar en posesión de investigaciones basadas en conocimiento sobre la función causa-efecto de cómo cambia la fre- cuencia esperada de accidentes cuando cambian los atributos relevantes para la respuesta. Agregue la Capa 3. Hasta ahora, las carreteras de cada grupo diferían solo en la velocidad pro- medio y se asumió que existe un conocimiento basado en la investigación de la función que vincula la frecuencia de choque y la velocidad promedio. Supongamos ahora que las carreteras A difieren de las carreteras B también en que tienden a estar más cerca de las zonas urbanas. áreas Tal atributo de 'ubicación' podría influir en la seguridad de varias maneras, por más com- pleto notificación de accidentes, por menor tiempo de respuesta de los servicios médicos de emergencia, por diferencias en el edad, género, ingresos de los usuarios de la vía, por diferencias en el consumo de alcohol, etc. No es probable que uno tener conocimiento de la relación funcio- nal que vincula la frecuencia de los accidentes y la 'ubicación'. A Es posible que ni siquiera exista una relación estable (transferible) de este tipo 1 . Sin embargo, sin tal función las correcciones no se pueden estimar. Así, por lo general, O2. Incluso si uno tiene datos sobre un atributo rela- cionado con la respuesta, el requisito correspondiente puede faltar una relación funcional. En ese caso, no se puede aplicar ninguna corrección y el no se puede explicar la confusión debida a tal atributo. Una dificultad añadida es que aunque conociéramos las funciones μ ( velocidad media) y μ (ubi- cación de la carretera) uno no puede asumir que la función conjunta μ ( velocidad promedio, ubicación de la carretera) es algo simple compuesto de las dos funciones constituyentes
  • 24.
    separadas. En general,O3. La corrección por confusión requiere el conocimiento de una función multivariable que vincule μ a todos los atributos importantes relacionados con la respuesta (va- riables). En seguridad vial, tales funciones actualmente no existe. Agregue la capa 4. Otro paso hacia el realismo en el ejemplo del ancho del arcén pavimentado es asumir que existen variables relacionadas con la respuesta que se sabe que son importantes (p. ej., distribución de edad de los usuarios de la carretera o fricción de la superficie de la carre- tera) sobre el cual nuestro conjunto de datos es mudo. En este caso, no hay corrección corres- pondiente se puede aplicar y se debe suponer que existe confusión. 1 Puede no existir una relación funcional estable porque el atributo urbano, suburbano o rural refleja un paquete o atributos más fundamentales (informe de accidentes, tiempo de respuesta de los servicios médicos de emergencia, distribuciones de edad, ingreso de género y otros ras- gos de los usuarios de la vía pública, consumo de alcohol, etc.) y estos atributos pueden variar de un urbano (o rural) a otra. 31 O4. Para corregir la confusión, uno debe tener datos sobre lo que se sabe que es importante atributos relevantes para la respuesta de las unidades en A y B. Si tales datos no están disponi- bles, confusión debe suponerse que existe. Agregue la capa 5. Finalmente, están los atributos relevantes para la respuesta que no conoce- mos. Destacan entre ellas las razones por las cuales un camino terminó teniendo dos pies de pavi- mentado hombros y otros cuatro. La influencia de estos atributos, desconocidos, insospechados, no reconocido o indocumentado pero omnipresente, siempre estará al acecho en el fondo. En general, O5. En la medida en que hay algunos atributos relevantes para la respuesta que no conocemos sobre, y hay razones no documentadas para aplicar 'c' a algunas unidades pero 't' a otras unidades, se debe suponer que existe confusión Esta fuente de confusión no se puede corregir por. Si bien algunas de las dificultades a las que se enfrenta el enfoque de "corrección por análisis" tal vez podrían tratarse si tuviéramos datos mucho más ricos y un conocimiento mucho mejor del requisito funcional relaciones, algunos obstáculos parecen insuperables. Las dificultades insupe- rables son dos. En primer lugar, en el contexto de la seguridad vial siempre será difícil argumentar que el juicio de profesionales para implementar 't' o 'c' no fue influenciado por la historia pasada de choques o casi accidentes, por consideraciones basadas en una familiaridad con el sitio y sus circunstan- cias que no se puede ver en los datos, o por algún atributo relevante de respuesta ahora irreco- nocible. los La segunda dificultad (aparentemente) insuperable es que generar confianza en la 'corrección por enfoque de análisis, uno tendría que proporcionar evidencia empírica de que μ A□ es lo que los μ caminos B sería si tiene los atributos relevantes para la respuesta elegidos y hombros de dos pies y el μ B□ es cerca de lo que sería el μ en las carreteras A si tienen los atributos relevantes para la respuesta elegidos y hombros de cuatro pies. Esto implica que habría que encontrar caminos que realmente deberían estar equipados con 't' como son los caminos en A, pero permaneció equipado con 'c' por algún capricho del destino que es completamente sin relación con ningún posible atributo relevante para la respuesta. No puedo pensar en algo tan natural. experimentos Por lo tanto, no puedo ver una manera de verificar empíricamente que la 'correc- ción' está cerca de lo que debería ser En resumen, en los estudios observacionales transversales en los que se comparan las unidades que tienen 'c' con unidades que tienen 't', existirá confusión
  • 25.
    a menos quese elimine por 'restricción o emparejamiento' o por 'análisis'. La opción de eliminar la confusión por 'restricción y coincidencia' es limitado por el problema de los "datos escasos" y por el de los atributos relacionados con la respuesta desconocida. los posibilidad de 'corrección por análisis' está circunscrita por las dificultades O1 a O5 enumeradas arriba. 3.2.3 ¿Se pueden igualar los atributos usando modelos de regresión paramétrica? Supon- gamos ahora que en lugar del enfoque de 'dos correcciones' descrito en la sección 3.2.2, uno utilizará los datos sobre choques y atributos para estimar dos modelos de regresión, uno para las carreteras A y otra para caminos B. Una vez hecho esto, se podría: a. especificar un conjunto de valores de atributos → b. calcule los choques/año pronosticados para un camino de A y (usando los mismos valores de atributo) para un camino de B → c. comparar las dos predicciones y así, → d. estimar el efecto de seguridad de reemplazar arcenes de dos pavimentados por arcenes pavimentados de cuatro pies para una carretera con el atributo especificado valores. 32 Esta es, en esencia, una versión de 'igualación de atributos' discutida en 3.2.2. llamaré este es el enfoque de 'ecualización por regresión'. La pregunta es cuáles son las fortalezas y limita- ciones del uso del enfoque de igualación por regresión para eliminar el sesgo de confusión cuando se hace uso de datos observacionales de secciones transversales? Para responder a esta pregunta haré uso de las observaciones O1 a O5 del apartado anterior (3.2.2). La primera observación general en la sección 3.2.2 (O1) fue que para corregir las diferencias en un atributos relacionados con la respuesta entre las unidades del grupo A y las unidades del grupo B que uno debe tener conocimiento de qué cambio en la respuesta es causado por un cambio en el atributo. En la sección 3.2.2, el Se asumió que la relación funcional necesaria se basaba en el acervo de hallazgos de la investigación. acumulado a lo largo del tiempo. Cuando se utiliza el enfoque de ecualización por regresión, se supone que la relación funcional requerida es el propio modelo de regresión - el resultado de ajustar un ecuación a los datos de las unidades en el grupo. El atractivo de este enfoque es que uno no necesita rastrear, dominar y evaluar los datos exis- tentes. investigación acumulada para establecer lo que se sabe; que el modelo estimado proporciona la necesitaba una función de causa-efecto a la manera de 'deus ex machina'. La misma caracterís- tica de la El enfoque de 'ecualización por regresión' también parece cuidar el O2, que a veces, incluso si los datos acerca de un atributo relacionado con la respuesta está disponible, el cono- cimiento de la correspondiente sin confundir Falta la relación funcional. 1 Desafortunadamente, esta forma automática por la cual una regresión proporciona las relaciones funcionales necesa- rias es también una fuente de gran debilidad. confiando exclusivamente en la forma funcional y parámetros estimados del modelo de regresión que fue ajustado al conjunto de datos específico en cuestión, uno está esencialmente ignorando todo lo que se sabe de investigaciones previas sobre tales relaciones funcionales 2 . Es como si no existiera ningún conocimiento además lo que afirma el modelo de regresión actual y como si uno pudiera estar seguro de que cualquiera que sea el El modelo actual afirma que está lo suficientemente cerca de la verdad, incluso si va en contra de lo que otros encontraron o lo que comúnmente se conoce. Ninguna suposición es aceptable. Primero, descartar todo conocimiento fuera del conjunto de datos que se examina está en desacuerdo con la tradición de la ciencia. En la ciencia, el conocimiento. es una cuestión de acumulación, y la clave para confiar en alguna afirmación sobre la realidad es la consistencia con la que se puede obtener. En segundo lugar, la experiencia con modelos
  • 26.
    de regresión encarretera la seguridad nos dice que diferentes investigadores tienden a encontrar diferentes funciones para las mismas variables 3 . Eso Es difícil saber cuál de las diversas rela- ciones está cerca de reflejar causa y efecto. Por lo tanto, no puede estar seguro de que cualquier modelo de regresión estimado específico represente de manera confiable la función causal necesaria necesaria para lograr la igualación de atributos. A primera vista, el enfoque de 'ecualización por regresión' también se ocupa de O3: la necesidad tener una función multivariable que vincule μ con todos los atributos relacionados con la res- puesta ; el resultado de un regresión siempre hace que μ sea una función de todas las variables retenidas. Por desgracia, esto no es una función. encontrado por la investigación acumulada para describir consistente y adecuadamente un fenó- meno, ni es el función sugerida por una teoría plausible. Es una función que es seleccionada por el modelador y es 1 Cuando se usa el enfoque de 'ecualización por regresión', para cada atributo (variable) que se retiene en el modelo siempre hay una relación funcional correspondiente. 2 Esta debilidad podría desaparecer si los modelos de regresión fueran completamente bayesia- nos, y si se hiciera uso de modelos 'informativos'. antecedentes que encarnan todo el conocimiento acumulado. 3 Como lo ejemplifican los modelos Coleman-Stewart versus Mengert. 33 basado en la evidencia limitada y generalmente difusa de un solo conjunto de datos. Como resultado, a menudo es un prototipo simple elegido del pequeño repertorio y compuesto por adi- tivos o multiplicativos bloques de construcción que en sí mismos son funciones simples, gene- ralmente de una sola variable. tal La función se puede considerar como una aproximación de la serie de Taylor de primer orden de la función subyacente desconocida. función. Como tal, si la función subyacente no es lineal, la aproximación es adecuada solo para valores cercanos al punto en el que se centra la serie de Taylor, pero no es aplicable a lo largo del rango de variación variable que normalmente se encuentra en las poblaciones reales de uni- dades. Por lo tanto, la corrección por confusión que se basa en tal aproximación de primer orden puede ser ampliamente fuera de la marca. La pregunta global abordada en este documento es si las regresiones cuando se basan en la sección transversal los datos pueden apoyar la interpretación de causa y efecto. Mientras no se responda la pregunta uno no puede asumir que lo hacen o que no lo hacen. Una parte de lo que se describió como debilidad de el enfoque de igualación por regresión en los párrafos anteriores se basa en la suposición de que, en seguridad vial, tales regresiones por lo general no logran captar la causa y el efecto. Si fuera cierto lo contrario, las debilidades identificadas desaparece- rían. En la sección 3.2.2, señalé en O4 que: “Para corregir la confusión, uno debe tener datos sobre lo que se sabe que son atributos relevantes para la respuesta de las unidades en A y B”. lo mismo es verdadero para el enfoque de igualación por regresión. En la medida en que sabemos de la existencia de algún atributo relevante para la respuesta que no se usa en la ecuación de regre- sión 1 , su omisión será un fuente de confusión tal como lo es cuando el enfoque de 'corrección por análisis' de la sección 3.2.2 es usó. Así, por ejemplo, si los usuarios de las carreteras A diferían en edad, ingresos o consumo de alcohol de los usuarios de carreteras B, y si la edad, los ingresos o el BAC no fueran variables en la regresión, entonces la igualación por regresión los resultados del enfoque se confundirán de la misma manera que los resultados basados en el
  • 27.
    el enfoque de'corrección por análisis' sería; uno no sabrá si la diferencia de seguridad que los modelos indican se debe al ancho del arcén pavimentado o a diferencias de edad, riqueza o hábito de beber De manera similar, al igual que en 3.2.2, se debe suponer que cuando la 'ecua- lización por regresión' se utiliza el enfoque, puede haber algunos atributos relevantes para la respuesta que ni siquiera conocemos sobre. Destacan las oscuras razones para aplicar 'c' a algunas unidades y 't' a otras unidades. Sólo como en 'ecualización por análisis' (sección 3.2.2, O5), esta fuente de confusión no se puede eliminar a partir de estudios observacionales trans- versales mediante el enfoque de 'ecualización por regresión'. Al resumir 3.2.2, señalé que la posibilidad de eliminar la confusión por el El enfoque de 'correc- ción por análisis' está circunscrito por las observaciones etiquetadas O1 a O5. Las limitaciones O4 y O5 se aplican al enfoque de 'ecualización por regresión' sin modificaciones. A primera vista, las limitaciones O1, O2 y O3 parecen aliviarse con el enfoque de regresión. Sin embargo, esta primera impresión probablemente sea incorrecta. La confianza en un único conjunto de datos y la 1 Se puede omitir un atributo porque no se dispone de datos sobre él. Además, incluso si los datos sobre una variable son disponible puede terminar no siendo utilizado en la regresión. La razón para no usar una variable en una regresión es porque su asociación con el resultado no está clara, porque su rango de variación es pequeño, porque el parámetro estimación no se considera estadísticamente significativa, porque está fuertemente correlacio- nada con otras variables, etc. la omisión de dicha variable también será una fuente de confusión. 34 el desprecio de todo el conocimiento acumulado es probable que sea el resultado de una 'ecualización por regresión' menos confiable que lo que se puede lograr con el 'enfoque de co- rrección por análisis'. 3.2.4 Varias poblaciones o niveles de tratamiento. Hasta ahora, la discusión se limitó a la circunstancia en que dos grupos de unidades y por lo tanto, solo se compararon dos tratamientos. ¿Qué pasa con la comparación de varios tratamien- tos? niveles, o incluso un tratamiento graduado continuamente? La situación que se muestra en la Figura 9 donde dos poblaciones de unidades y dos tratamientos se comparan permanece prácticamente sin cambios cuando el la comparación es N>2 poblaciones correspondientes a N>2 niveles de tratamiento. Usando lo anterior ejemplo, suponga que preguntamos sobre el efecto del ancho del arcén pavimentado y que los datos son disponibles en caminos rurales de dos carriles con arcenes pavimentados de 2', 4' y 6'. La situación está representada en la figura 10. Figura 10. Tres niveles de 'tratamiento'. Como antes, los cuadrados negros indican lo que se puede observar o estimar. el tamaño de la Las flechas indican la corrección necesaria para llevar cada grupo de caminos al mismo conjunto de caminos especificados. rasgos relevantes para la respuesta. Los cuadrados vacíos muestran cuáles son los μ de los conjuntos de carreteras que se muestran en la eje horizontal sería si todos tuvieran los mismos rasgos específicos relevantes para la respuesta. El efecto de el arcén pavimentado debe juzgarse por la relación entre los cuadrados vacíos. Para eliminar El sesgo de confusión requiere la capa- cidad de predecir cuál sería el μ de cada conjunto de unidades si todos tenían un conjunto espe- cífico de rasgos. Por lo tanto, las observaciones O1 a O5 hechas anteriormente, se aplican sin modificación cuando el número de poblaciones y niveles de tratamiento, N, es mayor a 2.
  • 28.
    De manera similar,aplicable a N>2 es la discusión en 3.2.3 sobre la fuerza y las limitaciones de confiar modelos de regresión paramétrica para lograr la 'ecualización por regresión'. 3.3 Consistencia de los hallazgos. En la discusión hasta ahora, el enfoque estaba en el juicio de causa y efecto en un solo estudio observacional transversal. En última instancia, la justificación de la causalidad descansa en una acumulación de confianza y de convicción justificada que se basa en una consistencia de los hallazgos como los estudios se acumulan. Recuérdese, por ejemplo, que la solución científica al problema fundamental de la causalidad inferencia era asumir que las observaciones obtenidas consistentemente en el pasado se repetirían en 35 el experimento actual si las condiciones per- manecieran sin cambios. El mismo mecanismo de confianza edificio se aplica si uno reemplaza la frase 'observaciones obtenidas consistentemente' con la frase 'estimaciones del efecto obte- nidas consistentemente'. Por lo tanto, una de las consideraciones clave en el examen de la cau- salidad y el efecto del tratamiento no es la defensa de las conclusiones extraídas en un estudio único de un conjunto de datos específico, sino más bien el examen de la consistencia de los hallazgos obtenido en todos los estudios del mismo tratamiento. La mayoría podría estar de acuerdo en que la causalidad tiene que ver con la formación de expectativas justificables; en nuestro caso, expectativas sobre el efecto de seguridad de los tra- tamientos. La mayoría también podría estar de acuerdo en que el La formación de expectativas justificadas se basa en la regularidad con la que se comprueba que se produce un determinado efecto. seguir una determinada causa. Esta es la razón por la cual la consistencia de los hallazgos en todos los estudios del mismo tratamiento es uno de los sellos distintivos de una relación causal 1 . La consistencia de los hallazgos es un requisito necesario (pero no un condición suficiente. Es decir, si los hallazgos de estudios separados del mismo tratamiento difieren ampliamente se puede afirmar que no se puede considerar con justicia ninguna creencia de causalidad. Si los hallazgos de diferentes los estudios son consistentes, entonces todos pueden estar igualmente confundidos. Sin embargo, en este circunstancia es al menos posible que, el juicio de causalidad pueda ser justificado. La noción de "coherencia de los hallazgos" requiere mayor aclaración. Como se discutió en Sec- ción 2, un estudio observacional siempre involucra varias unidades que difieren en sus atributos. Está completamente posible, incluso probable, que el efecto del tratamiento 't' relativo a 'c' de- penda de la atributos de cada entidad tratada. Sin embargo, en la mayoría de los estudios del tipo antes-después, por lo general el se informa el "efecto promedio del tratamiento" 2 . Este promedio está por encima de las entidades tratadas en el estudio. Debido a que las unidades en el estudio X pueden tener diferentes atributos de las unidades en el estudio Y, el promedio efecto del tratamiento de los dos estudios por lo general será diferente, incluso si sus resultados son totalmente coherente. Para ilustrar, suponga que se aplica un tratamiento a la intersección 'I' donde, sin la tratamiento, se esperan 5 choques/año, y también a la intersección 'J' donde, sin tratamiento, 50 se esperan accidentes/año. Suponga que el tratamiento resultó en reducciones de 0.22 choques/año en 'I' y 0,71 accidentes/año en 'J'. Estos pueden parecer inconsistentes si se asume que el dos reduc- ciones deben ser iguales o que las reducciones deben ser proporcionales a los choques espera- dos sin tratamiento. Sin embargo, si es cierto que el efecto del tratamiento es reducir los choques por 0.1× (accidente esperado/año) 0.5 , luego el 0.22 y 0.71 luego las dos reducciones estimadas en accidentes/año son totalmente consistentes.
  • 29.
    1 Cuando elCirujano General (1964) afirmó que fumar causa cáncer, se aplicaron las siguientes reglas ad hoc para juzgar la causalidad: usó: 1. Fuerza de la asociación (lo que significa que alguna medida estadística de asociación es fuerte). 2. Efecto dosis-respuesta (cuanto más factor causal, mayor el efecto). 3. Sin ambigüedad temporal. (La enfermedad sigue a la exposición al factor de riesgo). 4. Consistencia de los hallazgos. (Varios estudios producen resultados similares). 5. Plausibilidad biológica. (La hipótesis tiene sentido en vista de lo que se sabe en biología). 6. Coherencia de evidencia (Alguna combinación de 4 y 5). 7. Especificidad . (El factor causal causa esta enfermedad, y esta enfermedad se debe a este factor causal). Muchas de estas normas no tienen nada que ver con cuestiones de seguridad vial. Sin embargo, alguna adaptación de 1,2 (cuando corresponda), y de 4 y 5 sería oportuno y deseable. 2 Rubin (1974) dice que “Una definición obvia del efecto causal 'típico'. para M ensayos es el promedio (media) efecto causal”. 36 También se deduce que cuando el efecto de seguridad de un tratamiento es un atributo de función, el el "efecto promedio del tratamiento" puede tener un significado poco claro. En el ejem- plo ilustrativo el promedio el efecto de seguridad sería una reducción de (0,22+0,71)/2=0,46 ac- cidentes/año; esto no se aplica a ya sea la intersección 'I' o 'J', ni a una intersección con la fre- cuencia promedio de accidentes de (5+50)/2 (ya que allí se debe esperar una reducción de 0,52 choques/año). Por lo tanto, el requisito de que los hallazgos sean consistentes no significa que uno deba esperar el mismo efecto promedio del tratamiento en dos estudios de antes y después del mismo trata- miento. solo significa que cuando se aplica un tratamiento a unidades con atributos idénticos , el efecto debe ser el mismo. Porque, si no fuera así, no habría motivos para esperar cuál podría ser el efecto de un trata- miento. De ello se deduce que para examinar los hallazgos de dos estudios de antes y después en busca de consistencia, uno debe mostrar que las unidades en ambos estudios tenían atributos muy similares 1 , o uno debe saber cómo el tratamiento El efecto depende de los atributos de las unidades en cada estudio y explica las diferencias. Este tiene tres implicaciones importantes para la realización de estudios de antes y después. • En cada estudio de antes y después, se debe anotar y publicar cuáles son las respuestas rele- vantes. atributos de las unidades tratadas. • Se debe tomar nota de las estimaciones del efecto para cada grupo de unidades con similar atributos relacionados con la respuesta (y solo entonces determinar el 'efecto promedio del tra- tamiento'). • Uno debe investigar las estimaciones del efecto de dependencia funcional sobre la respuesta relevante atributos Por las razones ya mencionadas, no se puede decir fácilmente si el trata- miento promedio efecto encontrado de un estudio antes-después es consistente con los hallaz- gos de un estudio de corte transversal - tenía unidades diferentes, el efecto promedio del trata- miento habría sido diferente. Sin embargo, si se conocían los atributos de las unidades en el estudio de antes y después, y se utilizaron los mismos atributos en el modelo del estudio
  • 30.
    transversal, entonces laconsistencia de los hallazgos obtenidos en los dos tipos de estudio po- dría ser examinado. Finalmente, cuando se examina la consistencia de los resultados de dos estudios transversales, particularmente aquellos basados en el enfoque de igualación por regresión, la consistencia puede ser examinada con bastante facilidad. Todo lo que hay que hacer es comprobar si, en circunstancias similares, los dos los estudios predicen efectos similares. En resumen, la consistencia en los resultados de los estudios de investigación basados en datos sobre el efecto de un el tratamiento es una condición necesaria (pero no suficiente) para susten- tar el juicio de causalidad. Desafortunadamente, las estimaciones del "efecto promedio del tratamiento" en los estudios de antes y después no pueden ser directamente comparados cuando el efecto del tratamiento de- pende de los atributos de las unidades tratadas. De ello se deduce que la publicación del efecto medio estimado del tratamiento no es una base suficiente para juzgar la consistencia y, por lo tanto, un impedimento para los juicios de causali- dad. Ser capaz de Examinar si los hallazgos de estudios separados de antes y después son consistentes, se debe conocer la atributos de las unidades tratadas y también cómo el efecto del tratamiento depende de estos atributos. 1 En todo esto, también se debe tener en cuenta la precisión con la que se mide el efecto de seguridad. Así, por ejemplo, si un cierto tratamiento se aplica a varias entidades con atributos idénticos, los resultados son consistentes cuando la varianza de seguridad estimaciones sobre estas entidades es igual a la varianza de la estimación. 37 Por el contrario, la consistencia o su ausencia son fáciles de establecer a partir de los resul- tados de la sección transversal. estudios precisamente por la razón de que en tales estudios los atributos de las unidades que tienen 'c' y aquellos que tienen 't' son conocidos. Por lo tanto, nuestra discusión conduce a una desafiante yuxtaposición de dos realidades nega- tivas. Mientras que los juicios de causalidad cuando se basan en aplicar primero 'c' y luego 't' a las unidades (como en estudios de antes y después) son más fáciles de defender que juicios simila- res cuando se basan en una comparación de unidades que se encontró que tenían 'c' y aquellas que tenían 't' (como en los estudios transversales), el juicio que los hallazgos de dos estudios sean consistentes es más fácil para estudios transversales y más difícil para los estudios de antes y después. El conocimiento de causa y efecto es esencial para una acción eficiente. El progreso hacia dicho conocimiento es posible si se cumplen al menos dos condiciones: una. Los juicios de causa y efecto pueden respaldarse en cada estudio del efecto de un tratamiento y, b. A medida que se acumulan los estudios, se encuentra que sus hallazgos son consistentes. 38 4. CASOS Y PREOCUPACIONES La oración "Si hago X, entonces es probable que Y siga" es lo que guía la acción racional. Eso refleja la creencia en un vínculo de causa y efecto entre X e Y. Los datos transversales a menudo se utilizan para llegar a tales creencias causales. En este capítulo examinaré varios estudios donde esto ha sido hecho. Algunos de estos estudios ocupa- ron un lugar destacado en importantes debates que influyeron tanto investigación y política de seguridad; algunos se utilizan para guiar la práctica de la ingeniería. mi propósito es ilustrar los escenarios, los argumentos, las convicciones y las dudas. 4.1 Peltzman y otros sobre el efecto Reglamento de seguridad del automóvil.
  • 31.
    El artículo históricode Peltzman (Peltzman 1975) todavía se cita 1 . Proporciona un oportunidad de examinar el método por el cual una creencia causal (que la seguridad del automóvil las regu- laciones adoptadas alrededor de 1966 no tuvieron efecto sobre los accidentes fatales). Nuestro interés aquí es no en la veracidad de la conclusión, sino en el método utilizado para llegar a ella. Porque el hallazgo fue controvertido, el trabajo de Peltzman ha sido examinado y comentado por muchos. Esto hace que un material particularmente rico para el examen de lo que fue criticado y por qué. Un economista se inclina a pensar en el riesgo de accidente como un elemento del costo aso- ciado con viajes; un costo como, digamos, el gasto de tiempo o el costo del combustible. En el economista concepción, el conductor, un homo economicus, negociará entre los diversos ele- mentos de costo asociados con los viajes y decidirse por esa mezcla que maximiza la utilidad. Compensación, maximización de la utilidad y el equilibrio están cerca del núcleo de esta visión del mundo. Por lo tanto, es natural para Peltzman (que es un economista) suponer que la fabri- cación de vehículos menos dañinos podría inducir en el conductor más 'conducción intensidad', principalmente una mayor velocidad y quizás incluso un mayor consumo de alcohol. La conse- cuencia de esta 'adaptación del comportamiento' sería compensar parcial o totalmente el bene- ficio de vehículos más seguros. Para por esta razón se llama 'comportamiento de compensación'. El propósito del trabajo de Peltzman fue estimar la medida en que el supuesto comportamiento compensatorio anulaba el efecto de la regulación que producido vehículos más seguros. En ge- neral, fue un intento de estimar el efecto de seguridad de un tratamiento - siendo aquí el trata- miento la regulación de la seguridad del automóvil y el consiguiente uso de vehículos más segu- ros. El efecto de seguridad de los tratamientos se puede estimar usando 'antes-después' o enfo- ques de 'sección transversal'; Peltzman usó ambos. 4.1.1. La parte antes-después (serie de tiempo) del estudio de Peltzman. La esencia de un estudio antes-después es usar datos antes del tratamiento para predecir qué han ocurrido durante el período posterior al tratamiento si no se hubiera aplicado el tratamiento 2 . Peltzman equipado un modelo multivariable para los datos antes del tratamiento y usó el tratamiento independiente posterior variables en el modelo para predecir 'lo que habría sucedido'. Después de un razonamiento detallado, Peltzman postuló el modelo de forma reducida 3 R=f(P, Y, T, A, S, K, u) donde R=tasa de accidentes fatales por 1 Este interés continuo no está tanto en su hallazgo principal (alegando que el efecto de todos los costos de seguridad del automóvil estándares introducidos después de 1966 fue nulo) como en la noción de 'comportamiento com- pensatorio' o 'adaptación' - el ser humano Tendencia a aumentar el comportamiento de riesgo cuando se cree que el riesgo ha disminuido. 2 El término usado para una predicción de algo que habría sucedido bajo alguna condición que de hecho no sucedió. materializarse es 'contrafactual'. El término se utilizará más adelante. 3 Por lo general, la teoría económica que compone un modelo se escribe como un sistema de relaciones (ecuaciones y desigualdades) entre variables tales que una variable que está en el lado derecho de algunas relaciones puede estar en el lado izquierdo lado de la mano de otro. Ocasionalmente, a través de manipulación y aproximación algebraica, es posible reescribir este sistema de relaciones para que las variables del lado izquierdo de las relaciones nunca aparez- can en el lado derecho. Este 39 milla del vehículo; f es alguna función, P=costo asegurado del accidente; Y=ingreso; T=tendencia secular; A=intoxicación alcohólica; S=velocidad de conduc- ción; K=edad del conductor; yu=factores aleatorios. 1 Estimaciones de la Los valores de las va- riables independientes para cada año durante 1947-1974 fueron compilados de varios fuentes y,
  • 32.
    en el proceso,se tuvo que hacer una variedad de suposiciones y ajustes 2 . Datos para se utilizó el período 'antes de la regulación' 1947-1965. El eje central del enfoque de Peltzman era un modelo de regresión que expresaba R como una función de P, Y, T, A, S y K. Luego, alimentando este modelo con los valores 'después de la regulación' de P, Y, T, A, S y K 3 predicciones contrafactuales de cuál habría sido la tasa de accidentes en el período 'después de la regulación' si no hubiera habido cambios en los están- dares de seguridad de los automóviles. Peltzmann compara estas predicciones contrafactuales con las R observadas para el período 'después de la regulación'. Dado que se encontró que las predicciones contrafácticas eran muy similares a las del período posterior observadas R's, Peltzman concluyó que las nuevas normas para vehículos no tenían ningún efecto sobre la seguridad. Para construir el modelo de regresión Peltzman asumió que la función 'f' de las variables P, Y, T, A, S y K es multiplicativo 4 (R β P β Y β e β T . 0 = 1 2e 3 ). Así, por ejemplo, para el promedio de y muertes urbanas por milla Peltzman encon- tró: 0,172 0,884 0,074 0,359 1,843 0,827 0 R = β PAG - y mi - TAREA _ En tal expresión multi- plicativa los exponentes son 'elasticidades' 1 . Así, según este modelo particular, un aumento del 1% en P (costo asegurado del accidente) hace una disminución del 0,172% (ver es más o menos lo que se entiende por 'forma reducida'. En el artículo de Peltzman, la teoría de la que se deriva la forma reducida nunca se especifica. La frase 'forma reducida' se refiere únicamente al uso que hace Peltzman del juicio profesional acerca de lo que podrían ser variables importantes para incluir en una ecuación modelo (multiplicativa), 1 La siguiente es una ilustración del razonamiento de Peltzman: “ He optado por ver los accidentes automovilísticos como el subproducto de un actividad de consumo ordinario (intensidad de conducción). Por lo tanto, busco explicar los pa- trones de accidentes como la resultante de fuerzas que cambiar la demanda de conducción arriesgada o cambiar el costo de tener un accidente. Un análisis del costo para un conductor de tener un accidente se complica por el hecho de que los componentes importantes de este costo por lo general están asegurados. Si las compañías de seguros no ajustar las primas a la luz de la experiencia de accidentes de los conductores en particular, los costos asegurados derivados de un accidente no disuadirían conducción arriesgada. Sin embargo, voy a asumir una califica- ción de experiencia suficientemente precisa y extensa por parte de las aseguradoras para un asegurado. conductor espere incurrir en una parte de los costos asegurados asociados con su conducción riesgosa. Si esto es así, entonces la frecuencia y la severidad de los accidentes debe reducirse por cualquier cosa que aumente el costo creado en un accidente. Representaré estos costos mediante un índice de costos directos de accidentes (es decir, daños a la propiedad y atención médica) multiplicado por un factor de carga del seguro (la proporción de primas a los beneficios pagados). Es decir, si el seguro fuera simplemente un método de pago de un accidente a plazos, el El conductor "asegurado" sería responsable tanto del daño causado por un accidente como del costo de administrar el cobro y pago de estos daños; Estoy suponiendo que una parte de estos costes se cobra de hecho a los conductores asegurados. Simplificar el trabajo empírico, voy a ignorar el hecho de que algunos conductores se autoaseguran y que, en consecuencia, los cargos de carga del seguro puede ser irrelevante para su comportamiento”. (pág. 684 -5) 2 Así, por ejemplo, 'A' se midió por el consumo de licores destilados por persona mayor de 15 años; 'S' fue el estimado velocidad promedio fuera de las horas pico en caminos rurales no interestatales; Se supuso que 'T' era una línea recta; 'K' era la razón de 15- Conductores de 25 años y mayores de 25, etc.
  • 33.
    3 El término'contrafactual' no debe tomarse para indicar que algo es contrario a los hechos. Más bien, debería connota algo que de hecho no se materializó. Una predicción contrafactual es sobre lo que se habría tenido R no ha habido cambios en las normas de seguridad de los automóviles. Por lo tanto, es una predicción sobre un estado que nunca existió. los La razón para introducir este término problemático es que todo el artículo se basará en lo que los filósofos llaman el 'teoría contrafáctica de la causalidad'. 4 Si este fuera un modelo de forma reducida genuino obtenido algebraicamente de un conjunto de ecuaciones simultáneas que capturan un teoría, la forma funcional (aditiva, multiplicativa, etc.) reflejaría la teoría subyacente. la forma funcional postulado por Peltzman no tiene ningún vínculo con una teoría subyacente. Es un 'modelo cuasi reducido'. Por lo tanto, no hay razón para pensar que la forma funcional utilizada por Peltzman es una descripción apropiada o una aproximación exitosa del fenómeno de la accidentalidad mortal. 40 signo menos) en R (tasa de accidentes mortales); un aumento del 1% en S (velocidad) genera un aumento del 1,8% en la tasa de accidentes, etc Dado el razonamiento impulsado por la teoría económica que guió la elección de las variables, los muchos suposiciones hechas en la definición de las variables, la naturaleza de las variables (que son promedios para todos los EE. UU.), las inexactitudes inherentes a los datos disponibles, los ajustes a la datos que había que hacer, el número limitado de variables utilizadas para representar este complejo fenómeno, la ausencia de cualquier razón (aparte de la conveniencia o la tradición) para la forma de modelo multiplica- tivo, la correlación inherente entre la mayoría de las variables y el 'tiempo' variable (T), etc., mi inclinación habría sido invocar el principio habitual de que "la correlación no es causalidad” 2 y, sobre esta base, desconfiar de cualquier interpretación causal. Peltzman, sin embargo, mostró no dude en hacer interpretaciones causales detalladas y específicas 3 de los resultados de la regresión. Así, por ejemplo, al comentar sobre la relación entre el ingreso (Y) y la tasa de accidentes (R) Peltzman dice que: “Cada concepto de ingreso empleado 4 tuvo una correlación parcial positiva con las tasas de mortalidad y estuvo acompañado de un fuerte efecto de tendencia negativa 5 . Aparentemente, gran parte de este comportamiento a corto plazo es coherente con la respuesta del conductor a los cambios en los precios sombra del ocio. mientras que la velocidad variable puede captar parte de esta respuesta, ignora específicamente la mayor parte del tráfico y no captura todos los riesgos inducidos por un aumento en el precio del ocio (por ejemplo, el paso más frecuente de otros coches)." 6 P.692. De esta manera, la correlación estadística se toma como un reflejo de comportamientos tomados del léxico de los economistas. Del mismo modo: “…los resultados anteriores parecen generalmente consistente con un régimen en el que la res- puesta inmediata más barata a un inesperado aumento de los ingresos es aumentar la intensidad de la conducción, especialmente cuando no hacerlo implica una sacrificio de las oportunidades de obtener ingresos. (La presunción aquí es que las desviaciones del ingreso de la tendencia son inesperados.) El fuerte efecto de tendencia negativa puede interpretarse como un reflejo, en parte, una respuesta a más largo plazo a los cambios permanentes en los ingresos, mediante la cual los ajustes de, por 1 En lenguaje económico, la elasticidad es el cambio porcentual en una variable causado por un cambio porcentual en otra variable. Así, por ejemplo, si Q denota la cantidad comprada y P denota el precio, la elasticidad precio de la demanda es (PQ) (dQ dP) .] 2 “Que correlación no es causalidad es quizás lo primero que hay que decir”. Esta es la frase de apertura que describe el término CAUSACIÓN aportado por GA Barnard a la Encyclopedia of Statistical Sciences (Volumen 1, John Wiley and Sons, 1982, 387-389).
  • 34.
    3 Las conclusionescausales de esta parte del artículo, en la que se utilizó el modelo de regresión para el período previo a la regulación desarrollados, se refieren únicamente al comportamiento del conductor en el período anterior a la regulación; el objetivo era captar cómo reaccionan los conductores a los cambios en los ingresos y costos de los accidentes por la elección de la velo- cidad y el consumo de alcohol. 4 Renta permanente per cápita, Consumo personal per cápita,., Ingreso del trabajo por adulto en edad de trabajar (utilizado en regresión). 5 Es decir, un coeficiente de regresión positivo para Y siempre estuvo acoplado con una cons- tante negativa para T. Dado que, en Datos de Peltzman, el ingreso (Y) fue aumentando con el tiempo (T), el coeficiente de regresión s de Y y T estarán correlacionados; un aumento en uno causará una disminución en el otro. Sin embargo, en lugar de atribuir esto al hecho de que sus datos son para un período de ingresos que generalmente aumentan con el paso del tiempo, Peltzman favorece y interpretación del comportamiento económico. 6 Al tratar de descifrar la jerga profesional, Peltzman puede haber querido decir algo como esto: un aumento en los ingresos implica que el conductor valora ahora más el tiempo de ocio y, por lo tanto, para ganar ese tiempo ahora más valioso, conduce más rápido y pasa a otros con más frecuencia. Uno puede preguntarse: ¿Es cierto, por ejemplo, que las personas con mayores in- gresos manejan más rápido, correr más riesgos y sufrir más accidentes? Porque, si no, todo el edificio se derrumbará. De hecho, creo que la la evidencia empírica existente apunta en la direc- ción opuesta. ¿Refleja un cambio en la elección de la velocidad el mayor valor colocamos en el ocio a medida que aumentan nuestros ingresos o, en general, refleja un viaje más suave y un mejor manejo que el los vehículos más nuevos ofrecen? ¿Es cierto que en períodos de estanca- miento o decrecimiento de los ingresos medios la velocidad ha disminuido? Todos estas son preguntas que se pueden responder. Cuando no se les pregunta ni responde, el modelo es poco más que un privado opinión. 41 ejemplo, el diseño de los vehículos está hecho para reducir los costos que implica el aumento permanente de la conducción intensidad." pags. 693. Para mí, desde una distancia de treinta años, y sin la perspectiva o la fe del economista, este tipo de argumento parece estar más cerca de una opinión culturalmente predispuesta que de una inferencia comprobada empíricamente. Lanzando el desapego científico al viento, Peltzman se involucra a lo largo del documento en especulaciones libres sobre causa y efecto; conjetura ca- balga sobre suposiciones montadas sobre intuiciones y conjeturas. Para entender el de Peltzman predisposición tal vez sea necesario transformarse en un estado de ánimo en el que la noción de utilidad la maximización de los consumidores dio lugar a una rica teoría que tiene un papel fundamental en la economía y ha tenido éxito en muchos casos en la predicción de la dirección del cambio. Es sobre la base de esto tipo de teoría que Peltzman forma sus expectativas sobre el signo de los coeficientes de regresión. Está la misma fe en la teoría económica que está en la raíz de sus creencias causales e interpretación de coeficientes de regresión. El problema es que una explicación que sea consistente con la economía la teoría se puede encontrar para casi todos los hallazgos, como se ilustra en las citas anteriores. Por lo tanto, es importante señalar dónde parece estar la econometría en el tema de causalidad. Harvey (1990) abordó la cuestión de la siguiente manera: “El concepto de causa y efecto es fundamental en cualquier ciencia. Sin embargo, cuando no es posible Para llevar a cabo un ex- perimento controlado, se vuelve muy difícil producir evidencia convincente de que realmente existe una relación de causa y efecto. Este es casi invariablemente el caso en economía, y como resultado, el enfoque tradicional en econometría ha sido establecer un modelo sobre la base de
  • 35.
    la teoría económicaanterior. No sólo se supone que se cumple una relación de causa y efecto, sino que, además, también se da por conocida la dirección de la causalidad. Suponga, por simplicidad, que un sistema contiene solo dos variables, x e y. Dado que una causa y la relación de efecto puede ser en una sola dirección, digamos de x a y, la única pregunta que queda es si tal relación existe realmente. El enfoque más común para responder esta pregunta es hacer una regresión de y t sobre x t y probar el coeficiente de x t para la 'significación' 1 . Sin embargo, un alto correlación entre dos conjuntos de observaciones no experimentales no cons- tituye evidencia de una relación entre las variables subyacentes. Además, el problema de la co- rrelación espuria permanece incluso si se impone alguna estructura dinámica en el modelo to- mando y para depender de la corriente y valores pasados de x Por lo tanto, aunque se supone desde el principio que y no puede causar x, hay ninguna forma de establecer una relación causal entre x e y sobre la base de los datos solo. Dadas las limitaciones impuestas por los datos no experimentales, no es descabellado conside- rar que ajustar un modelo de regresión es principalmente un ejercicio de medición. que existe una relacion en realidad no se cuestiona, pero se da por sentado sobre la base de la teoría económica. En estos circunstancias, las pruebas de significación ya no se usan para juzgar si una relación existe entre dos variables. Lo más importante es el efecto medido de una variable en otro. Si bien este enfoque es la base de gran parte de la construcción de modelos economé- tricos, sufre de la desventaja de que se deposita una cantidad desmesurada de fe en el conoci- miento previo de teoría económica. Además, significa que ciertas características no comproba- bles se están poniendo en un modelo, violando así un principio importante de la investigación científica. 1 El subíndice t se refiere al tiempo ya que el libro de Harvey trata sobre el análisis econométrico de series de tiempo. 42 La necesidad de examinar los supuestos que subyacen a un modelo econométrico estimado a partir de datos no experimentales. Los datos de series temporales han llevado al desarrollo del concepto de causalidad. La idea de la causalidad se remonta a Wiener, pero Granger la formalizó por primera vez. Se toman dos reglas básicas para aplicar. La primera es que el futuro no puede predecir el pasado. Por lo tanto, la causalidad estricta sólo puede ocurrir con el pasado provocando el presente o el futuro. En segundo lugar, se supone que sólo tiene sentido discutir causalidad para un grupo de variables estocásticas. Entonces se dice que una variable x 'causa' una variable y si tener en cuenta los valores pasados de x permite hacer mejores predicciones para y, todas las demás cosas siendo igual. Esta noción de causalidad es puramente estadística y no corresponde a ninguna definición aceptable de causa y efecto en el sentido filosófico. En cambio, se refiere a más concepto limi- tado de previsibilidad.” (págs. 303-304). La principal conclusión de Peltzman (que la regulación de la seguridad del automóvil no redujo la tasa de accidentes) no tiene interés aquí. Lo que interesa es la creencia incuestionable de que un La regresión basada en una serie temporal de datos se puede interpretar en un modo de causa-efecto como una cuestión de curso; la creencia de que los matices de los coeficientes de regresión pueden y deben asignarse a algunos mecanismo de causa y efecto; que es suficiente que estos mecanismos sean ampliamente plausibles en a la luz de las suposiciones que los economistas tienden a hacer, sin tener que ser separadamente corroborado; que no es necesario considerar explicaciones plausibles alternativas y las relaciones correspondientes no necesitan estar representadas en el modelo. Nuestro interés está en esto.
  • 36.
    fe sorprendente; lafe en el poder de la regresión no sólo para desarrollar una teoría cuando es correcta, sino también, hasta cierto punto, para corroborar la corrección de la propia teoría 1 . Por lo que sé, y por lo que escribió Harvey, este tipo de fe en el poder de la regresión va en contra del tenor de la mayoría de la literatura científica y estadística. Sin embargo lo és posible que fuera común entre economistas y econometristas a mediados de los años setenta. Así, por ejemplo, al escribir sobre la especificación del modelo, Kennedy (Kennedy 1992) dice que: “En un momento 2 Los econometristas tendían a suponer que el modelo proporcionado por la teoría económica representaba con precisión el mecanismo del mundo real que genera los datos, y vio su papel como uno de proporcionando 'buenas' estimaciones para los parámetros clave de ese modelo”. Se refiere a esta visión de econometría como "obsoleta" y dice: "Ahora se reconoce generalmente que los modelos econométricos son 'falsos' y no hay esperanza ni pre- tensión de que a través de ellos se encuentre la 'verdad'”. (pág. 73.) Es más fácil decir lo que los modelos econométricos no pueden hacer que lo que pueden hacer. kennedy (al discutir la espe- cificación del modelo) piensa que la aceptación de un modelo econométrico depende de si “puede decirse que corresponde a los hechos” . Es el 'análisis de especificación' actividad que se supone que dice qué significa 'corresponder a los hechos' y, por lo tanto, identificar qué es un modelo correctamente especificado. Pero la especificación del modelo es algo así como un arte, y las pruebas de errores de especificación por lo general equivalen sólo a una búsqueda de formas en que los datos disponibles apuntan a alguna señal de problemas potenciales 3 . Por lo tanto, uno puede preguntarse: ¿Es cierto que un modelo correctamente especificado, que co- rresponde a los hechos, permite predecir el efecto de cambiar el valor de un 1 La teoría corrobo- rada aquí es la del 'comportamiento compensatorio'. 2 Kennedy parece fijar esto a mediados de 1970. 3 Se pueden probar las variables omitidas, la forma funcional incorrecta, la autocorrelación, etc. Para obtener detalles, consulte, por ejemplo, LG Godfrey, Pruebas de especificación errónea en econometría, Monografías de la Sociedad Econométrica No. 16, Cambridge University Press, 1988. 43 ¿variable? 1 Esta pregunta no parece plantearse explícitamente 2 . Porque la corrección de especificación se prueba solo por correspondencia con los hechos, sospecho que la respuesta debe ser: "Nosotros no sé si un modelo especificado correctamente permite predecir el efecto de cambiar el valor de una variable”. Si es así, ¿para qué se puede usar un modelo correctamente especificado? citas de kennedy Theil como diciendo: “Los modelos son para ser usados, pero no para ser creídos”. El uso de un modelo debe eventualmente implica responder a la pregunta: “¿Qué pasará si? Si no se puede creer la respuesta, el modelo no sirve. ¿Significa el aforismo de Theil que Peltzman no debería haber creído el conclusión a la que llegó? 4.1.2. Análisis de sección transversal de Peltzman. En la sección transversal de su artículo, Peltzman usó datos de 1961 a 1971 para 48 estados. Pregunta si en aquellos estados donde en el período posterior a la regulación hubo una mayor proporción de automóviles más nuevos (automóviles con los dispositivos de seguridad exigidos por la normativa) las tasas de mortalidad fueron menores de lo que cabría esperar. En este aná- lisis, Peltzman enfrentó un difícil desafío. La tasa de accidentes fatales, la cantidad de viajes, la demografía del conductor, el stock de carreteras, el uso de alcohol, etc., todo cambió con el paso del tiempo y difería entre los estados. los desafío era dar cuenta del efecto sobre la tasa de accidentes fatales de todos esos factores causales y luego para ver si las diferencias 'inexplica- das' restantes mostraban alguna relación con el factor de interés: la proporción de automóviles
  • 37.
    con la seguridadrecién exigida dispositivos 3 . Esta es una circunstancia típica de los estudios transversales; uno tiene que dar cuenta de la influencia de muchos factores causales de "moles- tias 4 " con el fin de aislar el efecto de uno (o pocos) factor(es) de interés. Para los factores de 'molestias', Peltzman postuló el modelo: β 1 β 2 β 3 β 4 β 5 β 6 β 7 β 8 β 9 β 10 0 D = β (FC) (SL) (U/R) (UD) (RD) (A) (K) (YD) (E/N) (PA) donde D=muertes de tránsito/100.000 habitantes; FC=consumo de combustible per cápita; SL=límite de velocidad en los principales caminos rura- les; U/R=relación entre conducción urbana y rural; UD=millas de viaje en vehículo/vía urbana; RD=millas de viaje en vehículo/carretera rural; A=consumo de licor destilado per cápita; K=pro- porción de jóvenes ya los viejos conductores; YD=ingreso personal disponible per cápita; Rela- ción E/N de lo ganado a lo no ganado ingreso; PA precio del accidente. Como en el modelo de regresión anterior, Peltzman explicó cuidadosamente la intención detrás de cada variables 5 . También como en el modelo anterior, se tuvieron que hacer concesiones entre qué datos se 1 Esto es, esencialmente, a lo que equivalen los contrafactuales como los utilizados por Peltzman; hay que creer que si Los Ingresos, el Costo de Accidentes, la Velocidad, etc. cambiaron, como lo hicieron, entonces, lo que el modelo predice se habría materializado. (Los La Enciclopedia de Filosofía de Stanford dice: “La idea básica de las teorías contrafácticas de la causalidad es que el El significado de una afirmación causal singular de la forma 'Evento c causó evento e' se puede explicar en términos de contrafactual condicionales de la forma 'Si c no hubiera ocurrido, e no habría ocurrido'. En nuestro caso el condicional contrafactual es 'si no hubiera regulación de automóviles, entonces se habría producido la predicción del modelo). 2 Kennedy considera la prueba de causalidad (Granger) solo brevemente (p. 68) y alude a las deficiencias de esta concepto. Godfrey solo ofrece una breve "explicación de la ausencia de una discusión sobre verificaciones basadas en series de tiempo para 'causalidad'…”p. 198. 3 El desafío se vio agravado por la dificultad de separar los efectos de la edad del automóvil per se y la efecto estrechamente correlacionado de los cambios de diseño debido a la regulación motivada por la seguridad. 4 Los factores molestos son aquellos que no son objeto de investigación pero que están presen- tes, varían de una entidad a otra y de vez en cuando, y seguramente afectarán la variable de resultado. En los estudios epidemiológicos a menudo se les llama 'confundidores'. 5 Por lo tanto, por ejemplo, FC es un indicador de las millas recorridas por vehículos, U/R tiene en cuenta las diferencias de estado a estado en las áreas urbanas y urbanas. tasas de mortalidad rural, etc. 44 se cree que representa un factor causal y qué datos se podrían tener. Además, se tomaron decisiones sobre qué variable incluir y cuál no 1 ; se hicieron suposiciones acerca de las mate- máticas expresión elegida para representar el fenómeno, etc. Algunas variables utilizadas en el modelo de sección transversal, cuando se suman en todos los estados, son la lo mismo que utilizó Peltzman para el modelo de regresión 'antes' descrito en la sección 4.1.1. Por lo tanto, si el modelo de regresión 'antes' y el modelo de regresión de sección transversal fueran correctos representacin del proceso de ocurrencia de accidentes fatales se debe esperar que la regresin coeficientes de variables similares (Costo de Accidentes, Límite de Velocidad, Consumo de Alcohol, Ingresos, Jóvenes Conductores) sería similar. Esto, sin embargo, no re- sultó ser el caso. En su crítica, Joksch (Joksch 1976) muestra las comparaciones en la Tabla 5.
  • 38.
    Tabla 5. Basadoen la Tabla 2 de Joksch (1976) Coeficientes de regresión 'Antes' de Peltzman Modelo de sección transversal de Peltzman (Serie temporal) Modelo 1961-1963 1964-1966 Coste del accidente -0,17 0,15 0,23 Ingreso 0,88 -0,81 -0,66 Alcohol 0,36 0,17 0,04 Velocidad 1,84 0,76 0,89 Conductores jóvenes 0,83 0,23 0,12 Peltzman interpretó los coeficientes de re- gresión como elasticidades. Así, por ejemplo, en el Se cree que el modelo 'antes' (serie temporal) de un aumento del 1 % en los 'Ingresos' causa un aumento del 0,88 % en la tasa de accidentes fatales por milla. Y, sin embargo, en el modelo de sección transversal, el mismo aumento del 1% Se cree que los 'ingresos' provocan una disminución del 0,81 % en la tasa de mortalidad por población. porque un aumento en la tarifa por milla implica un aumento en la tarifa por población, estos dos resultados (y la mayoría de los otros resultados en la Tabla 5) son mutuamente incon- sistentes; ambos no pueden ser verdad. Estas Las inconsistencias reflejan en parte la precisión estadística limitada de los coeficientes de regresión y principalmente las muchas deficiencias de los tipos de modelos utilizados por Peltzman (datos pobres y agregados, uso de una función matemática que no se conoce para describir adecuadamente el fenómeno, ausencia de variables importantes que no están incluidas en el modelo, uso de variables proxy que sólo débilmente corresponden a la causa, etc.). Independientemente de lo que causó las inconsistencias entre la regresión coeficientes, está claro que no se puede confiar en ellos. Si un coeficiente de regresión puede ser positivo o negativos, grandes o pequeños (como están en la Tabla 5), es mejor guardar silencio sobre la causa y el efecto. Nuestra investigación es sobre la pregunta: “¿cuándo se puede dar un significado de causa y efecto a los resultados? derivado de los datos de la sección transversal? Aplicado al trabajo de Peltzman esto se traduce en: “¿Puede su coeficiente de regresión puede interpretarse como elasticidades? Un buen augurio sería que la regresión los coeficientes de las series de tiempo 'antes' y los modelos de 'sección transversal' fueron similares. Ya que son no, uno debe concluir que una interpretación de causa y efecto de los coeficientes de regresión de Peltzman no está garantizado. Sin embargo, en el centro del trabajo de Peltzman había una cuestión diferente. preguntó si la regulación de seguridad automotriz afectó las tasas de accidentes. Su conclusión fue que: “La única afirmación que puede ser presentado con confianza es que la regulación de la seguridad del automóvil no ha afectado la tasa de mortalidad en las carreteras. 1 No está claro por qué se consideró que variables como la topografía, la precipitación, la latitud, etc. no eran importantes. 45 Ni las series temporales ni los datos transversales permiten ninguna otra conclusión”. 1 Para él las series temporales y los modelos transversales no eran más que herramientas para generar contrafactuales. la comparacion de los predicciones contrafactuales generadas por ambas he- rramientas a las tasas reales de accidentes llevaron a Peltzman a su conclusión. Si los modelos que no pueden apoyar las predicciones causales para el efecto de independiente Las variables aún pueden producir buenas predicciones contrafactuales que son útiles para alcanzar la causa- efecto. conclusiones sobre los tratamientos es una pregunta abierta. Sería un buen augurio si diferentes modelos, incluso cuando no capturan las relaciones de causa-efecto en su nivel atómico, condu- cen consistentemente a conclusiones similares sobre el efecto de un tratamiento. Si esto era cierto puede ser a juzgar por el debate que siguió a la publicación del artículo original de Peltz- man. 4.1.3 El debate subsiguiente.
  • 39.
    Lo que ahorase llama el 'efecto Peltzman' se convirtió en tema de acalorado debate. El debate fue impulsado tanto por la curiosidad científica como por los intereses de aquellos que estaban a favor de la seguridad vial regulación o desconfiaban de la regulación por parte del gobierno 2 . Crandall y Graham (Crandall y Graham 1984) describieron la historia del debate así: “Siguió una controversia animada y emotiva. HC Joksch (1976), Paul MacAvoy (1976) y Richard Nelson (1976) criticaron la metodología de Peltzman pero no ofrecieron nuevas estimaciones. Peltzman (Peltzman 1976) respondió con refutaciones incisivas. Leon Robertson (1977) produjo resultados diferentes con un modelo revisado, pero Peltzman (1977) y Glenn Blomquist (1981) argumentan que las revisiones son ad hoc e inconsistentes con un modelo de elección racional del conductor. Óscar Cantú (1980) ha replicado los hallazgos de Peltzman con una base de datos construida de forma independiente, pero Graham y Garber (1984) han demostrado que los re- sultados de Peltzman son sensibles a plausible cambios en las especificaciones.” Por supuesto, no es inusual ni sorprendente encontrar que la opinión de la investigación está dividida, particu- larmente cuando, al acecho en el fondo es una diferencia ideológica (o política) entre aquellos en ven la intervención del gobierno como a menudo necesaria y aquellos para quienes la regu- lación es a menudo injustificado. Lo perturbador es que todos los protagonistas usaron el mismo tipo de datos y métodos y Todavía podría llegar a conclusiones muy diferentes. Aún más pertur- bador es el hecho de que ni el recopilación y análisis de datos adicionales, ni el debate parecía haber reducido las diferencias de opinión. La posición original de Peltzman permaneció sin mo- dificaciones. Hoy en día, después de Kuhn y Feyerabend, no es posible adherirse a una visión purista de que Las controversias científicas generalmente se resuelven yendo al laboratorio y replicando o re- futando los resultados de los demás. Sin embargo, para avanzar hacia una mejor explicación y Para que la comprensión sea posible, uno debe insistir en que ". algún principio o conjunto de principios son especificado para comparar teorías rivales contra un trasfondo evidencial dado. Tales principios 1 La declaración de apertura de su sección 'Resumen y Conclusiones'. 2 El trabajo de Joksch y Robertson fue apoyado por el Instituto de Seguros para la Seguridad en las Carreteras, un proponente de Reglamento de seguridad del automóvil. Peltzman es ahora un académico adjunto del Cato Institute, cuya declaración de misión incluye: “…principios estadou- nidenses tradicionales de gobierno limitado, libertad individual, libre mercado y paz”. 46 (son) frecuentemente referidos como metodología.” (Newton-Smith 1981)(p. 4) . El principio que tengo en mente es uno muy básico: • Principio: Cuando se aplica la misma metodología al mismo tipo de datos (la misma “antecedentes probatorios”), se debe llegar a conclusiones simi- lares. Cuando esta condición no se cumple, cuando algunos afirman que sus datos muestran que un metal se expande cuando se calienta mientras que otros mantendrán que sus datos muestran que se encoge, entonces hay algo anda mal con los datos y/o el método de medición. En la refutación de Pelzman a Robertson (Peltzman 1977). El primer punto se refiere a la posibi- lidad de verificación. Peltzman lo dice sin rodeos: "No analista experimentado de datos debería sorprenderse con el resultado (de Roberson) , ya que la edición selectiva de datos motivados solo por el descontento con un resultado particular casi siempre se puede perseguir para éxito." (pág. 673). Incluso si se descarta la acusación de edición de datos tendenciosa, ciertamente es cierto que sería muy difícil comprobar (y replicar) los datos utilizados para el análisis de regresión por un investigador en particular. Todo el ensamblaje de datos de múltiples fuentes requiere una miríada de juicios.
  • 40.
    hacerse. Peltzman implicaque el resultado del proceso de ensamblaje de datos es sensible a estos juicios que son esencialmente idiosincrásicos y por lo tanto desafían la verificación y la replicación. Si los resultados o la investigación dependen crucialmente del proceso de preparación de datos, y el proceso no se puede verificar su corrección, entonces la replicación y verificación de los resultados de la investigación es una imposibilidad práctica. De hecho, como el lector verá a lo largo de la Sección 4: una. Los resultados obtenidos por otros nunca se verifican; b. Los autores tienden a recopilar y analizar sus propios datos mediante métodos de su propia elección. C. Dado que se premia la originalidad y los avances metodológicos, cada nuevo estudio tiende a diferir de todos los estudios previos en detalles importantes (variables utilizadas, forma funcio- nal elegida, estructura de error asumida, etc.). Esto dificulta la comparación; d. Por las mismas razones (originalidad e innovación), los autores tienden a creer en sus propios hallazgos. y encontrar deficiencias en los métodos o datos de otros, especialmente si encuentran lo contra- rio. Señalé anteriormente que para que el progreso hacia una mejor explicación y comprensión sea posible se debe insistir en que cuando se aplica la misma metodología al mismo tipo de datos, uno debe llegar a conclusiones similares. En un entorno de investigación en el que ni los datos ni el método son fácil de comparar y acumular, el progreso será lento. El otro punto destacado se refiere al papel de la teoría. Peltzman utiliza una construcción teórica sobre el comportamiento de las personas -teoría de la elección racional- que lo guía en la deci- sión que variables a incluir en la ecuación de regresión, y le permite (en muchos casos) visualizar qué el signo de un coeficiente de regresión debería ser. Así, por ejemplo, Peltzman sostiene que racionalmente elegir conductores que después de una fecha determinada no tuvieron más reme- dio que comprar vehículos que cumplieran con los los nuevos estándares de seguridad respon- derán al vehículo más seguro tomando más riesgos. Él llama al riesgo 'intensidad de conducción' y supone un aumento en la intensidad de conducción que se manifiesta por aumentos en veloci- dad, emociones, tal vez más beber y conducir. De esta manera, la teoría de la elección racional motiva la elección de variables para la regresión; en el caso de Peltzman la inclusión en el ecua- ción de regresión de velocidad y consumo de alcohol. Si la teoría es correcta y más segura los automóviles inducen a los conductores a tomar más riesgos, entonces uno debería ver un au- mento en los no ocupantes 47 (peatones, ciclistas, etc.) muertes. De esta manera, la teoría tam- bién apunta a consecuencias comprobables. Peltzman critica a Robertson por la ausencia de teoría en su artículo diciendo que “ su (de Ro- bertson) se centran casi por completo en el resultado empírico, más que en el análisis económico (¿teoría?) que lo motivó”. (p.673) “El lector buscará infructuosamente en su (de Robertson ) para una alternativa a mi marco teórico (de Peltzman) que informa sus regresiones. Esta falta de una teoría articulada alternativa conduce inevitablemente a formidables Dificultades en la interpreta- ción de los resultados estadísticos. No se nos dice si, o por qué motivo, cualquier resultado par- ticular es consistente con las expectativas previas. Nos quedamos con acertijos sin resolver por ejemplo, por qué más motocicletas en la carretera salvan la vida de los ocupantes pero matan a los peatones. Robertson nos haría concluir que la regulación no solo ha salvado la vida de los ocupantes sino también la de peatones . En ausencia de cualquier teoría plausible que sugiera este resultado, creo que estamos obligados ser considerablemente escéptico.” (p.675) Este ar- gumento es indicativo de dos puntos de vista de regresión o dos prototipos de regresión.
  • 41.
    modelado: Tipo A,ejemplificado por el artículo de Peltzman, en el que la elección de variables independientes es basado en una teoría preexistente 1 . En este enfoque no se pregunta por la causalidad. La causalidad preexiste dentro de la teoría asumida que especifica cuáles son las variables que provocan el cambio y en en qué dirección cambiará la variable dependiente como resultado de una manipulación o cambio en las variables independientes; la única pregunta es sobre la magnitud del efecto, es decir, el tamaño del coeficiente de regresión. Si los coeficientes de regresión estimados concuerdan en signo con lo que la teoría anticipó, esto parece ser tomado como una indicación de que el modelo está correctamente especificado y que uno puede usar el modelo para predecir el efecto del cambio o intervención. El tipo B (del que se acusa a Robertson) no se basa en una teoría totalmente articulada. Eso por lo general presupone la existencia de algún entendimiento general (quizás basado en la intuición e investigaciones anteriores) sobre qué variables podrían estar relacionadas con el fenómeno a predecir. La inclusión o exclusión de una variable se basa en ese entendimiento y en criterios estadísticos (Fuerza de la correlación con el resultado, importancia de la estadística t, correlación débil con otros variables explicativas) que en un juicio de causa. Por la vista tipo B del modelo de regresión uno puede anticipar la dirección en la que la variable explicativa afectará a la dependiente varia- ble. Sin embargo, dado que no se puede recurrir a una teoría rígida, uno puede y encontrará una plétora de mecanismos plausibles para explicar cualquier resultado. La ecuación del modelo es- timado, resultados esperados y sorprendentes, a menudo se consideran una representación de una realidad hasta ahora menos conocida; una indicación de una posible estructura de causa y efecto descubierta por medios que son estadísticos en naturaleza. 1 Según Hogarth (2004) “La palabra “teoría” puede considerarse como una descripción de una creencia o condición expectativa que le permite a uno tomar acciones en el mundo o hacer de- claraciones sobre “cómo son las cosas”." la mayoría teorías del comportamiento (el tema de gran parte de la economía, la sociología y la psicología), se ocupan de los tipos de acciones la gente toma en ambientes específicos. Por lo tanto, estas teorías son declaraciones condicionales de (a) qué tipo de personas toman (b) qué tipo de acciones en (c) qué tipo de entornos. Según el Concise Oxford Dictionary, una teoría es:” una suposición o un sistema de ideas destinado a explicar algo, especialmente uno basado en principios generales independiente de la cosa a explicar. 48 Si se pudiera suponer que la teoría detrás del modelo tipo A es correcta (y si alguna condicio- nes adicionales mantenidas) uno se sentiría atraído por este tipo siempre que sea posible. el peligro es que si la teoría es débil, incompleta o incorrecta, la investigación se dirigirá en direc- ciones que son demasiado estrechos y hacia resultados, quizás, falaces, incluso tontos. Las an- teojeras de un teoría asumida puede proteger del investigador el mundo real que se refleja en los datos y puede impedir que la realidad sea revelada y descubierta. De este modo, • Cuando la teoría es débil, incompleta o posiblemente incorrecta, podría ser más rentable centrarse en el modelado de tipo B, lo que permite que los datos guíen el descubrimiento. Para ilustrar esta elección en el contexto del artículo de Peltzman, considere la crítica contenido en Nelson (1976): “ Dado que Peltzman asume explícitamente que los conductores se ven esti- mulados a ser más "asuntos de riesgo" por la legislación, e implícitamente asume que la legisla- ción es la única diferencia entre los dos períodos, es llevado a algunos argumentos que, para alguien no tan comprometido con estas presunciones, puede parecer extraño. Comienza afir- mando que su análisis predice directamente el cambio en composición de muertes y daños rela- cionados con accidentes. Como resultado de los nuevos dispositivos de seguridad, los
  • 42.
    conductores estaban motivadospara conducir de manera más arriesgada, pero solo compensa- ron parcialmente la mayor seguridad. Los peatones y la propiedad, sin embargo, fueron los perdedores. Luego busca otra evidencia de "aumento de la asunción de riesgos", y sugiere que esto podría manifestarse en una conduc- ción más rápida, en una mayor propensión de los jóvenes a conducir, y una creciente propensión a conducir después de beber. Él encuentra ninguna evidencia real para una conducción más rápida. Él encuentra evidencia de que más jóvenes conducen y conducir ebrio (aunque no sigo del todo su argumento numérico con respecto a un aumento propensión de los jóvenes, en com- paración con las personas mayores, a conducir). El punto implícito, por supuesto, es que estas tendencias fueron causadas directamente por la legislación. Qué argumento más peculiar. Si uno no entraba en el estudio con las anteojeras particulares de Peltzman, y vio los datos que Peltzman ha descubierto, podría haber preguntado el analista, con una mente bastante abierta manera: ¿Por qué el aumento en la conducción de adolescentes y la conducción en estado de ebriedad (que parecen plausiblemente conectados con el aumento de muertes de peatones y daños a la propiedad)? En la búsqueda de los factores detrás de estos desarrollos, el investigador podría haber mirado una serie de variables, pero dudo seriamente si hubiera puesto mucho peso en la posibilidad de que la razón principal fuera la nueva legislación de seguridad automotriz. Sin la legislación, ¿la incidencia de conductores jóvenes y ebrios la conducción ha sido significativamente menor? ¿Sería un ataque efectivo contra el aumento de las muertes de peatones? y daños a la propiedad para prohibir los cinturones de seguridad y los dispositivos de seguridad para automóviles relacionados? Había muchas cosas además de los cinturones de seguridad que eran diferentes en el período posterior a 1965. En comparación con el período anterior, la era posterior a 1965 (hasta 1970) fue de alto nivel de empleo. y prosperidad La "fuera de tendencia". aumento de los accidentes notificados no fatales bien podría resultar parcialmente del aumento de la fracción de coches nuevos (algo que Peltzman incorpora explícitamente en otros regresiones). El aumento de muertes de peatones, que destaca Peltzman, seguramente necesita más análisis completo que le da al problema. Aunque parte del aumento puede deberse a Hábitos de conducción más peligrosos, algunos de ellos podrían de- berse al efecto no lineal de más peatones, a más coches, o a su interacción. Demográficamente, la enorme población posterior a la Segunda Guerra Mundial cohorte de nacimiento estaba lle- gando a la mayoría de edad, y uno puede dudar de que el aumento asociado en la cultura juvenil, y los efectos que podría haber tenido en la seguridad del automóvil, se capta adecuadamente por el coeficiente de tamaño de Peltzman de grupo Esta fue una era de drogas, alcohol y rebelión juvenil, por razones que los economistas los modelos pueden no captar muy bien. Ciertamente, Peltzman ni siquiera trató de lidiar seriamente con el 49 razones. Estaba la guerra de Vietnam y sus influencias internas. ¿Podría esto haber estado relacionado al fenómeno en cuestión? No sé, pero la "desviación de la tendencia" obviamente no puede ser atribuido a la "legislación de seguridad" hasta el efecto de estos otros factores si se evalúa cuidadosamente. Uno de Mis colegas bromearon sugiriendo que el caso Peltzman podría conservarse si nuestra aventura en Vietnam podría atribuirse al hecho de que nos sentimos más seguros conduciendo y queríamos compensar. . Pero creo que he hecho el punto. (pág. 65-66) El punto de sentido común que plantea Nelson es que el compromiso doctrinario de Peltzman con una teoría económica simplista (enfoque tipo A) le impidió ver que los cambios en el consumo de alcohol, el exceso de velocidad, más con- ducción por parte de los jóvenes, etc. es más probable que sean el resultado de muchas
  • 43.
    corrientes y tendenciassociales complejas que de un ajuste que maximiza la utilidad a la pre- sencia en el automóvil de un cinturón de seguridad o de una columna de dirección plegable. Las anteojeras de un incompleto la simple teoría oscurecía una realidad compleja. Por otra parte, la ausencia de teoría que defina el enfoque B, lo priva de una clara criterio por el cual se puede hacer una atribución de causa. Lo que uno ve son coeficientes de regresión. algunos de los cuales pueden estar de acuerdo con la intuición o la comprensión previa y otros que no. A coeficiente de regresión con un signo inesperado por lo general se puede explicar fácilmente como reflejando no una causa sino una variable oculta, una interacción desatendida, algunos datos no disponibles, etc. Y aquí está el problema; si en el modelado tipo B se debe dudar del significado causa-efecto de un coeficiente de regresión inesperado uno debe igualmente dudar del mensaje de un coeficiente de regresión con un signo esperado y por lo tanto la posibilidad de interpretación causal de toda la empresa. El debate sobre el 'efecto Peltzman' no terminó en 1977. Escribiendo en 2003, Sobel y Nesbit (Sobel y Nesbit 2003) resumió el debate así: “ Aunque los resultados de Peltzman no son deci- sivos, sus hallazgos respaldan en última instancia la existencia 1 de Comportamiento compen- satorio. Mejoras y variaciones del estudio de Peltzman han sido ofrecidas por numerosos econo- mistas, a menudo produciendo resultados que sugieren poco o ningún comportamiento compen- satorio. Ambas cosas Robertson (1977) y Graham y Garber (1984) revisan el modelo de Pelzman y encuentran opuestos resultados. Peltzman (1977), sin embargo, responde a las críticas de Robertson, argumentando que las revisiones a su modelo no son consistentes con el supuesto de racionalidad del conductor. Graham y Garber, usando especificación y control alternativos para el tamaño del vehículo, sin seguro contra fallas y el mayor uso de motocicletas, encuentra que el desempeño es consistente con las proyecciones de ingeniería de menor muertes totales 2 . Los resultados. no se han acercado más al consenso en las últimas dos décadas. Chirinko y Harper (1993), utilizando datos de series de tiempo sobre muertes, encuentra evidencia de algún comportamiento compensatorio mientras que Risa (1994), usando datos de lesiones y fatalida- des de Noruega, encuentra que los efectos de compensar comportamiento más que negar los beneficios. Varios otros estudios que utilizan datos de accidentes encuentran resultados mixtos. resultados sobre el comportamiento de compensación, y en su mayoría solo ligeramente signifi- cativos, si es que lo son. A diferencia de estos estudios, una tendencia más reciente es utilizar datos sobre lesiones o reclamaciones de seguros por marca o modelo específico de automóvil, comparándolo con las características de seguridad del modelo. Peterson y Hoffer (1994), por ejemplo, encuentra que las tasas de lesiones y las reclamaciones de seguros nunca mejoran, y suelen empeorar signifi- cativamente, para los modelos equipados con bolsas de aire. Lund y Hazelbaker (1993), 1 La afirmación de Peltzman no se trata de la existencia de un comportamiento compensatorio; su existencia se presume sobre la base de teoría económica. La afirmación de Peltzman se refiere a la magnitud de la conducta compensatoria, es decir, que es más o menos completa negado el efecto de seguridad de la regulación del automóvil. 2 Es decir, exactamente la conclusión opuesta a la de Peltzman. 50 sin embargo, no están de acuerdo con ese resultado y citan lo que creen que es una prepon- derancia de evidencia lo que sugiere que no hay cambios en el comportamiento del conductor. Por lo tanto, incluso con este enfoque alternativo de datos, no se ha llegado a un consenso. Debe
  • 44.
    quedar claro apartir de los resultados mixtos resumidos anteriormente que un la respuesta defi- nitiva está lejos de ser clara”. págs. 6-7. No es realmente necesario describir el mérito del argumento y el contraargumento. los El men- saje general es claro. Hace unos treinta años, la pregunta sobre el efecto de seguridad de los automóviles se planteó la legislación. Muchos investigadores han tratado de responder a la pre- gunta utilizando variantes de la misma herramienta: un modelo econométrico multivariable ba- sado y los datos agregados disponibles para alimentarlo. Dependiendo de los detalles de los datos y el modelo, diferentes investigadores llegaron a dife- rentes estimaciones y conclusiones. Se debe concluir que, en este caso, no se podría resolver la cuestión de qué El cambio en las muertes por accidentes de tránsito fue causado por la regu- lación de la seguridad del automóvil usando multivariable. modelos econométricos. 4.1.4 La Moraleja de la Historia de la “Regulación de Seguridad Automovilística”. Como se indicó anteriormente, nuestro interés no está en la cuestión de cómo las normas de seguridad de los automóviles seguridad afectada, sino en la cuestión de si los modelos econo- métricos multivariables basados en los datos agregados permiten la interpretación de causa y efecto. Por lo tanto, es interesante examinar si los mismos modelos econométricos ya revisados, así como algunos adicionales, produjo estimaciones consistentes para el efecto de variables ta- les como ingresos, costos de accidentes, alcohol Consumo, Velocidad, etc. Si los coeficientes de regresión se encuentran más o menos consistentes, toma esto como un buen augurio; una señal de que diversos datos muestran aproximadamente el mismo efecto de un variable. Sin embargo, si el coeficiente de regresión estimado de la misma variable se encuentra en todo el mapa, concluiremos que el: una. el efecto de la misma variable es diferente en cada estudio y entorno o, b. la herramienta (modelado econométrico multivariable de datos agregados) no pro- dujo estima una representación fiable del fenómeno. En cualquier caso, no se puede atribuir ningún significado de causa-efecto a los resultados de tal estudio. A continuación se muestran las estimaciones del coeficiente de regresión para variables y mo- delos seleccionados. Tabla 6 . Estimaciones de parámetros para variables seleccionadas Ácido. Costo Ingreso Alcohol Velocidad Tráfico Densidad Joven Conductores Peltzman (1975) Serie temporal 1,2,4 -0,17 0,88 0,36 1,84 0,83 Peltzman (1975) Sección transversal 61-63 1,3,4 0,15 - 0,81 0,17 0,76 0,23 Peltzman (1975) Sección transversal 64-66 1,3,4 0,23 -0,66 0,04 0,89 0,12 Graham (1983) Serie temporal 5 -1,916 1,032 2,472 20,52 Crandall (1983) 4,6 1,062 0,2941 0,7325 Zlatoper (1991) Sección transversal 5 -0,002 2,646 0,363 7,242 -0,735 Chirinko Harper (1993), Serie temporal 2,4 -0,810 -0,634 1,053 -0,112 1Basado en Joksch (1976), 2 Accidentes fatales/Milla vehicular, 3 Muertes de tránsito /Población, 4 Formulario de modelo multiplicativo (log-lineal), 5 Formulario de modelo aditivo lineal, 6 Muertes de ocupantes/año. Independientemente de si se utilizó una forma de modelo multiplicativa (log-lineal) o aditiva (li- neal) utilizado, si un coeficiente de regresión es positivo en un estudio y negativo en otro, esto es una señal segura de problemas Este problema se presenta en las variables Costo de Acci- dentes, Ingresos y Conductores Jóvenes. 51 Alcohol y Speed tienen en todos los estudios coeficientes de regresión positivos 1 . con algo de cautela uno puede examinar y comparar las magnitudes de los coeficientes de regresión para
  • 45.
    el multiplicativo modelosAsí, por ejemplo, el coeficiente de regresión para el alcohol en el modelo de sección transversal de Peltzman es 0.04 mientras que en Chirinko y Harper es 1.053 2 . Esto también es una señal de problemas ya que un estudio indica que un aumento de más del 1% en muertes y el otro solo un poco más del 0% por incremento porcentual en la variable Alcohol. Los intentos sucesivos de modelado econométrico multivariable por parte de varios investigado- res no responder a la pregunta qué reducción en las muertes de tránsito fue causada por la seguridad del automóvil regulación. La investigación no condujo a un consenso sobre la existen- cia y la magnitud de la compensación comportamiento; y no arrojó ecuaciones que permitan predecir cuál será el cambio en las muertes causado por un cambio en variables como Velocidad, Alcohol, Ingresos, etc. Es como si algunos encontraran que metal se expande cuando se calienta, mientras que otros llegaron a la conclusión de que se contrae, y todo el experimento desorden dejado en el piso del laboratorio, con todos publicando y creyendo sus propios resultados, y nadie pregunta si el método de medición utilizado por todos es bueno. 4.2 Lave y otros sobre el límite de velocidad La Sección 4.1 trataba sobre el desafío de Peltz- man a la opinión del sentido común de que los vehículos más seguros lograr menos muertes. Un desafío similar a la sabiduría recibida fue lanzado en 1985 por Charles Lave (Lave y A.). Afirmó que "la varianza no mata la velocidad". (pág. 1159). Como Sobel y Nesbit (2003) señaló: “El Santo Grial en la investigación económica es encontrar un modelo teóricamente sólido que pre- dice un resultado contraintuitivo…” (p.2) 4.2.1 Hallazgos de Lave. Como otros antes que él, Lave depositó su confianza en el poder de la regresión para cuantificar las causas. Su variable dependiente fue la tasa de letalidad (FR, fatalidades/10 8 millas del vehículo). El independiente las variables fueron promedios estatales para: 1. Velocidad promedio; 2. Percentil de velocidad 85; 3. exceso de velocidad citaciones/100 conductores por año; 4. una medida de Acceso al Hospital. Para cada tipo de carretera y año (seis tipos de carreteras y dos años natu- rales, lo que da como resultado doce modelos estimados) tenía entre 18 a 47 puntos de datos. Las ecuaciones del modelo de Lave eran lineales aditivas 3 . La ecuación de regresión final (Ecuación de Lave 2) es: 1 Es pertinente señalar aquí que toda la siguiente sección gira en torno a un hallazgo de que, en una regresión similar esfuerzo de modelado, el coeficiente de regresión de la velocidad fue negativo y esto dio lugar al 'hallazgo' de que la velocidad no es relacionados con accidentes mortales. 2 El hecho de que Peltzman use muertes de ocupantes/ 10 5 población mientras que Chirinko y Harper usan vehículo motorizado muertes de ocupantes.10 8 millas del vehículo deberían hacer muy poca diferencia. En Peltzman el consumo de alcohol es el de licores destilados por personas mayores de 15 años; Chirinko y Harper hablan de “consumo per cápita de alcohol” que puede ser una variable algo diferente si incluye vino y cerveza. Fridstrøm e Ingebrigtsen (1991)(Frids- trøm and Ingebrigtsen 1991) muestran diferencias sustanciales en los coeficientes de regresión asociados con Venta de cervezas, vinos y licores. 3 Ni Lave ni ningún otro autor cuyo trabajo haya sido mencionado hasta ahora dan razones para su elección de forma funcional. Y, sin embargo, las conclusiones a las que lleguen pueden de- pender crucialmente de esta elección, una elección que todos hacen. por razones no reveladas. Escribiendo en el Handbook of Econometrics, Lau (1986, p. 1516-8) (Lau 1986) escribe: “Históricamente, las primeras formas de funciones algebraicas se eligieron por su facilidad de estimación. Casi siempre un la forma funcional elegida es lineal en paráme- tros, después de una transformación de la variable dependiente si es necesario. … 52 (Citas /
  • 46.
    Conductor) (Acceso alhospital) FR (Velocidad promedio) (Percentil 85 de velocidad - Velocidad promedio) 3 4 1 2 + β + β = α + β + β ecuación 4 Para evitar usar la misma variable (Velocidad promedio) en dos términos de la ecuación. 4 Lave también estimó: (Citas / Conductor) (Acceso al hospital) FR (velocidad media) (percentil 85 de velocidad) * 4 * 3 * 2 * 1 * + β + β = α + β + β ecuación 5 Naturalmente, el percentil 85 y el promedio de una distribución siempre son alta- mente positivos . correlacionado. Y por lo tanto la ecuación transformada. 5 solo acentúa el problema de colinea- lidad en la ecuación. 4. Por lo tanto, reportaré los coeficientes de regresión seleccionados para la ecuación. 4. Tabla 7. Coeficientes de regresión seleccionados para Eqn. 4. Promedio Velocidad ( β 1 ) Velocidad Variabilidad β2 _ β 3 β 4 R 2 Número de Estados norte Interestatal rural 1981 -0,5 0,176 0,036 -7,75 0,624 41 Arterial Rural 1981 -1.3 0.677 0.0122 0.915 0.237 46 Recolector Rural 1981 -0.1 0.011 0.0041 -8.61 0.019 41 Autopista Urbana 1981 -0.5 0.281 0.041 -0.286 0.193 18 . Lave estimó los coeficientes de regresión β 2 a β 4 cuando la velocidad promedio no se utilizó como variable. Si la Velocidad Media se incluyera entre las variables, su coeficiente de regresión sería que se enumeran en ( β 1 ). Porque β 2 es positivo en 11 de 12 casos y β 1 es negativo en 10 de los 12 modelos estimados, Lave concluyó que es la variabilidad de la velocidad (medida por la diferencia percentil 85 y la velocidad media) y no la velocidad media lo que importa. En En apoyo de esta evidencia basada en la regresión, Lave aduce algunos hallazgos de investigación adicionales. Aparte de su apoyo agregado es empírico y proviene de Solomon (Solomon 1964) y Cirillo (Cirillo JA. 1968) quien descubrió que la tasa de participación en accidentes aumenta dramáticamente para los vehículos que conducen más lento o más rápido que la velocidad me- dia. Otra parte del apoyo es teórico y viene de un pecado de mi juventud (Hauer 1971) donde muestro que la frecuencia de los adelantamientos experimentados Finalmente, por facilidad de cálculo e interpretación y por razones estéticas (comúnmente elegidos son) iii y = Σ f ( X ) α (1.1) o = Σ iii g ( y ) f ( X ) α (1.2).” Un ejemplo de ec. 1.1 es la forma funcional lineal ampliamente utilizada en la que f(X i )=X i (usado por Lave y otros). Un ejemplo de ec. (1.2) es la forma fun- cional logarítmica doble en la que g(y)=ln(y) y f(X i )=lnX i .(utilizado por Peltzman y otros) …. formas funcionales del tipo en ecuaciones. (1.1) y (1.2) pueden interpretarse como aproximacio- nes de primer orden a cualquier función arbitraria en la vecindad de algún XX 0 y esa es una de las razones por las que tienen una moneda tan amplia. Sin embargo, las funciones lineales, aunque pueden aproximarse a la función subyacente, razonablemente bien para pequeños cam- bios en las variables independientes, frecuentemente no funcionan muy bien…” Nunca funcionan bien cuando la función subyacente es fuertemente no lineal y X no está cerca de X o . Esta crítica ciertamente se aplica a Lave (1985) en el que, por ejemplo, el valor medio de (percentil 85 - Velocidad media) es de aproximadamente 5 pero varía de 2.7 a 9.0 y la citación/conductor varía de 24 a 193 y donde generalmente se piensa que la posibilidad de una fatalidad aumentar con la cuarta potencia de la velocidad. 53 por vehículos que van más lento o más rápido que la velocidad mediana aumenta de una manera muy similar a la 'Curva de Salomón'. Especulé allí que la frecuencia de adelantamiento podría ser el mecanismo lo que explica los hallazgos de Salomón. Así, para Lave, el problema con la velocidad parecía ser su variabilidad (falta de coordinación), no su magnitud. Si es así, según Lave, el apropiado la respuesta política debe ser medidas que reduzcan la variabilidad de la velocidad, no esfuerzos para cambiar la velocidad distribución a velocidades menores, man- teniendo su varianza.
  • 47.
    El tema decausa y efecto vuelve a estar en el centro del escenario. Como Peltzman y otros antes que él, Lave se inclinaba a creer que lo que uno encuentra por regresión multivariable puede ser se lee como causa y efecto. En este caso, la principal interpretación causal es que si se actúa para reducir el diferencia entre el percentil de velocidad 85 y la velocidad media, es probable que se obtenga una reducción en la tasa de accidentes fatales en la dirección y quizás la magnitud predicha por la correspondiente coeficientes de regresión. Además, también con base en el signo y la magnitud de la regresión coeficientes, Lave argumenta que si uno reduce la velocidad pro- medio sin reducir la dispersión de velocidad, es posible que no se reduzca la tasa de accidentes mortales. La dificultad obvia con la conclusión de Lave (que reducir la velocidad sin reducir la variabilidad de la velocidad no disminuye las fatalidades) es que niega no solo la sabiduría convencional sino también las leyes de la naturaleza en las que se basa la sabiduría convencional. La extensión de la lesión depende sobre la capacidad del cuerpo humano para resistir el impacto y la deformación causados por un choque y éstos, a su vez, están determinados por las leyes de la física. Real- mente no es posible argumentar que la El daño al cuerpo humano que es causado por el impacto y la deformación no están relacionados con la energía. disipado en un choque o al cambio en el momento de las masas involucradas. Energía y cantidad de movimiento son funciones de la velocidad. Por lo tanto, los resultados de la regresión de Lave no sólo van en contra de sabiduría convencional, también parecen negar hechos físicos y médi- cos que pocos pregunta. Solo puedo pensar en dos formas de cuadrar la afirmación de Lave con las realidades de la mundo físico. Una sería si la velocidad en el momento del impacto fuera completamente independiente de la velocidad a la que viajaba el vehículo unos segundos antes del impacto; no es muy plausible conjetura, especialmente no para choques de un solo vehículo 1 . Otra sería si los que manejan rápido estuvieron involucrados en menos colisiones que los que conducían, digamos, a la velocidad media. Desde la oportunidad de una colisión que resulte en fatalidad aumenta aproximadamente con la cuarta potencia de la velocidad, la compensar la re- ducción en la frecuencia de colisiones para aquellos que van rápido tendría que ser absurda- mente largo. Por lo tanto, no puedo pensar en circunstancias en las que el resultado de Lave pueda ser cierto. 4.2.2 Los comentaristas. Siguió de nuevo un animado debate, gran parte del mismo en el número de septiembre de 1989 del American Revista Económica. Fowles y Loeb (Fowles y Loeb PD 1989) argumentaron que el modelo de Lave puede haber omitido muchas variables importantes 2 . También piensan que su modelo podría ser “frágil 1 Existe alguna evidencia (Farmer 2003) de que la relación entre el cambio de velocidad antes del impacto (Delta-V) y el límite de velocidad es mucho más débil de lo que cabría esperar. Por lo tanto, si el límite de velocidad y la velocidad media son fuertemente correlacionada, la conjetura podría considerarse plausible. 2 ¿Qué pasa si, por ejemplo, aquellos estados donde las velocidades son más diversas también tienen menos tráfico? Como es sabido, en la mayoría de los tipos de carreteras, la tasa de acci- dentes disminuye a medida que aumenta el flujo de tráfico. Por lo tanto, si se incluyera una medida de la densidad del tráfico en el modelo esto podría haber alterado los hallazgos de Lave. ¿Qué pasaría si fuera cierto, por ejemplo, que cuanto más alcohol haya en el asiento del con- ductor? sangre, más diversa y extrema tiende a ser su velocidad? Si es así, ¿qué fue interpretado por Lave como el efecto de la variación de la velocidad puede, de hecho, reflejar diferencias en el contenido de alcohol en la sangre? 54 con respecto a la especificación del modelo” 1 Para examinar estos temas, Fowles y Loeb construyeron un modelo de los suyos También era lineal-
  • 48.
    aditivo. La variabledependiente fue el número de muertes en un estado y las variables indepen- dientes fueron: 1. La existencia de un sistema de inspección de vehículos de motor en el estado, 2. Velocidad promedio ponderada de vehículos de movimiento libre en carreteras interestatales, 3. Diferencia ponderada entre el percentil 85 y la velocidad media de los vehículos en movimiento libre en carreteras interestatales, 4. Edad mínima para beber cerveza, 5. Consumo per cápita de cerveza, 6. 10 8 millas recorridas por vehículos, 7. Acceso al hospital, 8. Millas de carretera, 9. Densidad de población, 10. Proporción de conductores entre 18 y 24 años, 11. Población en el estado, 12. Variable ficticia para 'Western Estados'. Los autores encontraron que "las variables de 'velocidad' y 'variabilidad de la velocidad' tienen coeficientes que son positivos y (estadística- mente) significativos”. Dijeron que: “ Los resultados son excediendo estable a través de un con- junto bastante extenso de especificaciones de modelo 2 lo que lleva a creer que los resultados son ciertamente plausibles. Estos resultados están en fuerte desacuerdo con Lave ”. (Énfasis añadido p.917-918). En el mismo número de American Economic Review, Levy y Asch (Levy y Asch 1989) examinó los resultados de Lave a la luz de su propio modelo. Sus datos de sección transversal fueron para 50 estados en el año 1985. La variable dependiente fue Fatalidades de vehículos de motor interestatales por Conductor. Las variables independientes fueron: 1. Millas de vehículos inter- estatales/conductor, 2. Ingreso per cápita, 3. Proporción de conductores masculinos, 4. Propor- ción del kilometraje por carretera que es municipal, 5. Conducción legal edad, 6. Consumo de alcohol per cápita, 7. Promedio estatal de velocidad de conducción promedio para varios tipos de vías, 8. percentil 85 - velocidad media, 9. producto de 8×9. El modelo preferido fue nuevamente lineal y aditivo. Levy y Asch encontraron que cuando La variable 9 (el producto de la velocidad y la variabilidad de la velocidad) no está incluida en el modelo “velocidad media tiene un efecto positivo aunque (estadísticamente) insignificante. El efecto de la varianza (más precisamente variabilidad de la velocidad) es positiva y significativa”. (pág. 914). Sin embargo, cuando la 'interacción variable' (9) está incluida en el modelo, “Su coe- ficiente es positivo (0.0038) y significativo al 0,05 (mientras que los coeficientes de la velocidad media (-0,027) y la varianza de la velocidad (-0,21) volverse negativo y significativo)…” (p. 915). Sobre esta base concluyen que: “…Lave's argumento está incompleto. La falta de coordinación sí implica mayor riesgo. El grado en que lo hace, sin embargo, depende de la velocidad media; y la velocidad media también contribuye al riesgo a un ritmo que depende de la varianza.” Es difícil abstenerse de comentar aquí, una vez más, sobre la asombrosa fe en el poder de regre- sión. Levy y Asch intentaron modelar muertes en la carretera interestatal sistema. Usaron como variables independientes una variedad de variables disponibles, pero a menudo solo vagamente. estadísticas agregadas pertinentes. Uno puede preguntarse, por ejemplo, qué tan cerca está el ingreso per cápita en el estatal (que era una de las variables), refleja el ingreso per cápita de quienes utilizan la interestatal sistema en ese Estado (los camioneros, los viajeros fuera del es- tado, etc.); uno puede preguntarse, por ejemplo, qué tan directo es el nexo de causalidad entre la proporción de vías en el estado que se clasifican como municipales (también una variable utilizada en la regresión) y muertes en las carreteras interestatales; uno puede cuestionar el pa- pel de la velocidad promedio estatal y la variabilidad de la velocidad para varios tipos de carre- teras (la principal variables independientes de interés) como una 'causa' de fatalidades interes- tatales. Sin embargo, la principal prueba de 1 La fragilidad del modelo generalmente significa que la conclusión que se extrae depende de la suposición que hace el investigador sobre el
  • 49.
    modelo; suposiciones sobrequé tipo de función matemática se debe usar para representar el fenómeno a mano; supuestos sobre qué variables deben incluirse en el modelo y cuáles no, etc. 2 Se han probado diez modelos aditivos lineales. Estos diez modelos difieren en las variables incluidas y excluidas. 55 la credibilidad de uno viene cuando Levy y Asch agregan al modelo la variable de 'interacción' (promedio velocidad) × (variabilidad de la velocidad). Usando los coeficientes de regresión dados por Levy y Asch, muestro en Figura 11 cómo la adición a 'Muertes de vehículos de motor inter- estatales' (desinflado por conductores con licencia) depende de las variables 'Velocidad media' y del 'percentil 85 – Velocidad media' 1 . Figura 11. La suma de accidentes por la Velocidad y la Variabilidad de la Velocidad Estos resultados no tienen sentido. Si fueran ciertos, uno concluiría que, cuando la velocidad la varia- bilidad es baja 2 entonces, cuanto mayor sea la velocidad media, menor será el número de muer- tes. Sin embargo, lo contrario estaría indicado cuando la variabilidad de la velocidad es grande. Las dos líneas que se muestran en la Figura 11 se cruzan alrededor de 55 mph. Si esto fuera cierto entonces, para todos los valores de velocidad media por debajo de 55 mph, menos varia- bilidad en la velocidad, se deben esperar más accidentes fatales y lo contrario se mantiene por encima de 55 mph. No hay indicios en el documento de que estas peculiares consecuencias de la forma funcional elegida han sido revelados por algunos análisis exploratorios de datos. Lo más probable es que la tontería sea directa. consecuencia no de los datos sino de las elecciones realizadas por los investigadores: la decisión de utilizar un modelo aditivo lineal y la decisión de utilizar como una variable el producto de la velocidad media y la velocidad variabilidad. Las elecciones de este tipo a menudo se hacen habitualmente. Y sin embargo, una vez que la forma modelo fue elegido infundadamente y viendo que el coeficiente de regresión del producto de la velocidad media y la variabilidad de la velocidad “.es positiva y significativa” Levy y Asch no dudan en concluir que: ". la falta de coordinación tiene mayores efectos fatales a velocidades más altas". (pág. 915). Ciertamente así es difícil comprender la intolerable ligereza con la que se pueden hacer tales afirmaciones causales y publicado. Snyder contribuyó a otra discusión de las afirmaciones de Lave (Snyder 1989). Su El argumento era doble. Primero, que uno debería distinguir entre conductores lentos y rápidos usando dos variables separadas: (velocidad percentil 85 - velocidad mediana) y (velocidad mediana- percentil 15 velocidad). Segundo, que uno debe minimizar el efecto adverso de las variables omitidas usando 1 La ecuación es: Adición a la Tasa de Accidentes= -0.027×VELOCIDAD-0.21×(Percentil 85 -VELOCIDAD)+ 0.0038 ×VELOCIDAD × Percentil 85 -VELOCIDAD). 2 Cuando (percentil 85 - VELOCIDAD ) < 7 mph. 56 variables ficticias para 'Estado' o 'Período de tiempo' 1 . Él también utiliza un modelo aditivo lineal en el que el la variable dependiente es 'Tasa de fatalidad en carretera/10 8 millas de vehícu- los' en carreteras primarias rurales incluyendo interestatales. Las variables independientes son 'velocidad mediana' y las dos mencionadas desviaciones de la velocidad media. Los principales resultados de Snyder se encuentran en la Tabla 8. Tabla 8. Coeficientes de regresión de Snyder ecuación R 2 Mediana- 15ª Mediana 85ª -Me- diana 1 Tres variables 0,40 0,03 0,37** 0,40* 2 Dos variables 0,41 0,38** 0,42** 3 Una variable 0,25 0,51** 4 Variables ficticias para 26 Estados 0,80 0,11 0,43** 0,26* 5 Variables ficticias para 1972, 73, 74 0,42 -0,03 0,35* 0,37* *Significativo al 0,05; ** Significativo al 0,001 Snyder concluye que 2 “la velocidad media del tráfico es un determinante importante de la carretera muertes…” y
  • 50.
    que “…la variaciónde velocidad 3 es importante solo para los vehículos más rápidos”. Él también ve sus resultados como representación de causa y efecto y, por lo tanto, se siente libre de ofrecer especulaciones explicaciones de sus hallazgos. Estas especulaciones (p. ej., "los vehículos len- tos tienen más probabilidades de ser grandes (autobuses, tractocamiones, etc.) y por lo tanto más fáciles de ver y evitar…. Los vehículos rápidos son más probablemente sea más pequeño y conducido imprudentemente por no profesionales”. p.924) son una ilustración de la facilidad con la que se puede explicar cualquier resultado de regresión. 4.2.3 Respuesta de Lave. En su réplica, Lave es recalcitrante; sigue manteniendo que solo la variabilidad de la velocidad importa y cree que: “… sus resultados (los del comentarista) son simplemente un artefacto de agregando diferentes tipos de carreteras”. (pág. 926). El de Lave es un argumento importante y tiene un efecto directo teniendo en cuenta la cuestión de cuándo la interpretación de causa y efecto de los resultados de la regresión puede ser equivocado. Lave argumenta así: “Los tipos de carreteras difieren marcadamente en sus características físi- cas y patrones de uso y, a su vez, estas diferencias en las características provocan una diferencia de 5:1 en la mortalidad tasa a través de los tipos de carreteras.” (p. 926) Para ilustrar lo que causa las diferencias incluso entre carreteras aparentemente similares, como las carreteras in- terestatales Lave menciona: "( a) las carreteras interestatales rurales son más aislado que las carreteras interestatales urbanas, el tiempo de demora para la ayuda médica es mayor, y por lo tanto ordinario los accidentes se convierten en fatalidades; (b) las carreteras interestatales rura- les transportan 2,4 veces la proporción de camiones pesados, por lo que hay más interacciones coche/camión; (c) las carreteras interestatales rurales tienen mayor recorrido longitud, más fatiga del conductor y, por lo tanto, un 15 por ciento más de accidentes en los que el vehículo simple- mente se sale del camino. Consciente de tales diferencias, ejecuto ecuaciones separadas en cada tipo de carretera. Los tres comentarios no.” (p. 926) 1 Si se vuelve a estimar un modelo de regresión después de agregar una nueva variable, el valor de la regresión previamente estimada el coeficiente puede cambiar. Si es así, la nueva variable es una variable omitida. El argumento de Snyder es que al agregar dummy variables para 'Estado' o 'Período de tiempo' se minimiza el efecto no contabili- zado de las variables omitidas. 2 Contrariamente a lo que afirma Lave. 3 Snyder realmente significa algo así como 'desviación de la velocidad media cuando es positiva'. 57 Lave explica el mecanismo por el cual los comentaristas podrían haber llegado a un conclu- sión incorrecta de la siguiente manera: “ ¿Cómo podría ocurrir esto? Las carreteras rurales tienen mayor mortalidad que las carreteras urbanas (por las razones estructurales citadas anterior- mente), y las carreteras rurales tienen velocidades medias más altas que las carreteras urbanas. Por lo tanto, combinar datos rurales y urbanos (como el comentaristas) producirá una falsa co- rrelación positiva entre la velocidad y fatalidades.” (pág. 926) Una parte del argumento de Lave tiene un gran mérito. Los sesgos de agregación son ampliamente reconocidos y descrito. Para consultar una revisión reciente en el contexto de la investigación sobre seguridad vial, véase (Davis 2004). Por un examen del sesgo de agregación en el contexto del trabajo de Lave ver (Davis 2002). Sin embargo, El principal argumento de Lave es esencialmente cíclico. Postuló que lo que causa mayores tasas de mortalidad en las carreteras interestatales rurales son (a) mayor demora en la ayuda médica, (b) más camiones ergo más graves colisiones, y (c) más colisiones de un solo vehículo que tienden a ser más graves. también asumió (en silencio), que (d) la mayor
  • 51.
    velocidad en lascarreteras interestatales rurales no es una de las principales razones por las que los accidentes en las carreteras interestatales rurales tienden a ser fatales con más frecuen- cia que las carreteras interestatales urbanas. (Solo cuando la suposición (d) ¿Puede Lave con- siderar que la correlación entre la velocidad y las muertes es " espuria ".) Por lo tanto, mientras que Lave argumenta que la correlación positiva entre la velocidad y la tasa de mortalidad que el comentaristas encontrados es espurio, lo más que puede decir es que sería espurio si (d) fuera cierto. Uno no puede argumentar que (d) es verdadero asumiendo que es verdadero. Lo más probable es que Lave tenga razón al pensar que una parte de la diferencia en las tasas de mortalidad entre carreteras interestatales rurales y urbanas se debe a factores como (a), (b) y (c) 1 . Si es así, lo que los comentaristas atribuido a la velocidad es, en parte, un reflejo del efecto de todas las diferencias mencionadas que no dieron cuenta. Lave cree que sus propios resultados son correctos porque examinó por separado cada tipo de carretera (interestatal, arte- rial, etc.) y entorno (urbano y rural). Sin embargo, las propias conclusiones de Lave están sujetas a las mismas críticas por las que desacredita los hallazgos de otros. Considere, por ejemplo, su modelo para carreteras interesta- tales rurales basado en el promedio de 41 estados. valores para 'Velocidad media', 'Variabilidad en la velocidad', 'Citas/Conductor' y 'Hospital Acce- so'. Para usar el propio argumento de Lave, estos 41 estados diferirán en, digamos, el promedio de 'Porcentaje de Camiones en su sistema interestatal rural. Si es cierto que más camiones pro- vocan más accidentes mortales (como postula Lave) y, si también es cierto que cuantos más camiones hay en la carretera, menor es el velocidad media entonces, ceteris paribus (como les gusta decir a los economistas) más muertes tenderían para ir con velocidades menores. De ello se deduce que el descuido de Lave del 'Porcentaje de Camiones' como variable tienden a pro- ducir el propio hallazgo de Lave, el hallazgo de que no hay efecto de la velocidad, incluso si en realidad la velocidad sí lo hace. aumentar la frecuencia y la gravedad de los accidentes. De manera similar, los estados difieren en la proporción de conductores mayores en interestatales Los conductores mayores mueren más fácilmente y los conductores mayores tienden a conducir más lento. Esto también podría aparecer como una asociación entre velocidades más lentas y más muertes. Así, sin tener en cuenta la edad como factor casual también puede inducir a error. Numerosos otros argumentos plausibles en este sentido podría agregarse. 1 Además de estos, las principales diferencias adicionales se encuentran en la frecuencia de los intercambios, los estándares de diseño las autopistas suelen tener medianas estrechas con una barrera mediana y una sección transversal de bordillo y cuneta + barandilla; rural las autopistas tienden a tener medianas más anchas, a menudo sin una barrera en la mediana, menos baran- das, etc.), iluminación, etc. 58 Por lo tanto, es justo decir que los propios resultados de Lave sufren el mismo tipo de confu- sión por lo que culpa a sus comentaristas. Si los resultados de los comentaristas pueden ser incorrectos, también pueden ser su. La categorización de Lave (por tipo de carretera y configu- ración) es insuficiente para dar cuenta de posibles variables de confusión como la cantidad de tráfico de camiones, la edad de los usuarios de la vía y otras; por lo tanto no asegura que los coeficientes de regresión de 'Velocidad' y de 'Variabilidad de la velocidad' puedan ser interpre- tado en un sentido de causa y efecto.
  • 52.
    ¿Qué sería entoncessuficiente? Esta cuestión necesita ser discutida exhaustivamente en su propia y no como un aparte de una anécdota histórica. Sin embargo, es claro que la posibilidad de llegar a conclusiones erróneas a menudo está presente en el trabajo no experimental, espe- cialmente cuando el los datos se agregan en medias y no se tiene en cuenta el efecto de las variables importantes. Tambien es claro que tales amenazas a la validez no son fáciles de evitar. El hábito de agregar datos en medios requiere una posdata interesante para esta porción de historia de la investigación (que fue iniciada por Lave en 1985 y finalizada por su refutación en 1989). Esta basado sobre un trabajo de Rodríguez (1990). Sin recurrir a ningún dato o suposición, Rodríguez muestra por lógica matemática que mientras la probabilidad de morir en un accidente sea una no lineal función de la velocidad, la tasa de mortalidad de un Estado será función de la velocidad media y de la velocidad variación, incluso si cada conductor estaba siempre solo en la carretera y, por lo tanto, la variabilidad de la velocidad tenía nada que ver con la ocurrencia de accidentes. Es decir, una ecuación de regresión correcta tendrá ambas medias la velocidad y la variación de la velocidad como variables independientes, incluso si la variación de la velocidad no tiene un papel causal en generación de choques. A primera vista, esto puede resultar desconcertante. ¿Cómo puede la tasa de mortalidad ser una función de la velocidad? varianza cuando todo el mundo viaja solo por la carretera? Para expli- carlo, suponga que la probabilidad de ser muertos en un choque aumenta con la cuarta potencia de la velocidad 1 . Por lo tanto, si a 60 mph la probabilidad de ser muerto en un choque es un número P, luego a 64 mph es P × (64/60) 4 = 1.29P, a 66 mph es 1.46P ya 70 mph es 1.85P. Considere el Estado X donde la mitad de los conductores van a 64 mph y la otra la mitad a 66 mph (la variación de velocidad es pequeña). El número de muertes en el Estado X será propor- cional a 1,29+1,46=2,73. Considere ahora el Estado Y donde la mitad de los conductores van a 60 mph y la otra mitad a 70 mph (la variación de velocidad es grande). Aquí el número de muertos es proporcional a 1+1,85=2,85. La velocidad promedio en los estados X e Y es la misma. La única diferencia entre los estados están en variación de velocidad; se ve que el estado con la varianza más grande tiene el número más grande de fatalidades Sin embargo, esta aparente dependencia de las muertes en la variación de la velocidad es solo un espejismo; eso se debe únicamente al hecho de que la posibilidad de morir en un choque es una función no lineal de la velocidad. El resultado es que una ecuación de regresión perfectamente correcta contendrá la velocidad media y la velocidad varianza como variables incluso si, en realidad, el número de muertes de- pende solo de la velocidad y tiene nada que ver con las diferencias en las velocidades individua- les. Así, incluso una regresión perfecta sin confusión que utiliza la velocidad media y la variación de la velocidad como variables conduciría a la incorrecta conclusión de que la variación de la velocidad es importante cuando no lo es. Todos los estudios que utilizan valores medios como variables son vulnerables a este problema. La conclusión general es que si en la población de que se extraen los datos, una covariable tiene una distribución con una media y una varianza, y si la función que vincula la covariable y la variable dependiente no es lineal, entonces la influencia de la La covariable no se puede representar correctamente usando en el modelo de regresión solo la media y la varianza de esta covariable. La búsqueda de Lave y sus comentaristas - su intento de separar el 1 Esto es, aproximadamente, lo que encuentra la investigación. 59 roles causales de la velocidad media y la variación de la velocidad- estaba condenada desde el principio. Una onza de lógica es mejor que una libra de regresiones. 4.2.4 La moraleja de la historia 'La velocidad no mata'.
  • 53.
    La sección 4.1giró en torno a la regulación de la seguridad del automóvil. Sin embargo, nuestro interés no era en el efecto de seguridad de dicha regulación, ni en la existencia o extensión de 'comportamiento compensatorio'. Nuestro interés estaba en la cuestión de si los modelos de re- gresión multivariable que utilizan datos agregados permitió a los investigadores llegar a conclu- siones de naturaleza causa-efecto. El histórico ida y vuelta de la investigación puesta en marcha por Peltzman solo proporcionó el escenario y el contexto. En la presente sección (4.2) la historia gira en torno a la cuestión política de si uno debe intentar reducir la velocidad o reducir la variabilidad de las velocidades. Una vez más, no estamos intere- sados en la veracidad de la afirmación causal de Lave de que sólo importa la variabilidad de la velocidad. Nuestro interés está en el método. (regresión multivariable) utilizada por diferentes investigadores que tenían como objetivo llegar a la causa-efecto conclusiones. La cuestión de la importancia relativa de la velocidad frente a la variación de la velocidad tiene una larga historia. Se ha debatido antes de 1985, cuando Lave presentó su artículo original y el debate continuó. después de 1989 cuando se publicaron los comentarios y la refutación. Las cinco publicaciones discutidas aquí, todos se basaron en datos transversales agregados y todos los autores utilizaron lineal multivariable regresión. Llegaron a diversas conclusiones. La crítica de Lave al método del comentarista es válido. Sin embargo, la misma crítica se aplica al propio trabajo de Lave y con igual fuerza. Además ahí está el resultado de Rodríguez. Dado que la probabilidad de morir en un choque depende de la velocidad en un manera altamente no lineal, uno no puede ni siquiera esperar obtener una especificación de modelo correcta cuando la media Se utilizan la velocidad y la varianza. Es decir, no se puede confiar en ninguno de los resultados y no se puede decir que ninguno permitir sacar conclusiones de causa y efecto. Como antes, desconcierta la facilidad con la que los investigadores atribuyen un significado de causa-efecto a sus resultados de regresión. También es desconcertante la tendencia a tener confianza en el propio resultado incluso si difiere de lo que otros han encontrado. Como se señaló anteriormente, sería un buen augurio para la causalidad si diferentes investigadores llegaron a conclusiones similares; por el contrario, una pretensión de haber establecido nunca se puede considerar la causalidad si los resultados de diferentes estudios están por todas partes. En el estudios recién revisados, los resultados están por todas partes. Y, sin embargo, las afirmaciones que son de naturaleza causal fueron realizados por cada uno de los autores. 60 4.3 Noland sobre la infraestructura y su efecto sobre las muertes. La cuestión de si la interpretación causal de los estudios transversales es prácticamente posible es de importancia central para aquellos que son responsables del diseño y la operación de ca- rreteras. La razón es que las oportunidades de hacer estudios observacionales de antes y des- pués sobre, digamos, la el efecto de seguridad de un cambio en la curvatura horizontal, la pen- diente del camino, el ancho del carril, la mediana de la pendiente, etc. son pocos e imperfectos. En contraste, dada la disponibilidad de bases de datos computarizadas, las oportunidades para abundan los estudios transversales observacionales de los mismos temas. Por eso mucho de lo que es que se creía que se sabía sobre el efecto de seguridad de muchas características viales importantes provino de estudios transversales observacionales. Sin embargo, si es cierto que tales estudios no conducen a una causa-efecto conclusiones, entonces gran parte de la tradición de seguridad vial existente debe ser cuestionada. De hecho, nuestro toda la indagación sobre causa y efecto en regresiones multivariables sobre datos transversales es motivado por esta
  • 54.
    misma preocupación: lapreocupación de quienes diseñan y operan carreteras sobre la cimientos de gran parte de su saber de seguridad. Quienes diseñan y operan carreteras pueden ver el episodio histórico sobre la seguridad efecto de la regulación del automóvil con una cierta cantidad de desapego; no incide directamente en lo que hacen. La historia de la controversia sobre si importa la velocidad o la variabilidad de la velocidad se acerca un poco más al hueso. Sin embargo, el mensaje de Lave todavía estaba a nivel de política: si uno tiene como objetivo reducir la velocidad o si uno tiene como objetivo reducir la variabilidad de la velocidad. el trabajo de noland (Noland 2003) y (2004) es de interés directo para los ingenieros que diseñan y operan carreteras; eso habla sobre el efecto que tienen varias 'mejoras viales' en la seguridad. Noland concluye que, en general, las mejoras de infraes- tructura no redujeron las muertes y lesiones 1 . Esto, si es cierto, va al corazón de lo que hacen los ingenieros. 4.3.1 El artículo de Noland sobre los 50 estados En su artículo de 2003, Noland usó datos de series de tiempo transversales para los 50 estados de EE. cada año entre 1984 y 1997. La variable dependiente fue la 'relacionada con el tráfico muertes' o 'lesiones relacionadas con el tráfico' en cada año y estado. Las variables independientes fueron de tres tipos: 1. Variables que describen la infraestructura estatal (kilómetros totales de carriles; número promedio de carriles interestatales, arteriales y colectores, caminos con carriles de 9, 10, 11 y 12 pies para colectores y para arteriales); 2. Variables demográficas y de tendencia (pobla- ción, porcentaje de población de 15 a 24 años y porcentaje de población mayor de 75 años, renta per cápita y año); 3. Otras variables (ley primaria y secundaria del cinturón de seguridad, con- sumo de alcohol per cápita, mortalidad infantil blanca, hospitales por milla cuadrada) El modelo era de la forma 2 : Número de muertes (o lesiones) por estado y año α X 1 X β 2 . 2 β 1 = ecuación 6 1 “Los resultados refutan contundentemente la hipótesis de que las mejoras de infraestructura han sido efectivas para reducir la muertos y heridos”. (Noland 2003, p. 599) 2 En el documento se indica una forma diferente. Sin embargo, basado en correspondencia pri- vada, ese formulario de arriba fue en realidad usó. Es la misma forma que la utilizada por Peltz- man y muchos otros. 61 Se requieren algunos comentarios explicativos sobre la ecuación del modelo. En este modelo forman el la influencia de la variable 'i' está representada por el multiplicador i β i X . Para mostrar lo que da forma a este relación implica, cómo los multiplicadores para "Lane Miles", "Porcentaje de población mayor de 75" y el “Ingreso Per Cápita” (Modelo 2A para fatalidades) dependen del valor de la variable que se muestra en la figura 12. Figura 12 La forma de X β . Si el ingreso per cápita se duplicara y todo lo demás permaneciera constante, se esperarían muertes aumentar por un factor de 1,94 (punto 1); si, al mismo tiempo, se aumentó el número de millas de carril en un 50% (punto 2), el número de muertes aumentaría en un factor de 1,94×1,15=2,23 etc.; cada multiplicador aplicado al producto de todos los demás multiplicadores. Noland informó sobre varios modelos que utilizan todos los mismos datos y forma funcional. Todos Sus modelos incluyen la infraestructura y las variables demográficas y todas están repre- sentadas en el Misma manera. La diferencia entre los modelos radica en cómo se lleva el cinturón de seguridad y se representan los avances de la medicina. Algunos modelos representan la in- fluencia de los cinturones de seguridad por la tipo de ley sobre cinturones de seguridad que prevalece en el estado (primario o secundario), mientras que otros lo representan por el variable 'porcentaje de uso del cinturón de seguridad'. Además, algunos modelos incluyen proxies para
  • 55.
    la influencia deavances médicos (mortalidad infantil blanca y hospitales por milla cuadrada) mientras que otros no. Una El modelo difiere de los otros cuatro en una suposición estadística (efectos fijos versus efectos aleatorios). 62 4.3.1.1 La Variable 'Lane Miles'. Los coeficientes de regresión de Noland para la variable 'Lane miles' en sus cinco modelos están en Tabla 9. Tabla 9. Estimaciones del coeficiente de regresión de Noland para la variable “Lane Miles” Tabla 2. (A y B) Efecto fijo Modelos con Asiento- Ley del cinturón, 1984(5) a datos de 1997 Tabla 2. (C&D) Efecto fijo Modelos con "Médico Avances" variables añadidas, 1984(5) a 1997 datos Tabla 3. Fijo Efecto con Asiento Tasa de uso de la correa (en lugar de Asiento Ley del cinturón), 1990 a datos de 1997 Tabla 3. Efecto fijo con uso del cinturón de seguridad Tasa (en lugar de Ley) y “Médico Anticipos” variables añadido, 1990 a 1997 datos Tabla 4. Aleatorio modelo de efecto con cinturón de seguridad Uso y "Médico Avances”, 1990 a datos de 1997 1 2 3 4 5 6 7 8 9 F 1 I 2 FIFIFIF 0.36 ±0,11 3 0.624 ±0,14 0.38 ±0,13 0.18 ±0,16 -0.29 ±0,23 0.89 ±0,27 -0.40 ±0,25 0.02 ±0,30 0.43 ±0,10 1 Muertes, 2 Lesiones, 3 Noland da el estadístico t para esta celda como 3.16. Eso se traduce en un error estándar del coeficiente de regresión= 0,36/3,16=±0,11. Al comentar sobre el efecto de la variable 'Lane Miles', Noland dice que 1 : (A) “Las expectativas iniciales eran que esta variable fuera significativa con signo negativo, lo que implica que las millas de carril adicionales reducen las muertes y lesiones. (B) “Si esta variable hubiera sido insignifi- cante, entonces esta sería una conclusión sólida en sí misma, ya que generalmente se supone que los carriles más nuevos, que están diseñados con los estándares de diseño de ingeniería más recientes, serán más seguro Un resultado que no mostrara un efecto significativo sería sor- prendente. (C) Si bien los resultados son menos convincentes basados en la serie de tiempo más corta de la tabla 3, estos resultados tienden a sugerir que las millas de carril adicionales en realidad aumentan las muertes y también tienen un pequeño efecto positivo 2 en lesiones.” (págs. 604-605) Esta cita requiere un comentario detallado y la segmenté en A, B y C para los propósitos de la exégesis a continuación. Comentario sobre (A): Esperar un coeficiente de regresión negativo significaría que uno cree que cuantas más millas de carril haya, menos muertes o lesiones habrá. ¿Por qué uno debería tener tal “expectativa inicial”? Tal vez Noland piensa que un estado con 'más carril-millas' tiene 'más carreteras de varios carriles' y que se espera que las carreteras de varios carriles sean más seguras. Esto sería lógico sonido si todos los estados tuvieran aproximadamente la misma can- tidad de millas de camino pero sus caminos diferirían en el número de carriles. Sin embargo, los estados difieren en tamaño, cantidad de tráfico, grado de urbanización, patrón del uso de la tierra y muchas otras circunstancias. En consecuencia, tienen diferentes longitudes en sus red de ca- rreteras. En 1998, Alabama tenía 195 mil millas de carril, Alaska 26 mil, Arizona tenía 116 mil etc. Estas diferencias tienen muy poco que ver con el número de carriles que tiene la vía. Dado que, con mucho, la mayor proporción de millas de carril en los EE. UU. está siempre en el stock de dos carriles carreteras 3 , la diferencia en la variable carril-millas que Noland ve en sus datos refleja principalmente 1 He analizado la declaración de Noland en las partes A, B y C para brindar claridad en la discusión posterior. 2 Noland significa coeficiente de regresión positivo. 3 Mohammedshah y Kohls (Mohamedshah y Kohls 1994) muestran 75% y 86% para los dos estados en los que reporte.
  • 56.
    63 diferencias enla longitud de la red vial rural de dos carriles. Por lo tanto, es difícil comprender qué la base de la "expectativa inicial" de Noland es. Si imaginas dos estados con la misma po- blación pero diferente en tamaño, y considere que el estado más grande tenderá a tener caminos más largos, hay poco razón para esperar que el estado más grande tendrá menos muertes que el más pequeño. Por lo tanto, la lo contrario de la regresión de expectativas inicial de Noland tiene más sentido. Comentario sobre (B): Noland da un salto lógico adicional y equipara 'más millas-carril' con 'ma- yor proporción de millas-carril mejoradas' 1 . Tal vez se podría dar este salto si el efecto de Las millas de carril se estimaron para cada estado por separado a partir de su propia serie temporal de observaciones. En ese caso, el aumento de millas de carril a lo largo del tiempo significaría de hecho una proporción creciente de caminos antiguos. Sin embargo, los datos de Noland son un panel de 14 años de datos para 50 estados. Por lo tanto, las diferencias en 'millas de carril' entre los 14 × 50 puntos de datos 2 utilizados en las regresiones expresan no principalmente cómo ha aumentado el kilometraje del carril en cada estado a lo largo del tiempo, pero principal- mente 3 cómo ha aumentado el kilometraje del carril difiere entre estados (por las muchas razo- nes mencionadas en el párrafo anterior). Eso muy bien puede ser que un estado en el este tenga más millas-carril que un estado de tamaño similar en el West, y, por razones históricas, las ca- rreteras en el estado del Este serán más antiguas; 'más millas de carril' no significa 'millas de carril más modernas'. El salto lógico es muy cuestionable. De ello se deduce que el coeficiente de regresión para 'carril-millas' refleja la influencia de todas las variables incluido en él pero no explicado explícitamente 4 – tamaño del estado, patrón de uso de la tierra, industrialización, historia de desarrollo, flujo de tráfico, etc.; interpretándolo como un proxy para 'infraestructura mejoras' o 'carreteras más modernas' no tiene sentido. Comentario sobre (C): Noland mira los resultados en la Tabla 9 y concluye que: “estos resultados tienden a sugieren que las millas de carril adicionales en realidad aumentan las muertes”. Dada su conclusión general (que las mejoras de infraestructura no reducen las muertes y lesiones) esto debe tomarse como un argumento en apoyo de su opinión de que añadir carriles a las carreteras no es una mejora de la seguridad. Que Es decir, Noland comenta sobre un vínculo entre una causa (añadir carriles) y un efecto (reducción de fatalidades). La Tabla 9 contiene tres estimaciones que son positivas (0.36, 0.38 y 0.43) y dos estimaciones que son negativos (-0.29 y -0.40). Señalé en la sección 4.1.4 que si diferentes estudios encuen- tran que el coeficientes de regresión de la misma variable están por todo el mapa, debemos concluir que no 1 “Por lo tanto, la variable de la milla del carril sirve como proxy para representar estas 'mejoras' en el diseño de carreteras”. pags. 599 2 Debido a algunos datos faltantes, no había 14 × 50 = 700 sino solo 657 puntos de datos. 3 En la fecha de Noland, el total de millas de carril cambió de 1985 a 1997 en la cantidad casi imperceptible de 0.2%/año. Naturalmente, por lo tanto, los coeficientes de regresión reflejan las diferencias de estado a es- tado en lugar del crecimiento en el estado en el carril. millas 4 Hasta ahora me he abstenido de discutir detalles estadísticos. Sin embargo, llegados a este punto, cabe un comentario de carácter técnico. en orden. Siguiendo el desarrollo de Hausman et al. (Hausman, Hall y Griliches 1984), Noland utiliza un procedimiento estadístico que, dice, “tiene el beneficio adicional de dar cuenta de la heterogeneidad en los datos” y “.permite al analista dar cuenta de la heterogeneidad entre gru- pos”. La frase 'considerando la heterogeneidad' significa (en el presente contexto) que el modelo
  • 57.
    representa adecuadamente elhecho de que dos estados, incluso si tuvieran el mismo los valores de todas las variables incluidas en el modelo normalmente tendrían diferentes medias para la variable dependiente (fallecidos o heridos). Lo que no significa tener en cuenta la heterogeneidad es que, habiendo utilizado el modelo de Hausman, uno puede olvidarse de las variables que faltan. Si se incluyeran en el modelo (considerar) algunas variables que son actualmente no re- presentado en él (tamaño del estado, patrón de uso de la tierra, etc.), el coeficiente de regresión de 'millas de carril' sería casi seguro que cambia. Como mostraré más adelante, ha cambiado incluso cuando variables ostensiblemente irrelevantes como la la mortalidad se añadió al modelo. 64 se les puede atribuir un significado de causa-efecto. La circunstancia aquí es diferente en que no tratar varios estudios realizados por diferentes investigadores que utilizaron datos diferentes; tenemos un estudio en que se usó la misma base de datos y las estimaciones en la Tabla 9 difieren porque el cinturón de seguridad variable fue representada de forma variable, porque las variables que representan los avances en la medicina fueron incluía algunos modelos pero no en otros, y porque a veces se usaban catorce años de datos ya veces siete. Si el valor de un coeficiente de regresión cambia sustancialmente como nuevo se agregan variables al modelo (o se representan de manera diferente, o se establece una suposición alternativa) hechos sobre efectos aleatorios o fijos), esto es una señal de que el modelo no contenía todos los elementos importantes factores que afectan el fenómeno en cuestión o es sensible a las suposiciones. Uno no puede tener confianza en el valor numérico de dicho coeficiente de regresión y no se le puede atribuir ningún significado a eso 1 . Si un coeficiente de regresión no alcanza lo que puede lla- marse 'estabilidad bajo condiciones variables Además, toda consideración de causalidad es pre- matura. Coeficientes de regresión de Noland para lanemiles en el modelo de accidentes fatales claramente no alcanzó tal estabilidad. Por lo tanto la declaración ese es el tema del 'comentario sobre (C)', en mi opinión, no está justificado sobre la base de los resultados dado 2 . Esto me permite enunciar otra precondición para la causalidad, para preceder a la condición mencionado anteriormente en la sección 4.1.4. • Si se va a considerar un coeficiente de regresión para la interpretación causal, debe exhibir el Propiedad de 'estabilidad bajo suma de variables'. La consecuencia práctica de esta condición previa es que el investigador debe comprobar hasta qué medida en que la introducción de nuevas variables afecta los coeficientes de regresión esti- mados anteriormente. Solamente cuando un coeficiente de regresión alcanza la estabilidad se puede decir que, dados los datos disponibles, el forma del modelo asumida y los supuestos es- tadísticos realizados, es el coeficiente de regresión utilizable. Esto todavía no justifica que se hagan juicios causales (ya que el coeficiente de regresión podría cambiar si se disponía de datos sobre variables adicionales o si se utilizaba un formulario modelo diferente). Sin embargo, la 'estabilidad bajo la suma de variables' es una precondición para que un juicio causal sea entretenido Nuestra preocupación es con la legitimidad de las interpretaciones de causa-efecto de la regresión. coeficientes Porque la cantidad de 'millas de carril' difiere de un estado a otro por una variedad de razones (tamaño, uso del suelo, geografía, etc.) y porque los cambios en las millas de carril a lo largo del tiempo son muy pequeños, los coeficientes de regresión de Noland para la variable carril-millas reflejan principalmente la relación de estado a estado. diferencias Por lo tanto, no importa cuál sea el valor del coeficiente de regresión de Noland, es 1 Así, por ejemplo, cuando se tuvo en cuenta la influencia de los cinturones de seguridad mediante
  • 58.
    la 'ley delcinturón de seguridad' y se utilizaron datos de 1984-1997, el coeficiente de regresión fue de +0,36±0,11; cuando estaba representado por el 'porcentaje de uso del cinturón de segu- ridad' y los datos de 1990-1997 eran utilizó el coeficiente de regresión cambiado a -0,29±0,23. 2 Un examen de los coeficientes de regresión de Noland para lesiones (sobre los cuales dice que hay un "pequeño efecto” ) no aumenta la perspicacia o la confianza de uno. En algunos casos el coeficiente de regresión para lesiones es mayor que para las víctimas mortales, en otros es menor y no se pueden excusar las diferencias únicamente por la precisión estadística. Consi- derar por ejemplo, la diferencia entre 0,62±0,14 en la columna 2 de la Tabla 9 y 0,18±0,16 en la columna 4. Si bien es posible que diferencia se debe a una precisión de estimación limitada, es más probable que la diferencia se deba a la adición de la variable 'avances médicos' a la regre- sión. De manera similar, ¿qué se puede hacer con el hecho de que en la columna 5 el coeficiente es -0,29±0,23 para muertes mientras que es 0,89±0,27 para heridos? sesenta y cinco No puedo decir mucho acerca de la acción de reemplazar caminos estándar más bajos con caminos están- dar más altos o sobre el efecto de las “mejoras de infraestructura”. Sin embargo, incluso si la variable pudiera ser de alguna manera vinculado a las mejoras de infraestructura, los coeficientes de regresión de Noland no pasan reunión; claramente no cumplen con el criterio de 'estabilidad bajo adición de variables'. Por lo tanto, La afirmación de Noland de que la variable de milla de carril es de alguna manera un indicador de mejoras en la carretera diseño y que, en este sentido, se puede hacer la afirmación causal de que “ millas de carril adicionales en realidad aumentar las muertes” no es, en mi opinión, compatible. Noland podría haber argumentado que al construir más caminos, al hacer que viajar sea más rápido y al Al hacer las carreteras más acogedoras, se están promoviendo patrones de uso del suelo que, a la larga, conducen a más viajes y que más viajes conducen a más muertes y lesio- nes. En este sentido es ciertamente cierto (pero no inesperado) que, a la larga, la construcción de más y mejores carreteras aumenta el número de automóviles y muertes relacionadas con camiones. Si Noland hubiera discutido sobre el vínculo entre las carreteras y los viajes en auto- móvil y entre viajes en automóvil y accidentes, un coeficiente de regresión positivo para la varia- ble carril-millas habría sido un resultado natural y esperado. Sin embargo, eso no es sobre lo que escribe Noland; habla sobre las diferencias entre la infraestructura más antigua y la más nueva en características como “la curvatura horizontal, la anchura de los arcenes, la separación de carriles con medianas y la presencia de peligros en la carretera” (p. 599). Los estándares moder- nos en estas características son lo que Noland tiene en mente cuando hablando de "mejoras en el diseño de carreteras" (para las cuales las millas de carril de carretera son supuestamente un apoderado). Después de discutir el efecto de seguridad de las 'millas de carril', Noland presenta argumentos similares sobre las otras variables de infraestructura (el 'número promedio de carriles' para inter- estatales, arteriales y colectores, el 'porcentaje de millas de carril por clase funcional', y 'el ancho promedio de carril por clase funcional'). Así, por ejemplo, sobre el promedio de carriles dice que “los estados con más los carriles (en promedio) interestatales y arteriales tendrán más lesiones”. (p.605) y que “un aumento en el número de carriles en las vías colectoras conduce a más muertes y posiblemente a una pequeña reducción (insignificante) de lesiones.” De aquí extrapola diciendo que “Normalmente es supone que el aumento de la capacidad de la carretera (agregando carri- les) aliviará la congestión y reducirá accidentes Esto implicaría que esperamos coeficientes ne- gativos en todas estas variables. Estas los resultados sugieren que este no es el caso y que los carriles agregados (en promedio) son (sic) probablemente perjudicial para la seguridad general”.
  • 59.
    Una exégesis deestas y otras afirmaciones similares seguiría el terreno ya cubierto; repetiría los mismos recelos y no conduciría a nuevos conocimientos. Se ha dedicado mucho espacio a la discusión detallada de si uno puede entretener a un inter- pretación causa-efecto de los resultados de la regresión de Noland. Argumenté que sus coefi- cientes de regresión son inestables y, por lo tanto, es posible que ni siquiera comiencen a plan- tearse cuestiones sobre causa-efecto. yo también argumentó que las variables que utilizó Noland no reflejan principalmente mejoras en las carreteras, adiciones, etc. y, por lo tanto, no se pueden utilizar para responder a la pregunta. Es hora de seguir adelante y discutir una faceta importante de la tesis de Noland, a saber, que el efecto de la infraestructura las mejoras en la seguridad deben buscarse a nivel agregado de todo el sistema; que conclusiones obtenidos de evaluacio- nes de seguridad proyecto por proyecto o sitio por sitio pueden (y lo hacen) inducir a error. El principal argumento de Noland a favor del uso de datos agregados a nivel estatal es “que puede capturar efectos tales como la migración de puntos negros que podrían perderse poten- cialmente usando la desagregación datos." (Noland 2003), (pág. 602). Este es un argumento de peso que merece un examen detallado. Para claridad, se discuten los problemas de impacto en todo el sistema y los problemas de agregación por separado a continuación. 66 4.3.1.2 Impactos en todo el sistema. La opinión de Noland es que los enfoques de ingeniería convencionales tienden a ". ignorar el comportamiento reacciones a las mejoras de seguridad que pueden contrarrestar los objetivos de reducción de fatalidades”. (pág. 599) . 1 el ejemplo que da es que “si una carretera de dos carriles se amplía a cuatro carriles, lo que podría reducir el riesgo de colisiones frontales, pero también puede dar lugar a que muchos conductores viajen a mayor velocidades, lo que poten- cialmente no conduce a ganancias en seguridad”. (pág. 599). 2 Ciertamente es cierto que los proyectos de mejora de carreteras pueden causar cambios en la velocidad elección, en la vigi- lancia y la activación, en el flujo de tráfico, etc. Se sabe que estos cambios afectan la seguridad y la no siempre se limitan al sitio del proyecto o sus inmediaciones. También es cierto que, a lo largo y en su conjunto, las mejoras viales afectarán los patrones de actividad y uso de la tierra, y por lo tanto, afectan la exposición (millas de viaje y toneladas de carga), la elección del modo, la propiedad del automóvil, etc. Estas también podrían llamarse 'adaptaciones conductuales'. Sin embargo, este término es qui- zás demasiado confinamiento cuando uno pretende describir los cambios en los patrones de producción, consumo, vivienda y estilo de vida que provienen de la inversión en transporte. Sin embargo, es evidente que un efecto de seguridad a largo plazo y en todo el sistema de las me- joras viales no será el mismo que el efecto de seguridad específico del sitio. 3 Una ilustración clásica de la posible diferencia entre la seguridad local y la de todo el sistema. efectos está en el trabajo de Lave y Elias (Lave y Elias 2002). En 1987 muchos estados aumen- taron la velocidad límite en porciones del sistema interestatal de 55 mph a 65 mph. La mayoría de las muchas evaluaciones concluyó que donde se aumentó el límite de velocidad, aumentaron las muertes. Lave y Elias discutieron que: “Estas evaluaciones comparten un problema común: solo miden los efectos locales de la cambio. Pero el cambio debe ser juzgado por sus efectos en todo el sistema. En particular, el nuevo 65 mph límite permitió a las patrullas de carreteras del estado cambiar sus recursos de la aplicación de la velocidad en el interestatales a otras activi- dades de seguridad y otras carreteras, un cambio que muchos jefes de patrulla de carreteras habían abogó por Si los jefes estaban en lo correcto, la nueva asignación de recursos de patrulla debería conducir a una reducción de las tasas de mortalidad en todo el estado. Del mismo modo, la oportunidad de conducir más rápido en las carreteras interestatales debería alejar a los
  • 60.
    conductores de otrascarreteras más peligrosas, nuevamente, generando 4 problemas en todo el sistema consecuencias." (Pi). Además del descuido de las adaptaciones conductuales, Noland señala otro común deficiencia de estudios de efecto local. “Otros factores, principalmente cambios en la combinación de edades demográficas de la población, aumento del uso del cinturón de seguridad, reducción del consumo de alcohol per cápita y las mejoras en la tecnología médica son responsables de la tendencia a la baja en el total de muertes accidentes. al analizar el efecto de seguridad del cambio de infra- estructura es necesario controlar para el cambio en (tales) factores exógenos.” (p. 610). Noland incorporó todos estos factores en su modelo de regresión. 1 Volvemos al comportamiento de compensación de Peltzman, ahora en el contexto de las me- joras viales. 2 Este ejemplo no está bien elegido, porque la adaptación de la velocidad se reflejaría en los resultados de un sitio específico. estudio antes-después. Para ser un ejemplo de ignorar las "reacciones conductuales", uno ten- dría que argumentar que cuanto mayor sea la la velocidad en la carretera mejorada se extendió a las carreteras vecinas. 3 También es claro que en el contexto de cambios en los patrones de producción, consumo, habitación y estilo de vida que provienen de la inversión en transporte, las repercusiones en la seguridad son solo una de las consecuencias a considerar, y no una de las principales. uno en eso. 4 Si bien es probable que aumentar el límite de velocidad en una autopista atraiga algunos viajes desde las carreteras superficiales cercanas, no es probable que tenga un efecto en todo el es- tado. El concepto de efecto 'en todo el sistema' debe definirse con cuidado. 67 No hay duda de que los efectos locales generalmente diferirán de los efectos de todo el sis- tema. Tampoco se puede dudar de la importancia de determinar el efecto de las intervenciones en todo el sistema. los La pregunta general es ¿por qué medios se pueden investigar los efectos causales a largo plazo y en todo el sistema? de intervenciones. La pregunta específica de interés en este documento es si se puede hacer usando datos agregados de sección transversal (junto con se- ries de tiempo) 1 para estimar los coeficientes de regresión de un 'cuasi de forma reducida 2 '. Respondí la pregunta específica del artículo de Noland de 2003 en la sección 4.3.1.1. Noland apuntó para determinar el impacto de las mejoras viales (como la adición de carriles, la amplia- ción de carriles y mejores estándares de diseño) en muertes o lesiones en todo el estado. porque sus variables independientes (por ejemplo, número de millas-carril) reflejan principalmente las diferencias de estado a estado (en tamaño, tráfico, etc.) que son no representada en el modelo, uno no puede pensar en estas variables independientes como un proxy para 'mejoras'. Además, los coeficientes de regresión de Noland son inestables y por lo tanto no pueden ser un punto de partida para la interpretación causa-efecto. No es el objetivo de este artículo discutir la cuestión general de “¿por qué medios se puede investigar los efectos a largo plazo y en todo el sistema de las intervenciones? Sin embargo, algunos comentarios están en orden. Las mejoras viales provocarán cambios en la distancia que recorren las personas, la frecuencia lo hacen, por qué modo o rutas, etc. Los planificadores de transporte tienen un elaborado arsenal de herramientas para predecir tales cambios en todo el sistema en los viajes. Los analistas de seguridad saben cómo la seguridad de un camino o la
  • 61.
    intersección cambia amedida que cambia el tráfico. Así, la caja de herramientas del planificador y de la seguridad analista, cuando se usa en tándem, tal vez pueda producir estimaciones de cambios en todo el sistema que reflejen los cambios en la población, el uso del suelo, la realiza- ción de viajes y la red de transporte y su desempeño. En términos más generales, para investigar los efectos de las intervenciones en todo el sistema se requiere una comprensión y representación de qué causa el cambio en qué. Para ilustrar, suponga que uno desea rastrear el efecto de seguridad en todo el sistema de convertir un deter- minado tramo de carretera de dos a cuatro carriles. Ciertamente es posible utilizar el conoci- miento y los modelos de planificación del transporte para estimar el impacto de tal cambio en varios otros enlaces de la red. Estos son los tipos de relaciones estructurales que necesitan ser representadas en un modelo si ha de haber una esperanza de vincular causa y efecto a nivel de todo el sistema 1 . Es difícil entender por qué uno puede esperar capturar estas complejidades causales por una sola ecuación, una ecuación cuya forma matemática es postulado sin justifica- ción, y en el que sólo se representan las variables fácilmente disponibles; por qué uno puede creer tan fácilmente en el significado de causa-efecto de la regresión resultante coeficientes 4.3.1.3 Problemas de agregación Al intentar detectar los efectos de las mejoras viales en todo el sistema, Noland utiliza el totales y promedios. Por lo tanto, por ejemplo, las muertes o las millas de carril son totales para todo el estado; variables como el ingreso per cápita o la mortalidad infantil blanca son promedios estatales. Peltzman, Lave 1 Es decir, datos agregados a grupos como estados o condados en lugar de unidades naturales como intersecciones o tramos de ca- rretera homogéneos. 2 Un modelo de forma reducida se deriva por manipulación algebraica de un conjunto de ecua- ciones y desigualdades que intentan capturar un fenómeno tal que las variables en el lado iz- quierdo de estas expresiones no aparecen en su lado derecho lado. Un modelo de forma redu- cida aún representa el fenómeno (o teoría) que representan las relaciones originales. Ecuaciones de modelo como las utilizadas por Peltzman, Lave y Noland, incluso si se les llama de forma reducida, en realidad no representan un conjunto subyacente de ecuaciones y desigual- dades. Son meras aproximaciones de primer orden (mediante un Taylor serie) de una función multivariable general. 68 y sus comentaristas también utilizaron datos agregados para el modelado. Cuando se utilizan datos agregados la unidad de observación (un estado, un condado) es grande 2 . En epidemio- logía, el término utilizado es "nivel de población". o estudios 'ecológicos'. En contraste con el nivel de población, se encuentra el enfoque de regre- sión. que utiliza datos desagregados 3 . En el modelado desagregado la unidad es atómica, natural y pequeña. En epidemiología la unidad de observación es un individuo y el término utilizado es 'nivel individual' estudiar. En seguridad vial, la unidad de observación puede ser un segmento de carretera específico (intersección o enfoque de intersección) que es homogéneo en el tráfico y otras características. Incluso a nivel desagregado, no se puede evitar por completo el uso de promedios. Así, por ejemplo, a Para representar el flujo de tráfico se utiliza comúnmente la AADT (Annual Average Daily Traffic) que, por definición, es un promedio 4 . De manera similar, en las curvas verticales el valor de la variable pendiente cambia continuamente y un segmento de carretera tendría que ser muy corto para que un solo valor de calificación lo describa eso. Si se selecciona una unidad de tiempo (por ejemplo, un año), las variables como la precipitación son promedios.
  • 62.
    En el contextode la seguridad vial, y quizás en general, se piensa en las causas como eventos específicos o acciones. Por esta razón, si uno puede hablar significativamente sobre el efecto causal de un promedio, es es sólo como un compuesto de los efectos causales sobre las unida- des del conjunto cuyo promedio es arreglado. Así, por ejemplo, puede haber un efecto causal de ampliar un carril de un segmento de carretera de 10 a 11 pies o de 11 a 12 pies 5 . Si un estado tuviera 10,000 millas-carril de caminos de 10', 20,000 de caminos de 11' y 70,000 millas-carril de caminos de 12' (el ancho de carril promedio es de 11.6') y si 5000 millas-carril de los caminos de 10' se ampliaron a 11' (de modo que ahora el promedio estatal era 11.65'), el efecto causal de este cambio en el ancho de carril promedio para todo el estado proviene de la ampliación espe- cífica de la 5000 millas específicas de camino de 10' a 11'. Hay dos problemas con los intentos de usar una respuesta promedio como indicación de la causa. El primero es el de diluir y debilitar el nexo causal. Para ilustrar, ampliar 5000 millas de carril de 10' a 11' y la ampliación de 2500 millas-carril de 10' a 12' equivale al mismo cambio en ancho de carril promedio pero un efecto de seguridad muy diferente 6 . Esto debilita la fuerza de la asocia- ción entre causa y efecto, hace que sea más difícil de detectar y estimar, y hace que es menos útil para la aplicación práctica. El segundo problema es puramente práctico. Para usar el anterior ejemplo, la ampliación de 5000 millas de carretera es un gran proyecto y sería relativamente tarea sencilla diseñar un estudio de antes y después para estimar el efecto de este cambio. En Por el contrario, sería casi imposible detectar estadísticamente un cambio de 0.05 'en el carril promedio ancho cuando la variable de respuesta es el total de accidentes en todo el estado. Sin embargo, los problemas debidos al uso de datos agregados en estudios ecológicos (a nivel de población) correr mucho más profundo. Peltzman, Lave y Noland utilizaron un estado como unidad de análisis, por lo tanto lo suyo son los estudios ecológicos. Los sesgos potenciales en los estudios ecológicos son bien conocidos y ampliamente 1 Para ejemplos de modelos de se- guridad vial estructural ver, por ejemplo, (Gaudry y Lasarre 2000). Para un contexto de causali- dad ver (Perla 2000). 2 En epidemiología, el término estudio de 'nivel de población' es común. 3 En epidemiología, el término estudio de 'nivel individual' es común. 4 Hay intentos de acortar el período de promediación y utilizar, por ejemplo, caudales horarios. Sin embargo, incluso esto es un promedio. Dado que el flujo se define como un promedio, el promedio es inevitable. 5 O tal vez de 10 a 12 pies si no es lo mismo que la suma del cambio de 10' a 11' y 11' a 12'. 6 Parece que si bien la ampliación de 10 a 11 pies reduce sustancialmente los accidentes, hay un mínimo en alguna parte cerca de 11.5 'y una mayor ampliación puede ir en detrimento de la seguridad (en caminos rurales de dos carriles). 69 discutido en la literatura 1 . Debido al gran potencial de sesgo y error en tales estudios, la Se ha acuñado la frase falacia ecológica y se utiliza en los libros de texto 2 . Un ejemplo frecuente- mente citado de la falacia ecológica está en la obra clásica del eminente sociólogo del siglo XIX E. Durkheim (1897), quien recopiló datos sobre la frecuencia de los suicidios y la composición religiosa de los europeos. provincias Descubrió que las provincias con mayor proporción de protestantes que de católicos tenían índices generales de suicidio más altos y llegó a la conclusión de que los protestantes tienen más probabilidades de cometer suicidio que católicos. Sólo tenía estadísticas agregadas
  • 63.
    sobre suicidios yno sabía si los que tomaban sus vidas eran protestantes o católicas. Es muy posible que los católicos que viven en un provincia predominantemente protestante encontraron la vida difícil y estaban más inclinados a tomar sus propias vida. Esto habría revertido el hallazgo de Durkheim. También es posible que las provincias con una mayoría protestante eran más po- bres por una variedad de razones históricas y esto, en lugar de la denominación religiosa condujo a más suicidios. Tales circunstancias también habrían cambiado El hallazgo de Durkheim 3 . La preocupación clave de los comentaristas de los estudios ecológicos es que lo que parece cierto para el grupo (el agregado) puede no ser cierto para las unidades individuales de las cuales el se forma el grupo. Ya hemos encontrado una manifestación del problema de agregación en la sección 4.2.3, cuando Lave pensó que sus críticos estaban obteniendo estimaciones sesgadas porque agregaron los datos sobre todas las clases de carretera en lugar de examinar la relación velocidad-accidente por separado para cada clase de carretera funcional (como lo hizo Lave). Lave mostró cómo esta agregación sobre todas las clases de carreteras podría conducir a un resultado que es lo contra- rio de lo que pensaba que era la verdad. También comenté cómo la propia agregación de Lave sobre tramos de carretera que difieren, por ejemplo, en el porcentaje de tráfico de camiones, podría conducir a un sesgo similar. En este sentido, los sesgos de agregación, confusión y omi- sión las variables están relacionadas. En su estudio ecológico seminal en el que la unidad de observación era un condado, Fridstrøm e Ingebrigtsen (Fridstrøm e Ingebrigtsen 1991) describen así el peligro de la agregación: “ Entre las objeciones más obvias al enfoque adoptado en este artículo está el problema de error de agregación, o la falacia "ecológica" en palabras de Robinson (1950). Cuando la causa la conexión es entre unidades a nivel micro (digamos, individuos, hogares, empresas o vehículos), sacar conclusiones de correlaciones parciales en datos agregados es inapropiado. Esta objeción se aplica a varias de las relaciones estimadas en nuestro modelo, más crucialmente, quizás, a la efectos del alcohol Como no sabemos la proporción de accidentes en los que el alcohol puede haber desempeñó un papel, ni la proporción de millas de vehículos recorridas por conductores ebrios, cualquier inferencia hecha acerca de tal conexión es en gran medida sin fundamento. No se puede confiar en él hasta que sea confirmado por datos desglosados relevantes”. (pág. 374) Una ilustración dramática del sesgo de agregación es la llamada paradoja de Simpson. un ver- dadero El ejemplo en el contexto de la seguridad vial se toma de los datos de Persaud 1 , Retting y Lyon (2003). los dos columnas más a la derecha de la Tabla 10 muestran que, después de la instalación de bandas sonoras en la línea central, los accidentes con heridos por milla-año dis- minuyeron en cada uno de los seis estados que se muestran. Y sin embargo, cuando los datos fueron 1 La colección de artículos de Greenland y otros que escriben en el American Journal of Epidemiology es una buena punto de partida para la lectura (Greenland y Robins 1994b), (Pian- tadosi 1994), (Cohen 1994), (Greenland y Robins 1994a). En su revisión del sesgo ecológico, Greenland y Robins (Greenland y Robins 1994b) escribieron una sección sobre “Conceptos erró- neos en la regresión ecológica”. 2 Así, por ejemplo, Kelsey et al. (1986) dicen que las “Conclusiones inapropiadas respecto a las relaciones a nivel individual nivel basado en datos ecológicos son frecuentemente referidos como la falacia ecológica.” (pág. 207) 3 Como lo discute Selvin (1958). 70 agregado sobre todos los estados (última fila en la Tabla 10) se indica lo contrario. Este sor- prendente pero El resultado completamente correcto no tiene nada que ver con la confusión, las variables que faltan, la elección inadecuada de forma funcional y otras fuentes comunes de sesgo. Es sólo el resultado (y por lo tanto uno de los peligros) de agregación 2 .
  • 64.
    Tabla 10. Datosde antes y después sobre la reducción de choques luego de la instalación de franjas sonoras en la línea central (basado en en la Tabla 1 en Persaud et al, 2003) Milla- años Lesión Estado Choques Choques/milla-año Antes Después Antes Después Antes Después colorado 118,37 84,55 262 183 2,21 2,16 Delaware 8,37 21,29 16 38 1,91 1,78 Maryland 91,44 32,56 55 12 0,60 0,37 Minnesota 518,44 96,90 156 24 0,30 0,25 Oregón 22,84 4,62 20 3 0,88 0,65 Washington 166,49 173,27 116 109 0,70 0,63 Totales 925,95 413,19 625 369 0,67 0,89 Noland menciona la crítica de Lave al uso de datos agregados 3 en el análisis de accidentes. Sin embargo, el cree (creo que equivocadamente) que la técnica de regresión estadística que utilizó puede obviar la problemas inherentes al uso de datos agregados para la caracterización de causa y efecto. Los comentarios anteriores no deben interpretarse en el sentido de que los estudios que utilizan datos agregados son inútil. Estudios de seguridad vial en los que la respuesta y las variables independientes son totales o promedios sobre un conjunto grande y no homogéneo de unidades puede servir útilmente para estimular investigar conjeturas no examinadas hasta ahora o generar hipótesis sobre posibles efectos imprevistos. Sin embargo, debido a las muchas formas posibles en que ciertos efectos pueden obtener en tales estudios, sus hallazgos por sí solos no son base suficiente para los juicios de causa y efecto. Además, los comentarios anteriores no deben interpretarse en el sentido de que las variables que reflejan los promedios de conjunto no son útiles en el modelado multivariante cuando los datos sobre carreteras específicas Se utilizan segmentos o intersecciones. El opuesto es verdad. Cuando se utiliza una serie temporal de datos para cada unidad, variables como el uso del cin- turón de seguridad o el consumo de alcohol que cambian con el tiempo deben ser representado. De manera similar, cuando las unidades difieren en variables espaciales como la densidad hos- pitalaria promedio o intensidad de la aplicación, estos también deben tenerse en cuenta. 4.3.2 El artículo de Noland sobre 102 condados de Illinois. En su artículo de 2004, Noland y Oh usan datos de carreteras y accidentes para carreteras man- tenidas por el estado. y datos sociodemográficos para cada uno de los 102 condados de Illinois en los cuatro años 1987-1990. los El examen de este artículo me permitirá hacer algunos puntos generales que no se han planteado antes. los 1 Persaud llamó mi atención sobre este ejemplo. 2 Para algunos números podemos tener a/b<A/B yc/d<C/D y sin embargo (a+c)/(b+d)>(A+C)/(B+D). Por ejemplo, 1/5<2/8 y 6/8<4/5 y todavía 7/13>6/13. Este ejemplo está tomado de (Malinas y Bigelow 2004) quienes brindan una discusión de la paradoja de Simpson. 3 Se refiere a la crítica de Lave donde mostró que agrupar todas las clases de carreteras funcio- nales juntas (como Noland ha hecho) puede llevar a conclusiones incorrectas “sobre variables clave de política” (p. 602). 71 La ecuación del modelo aquí es la misma que en el artículo de Noland de 2003 (ver Eqn. 6). Muertes y Total Los accidentes son las variables dependientes. Las variables independientes relacionadas con la infraestructura son: 1. Total millas de carril, número medio de carriles, 2. Ancho medio de carril, 3. Ancho medio de banquina exterior, 4, Curvas horizontales por milla, 5. Ángulo medio de deflexión de la curva horizontal 1 y 6. Curvas verticales por milla. Las variables socioeconómicas son: 1. Población, 2. Renta per cápita y 3. Porcentaje población en los tramos de edad de 15-24, 25-34 y 65+. Este estudio difiere del anterior en que: 1. la unidad de agregación es más pequeña (condado en lugar de estado); 2. Hay más detalles disponibles sobre variables de infraestructura; 3. Datos sobre consumo de alcohol, mortalidad infantil y hospitales por milla
  • 65.
    cuadrada que estabandisponibles a nivel estatal no se usaron en este documento; 4. El tiempo la serie es mucho más corta (cuatro en lugar de catorce años); 5. En lugar de una única variable de tendencia temporal utilizados en el estudio de 2003, aquí se utilizaron tres coeficientes anua- les. Algunas de sus regresiones los coeficientes para los seis modelos estimados se encuentran en la Tabla 11. Tabla 11. Coeficientes de regresión seleccionados de las Tablas 1 y 2. sin anual coeficientes, población, cohorte de ingresos y edad Con coeficientes anuales pero sin población, ingresos y cohortes de edad Con coeficientes anuales, población, ingresos y Cohorte de edad variable A 1 F 2 AFAF 1 Total de millas de carril 0,22±0,14 3 -0,13±0,51 -0,02±7,4 - 0,85±0,57 0,03±0,13 -0,82±0,58 2 Número medio de carriles 0,03±0,41 1,21±1,73 1,21±0,44 3,33±1,90 1,25±0,44 2,95±1,93 3 carril medio ancho 0,07±0,32 2,56±1,34 0,22±0,31 2,85±1,36 0,18±0,31 2,94±1,39 4 Media horizontal ángulo de desviación -0,17±0,30 -0,30±1,25 -0,14±0,29 0,25±1,24 -0,18±0,29 -0,08±1,37 5 Ingresos por cápita -0,33±0,27 0,27±0,16 1 Número de acci- dentes; 2 número de muertes; ±1 error estándar Se discutieron los coeficientes de regresión para la variable 'Total de millas de carril' (fila 1) exhaustivamente sobre la base del documento de 2003 anterior. Dado que varían mucho y son imprecisos, aquí como allá, poco debe decirse sobre su base. Lo mismo ocurre con los coeficientes de regresión para el ángulo de desviación hori- zontal en la fila 4. Por el contrario, los coeficientes de regresión para el 'Número medio de carriles' (fila 2) parecen transmitir un mensaje coherente. El mensaje es que los condados con más caminos de varios carriles tienden a tener más accidentes. ¿Qué significa eso? Hay una buena razón por la cual un condado tiene más carreteras de varios carriles que otra. La razón es que sus caminos necesitan transportar más tráfico. Naturalmente, con más tráfico vienen más accidentes. Dado que la can- tidad de tráfico en un condado no es entre las variables usadas en la regresión, no hay manera de decir cuánto de la asociación entre los accidentes en un condado y el número promedio de carriles en el condado se debe al tráfico y cuánto debido a otras variables (como el número de carriles). Este es un ejemplo clásico de un 1 Noland y Oh usan el ángulo de deflexión en lugar del radio de curvatura afirmando que cuanto mayor sea el primero, menor será el último. Esto no es estrictamente cierto. Cualquier radio de curvatura se puede ajustar a un ángulo de desviación dado. Sin embargo, es cierto que, como cuestión de asociación estadística, cuanto mayor es el ángulo de deflexión, más corto tiende a ser el radio. 72 variable oculta 1 . En el lenguaje intuitivo de las relaciones causales en el que una flecha indica el dirección de causalidad, la realidad es más probable que en la Figura 13. Hay un vínculo causal claro de 'cantidad de tráfico' a 'número de carriles' y otro vínculo causal de 'cantidad de tráfico' a 'número de accidentes'. También podría haber un vínculo causal entre el 'número de carriles' y el 'número de accidentes'. La regresión solo observa las relaciones dentro de la elipse. Ya que la 'cantidad de tráfico' variable no está en los datos, la regresión no puede representar su influencia en el número de accidentes directamente. Lo hace de forma indirecta, a través de la variable 'número de carriles'. Por lo tanto, los El coeficiente de regresión de 'número de carriles' refleja en parte (principalmente) la influencia de la 'cantidad de tráfico'. Pensar que este coefi- ciente de regresión refleja la influencia causal del 'número de La variable de carriles es un error. Figura 13. Dirección de causalidad La siguiente fila en la Tabla 11 es sobre el ancho medio del carril. La indicación es que un aumento del 1% en ancho de carril promedio se asocia con un aumento de alrededor del 0,2% en el total de accidentes y tal vez 2.5%-3% de aumento en muer- tes. ¿Cómo podría surgir tal asociación? Noland da un explicación causal plausible: cuanto más
  • 66.
    ancho es elcarril, más rápido uno puede estar inclinado a conducir y acelerar se sabe que au- menta la gravedad de los choques. Una explicación alternativa es la siguiente. Los estándares de diseño de carreteras son impulsados principalmente por la cantidad de tráfico que la carretera está destinada a transporte y por la 'velocidad de diseño' de la carretera. El ancho de los carriles en el momento del diseño suele ser determinado por una tabla de búsqueda en la que la fila es para 'Velocidad de diseño' y la columna para la 'Volumen de tráfico del año de diseño'. Así, por ejemplo, en Ontario si la velocidad de diseño es de 120 km/h y AADT>4000, se construyen carriles de 3,75 m (12,3'); si la velocidad de diseño = 80 km/h y 1000<AADT<2000, se construyen carriles de 3,0 m (9,8'). La cadena de causalidad en la Figura 14 es más complejo que el de la Figura 13. El ancho del carril es 'causado' por los estándares y hábitos de la carretera. Tráfico futuro de diseño y velocidad de diseño. Estos afectan la ocurrencia de accidentes de manera tortuosa; la 1 En su clásico sobre el “Uso y abuso de la regresión” (Box 1966) Box llama variables que influyen en el resultado pero no incluidos en la regresión 'latente' o 'al acecho'. Un ejemplo simple proviene de un libro de texto introductorio de Freedman, Pisani, Purves y Adhi- kari. (bajo el título “asociación no es causalidad ” ) : “ Para niños en edad escolar, zapato el tamaño está fuertemente correlacionado con las habilidades de lectura. Sin embargo, aprender nuevas palabras no hace que los pies crezcan. En cambio, hay un tercer factor involucrado : años. A medida que los niños crecen, aprenden a leer mejor y superan sus Zapatos. (En la jerga estadística. la edad es un factor de confusión)”. cantidad de tráfico Número de carriles Número de accidentes ? 73 El volumen de tráfico futuro previsto suele estar estrechamente relacionado con el volumen de tráfico real que se materializa una vez que se construye la carretera, mientras que la velocidad de diseño se correlaciona con la velocidad real en usar. La velocidad real ahora está sujeta a tres influencias: la velocidad de diseño a través de su selección de la curvatura y la distancia visual a lo largo del camino, el ancho del carril y la cantidad real de tráfico en el la carretera. Aún así, la velocidad real y el volumen de tráfico están fuera de la elipse de regresión. Por lo tanto, ¿cuál ve desde dentro de la regresión, la asociación del ancho del carril con los accidentes, de ninguna manera puede ser tomado como representante de un nexo causal. Para tener un modelo causal habría que decir cómo lane el ancho afecta la velocidad real y cómo la velocidad y el volumen reales afectan los accidentes. Figura 14. Una red de causalidad más compleja El resultado es que, una vez más, no es solo o principalmente el efecto causal del ancho del carril que el transmite el coeficiente de regresión; es también (quizás principalmente) la cantidad de tráfico y la velocidad. Habiendo revisado los documentos de 2003 y 2004, un punto adicional merece mención. En el documento de 2004 los coeficientes de regresión para la variable 'ingreso per cápita' es - 0.33±0.27 para accidentes totales y 0.27±0.16 para fatalidades (fila 5 en la Tabla 11). En el mo- delo 2003 lo mismo variable tuvo un coeficiente de regresión de 0,95±0,12 para muertos y 0,95±0,23 para heridos. Desde que sería una subversión de la noción de causalidad afirmar que en 2003 los accidentes dependían de ingreso de una manera y en 2004 de otra, estos resultados son claramente inconsistentes. Como se ha señalado en todo momento, los modelos que dan resultados inconsistentes no permiten interpretaciones de causa-efecto. Aun así, en consonancia con su trabajo de 2003, Noland concluye que: “Los resultados tienden a respaldar la hipótesis de que la mayoría de las variables de infraestructura (con algunas ex- cepciones) no tienen efecto sobre las muertes y falla cuando se controlan los cambios demográ- ficos”. (pp. 525,52 6) “Las dos excepciones son el número medio de carriles y el ancho exterior
  • 67.
    medio de labanquina”. (pág. 530). Del mismo modo, Noland concluye que: "Nuestros resultados sugieren que algunos cambios en la infraestructura en realidad han llevado a aumento de acci- dentes y muertes. En particular, los aumentos en el número de carriles parecen (sic) asociarse con un aumento de muertes y accidentes, y los aumentos en el ancho de los carriles están aso- ciados con un aumento de las muertes”. y que: “Claramente, estos resultados desafían algunas suposiciones sobre la Monto anticipado de ancho de carril de tráfico Número de accidentes ? Velocidad de diseño Velocidad real Cantidad real de Tráfico 74 beneficios de varias 'mejoras' de seguridad vial.” (p. 632). Creo que ahora debería ser obvio. que sobre la base de los datos, el método y los resultados de Noland, no se pueden respaldar tales afirmaciones. 4.4 El Medio no es el Mensaje. Sea lo que sea lo que McLuhan quiso decir con su enigmática afirmación de que el medio es el mensaje, a menudo se interpreta (quizás erróneamente) en el sentido de que la cubierta, el em- balaje o el herramienta son más importantes que el contenido de la idea. Peltzman, Lave, Noland, todos usaron el mismo medio –un enfoque econométrico de forma cuasi reducida para el mode- lado de regresión– para transmitir su mensaje. yo Me gustaría asegurarme de que mi examen crítico y detallado de este medio no se interprete como restando valor a su mensaje central. Su mensaje central también es común a los tres investigadores; es que la gente se adaptará a las circunstancias cambiantes. Peltzman pensó que la gente adaptado a vehículos más seguros cambiando su intensidad de conducción (velocidad, beber y conducir, etc.). Lave, en su trabajo posterior sobre el efecto del límite de velocidad de 55 mph, argumentó que viajar en el sistema interestatal menos atractivo indujo a algunos a hacer más uso del acceso no limitado menos seguro caminos y que la nueva velocidad provocó un cambio en la mano de obra policial a la sistema interestatal. Por lo tanto, según su argumento, el efecto de seguridad del límite de velocidad reducido es no se limita únicamente a la red de carreteras interestatales. Noland argumentó de manera similar que mientras un sitio por sitio análisis puede mostrar alguna intervención para mejorar la seguridad, el efecto de todo el sistema puede ser totalmente dife- rente. La adaptación puede tomar la forma de cambios en la velocidad, en la ruta de viaje, en la vigilancia, etc. Por tanto, cuando se trata de estimar el efecto de una intervención sobre la seguridad, corres- ponde a al investigador recordar que la adaptación puede existir. El medio elegido por Peltzman, Lave y Noland puede ser deficiente; sobre este debate continuará. Su mensaje central, sin em- bargo, es muy importante. Hasta ahora, revisé solo algunas regresiones ecológicas prominentes (a nivel de población) mo- delos Quizá lo que me hizo dudar de la posibilidad de interpretaciones causa-efecto en el los estudios a nivel de población de Peltzman, Lave y Noland no serán tan agudos para los estudios a nivel de unidad que no sufren los problemas de agregación de datos. Por lo tanto, el examen de algunos niveles de unidad Se procede a realizar estudios en los que la unidad de observación sean los tramos de carretera. 4.5 Algunos modelos a nivel de unidad para carreteras. La pregunta central es, como antes, si los resultados obtenidos por regresión multivariada el uso de datos transversales puede sustentar interpretaciones de causa-efecto. Los diversos concep- tos Las dificultades que dan lugar al escepticismo se discutieron anteriormente. Sin embargo, la prueba de la budín es en parte empírico: ¿producen estos estudios resultados suficientemente precisos, son los resultados consistentes sobre diferentes conjuntos de datos, son sensibles a
  • 68.
    los métodos demodelado y suposiciones, y son resultados obtenidos de regresiones transver- sales en línea con hallazgos basados sobre los datos antes y después del tratamiento. Se revisaron varios estudios de regresión a nivel de unidad sobre pasos a nivel de ferrocarril- carretera anteriormente en la Sección 2. En esta sección, el historial de algunos estudios de regresión a nivel de unidad de Se examinarán los segmentos 75 4.5.1 Modelos a nivel de uni- dad para caminos rurales de dos carriles En un importante proyecto de investigación (Vogt y Bared 1998b; Vogt y Bared 1998a) el objetivo fue desarrollar modelos de predicción de acciden- tes que tengan en cuenta elementos de diseño de carreteras como ancho de carril, tipo de arcén, curvatura horizontal o grado. La ecuación del modelo elegido fue: y β mi β 1 x 1 e β 2 x 2 . 0 = ecuación _ 7 donde y ˆ es la estimación de la frecuencia media de accidentes, las β s son la regresión estimada coeficientes y la x representan variables tales como ancho de carril, ancho de arcén, grado promedio, densidad de entrada, grado de curva, etc. Los datos fueron de Min- nesota (1694 accidentes que ocurrieron en cuatro años en unas setecientas millas de carretera) y Washington (1706 accidentes ocurridos en tres años en unas quinientas millas de carretera). Algunos de los resultados se encuentran en la Tabla 12 . Tabla 12. Coeficientes de regresión ( β ) con base en la Tabla 22 del informe completo y la Tabla 3 en papel. Carril de distribución Ancho Hombro Ancho Entrada de coches Densidad . Calificación 1.Minne- sota -0,20±0,04 -0,08±0,01 0,009±0,003 . 0,25±0,06 2.Washington +0,07±0,05 -0,04±0,03 0,012±0,002 . 0,08±0,02 3. Combinado veneno -0,09±0,03 -0,06±0,01 0,010±0,002 . 0,10±0,02 4. Negativo combinado. Compartimiento. -0,08±0,04 -0,06±0,01 0,010±0,002 . 0,11±0,03 El signo del coeficiente de regresión Lane Width para Washington es inesperado. En Minnesota, las ca- rreteras con atributos idénticos pero carriles más anchos tendían a tener menos accidentes mien- tras que lo contrario fue cierto para las carreteras en Washington. ¿Fue uno de los que adoptó el 'Factor de reducción de accidentes' interpretación, uno concluiría que ampliar un carril reduce la frecuencia de accidentes en Minnesota pero lo aumenta en Washington. Los autores atribuyeron esta anomalía en parte a las diferencias en la correlación entre ancho de carril y arcén que fue -0.06 en Minnesota y +0.11 en Washington 1 . Otro La posible explica- ción mencionada por los autores fue que las carreteras en Minnesota tenían en su mayoría grava arcenes mientras que en Washington los arcenes estaban mayormente pavimentados. En algún momento del análisis la los autores decidieron combinar los datos de los dos estados 2 y esto hizo que la anomalía fuera invisible. (Tenga en cuenta que, naturalmente, todos los β en la tercera fila ('combinada') de la Tabla 12 están entre los β en las dos primeras filas. Es por eso que la anomalía desaparece.) La anomalía percibida puede tener varias causas. Parte de la explicación podría ser la precisión limitada de los coeficientes de regresión. Debido a que los errores estándar que se muestran en la Tabla 12 son bastante pequeños, uno no puede razonablemente atribuir la diferencia entre -0.20 y +0.07 a estimar la imprecisión 3 . Otra parte de la explicación es que la forma funcional elegida (Ec. 7) puede que no se aproxime bien al efecto conjunto de 'Ancho de carril' y 'Ancho de arcén'. Tercero, un se mencionó una variable faltante importante (si el arcén está pavimentado o no); si fuera incluidos, el modelo podría tener un mejor sentido de los datos. En cuarto lugar, algunos podrían argumentar que hay podría haber diferencias entre Washington y Minnesota (en clima, cultura de conducción, topografía 1 Debido a que las variables están correlacionadas, las estimaciones del coeficiente de regresión también lo están. Así, por ejemplo, eran los problemático +0.07 para β Lane Width para reducirse, esto forzaría un aumento en el -0.04 del β Shoulder Width . Porque
  • 69.
    reducir un problemaaumentaría el otro, las correlaciones relativamente débiles no son la expli- cación probable. 2 Se utilizó un factor de multiplicación para distinguir un estado del otro. 3 El error estándar de la diferencia -0.20-0.07=0.27 es solo de √(0.04 2 +0.05 2 )=±0.06. 76 y similares) que hace que los carriles más anchos sean beneficiosos para la seguridad en Minnesota y perjudiciales para la seguridad. Washington. Quinto, como siempre es cierto, hay razones por las que algunas carreteras tienen carriles de diez pies y otros tienen carriles de once o doce pies. Los caminos más angostos pueden haber sido diseñados y construidos en épocas anteriores y, por lo tanto, difieren de los caminos más anchos en las muchas formas en que las regiones se desarrollaron antes con prác- ticas de diseño más antiguas difieren de las regiones desarrolladas más tarde con un diseño más nuevo hábitos en su lugar. Las carreteras con carriles más angostos tienden a llevar menos tráfico y por lo tanto tienen menos mantenimiento invernal, caídas de borde más grandes, más equipo agrícola, usuarios con menos ingresos, diferentes patrones de consumo de alcohol, etc. La influencia de tales factores causales no es explícita en la ecuación del modelo. Sin embargo, su presencia e influencia se expresa a través de la variables que resultan estar en la ecuación del modelo, siendo 'Lane Width' una de esas variables. Por lo tanto, lo que tomamos como el efecto de 'Lane Width' es en parte, y hasta un punto des- conocido, el efecto de todos los factores causales antes mencionados. Cambiando de ancho de carril no se cambia de calzada ingresos de los usuarios, patrones de consumo de alcohol, prác- ticas de diseño anteriores o mantenimiento actual estándares Esta es la razón por la que no se puede calcular simple y automáticamente el efecto del ancho del carril por usando el coeficiente de regresión para Lane Width. Esta es también, en parte, la razón por la cual la regresión coefi- ciente para la misma variable puede diferir de un estado a otro. Hay variables adicionales para las que Washington y Minnesota tienen diferentes coeficientes de regresión. Por lo tanto, en la Tabla 12, se estimó que el 'Ancho de hombro' en Minnesota tenía dos veces el efecto y 'Grado' tres veces el efecto en Washington. Estos grandes aparentes las diferencias tienen causas similares a las mencionadas anteriormente; precisión estadística limi- tada, una forma funcional asumida que puede no representar bien el fenómeno, variables que pueden ser falta en el modelo, etc. Los datos recopilados por Vogt y Bared se volvieron a analizar 1 unos años más tarde (Hauer 2001). Este nuevo análisis también implicó una exploración detallada de la necesidad de cambiar el funcionamiento forma asumida en la ecuación. 7. Este nuevo análisis ofrece una rara oportu- nidad de examinar cómo la regresión los resultados pueden cambiar cuando se utilizan los mis- mos datos pero se hacen diferentes suposiciones de modelado. En el curso del nuevo análisis resultó, por ejemplo, que el modelo de Vogt-Bared predice muy pocos accidentes para segmen- tos con carriles de 10 y 12 pies y demasiados accidentes para segmentos con carriles de 11 pies. Es decir, que la forma funcional e β Lane width × Lane Width utilizada por Vogt y Bared que no puede tener un mínimo no puede ajustar bien los datos que indican la presencia de un mínimo. Los resultados para el ancho de carril de los modelos originales de la Tabla 12 y el nuevo análisis se puede ver en la Figura 15. 1 De acuerdo con el estado actual de la técnica, Vogt y Bared supusieron que el parámetro de sobredispersión no depende de la longitud de los segmentos. Investigaciones posteriores de- mostraron que esta suposición puede dar un peso indebido a los cortos segmentos en la estima- ción de parámetros. Es por esto que se volvió a analizar la misma base de datos.
  • 70.
    77 Figura 15.Comparación de resultados de V&B y Hauer La impresión que deja la Figura 15 es que los hallazgos no son lo suficientemente consistentes para ser de orientación para la acción práctica. Si la inconsistencia se debe a variables faltantes, mal elegidas forma modelo, o posiblemente una diferencia real en el efecto del ancho del carril entre Minnesota y Washington, estos hallazgos no permiten anticipar cómo podría cambiar la seguridad como resultado de un cambio en el ancho del carril. El problema se resolvería aquí si no fuera por la existencia de una regresión adicional modelos basados en diferentes datos de sección transversal. Zeger et al. (Zegeer et al. 1987) utilizaron datos sobre unas 5000 millas de carreteras de dos carriles de siete estados 1 y cinco años de accidentes. Agrupando todo datos 2 Zegeer et al. representó el efecto del ancho del carril por el factor multiplicativo de 0.88 Lane ancho _ Esto es aproximadamente lo mismo 3 que e -0.12×An- cho de carril . Los hallazgos de Zegeer se mostrarían en la Figura 15 como una línea ligeramente por debajo de la etiqueta 'B&V Combined'. La evidencia adicional proviene de Hadi et al. (Hadi et al. 1995a) y (Hadi et al. 1995b) que utilizaron datos sobre unas 4200 millas de carreteras rurales de dos carriles en Florida. En su modelo, el efecto del ancho del carril está representado por el factor multiplicativo de e -0.086 × ancho de carril que coincide virtualmente con la línea 'V&B Combined' en Figura 15. Parece entonces que hay un núcleo de congruencia entre los varios hallazgos y también diversi- dad sustancial. La congruencia está entre los hallazgos de Hadi et al. para Florida, el Vogt y Bared resultados al combinar datos de Minnesota y Washington, y Zegeer et al. 1 Los estados son Alabama, Michigan, Montana, Carolina del Norte, Utah, Washington y Virginia Occidental. 2 Una investigación posterior de Ng y Hauer (Ng y Hauer 1989) reveló que “Bajo condiciones similares, diferentes los estados tienen diferentes números promedio de accidentes por milla- año” (p.4). Porque los estados también difieren en el ancho de vía de sus vías, no se puede saber en qué medida los coeficientes de regresión reflejan el efecto del ancho del carril o el efecto de otras diferencias de estado a estado. 3 La función γX β X mi β X = mi = . Por lo tanto, la forma funcional utilizada por Zegeer et al es la misma que la utilizada por Vogt y Bared y Hadi et al. Además, e β = 1 + β + β 2 2!.Cuando β es pequeño e β es aproximadamente igual a (1+ β ). Por lo tanto, e -0.12×Ancho de carril es aproximadamente lo mismo que 0.88 Ancho de carril . 78 resultados para los datos agrupados de siete estados. La diversidad es de dos tipos. Primero, hay grandes diferencias inexplicables entre los resultados de Minnesota, Washington y Florida. En segundo lugar, hay es una gran diferencia entre los resultados en los que la función supuesta era e β X y la función revisada modelo usando los mismos datos usando una función que puede tener un mínimo. Las muchas suposiciones hace en el modelado (qué variables usar, qué forma funcional elegir, qué estructura de error por la que optar, etc.) puede ser en parte responsable de la diversidad de hallazgos 1 . Actualmente mi opinión es este: • Es posible que la estructura subyacente de causa-efecto de la ocurrencia del accidente fenómeno podría ser revelado a tra- vés de análisis de regresión a nivel de unidad de sección transversal datos. Para lograr este objetivo, es necesario eliminar las principales fuentes de diversidad inexplicable. Si bien uno puede esperar que a través de futuras investigaciones cuidadosas, creativas y per- sistentes esto podría hacerse eventualmente, el historial discutido en esta sección y el concepto Las dificultades discutidas en la sección 3 no dan mucho lugar para el optimismo.
  • 71.
    4.5.2 Un modeloa nivel de unidad para carreteras de varios carriles En comparación con las carreteras de dos carriles, los modelos de regresión multivariable para carreteras de varios ca- rriles son escaso. Por lo tanto, uno no puede comparar los hallazgos de muchos modelos y eva- luar la consistencia de resultados. Sin embargo, todavía es posible examinar los resultados de los modelos a la luz de lo que conocido o esperado. Hauer et al. (2004) utilizó datos de ciento veinte millas de cuatro carriles urbanos segmentos de carretera no divididos en Washington en los que se encuentran unos 900 fuera de la carretera y 5300 en la carretera accidentes ocurridos durante los años 1993 a 1996. Un resultado típico (para el total de accidentes en la carretera) es la ecuación 8 donde, y es la estimación del número esperado de accidentes por año en un lado de el camino, X=AADT/10,000, D Ε grado de curva, ST es tipo de hombro, SWC es ancho de hombro categoría, PC es una curva vertical pico-cresta, VS es una curva vertical valle-sag y TWLTL es bidireccional- carril de giro a la izquierda y ∀ año un parámetro de escala anual. 1 Noland y Karlaftis (2004) (Noland y Karlaftis 2004) llegan a conclusiones similares. 79 ( ) y Longitud del segmento para la predicción X e [2e 0.037(%Camiones)] [e 0.059D] (Límite de velocidad) e/ (50.000 si PDO, 150 si Lesión, 2000 si Total) (0,803 si TWLTL está presente y 1 en caso contrario) [1 0.022(Ancho de carril 11')] [si ST 'Bordillo' o 'Pared' entonces 1.18, de lo contrario 1 0.044(SWC 1)] (1,26 si PC, 1,75 si VS, 1 en caso contrario) mi 0.027 (Número de entradas comerciales) 1.860 0.159X 0.071%Camiones) 0.265D 3.058 3.058 Límite de velocidad /30 1.108 (Longitud del segmento en los datos del modelo) = × × + × + ° × × × + − × = + − × × + × ⎡ ⎣ ⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢ ⎤ ⎦ ⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥ − − − ° − × − α año ecuación . 8 Se hizo un intento de moldear la forma del modelo para que pueda ajustarse al mensaje de los datos. Esto es por qué la forma matemática de los bloques de construcción es relativamente compleja y por qué el modelo consta de componentes multiplicativos y aditivos. Sólo aquellas variables que exhibieron un relación sistemática con la ocurrencia de accidentes se incorporaron en los modelos. Algunos hallazgos son los que cabría esperar y otros bastante inesperados. Por lo tanto, por ejemplo, mientras que para los accidentes fuera de la carretera la variable 'Por- centaje de camiones' no tuvo influencia, para los accidentes de tránsito, se encontró que la rela- ción en la Figura 16 refleja los datos. Figura 16. Multiplicador para la variable 'Porcentaje de camiones' Los datos indican que cuanto mayor sea la proporción de camiones en el flujo de tráfico, al menos hasta aproximada- mente 10%, menos accidentes en la carretera parecen ocurrir en carreteras urbanas de cuatro carriles en Washington. Dado que el hallazgo es inesperado tanto en dirección como en tamaño 1 , la mente buscará Explicaciones: tal vez las carreteras con muchos camiones difieren de las carreteras con pocos camiones en aspectos que no 1 Un flujo de tráfico sin camiones tiene el doble de accidentes que un flujo con diez por ciento de camiones. 80 representado en el modelo, tal vez donde los camiones son numerosos, las velocidades son menores, etc. especulaciones reflejan la intuición correcta de que hay muchas explicaciones posibles (razones, causas) para la relación encontrada por regresión al lado de la que resulta estar en el modelo ecuación. Es en la constitución psicológica humana que nos inclinamos a buscar tales causas y explicaciones cuando un hallazgo no está de acuerdo con la expectativa 1 pero está feliz de aceptar sin cuestionar lo que está en línea con nuestras creencias anteriores. Nuestra predispo- sición psicológica no debe oscurecerse buen juicio. Claramente, uno no puede considerar los
  • 72.
    hallazgos que estánde acuerdo con las expectativas como capturar una relación causal y, al mismo tiempo, considerar los hallazgos inesperados como no causales. Otro resultado inesperado en Hauer (2004) se encuentra en la Figura 17. La relación que se muestra es una buen ajuste a lo que indican los datos 2 . Si se atribuyera a esta curva una causa- efecto, es decir, una llevaría a concluir que, en este tipo de vías, aumentar el límite de velocidad en el rango de 30 a 50 mph rango reducirá los accidentes. A los que se oponen a los límites de velocidad les gustaría ver esta interpretación los datos. Sin embargo, en realidad, lo más proba- ble es que la dirección de la causalidad vaya en la dirección opuesta. Es decir, las personas conducen más rápido cuando sienten menos riesgo y los ingenieros deci- den cuál es la velocidad. los límites deben basarse en lo que los conductores muestran como una velocidad prudente. No es que aumentar la velocidad límite salva accidentes es que una carretera donde el riesgo parece menor tiende a tener mayor límite de velocidad (al menos en el rango de 30 a 50 mph). Figura 17. Multiplicador de la Variable 'Límite de Velocidad'. Otro punto a recordar es que la gravedad del accidente no depende de la velocidad indicada. límite sino en el cambio de velocidad antes de la colisión (Delta-V). Las reconstrucciones de accidentes muestran que Delta-V solo se ve ligeramente afectado por el límite de velocidad, como se muestra en la Figura 18 (basado en Farmer (2003)). De ello se deduce que la variable en la regresión (límite de velocidad) tiene solo un vínculo causal débil con el fenómeno y la relación encontrada representa una variedad de factores casuales, no principalmente de velocidad. 1 La disonancia cognitiva es un fenómeno psicológico que hace referencia al malestar que se siente ante una discrepancia entre lo que ya sabe o cree, y nueva información o interpretación. 2 El ajuste es bueno para las seis categorías de límite de velocidad de 25 a 50 mph. Hay un repunte en los datos de los pocos tramos con 55 mph. 81 Figura 18. El eslabón débil entre Delta-V y Speed Limit Las siguientes observaciones se hacen en la sección 'Lecciones' de Hauer (2004): “Se obtuvieron varios resultados inesperados. Frecuencia de accidentes parece disminuir como límite de velocidad aumenta o a medida que aumenta la proporción de camiones; hay más accidentes de tráfico en secciones tangentes que en la mayoría de las curvas horizontales, las carreteras con arcenes más anchos tienen más accidentes, etc. Si se supone que los datos son correctos y el proceso de modelado está libre de errores, la pregunta central es esta: ¿Cuáles de los muchos resultados obtenidos reflejan una relación causa-efecto y cuáles reflejan simplemente una asociación estadística cuyas razones pueden ser complejas? .Recuerde que los modelos multivariantes de este tipo se utilizan a me- nudo para obtener 'Modificación de accidentes Factors' como si tal interpretación de causa y efecto estuviera permitida. Una de las lecciones de este proyecto es que tal práctica está abierta a cuestionamiento. La 'cuestión central' antes mencionada no es siendo abordado por cualquiera de los programas de investigación de seguridad financiados en curso. Y sin embargo, si se deja sin resolver, gran parte de la investigación que actualmente está financiada por la FHWA y el NCHRP está en peligro de produciendo resultados inutilizables y potencialmente dañinos. Es difícil imaginar que nada de la asociación encontrada en los datos entre la frecuencia de accidentes y, digamos, el grado de la curva, el arcén y el ancho del carril o el tipo de curva vertical, refleja la causa y efecto. Las asociaciones encontradas aquí pertenecen a vías urbanas
  • 73.
    de cuatro carrilessin dividir y son muy diferente a las creencias establecidas durante décadas de investigación sobre caminos rurales de dos carriles. Por lo tanto, se debe considerar la posibilidad de que estos dos tipos de vías difieran sustancial- mente en cómo su seguridad depende de su geometría. Un programa de estudio con datos de otros Estados y el uso de una variedad de enfoques de investigación está en orden”. 82 4.5.3 Modelos de regresión y funciones de modificación de accidentes El objetivo decla- rado del proyecto Vogt & Bared (1998) discutido en la sección 4.4.1 era estimar la frecuencia esperada de accidentes (la variable dependiente, y ˆ ) de un segmento de carretera como función de sus atributos 1 (las 'variables independientes', x). Aun así, los autores pensaron que la El modelo se puede utilizar para determinar cuántos accidentes se evitarán si se utilizan atributos como el carril. o el ancho de los hombros se cambian. En la sección titulada “Factores de reducción de acci- dentes”, Vogt y Bared dice que: “Una forma de medir el efecto de una variable es calcular cuánto sería la media cambiaría si la variable aumentara en una unidad. El factor de reducción de acci- dentes es 1 100 [ mi 1 ] mi 100 e yo yo yo β x _ β (x 1) − − = ⎥⎦ ⎤ ⎢⎣ ⎡ − − + . Esta cantidad es el negativo del porcentaje cambio." (pág. 21) En esto, Vogt y Bared siguen la autoridad de Miaou y Lum (Miaou 1994) quienes usan un modelo de regresión que desarrollaron de manera similar “para estimar la reducción esperada en camiones accidentes causados por mejoras en algunos elementos de diseño geométrico…”, (pp. 13- 14) . La práctica de usar los resultados de la regre- sión para calcular los 'Factores de reducción de accidentes' es casi universal, como puede de- ducirse de los influyentes trabajos de Zegeer et al. (Zegeer et al. 198), Haddi et al. (1995) y muchos otros. Este es el quid de la cuestión. Existe la cautela estadística elemental y de larga data que 'corre- lación no es causalidad' y existe un escepticismo científico generalizado acerca de la interpreta- ción de ecuaciones de regresión como indicaciones de causa y efecto. También hay amplio evi- dencia empírica respaldada por los muchos ejemplos revisados en detalle en este informe que la cautela estadística está bien fundada y el escepticismo científico justificado. y sin embargo el La tradición econométrica en la investigación de la seguridad vial es una de disposición incues- tionable 2 para utilizar los resultados de regresiones basadas en datos transversales para pre- decir el efecto de las manipulaciones. El escepticismo sobre la posibilidad de atribuir significado causal a las relaciones encontradas por regresión que utiliza datos transversales no significa que los resultados sean inútiles, o que Nunca se puede captar el efecto causal de algunas variables. Las relaciones encontradas por regresión son bueno para estimar cuántos accidentes se espera que ocurran en los tramos de carretera sobre los cuales el la información requerida para alimentar el modelo está disponible. La relación encontrada por tales regresiones también puede servir como inspiración y desenca- denante para futuras investigaciones. ¿Por qué en multicarril urbano las carreteras no divididas las curvas suaves son más seguras que las secciones tangentes, los segmentos con un límite de velocidad de 50 mph ¿Son más seguras que las secciones donde hay 30 mph, etc.? Si bien las preguntas surgen de una regresión que 1 El esfuerzo de investigación fue realizado por la Administración Federal de Carreteras para proporcionar las predicciones necesarias para el mo- delo interactivo de diseño de seguridad vial 2 Es difícil entender la seducción de la expresión matemática como la Eqn. 7. Tal vez sea el terminología de variables 'independientes' a la derecha y variable 'dependiente' a la izquierda que es responsable de esto predisposición injustificada a 'calcular' cómo cambia lo que es dependiente cuando alguien incide en un cambio en la variable independiente. Después de todo, incluso la Segunda Ley de Newton (F=m×a) no implica que al
  • 74.
    cambiar la aceleración(a) uno puede cambiar la cantidad de fuerza (F). Citando a Bunge (1979) “ .sería difícil asignar a las matemáticas el tarea de dar cuenta de las conexiones causales. La productividad (en el sentido de que algún efecto es producido por alguna causa) es ausente de las matemáticas. ” (p. 45) 83 Si se utilizan datos transversales, las respuestas provendrán de una investigación enfocada realizada por otros medios. Está mi opinión que: • Mejores datos y prác- ticas de modelado podrían reducir la diversidad inexplicable de hallazgos aumentando así la confianza en algunas interpretaciones de causa-efecto. Sin embargo, en la actualidad, la supo- sición habitual e incuestionable de que las ecuaciones obtenidas por regresión son máquinas matemáticas que se pueden utilizar para calcular simplemente el efecto de las manipulaciones es no justificable 84 5. RESUMEN Mucho se ha dicho en las cuatro secciones precedentes. Una mente más disciplinada podría haber Dijo lo mismo con menos palabras y más claridad. Pero, en su defecto, será el papel de la Sección 5 para exprimir la esencia de una narración incoherente en un recipiente más pequeño. La pregunta es si es posible dar interpretaciones de causa-efecto a los resultados de regresiones utilizando datos sobre accidentes y atributos de una sección transversal de unidades (segmentos de carretera, intersecciones, condados, estados, etc.). La pregunta es de importancia práctica por dos razones. Primero, conocimiento sobre las consecuencias de seguridad de las decisiones de diseño sobre características tales como horizontal la curvatura, el grado de la carretera, el ancho del carril, las pendientes medianas provienen principalmente de tales regresiones. de he- cho esto es a menudo la única forma en que se puede determinar el efecto de seguridad de estas características. Otro La razón es que la orientación sobre cuestiones importantes de política 1 se basa habitualmente en regresiones que utilizan datos de la sección transversal. Muchos de los que estudian la seguridad vial asumen rutinariamente que si uno pone la sección transversal disponible datos en la tolva de un software de regresión estadística apropiado, lo que sale es un ecuación que se puede utilizar para calcular el efecto de seguridad de algún cambio en el 'independiente variables'. Por qué esta creencia es tan común es un misterio porque con- currente con ella existe la STATS 101 advierte que 'correlación no es causalidad', la advertencia de que 'no hay causalidad sin manipulación' y también la opinión generalizada de que los resul- tados de las regresiones cuando se basan en No se puede confiar en que los datos de sección transversal representen relaciones causales. Esta tensión entre lo que se asume rutinariamente y la duda sobre la validez de la misma suposición es el eje alrededor que gira este informe. Sección 2. En esta sección examiné la pregunta general antes mencionada en el contexto de un estudio de caso. ¿Qué se puede aprender de la historia de la investigación sobre el efecto de seguridad de reem- plazar los crossbucks? con luces intermitentes en un paso a nivel de ferrocarril-carretera? Varios modelos de regresión y varios antes-después los estudios se introdujeron en la evidencia. Se encontró que un modelo de regresión era totalmente inconsistente con lo que se comprobó re- petidamente en todos los estudios de antes y después. Los otros modelos de regresión llevaron a resultados diversos. Los estudios de antes y después llevaron a estimaciones similares del efecto de seguridad. Este caso-historial dio lugar a algunos puntos generales. 1. Hay muchas diferencias bien conocidas entre los estudios transversales y antes-después. Sin embargo, rara vez se destaca una diferencia. Una ecuación de regresión basada en la sec- ción transversal los datos son una función de atributos (variables). Por lo tanto, cuando se utiliza para calcular el efecto de seguridad de un cambio en algún atributo, esto también suele ser una
  • 75.
    función de losatributos. así es como debe ser porque uno debe asumir que, generalmente, el efecto de un tratamiento depende de los atributos del unidad tratada. Sólo cuando el efecto de- pende débilmente de todos los atributos puede ser descrito por uno número. Por el contrario, un estudio de antes y después en el que se aplica algún tratamiento en varios sitios por lo general , 2 produce un solo número, una estimación del ' efecto de seguridad promedio 1 '. Tenía unidades con 1 ¿La regulación de seguridad del automóvil redujo los accidentes? ¿Es la 'Velocidad' o la 'Variación de la velocidad lo que importa? Hacer caminos construidos para mejores estándares mejoran la seguridad? 2 Rara vez es factible tener datos para un número suficiente de sitios tratados para permitir la estimación del efecto de seguridad por atributos 85 Si se hubieran tra- tado diferentes atributos, este efecto de seguridad promedio sería un número diferente. Sigue que las estimaciones del efecto de seguridad obtenidas mediante un estudio de antes y después tienen dos inconvenientes: • Las estimaciones tenderán a diferir de un estudio a otro debido a que los atributos de las unidades tratadas en cada estudio son diferentes. • Cuando un médico contempla el tratamiento de una unidad específica, es la seguridad esperada efecto en esta unidad que es de interés. Este propósito es bien atendido por una ecuación que expresa el efecto de seguridad en función de los atributos de la unidad. Conocimiento de lo que es el promedio el efecto de seguridad que podría tener sobre las unidades cuyos atributos no se conocen es menos útil. 2. En los modelos de regresión revisados, y en todos los demás modelos de regresión que co- nozco, el funcional la dependencia del efecto de seguridad en los atributos es un subproducto no premeditado de la ecuación elegida por el modelador por razones que no tienen nada que ver con cómo el efecto de seguridad de algún cambio depende de los atributos de la unidad tratada. Por lo tanto, no debe sorprender que tal Las ecuaciones no logran captar cómo el efecto de seguridad del cambio depende de los atributos. • Lo que parecía ser una ventaja genérica del enfoque de regresión para el efecto de seguridad estimación - su capacidad automática para hacer efecto de seguridad en función de los atributos - puede ser sólo una ilusión seductora; todo depende de si la regresión captura adecuadamente un relación causa-efecto. • Si se van a usar modelos de regresión para estimar el efecto de seguridad del cambio en los atributos, esto debe tenerse en cuenta cuando se elige la ecuación del modelo. 3. Los modelos de regresión examinados en la Sección 2 predicen en circunstancias idénticas un muy efecto de seguridad diferente para la conversión de crossbucks a flasher. Y, sin embargo, la piedra angular de la causalidad es la creencia de que en circunstancias idénticas el mismo trato tendrá el mismo efecto. Si es así, tomados en conjunto, los modelos examinados fallan esta prueba de causalidad. • La consistencia de los resultados (efectos) es una piedra de toque importante para la causali- dad. Si modelos producidos por regresiones basadas en datos transversales no producen resul- tados consistentes, uno no se puede decir que capten una relación causal. Si no se puede decir si una causa se ha capturado la relación, los modelos no se pueden utilizar para predecir el efecto de seguridad de un cambio. 4. La consistencia de los resultados como piedra de toque de la causalidad se aplica no solo a las comparaciones de regresión resultados del modelo, sino también a las comparaciones entre los resultados de las regresiones y los estudios de antes y después. Si bien uno de los modelos de regresión examinados en la Sección 2 era claramente incompatible con los modelos existentes estudios de antes y después, lo más que se puede decir sobre el otro
  • 76.
    modelo de regresiónexaminado es que su los resultados no son inconsistentes con los de los estudios de antes y después existentes. El punto general es que • Las estimaciones del "efecto de seguridad promedio" de los estudios de antes y después no se pueden comparar fácilmente con resultados de regresiones cuando los atributos de las unidades tratadas en el estudio antes- después no se conocen. 1 El promedio es sobre todos los sitios tratados incluidos en el estudio. 86 • De ello se deduce que la utilidad de los estudios de antes y después mejoraría mucho si: una. Sabíamos los atributos de las unidades en el estudio antes-después y, b. Sabíamos cómo el efecto de seguridad depende de estos atributos. 5. Es necesario resaltar otra diferencia importante entre los estudios de antes y después y los transversales. Cuando se compara la seguridad de una unidad antes y después del tratamiento, la unidad sigue siendo la misma; es básicamente el mismo camino o intersección, utilizado por el mismo tipo de personas, en el mismo lugar, clima, etc. Lo que puede cambiar materialmente es el flujo de trá- fico, la precipitación, los límites de notificación de accidentes y similares. Por lo tanto, es razona- ble esperar que uno pueda dar cuenta de lo que materialmente ha cambió del período 'antes' al período 'después'. En cambio, en un estudio transversal se compara unidades 'con atributo A' y diferentes unidades 'con atributo B'. Ahora bien, la continuidad proporcionada por el falta el co- nocimiento de que 'la unidad sigue siendo la misma'. Por lo tanto, uno puede estar menos seguro de que no hay diferencias importantes y no explicadas entre el 'con atributo A' y 'con atributo B' unidades; diferencias sobre las que no hay información, y cuya existencia puede que ni siquiera sospeche. Además, existe la sensata suposición de que las unidades tienen el atributo A y no B por buenas razones, y que estas razones no se conocen completamente y son difíciles de expli- car. Seccion 3. En esta sección intento proporcionar una base conceptual para la discusión de la causa y efecto En esto me guié por los escritos de Rubin-Holland y Greenland-Robins. los El 'problema funda- mental de la inferencia causal' sobre el efecto de un tratamiento es que es imposible tratar y no tratar simultáneamente la misma unidad y por lo tanto es imposible observar cómo la misma unidad respondería tanto al tratamiento como al no tratamiento. La solución científica a esto El problema es suponer que los resultados obtenidos antes, en condiciones idénticas pero sin tra- tamiento, se obtendría si no se hubiera aplicado el tratamiento cuando se hizo. La solución del estadístico es tratar algunas unidades de una población y dejar las unidades restantes sin tratar. tanto para el científico y el estadístico la creencia subyacente es que: • La respuesta de una unidad a un tratamiento está determinada por sus atributos relevantes para la respuesta. Las unidades con atributos relevantes para la respuesta idénticos tendrán respuestas idénticas a tratamiento. Cuando el investigador no tiene control sobre la asignación de unidades al tratamiento, como ocurre en estudios de observación, el enfoque del estadístico falla y el razonamiento del científico que necesita ser seguido. Considere primero un estudio observacional de antes y después. Para que la inferencia causal siga la Paradigma científico, lo que debe mostrarse es que mediante el uso de valores observados del pasado (y complementando esto con información sobre cómo algunas circunstancias relevantes para la respuesta han cambió del período 'antes' al 'después') es posible predecir lo que sucedería sin tratamiento en el período 'después'.
  • 77.
    • Si ycuándo lo que se predice para una unidad y lo que se observa en ella se puede demostrar que estar repetida y suficientemente cerca uno del otro es una pregunta empírica que puede ser respondido a través de un programa de indagación. • Dado que en la investigación sobre seguridad vial aún no se ha elaborado un programa de investigación de este tipo, llevado a cabo, todavía no es posible decir si en los estudios observa- cionales de antes y después, 87 los juicios de causalidad pueden estar bien fundamentados en el paradigma de un 'científico observacional'. Pero la perspectiva de éxito es excelente. Considere a continuación un estudio observacional transversal sobre el efecto de seguridad del cambio de del estado 'c' al estado 't' en el que las unidades que tienen 'c' se comparan con otras unidades que tienen 't'. Ahora, la suposición que se justifica es que las unidades que tienen 't' habrían respondido a 'c' en de la misma manera que las unidades que tienen 'c'. Para justificar esta suposición, uno debe poder demostrar que las unidades que tienen 'c' tienen los mismos atributos relevantes para la respuesta que las unidades que tienen 't'. Hacerlo es difícil por razones tanto prácticas como conceptuales. La razón habitual por la que uno unidad tiene 'c' (digamos, crossbucks) y otra tiene 't' (digamos, intermitentes) es que difieren en algunos atributos de respuesta (digamos, tráfico). Por lo tanto, es prácticamente difícil encon- trar unidades con 'c' que tengan los mismos atributos relevantes para la respuesta que las uni- dades con 't'. Incluso si esta dificultad práctica pudiera ser superar uno debe preguntarse por qué entre los que parecen tener atributos similares relevantes para la respuesta, algunos tienen 'c' y otros 't'? La sospecha debe ser que alguien juzgó una unidad más adecuada para 'c' y el otro para 't'. Si este juicio no careciera de base, entonces los atributos relevantes para la respuesta de unidades con 'c' y unidades con 't' no son lo mismo. Las conclusiones es que • Para estudios transversales observacionales en seguridad vial, no puedo pensar en un análisis empírico pro- grama de estudio para demostrar que las unidades que tienen 'c' responderían a t' en el de la misma manera que lo hicieron las unidades que tenían 't'. Tampoco parece posible demostrar que algunos las unidades que tienen 'c' y algunas unidades que tienen 't' tienen la misma res- puesta relevante atributos Hasta que se diseñe y se lleve a cabo con éxito un programa de estu- dios de este tipo, tener poca confianza en la afirmación de causa-efecto cuando se basa en una sección transversal observacional estudios. El resto de la Sección 3 trata sobre cómo disminuir la amenaza del sesgo de confusión en estu- dios transversales observacionales. Un enfoque sería seleccionar unidades con 'c' y unidades con 't' para tener atributos relevantes para la respuesta muy similares. Por las razones mencio- nadas anteriormente, en la investigación en materia de seguridad vial, es probable que esto no sea práctico. El otro enfoque es tener en cuenta las diferencias. en atributos relevantes para la respuesta entre unidades con 'c' y unidades con 't' por análisis. para hacerlo requiere conocimiento de una. ¿Cuáles son los atributos relevantes para la res- puesta de las unidades con 'c' y las unidades con 't'? b. Conocimiento de cómo cambiaría la respuesta de cada unidad en función del cambio en un atributos relevantes para la respuesta. Si el conocimiento en 'a' y 'b' estuviera disponible, se podría aplicar una 'corrección' a lo obser- vado frecuencias de accidentes que traen unidades con 'c' y unidades con 't' a un conjunto común de respuestas relacionadas atributos Hay muchos obstáculos en esta ruta. Primero, para corregir por confundir uno debe tener datos sobre lo que se sabe que son importantes atributos relevantes para la respuesta de las unidades con 'c' y con 't'. Si tales datos no están disponibles, se debe
  • 78.
    suponer que existeconfusión. Segundo, incluso si uno tuviera los datos, corregir la confusión requiere el conocimiento de un multivariable función que vincula la respuesta (frecuencia de ac- cidentes) con todos los atributos importantes relacionados con la respuesta (variables). En se- guridad vial, tales funciones actualmente no existen. Por último, están las respuestas relevantes atributos que no conocemos. Entre ellas destacan las razones por las cuales una unidad terminó teniendo 'c' y otra 't'. La influencia de estos atributos, desconocidos, 88 insospechados, no reco- nocidos o indocumentados pero omnipresentes, siempre estarán al acecho en el antecedentes. De este modo, • Si no hay datos sobre lo que se sabe que son los atributos relevantes de res- puesta de las unidades con 'c' y las unidades con 't', incluidas las que explican por qué una unidad tiene 'c' y otra 't', o si la función que vincula la respuesta a todos los atributos relevantes para la respuesta no es conocida, debe juzgarse que existe confusión. Si bien algunas de las dificultades a las que se enfrenta el enfoque de "corrección por análisis" tal vez podrían ser superado si tuviéramos datos mucho más ricos y un conocimiento mucho mejor del requisito funcional relaciones, algunos obstáculos parecen insuperables. Los obstácu- los aparentemente insuperables son dos. En primer lugar, en el contexto de la seguridad vial siempre será difícil argumentar que el juicio de profesionales para implementar 't' o 'c' no fue influenciado por la historia pasada de choques o casi accidentes, por consideraciones basadas en una familiaridad con el sitio y sus circunstancias que no se puede ver en los datos, o por algún atributo relevante de respuesta ahora irreconocible. los La segunda dificultad aparentemente in- superable es que para generar confianza en la 'corrección por enfoque de análisis uno tendría que proporcionar evidencia empírica de que la corrección es aproximadamente correcta. Esto implica que uno tendría que encontrar unidades que realmente deberían ser equipado con 't' pero permaneció equipado con 'c' por algún capricho del destino que es completamente sin relación con ningún posible atributo relevante para la respuesta. No puedo pensar en tales experimentos naturales. Por lo tanto, no puedo ver una manera de verificar empíricamente que la 'corrección' está cerca de lo que debería ser. Queda por preguntar si se pueden igualar los atributos usando regresiones paramétricas. Suponga que uno usará los datos sobre fallas y atributos para estimar dos regresiones modelos, uno para unidades con 'c' y otro para unidades con 't'. Una vez hecho esto, se podría: a. especificar un conjunto de valores de atributos comunes → b. calcule los choques/año previstos para las unidades con 'c' y de unidades con 't' usando los valores de atributos comunes → c. comparar las dos predicciones y por lo tanto → d. estimar el efecto de seguridad de reemplazar 'c' por 't' para una unidad con el especificado valores de atributos comunes. Llamaré a esto el enfoque de 'ecualización por regresión'. La pregunta es cuáles son las fortalezas y limitaciones de usar el enfoque de igualación por regresión para eliminar el sesgo de confusión cuando se hace uso de datos transversales observacionales? Noté que para corregir las diferencias en los atributos relacionados con la respuesta entre las unidades con 'c' y unidades con 't' uno tiene que saber qué cambio en la respuesta es causado por un cambio en el atributo. En En general, la relación funcional necesaria se basa en el acervo de hallazgos de investigación acumulados. tiempo extraordinario. Cuando se utiliza el enfoque de ecualización por regresión, se supone que el La relación funcional requerida es el propio modelo de regresión: el resultado de ajustar una ecuación a los datos de las unidades del grupo. El atractivo de este enfoque es que uno no necesita buscar, dominar y evaluar la investigación acumulada existente para establecer lo que se sabe; que el modelo estimado proporciona la función necesaria a la manera de 'deus ex ma- china'. Desafortunadamente, esta forma automática por la cual una regresión proporciona las
  • 79.
    relaciones funcionales necesariases también una fuente de gran debilidad. Al confiar exclusiva- mente en la forma funcional y estimada parámetros del modelo de regresión que se ajustó al conjunto de datos específico en cuestión, uno es esencialmente sin tener en cuenta todo lo que se sabe de investigaciones previas sobre tales relaciones. es como si no existía conocimiento además de lo que afirma el modelo de regresión actual y como si uno pudiera ser seguro de que todo lo que afirma el modelo actual está lo suficientemente cerca de la verdad, incluso si va contra lo que otros encuentran o lo que comúnmente se conoce. En la ciencia, el conocimiento es una cuestión de 89 acumulación, y la clave de la confianza en alguna afirmación sobre la realidad es la consistencia con que se puede obtener. La experiencia con modelos de regresión en seguridad vial nos dice que diferentes los investigadores tienden a encontrar diferentes fun- ciones para las mismas variables. Por lo tanto uno no puede ser seguro de que cualquier modelo de regresión estimado específico representa de forma fiable la función causal necesarios para lograr la igualación de atributos. Dije antes que para corregir la confusión uno debe tener datos sobre lo que se sabe que es atributos relevantes para la respuesta de las unidades en 'c' y unidades con 't'. Lo mismo es cierto para el enfoque de igualación por regresión. En la medida en que sabemos de la existencia de algunos atributo relevante para la respuesta que no se utiliza en la ecuación de regresión, su omisión será un fuente de confusión tal como lo es cuando se utiliza el enfoque general de "co- rrección por análisis". De manera similar, se debe suponer que cuando se usa el enfoque de 'ecualización por regre- sión', hay puede haber algunos atributos relevantes para la respuesta que ni siquiera conocemos. Destacados son los oscuras razones para aplicar 'c' a algunas unidades y 't' a otras unidades. Así como en general 'ecualización por análisis' esta fuente de confusión no puede eliminarse de la observación estudios transversales por el enfoque de 'ecualización por regresión'. En suma, • El atractivo del enfoque de 'ecualización por regresión' es la conveniencia. las variables en el modelo se supone que son los atributos relevantes para la respuesta; la ecuación del modelo es se supone que es la función que vincula los atributos a la respuesta. • Las desventajas del enfoque de 'ecualización por regresión' son que las variables de No se puede suponer que el modelo incluya todas las principales variables relevantes para la respuesta y que la ecuación del modelo, cuando no se basa en el conocimiento acumulado, no puede asu- mirse ser la mejor función que vincula los atributos con la respuesta. El último tema discutido en la Sección 3 fue el de la consistencia. En la cuenta final, el La justifi- cación de la causalidad se basa en una acumulación de confianza y de convicción justificable que es basado en una consistencia de los hallazgos a medida que se acumulan los estudios. Por lo tanto, una de las consideraciones clave en el examen de la causalidad y el efecto del trata- miento no es la defensa de las conclusiones extraídos en un solo estudio de un conjunto de datos específico, sino más bien el examen de la consistencia de los hallazgos obtenidos en todos los estudios del mismo tratamiento. La consistencia de los hallazgos es una condición necesaria (pero no suficiente). Es decir, si los hallazgos por estudios separados del mismo tratamiento difieren ampliamente se puede afirmar que ninguna creencia de causalidad puede ser justamente entretenido. Sin embargo, incluso si los hallazgos de diferentes estudios son consistentes, aun así, todos pueden estar igualmente confundidos. Sin embargo, cuando los resultados son consistentes es al menos posible que el juicio de causalidad pueda ser justificado. El requisito de que los hallazgos sean consistentes no significa que se deba esperar que mismo efecto promedio del tratamiento en dos estudios de antes y después del mismo tratamiento. solo
  • 80.
    significa que cuandose aplica un tratamiento a unidades con atributos idénticos, el efecto debe ser el mismo. Porque, si no fuera así, no habría motivos para esperar cuál podría ser el efecto de un trata- miento. De ello se deduce que para examinar los hallazgos de dos estudios de antes y después en busca de consistencia, uno debe muestran que las unidades en ambos estudios tenían atributos muy similares, o uno debe saber cómo el tratamiento El efecto depende de los atributos de las unida- des en cada estudio y explica las diferencias. Este tiene tres implicaciones importantes para la realización de estudios de antes y después. 90 • Primero, uno debe tomar nota de los atributos relevantes para la respuesta de las unidades tratadas. • En segundo lugar, se debe tomar nota de las estimaciones del efecto para cada grupo de uni- dades con similar atributos relacionados con la respuesta (y solo entonces determinar el 'efecto promedio del tratamiento'). • En tercer lugar, se deben investigar las estimaciones del efecto de dependencia funcional sobre la respuesta relevante. atributos Por las razones ya mencionadas, no se puede decir fácilmente si el tratamiento prome- dio el hallazgo del efecto de un estudio de antes y después es consistente con los hallazgos de un estudio transversal. Sin embargo, ¿se conocían los atributos de las unidades en el estudio antes-después y los mis- mos atributos se utilizaron en el modelo de un estudio transversal la consistencia de los resulta- dos obtenidos en los dos tipos de estudio podrían ser examinados. Finalmente, cuando los ha- llazgos de dos estudios transversales son examinados para verificar su consistencia, particular- mente aquellos basados en el enfoque de igualación por regresión, la consistencia se puede examinar con bastante facilidad. Todo lo que hay que hacer es comprobar si para circunstancias similares los dos estudios predicen efectos similares. En suma, el conocimiento de causa y efecto es esencial para una acción eficiente. Progreso hacia tal conocimiento es posible si se cumplen al menos dos condiciones: una. Los juicios de causa y efecto pueden respaldarse en cada estudio del efecto de un tratamiento y, b. A medida que se acumulan los estudios, se encuentra que sus hallazgos son consistentes. Sección 4. En esta sección examiné una serie de episodios importantes en los que los datos transversales se utilizaron para llegar a conclusiones causales. El primer episodio comienza con un artículo de Peltzman. Su punto de partida fue económico. teoría: la suposición de que las personas se comportan para equilibrar los costos y beneficios percibidos. Esto llevó él postulara que el beneficio de tener vehículos más seguros sería parcial o totalmente compensado por comportamiento de mayor riesgo ('compensación'). El siguiente paso fue reunir datos para probar este postulado. Los datos son siempre desordenado. Como no hay estadísticas sobre cómo se comporta la gente, tuvo que usar una variedad de sustitutos agregados; consumo de alcohol en todo el estado, velocidad promedio fuera de las horas pico en carreteras no interestatales carreteras, etc. Tampoco fue posible escribir fácilmente un con- junto de ecuaciones simultáneas en el espíritu de tradición econométrica, ecuaciones sobre, di- gamos, cómo el aumento de los ingresos afecta la cantidad de viajes, consumo de alcohol o speed; qué cantidad del viaje adicional se refleja en el uso de diferentes carreteras; cómo la
  • 81.
    velocidad es unafunción del tipo de camino y la cantidad de viaje, etc. Por lo tanto, sin ningún razón obvia, Peltzman escribió una función multiplicativa de todas las variables que pensó podría ser importante y para el cual se podrían encontrar datos, y procedió a estimar la incógnita pará- metros ¿Por qué debería ser posible captar la esencia de lo que es un fenómeno complejo tal procedimiento? Para una mente no instruida en la práctica econométrica, la priorización de las perspectivas de el éxito parecería mínimo. De hecho, las propias estimaciones de parámetros de Pelzman resultaron ser a menudo inconsistente y a veces peculiar. Cuando otros investigadores investigaron la misma pregunta, utilizando datos y procedimientos similares llegaron a conclusio- nes diversas. Y, sin embargo, había una incuestionable creencia de todos que las ecuaciones de regresión de este tipo pueden interpretarse en un modo de causa-efecto como un cosa normal; que los matices de los coeficientes de regresión pueden y deben asignarse a algunos mecanismo de causa y efecto; que es suficiente que estos mecanismos sean ampliamente plausibles en a la luz de las suposiciones que los economistas tienden a hacer, sin tener que ser separadamente 91 corroborado; que no es necesario considerar explicaciones plausibles alternativas y las rela- ciones correspondientes no necesitan estar representadas en el modelo. Esta fe en el poder de regresión no sólo para desarrollar una teoría cuando es correcta, sino también, hasta cierto punto, para corroborar que la corrección de la teoría misma fue sostenida por todos a pesar del hecho de que cada participante sabía que otros, utilizando la misma técnica, llegaron a diferentes conclusiones sobre el mismo pregunta y que muchos de sus coeficientes de regresión no eran consistentes con lo que otros tenían fundar. Tal fe y hábito no es lo que contribuye al progreso de la ciencia. El argumento y el contraargumento dieron lugar a las siguientes observaciones: 1. Es difícil com- probar los datos preparados para su uso en el análisis de regresión por otra persona. Por lo tanto, • Los resultados obtenidos por las regresiones rara vez (¿nunca?) se replican o verifican. Los autores tienden a recopilar sus propios datos y hay una prima en mostrar dónde se hizo una mejora en lo que otros han hecho y en el uso de avances recientes en estadística metodología. Por lo tanto, • Cada nuevo estudio tiende a diferir de estudios previos en detalles importantes (variables utilizadas, forma funcional elegida, estructura de error asumida, etc.). Esto dificulta la comparación. Las mismas razones (búsqueda de originalidad y avances estadísticos recientes) facilitan a los autores creer en sus propios hallazgos y descartar los hallazgos de otros. • En un entorno de investigación en el que ni los datos ni el método se comparan fácilmente, los resultados no son compatibles y no se pueden acumular, el progreso será lento. 2. Hay dos prototipos de modelos de regresión. Tipo A en el que la causalidad preexiste dentro la teoría asumida, como en Peltzman. La teoría especifica cuáles son las variables que provocan el cambio. y en qué dirección cambiará la variable dependiente como resultado de una manipulación. los La cuestión no es de causa sino de la magnitud del efecto. El modelado tipo B se ejemplifica me- diante el trabajo de Lave y Noland y todos los modelos a nivel de unidad en seguridad vial. Aquí uno no se fía en una teoría preexistente. Si bien uno puede anticipar la dirección en la que la explicación variable afectará a la variable dependiente, no se puede recurrir a una teoría rígida. los ecuación de regresión estimada, que produce resultados esperados y sorprendentes, a me- nudo se considera ser una representación de una realidad hasta ahora menos conocida; una
  • 82.
    indicación de unaposible causa y- estructura de efecto descubierta por medios que son de na- turaleza estadística. Si la teoría detrás del modelo de regresión tipo A fuera correcta, uno se sentiría atraído por usarla. cuando sea posible. El peligro es que si la teoría es débil, incompleta o incorrecta, entonces la investigación se dirigirá en direcciones demasiado estrechas y hacia resultados que son, quizás, falaz, incluso tonto. Las anteojeras de una supuesta teoría pueden ocultar al investigador la ver- dadera mundo que se refleja en los datos y puede impedir que la realidad brille, que sea revelado y descubierto. • Cuando la teoría es débil, incompleta o posiblemente incorrecta, podría ser más rentable cen- trarse en el modelado de tipo B, lo que permite que los datos guíen el descubrimiento. 92 Por otra parte, la ausencia de teoría que defina el enfoque B, lo priva de una clara criterio por el cual se puede hacer una atribución a la causa. Lo que uno ve son coeficientes de regresión. algunos de los cuales pueden estar de acuerdo con la intuición o la comprensión previa y otros que no. A coeficiente de regresión con un signo inesperado se puede explicar fácilmente como que no refleja un causa sino una variable al acecho, una interacción descuidada, algunos datos no disponibles, etc. Y aquí está la frotar: • Si uno debe dudar del significado de causa-efecto de un coeficiente de regresión inesperado, uno igualmente debe dudar del mensaje causal de un coeficiente de regresión con un signo esperado y por tanto de toda la empresa. 3. Para que la explicación y la comprensión sean posibles, se debe insistir en un principio simple. Eso requiere que • Cuando se aplica el mismo tipo de método al mismo tipo de datos, se debe llegar a conclusiones similares. Si esta condición no se cumple, si algunos pueden afirmar que sus datos muestran que un metal se expande cuando calienta mientras que otros pueden mantener que sus datos muestran que se encoge, entonces hay algo mal con los datos y/o el método. En conclusión, la saga de la “Reglamento de Seguridad Automovilística” es una historia de inten- tos sucesivos en el modelado econométrico multivariable de varios investigadores que no logra- ron responder la cuestión de qué reducción en las muertes de tráfico fue causada por la regula- ción de la seguridad del automóvil. La investigación no condujo a un consenso sobre la existencia y la magnitud del 'comportamiento compensatorio'; y no arrojó ecuaciones que permitan predecir qué cambio en las muertes se producirá por un cambio en variables como Velocidad, Alcohol, Ingresos, etc. Es como si algunos encontraran ese metal se expande cuando se calienta, mientras que otros llegaron a la conclu- sión de que se encoge, y todo el lío experimental se quedó en el piso del laboratorio, con todos publicando y creyendo sus propios resultados, y nadie pregunta si las medidas y el método utili- zado por todos son buenos. El segundo episodio comienza con un estudio de Lave , quien también lanzó un desafío para recibir sabiduría al afirmar que "la variación no mata la velocidad". Según el signo y la magnitud de su coeficientes de regresión, Lave argumentó que si uno reduce la velocidad promedio sin reducir la dispersión de velocidades, puede no haber reducción en la tasa de accidentes fatales. De nuevo un animado siguió el debate. Cada comentarista usó sus propios datos para sacar sus propias conclusiones, generalmente negando lo que Lave ha encontrado. Pero Lave se mantuvo recalcitrante diciendo (con razón) que los resultados por otros están equivocados, siendo un artefacto de agregación sobre diversas categorías viales. Agregación los artefactos y sesgos son ampliamente conocidos y descritos. Se puede demostrar que el propio Lave Las conclusiones
  • 83.
    están sujetas ala misma crítica con la que desacredita los hallazgos de otros. Está por lo tanto, es justo señalar que • La posibilidad de llegar a conclusiones erróneas suele estar presente en las prácticas no experimentales. trabajo, especialmente cuando los datos se agregan sobre una población de unidades en pro- medios, ocultando así el efecto de variables importantes. 93 En este episodio, todos los autores utilizaron datos transversales agregados en regresión lineal multivariable. Llegaron a diversas conclusiones. Como se señaló anteriormente, sería un buen augurio para la causalidad si diferentes investigadores llegaron a conclusiones similares; Por el contrario • No se puede considerar una afirmación de causalidad si los resultados de diferentes estudios sobre el mismo problema están por todas partes. A pesar de la obvia diversidad de hallazgos, cada uno de ellos hizo afirmaciones que son de naturaleza causal. los regresores. Como en el episodio de Peltzman, la facilidad con la que los regresores atribuyen significado de causa-efecto a sus resultados es asombroso. También es desconcertante la tendencia a tener confianza en el propio resultado. incluso si difiere de lo que otros encontraron usando medios similares. A pesar del evidente fra- caso de regresiones sucesivas para discernir lo que es correcto y lo que no, parece posible con- siderar resultados de la regresión como árbitro de la verdad incluso si, como en el caso de la velocidad y las lesiones, parecen volar en contra de la física newtoniana. En el tercer episodio revisado , Noland desafió la sabiduría recibida de que los caminos se cons- truyen para los estándares más altos son más seguros. Él también usó regresiones basadas en datos agregados para presentar su caso. A diferencia de las afirmaciones de Peltzman y Lave, que fueron debatidas públicamente por otros, las afirmaciones de Noland no fueron seguidos por una discusión abierta. Por lo tanto, el mérito de su argumento tenía que ser examinado a la luz de su propio trabajo. Usando datos para los estados de EE. UU., Noland encuentra, por ejemplo, que la variable 'carril- millas' generalmente tiene un coeficiente de regresión positivo. Sobre esta base, extrae la con- clusión causal de que “estos resultados tienden a sugerir que las millas de carril adicionales en realidad aumentan las muertes”. Él sigue esta lógica. Saltar por otro acto de fe diciendo que " la variable carril-milla sirve como un proxy para repre- sentar estas 'mejoras' en el diseño vial”. De esta manera, por la sola fuerza de voluntad, la esta- dística asociación entre carril-millas y muertes que existe en sus datos se transforma en la con- clusión causal de que la acción de construir caminos mejorados no reduce e incluso puede au- mentar las muertes. La pregunta que debemos hacernos es ¿por qué los estados con más millas de carril tienden a tener más muertes? Georgia es casi diez veces más grande que Nueva Jersey, tiene tres veces más millas de carril y el doble tantas muertes, pero ambos tienen aproximadamente la misma población. De dos estados con la misma población pero diferente en tamaño, el estado más grande tenderá a tener caminos más largos y también más muertes Pero el tamaño del estado no entraba en la ecuación de Noland. Tampoco el grado de urbanización, patrones de uso de la tierra, o muchas otras variables que pueden estar en la raíz de la asociación. Fuera de todo las
  • 84.
    posibles razones dela asociación entre lane-miles y fatalities Noland selecciona el que él lo favorece y lo imbuye de un significado causal que conduce a conclusiones políticas. Noland también ve en sus datos una asociación positiva entre el número de carreteras de varios carriles en un condado y el número de accidentes. Sobre esta base “ cuestiona la política de aumentar muchos carreteras de dos carriles a carreteras de cuatro carriles por razones de segu- ridad” . La razón por la que un condado tiene más carreteras de varios carriles que otra es que sus carreteras necesitan transportar más tráfico. Naturalmente, con más tráfico vienen más ac- cidentes. Dado que la cantidad de tráfico en un condado no está entre los variables utilizadas en la regresión de Noland, no hay forma de saber cuánto de la asociación se debe 94 al tráfico y cuánto debido a otras variables (como el número de carriles). Esto es de nuevo un clásico. instancia de una variable al acecho; causa se asigna incorrectamente a una variable que es visible y no a la verdadera causa acecha en el fondo. Una vez más sorprende la insoportable ligereza con que se establece una asociación estadística. convertidos en creencias causales y recomendaciones de política; por el vaivén misterioso que resultado de un análisis de regresión tiene sobre la mente. Señalé anteriormente que si diferentes estudios encuentran que los coeficientes de regresión del mismo variables están en todo el mapa, no se les debe atribuir un significado de causa-efecto. los circunstancia aquí es que no nos ocupamos de varios estudios realizados por diferentes in- vestigadores que utilizan datos diferentes; tenemos un estudio en el que se utilizó la misma base de datos en varios modelos. Noland basa su conclusión causal en cinco coeficientes de regresión para la variable carril-milla (0,36, 0,38, 0,43, -0,29 y -0,40) de cinco regresiones. Las estimaciones difieren porque en su regresiones, la variable del cinturón de seguridad se representó de forma variable, las variables representan los avances en medicina se incluyeron en algunos modelos pero no en otros, y por- que a veces catorce años de Se utilizaron datos y, a veces, siete. Si el valor de un coeficiente de regresión cambia sustancialmente a medida que se agregan nuevas variables a un modelo, esto es una señal de que el modelo no contenía todas las factores importantes que afectan el fenó- meno en cuestión. Si es así, uno no puede tener confianza en el valor numérico de tal coeficiente de regresión y no se le puede atribuir ningún significado. Un mínimo El requisito es que a medida que se agregan variables a un modelo, el cambio en las estimaciones previas coeficientes de regresión es pequeño. De este modo, • Si un coeficiente de regresión no alcanza lo que puede llamarse 'estabilidad bajo condiciones variables Además, la atribución de significado causal es prematura. Los coeficientes de regresión de Noland para carriles-millas en el modelo de accidentes fatales claramente no alcanzaron tal estabilidad. Noland destaca el punto importante de que el efecto de las mejoras de infraestructura en la se- guridad debe buscarse a nivel de todo el sistema; que las conclusiones obtenidas de proyecto por proyecto o sitio por- las evaluaciones de seguridad del sitio pueden (y lo hacen) inducir a error. La pregunta general es ¿por qué medios se puede investigar los efectos causales de las intervenciones en todo el sistema y a largo plazo. La pregunta específica aquí es si se puede hacer usando datos de panel de corte transversal para estimar los coeficientes de regresión de una sola ecuación modelo. Para responder a la pregunta general hay que reconocer que las mejoras viales provocarán cam- bios en cuándo, dónde, con qué frecuencia, por qué modo o rutas viaja la gente. Transportación los planificadores tienen un elaborado arsenal de herramientas para predecir tales cambios en
  • 85.
    los viajes entodo el sistema. La seguridad los analistas saben cómo cambia la seguridad de una carretera o intersección a medida que cambia el tráfico. Por lo tanto, la kit de herramientas del planificador y del analista de seguridad, cuando se utiliza en tándem, tal vez puede producir estimaciones de cambios en todo el sistema que reflejan cambios en la población, el uso de la tierra, la realización de viajes y red de transporte y su funcionamiento. Estas son las relaciones estructurales que necesitan representarse en un modelo si se espera vincular la causa y el efecto a nivel de todo el sistema. Para responder a la pregunta específica, debería ser obvio que uno no puede esperar capturar el complejidades antes mencionadas por una ecuación comodín, una ecuación la forma mate- mática de que se elige sin fundamento y en el que solo se representan variables fácilmente dis- ponibles. 95 Peltzman, Lave, sus comentaristas y Noland utilizan como datos promedios o totales para grandes conjuntos como un país, un estado o un condado. Estos son 'nivel de población' o Es- tudios "ecológicos". Los sesgos potenciales en los estudios ecológicos son bien conocidos. de- bido a la gran potencial de sesgo y error en tales estudios se ha acuñado la frase falacia ecológica y se utiliza en los libros de texto. La preocupación clave es que lo que parece cierto para el grupo (la 'población') puede no ser cierto para las unidades individuales de las que se compone el grupo. Así, por ejemplo, cuando Los comentaristas de Lave agregaron los datos de todas las clases de caminos en lugar de examinar el accidente de velocidad. relación por separado para cada clase de camino funcional (como hizo Lave) alcanzaron conclu- siones potencialmente incorrectas. Una ilustración dramática del sesgo de agregación es la llamada paradoja de Simpson de que se da un ejemplo real de seguridad vial en la Sección 4. Mientras que las franjas sonoras de la línea central se vieron para reducir los accidentes en cada estado, parecían aumentar los acci- dentes cuando el total de todos los estados era consideró. Este sorprendente pero completa- mente correcto resultado no tiene nada que ver con confundir, variables faltantes, elección inade- cuada de la forma funcional y otras fuentes comunes de sesgo. Está sólo el resultado (y por lo tanto uno de los peligros) de la agregación. Peltzman, Lave, sus comentaristas y Noland llegaron a conclusiones causales utilizando regre- siones sobre datos agregados. • Por las muchas razones discutidas, uno debe dudar de la validez de las conclusiones causales. alcanzado por Peltzman, Lave, sus comentaristas y Noland. De hecho, en estos históricos epi- sodios uno no puede encontrar apoyo para la posibilidad de que tales datos y métodos puedan ser utilizado de forma fiable para apoyar las creencias causales. Esto no significa que las regresiones que utilizan datos agregados no sean de utilidad. • Estudios de regresión de seguridad vial en los que la respuesta y las variables independientes son Los totales o promedios de conjuntos de unidades grandes y no homogéneos pueden ser útiles para estimular la investigación de conjeturas no examinadas hasta ahora o para generar hipótesis sobre posibles efectos imprevistos. Sin embargo, los hallazgos de tales estudios por sí solos no son base suficiente para los juicios de causa y efecto. ¿Pueden los estudios de regresión a nivel de unidad tener éxito cuando los estudios de re- gresión a nivel de población, estando sujetos a las dificultades de la agregación, han fallado? Para examinar los resultados de esta pregunta Se examinaron varios estudios que utilizan datos sobre segmentos de carretera homogéneos. Uno de esos estudios fue de Vogt y Bared. A partir
  • 86.
    de su análisisde regresión parecía, por ejemplo, que por lo demás idénticas caminos, los cami- nos con carriles más anchos tendían a tener menos accidentes en Minnesota pero más acciden- tes en Washington (ver Figura 19). Si alguien interpretara esto como una indicación de causa y efecto, sería significaría que se espera que ampliar un carril reduzca la frecuencia de accidentes en Minnesota, pero aumentarlo en Washington. Esta anomalía puede tener varias causas: a. Precisión de estimación limitada; b. Un funcional forma de la ecuación de regresión que no se ajusta a los datos; C. Una variable que se sabe que falta (si el arcén estaba pavimentado o no); d. La posibilidad de una diferencia real en el efecto de ancho de carril entre Washington y Minnesota; mi. O, como siempre es cierto, inexplicable, por razones 96 por qué algunos caminos tienen carriles de diez pies y otros tienen carriles de once o doce pies. volví a analizar los mismos mismos datos utilizando diferentes suposiciones de modelado y el resultado también se muestra en Figura 19. Figura 19. Comparación de resultados de V&B y Hauer La impresión es que los hallazgos no son lo suficientemente consistentes y no permiten anticipar cómo podría cambiar la seguridad como resultado de un cambio en el ancho del carril. vendría el tema descansar aquí si no fuera por los hallazgos de modelos de regresión adicionales (por Zegeer y por Hadi) que coinciden virtualmente con la línea 'V&B Combined' en la Figura 19. Parece entonces que, en este caso, • Hay un núcleo de congruencia entre los varios hallazgos y también una diversidad sustancial. Los modelos de regresión a nivel de unidad para carreteras de varios carriles son escasos. Por lo tanto uno no puede comparar los hallazgos de muchos modelos y evaluar la consistencia de los resultados. Sin embargo, todavía es posible examinar los hallazgos del mismo modelo a la luz de lo que se sabe o se espera. Hauer et al. usó datos sobre segmentos de carreteras urbanas de cuatro carriles sin dividir en Washington. Alguno los hallazgos fueron los esperados, mientras que otros fueron sorprenden- tes. Así, por ejemplo, inesperado es el hallazgo de que los accidentes disminuyen a medida que aumenta la proporción de camiones en el flujo de tráfico. Igualmente sorprendente es el resultado es que cuanto más alto es el límite de velocidad, menos son los accidentes. Si alguien atribuyera esto a causa y efecto, se llegaría a la conclusión de que, en este tipo de carretera, aumentar la velocidad límite en el rango de 30 a 50 mph reducirá los accidentes. Cuando un hallazgo no está de acuerdo con las expectativas, nos inclinamos a buscar causas y explicaciones fuera de la regresión, pero están felices de aceptar sin cuestionar lo que está en línea con nuestras creencias anteriores. No se debe permitir que esta predisposición psicológica oscurezca juicio. Claramente, uno no puede considerar los hallazgos que están de acuerdo con las expectativas como capturando un relación causal y, al mismo tiempo, considerar los hallazgos inesperados como no causales. La pregunta es esta: ¿Cuál de los muchos resultados obtenidos en una regresión refleja una causa-efecto? relación, y que reflejan meramente una asociación estadística cuyas razones pue- den ser ¿complejo? Esta pregunta no está siendo abordada por ninguna de las investigaciones de seguridad financiadas en curso. 97 programas Y, sin embargo, si no se resuelve, gran parte de la investigación actualmente fi- nanciada por la FHWA y NCHRP está en peligro de producir resultados inutilizables y potencial- mente dañinos. De momento mi opinión es esta: • Es posible que la estructura subyacente de causa-efecto de la ocurrencia del accidente fenómeno podría ser revelado a través de análisis de regresión a nivel
  • 87.
    de unidad desección transversal datos. Para lograr este objetivo, es necesario eliminar las prin- cipales fuentes de diversidad inexplicable. Si bien uno puede esperar que a través de futuras investigaciones cuidadosas, creativas y per- sistentes esto podría hacerse eventualmente, el historial discutido en esta sección y el concepto Las dificultades discutidas en la sección 3 no dan mucho lugar para el optimismo. El objetivo declarado del proyecto Vogt y Bared era estimar el accidente esperado frecuencia de un segmento de carretera en función de sus atributos. Aun así, los autores pensaron que la El modelo se puede utilizar para determinar cuántos accidentes se evitarán si se utilizan atributos como el carril. o el ancho de los hombros se cambian. Al hacerlo, siguen los pasos de muchos. De hecho, el La práctica de usar los resultados de la regresión para calcular los 'Factores de reducción de acci- dentes' es casi universal. Y, sin embargo, existe la antigua y elemental advertencia estadística de que "la correlación es no causalidad', existe el escepticismo científico generalizado acerca de la interpretación de la regresión ecuaciones como indicaciones de causa y efecto, existen todas las dificultades enumeradas en la Sección 3, y existe la amplia evidencia empírica apoyada por los muchos ejemplos revisados en meticuloso detalle en la Sección 4, a saber, que la cautela estadística está bien fundada y el escepticismo científico justificado. Y, sin embargo, la tradición econométrica en la investigación de la seguridad vial es incuestionable. disponibilidad para usar los resultados de regresiones basadas en datos transversales para pre- decir el efecto de manipulaciones. es mi opinion que • Los datos mejorados a nivel de unidad y la práctica de modelado podrían reducir la diversidad no explicada de los hallazgos aumentan así la confianza en algunas interpretaciones de causa-efecto. Sin embargo, en presente, la su- posición habitual e incuestionable de que las ecuaciones obtenidas por regresión son máquinas matemáticas que se pueden utilizar para calcular el efecto de las manipulaciones no es justifica- ble. Esto completa el resumen de los principales temas discutidos en las Secciones 1 a 4 y establece el escenario para extraer algunas conclusiones generales. 98 6. CONCLUSIONES La pregunta era si uno puede llegar a creencias causa-efecto justifica- bles sobre la base de datos observacionales de sección transversal, en particular cuando la he- rramienta de análisis elegida es multivariable regresión. La experiencia pasada indica una persistente falta de éxito. Los fracasos de los esfuerzos pasa- dos y sus raíces fueron ilustradas por la historia de varias investigaciones que utilizaron la regre- sión para dibujar conclusiones acerca de la causa y su efecto. El tema de estos episodios histó- ricos fue diverso: Estimar el efecto de seguridad de cambiar el dispositivo de advertencia en los pasos a nivel de una vía férrea; Preguntar sobre el efecto de seguridad de las normas de segu- ridad del automóvil; examinando al familiar importancia de la velocidad y su variación en la cau- salidad de accidentes; Preguntar si las mejoras viales reducir los choques; Investigar el efecto del ancho del carril en la frecuencia de accidentes; Modelando la seguridad de carreteras de varios carriles. Resultó que cuando diferentes investigadores examinaron la misma pregunta por con el mismo tipo de datos y método, se llegó a conclusiones diversas, incluso contradictorias. los la magnitud y el signo de los coeficientes de regresión fue inconsistente entre los estudios y, a menudo, incluso entre modelos usando los mismos datos. Los resultados en línea con las expectativas fueron aceptados como válidos y los contrarios a las expectativas explicados. Mi conclusión principal es que: • La consistencia de los resultados (efectos) es una piedra de toque importante para la causalidad. Si las regresiones basados en datos transversales
  • 88.
    observacionales no producenresultados consistentes, ya que actualmente, no se puede decir que capten una relación causal. Si uno no puede decir si se ha capturado una relación causal, los modelos de regresión no se pueden utilizar para predecir el efecto de seguridad de un cambio. La fuente de la dificultad es esta: cuando algo sobre una unidad ha cambiado, si hay fue una intervención o algún tratamiento (como en un estudio antes-después), entonces uno puede usar varios significa predecir cuál habría sido la respuesta de esa unidad si no hubiera habido ningún cambio. Se puede verificar empíricamente si la predicción es generalmente buena y cuándo para las unidades en las que un Se solicitó un cambio similar, pero aún no se implementó. Así, para la observación antes-después estudios es posible proporcionar una base empírica aceptable para las creencias de causa-efecto. En estudios que utilizan datos transversales no hay cambio, tra- tamiento o intervención; la comparación es entre unidades que tienen el atributo 'c' y otras uni- dades que tienen el atributo 't'. ahora uno tiene para mostrar que las unidades que tienen 'c' habrían respondido a 't' de la misma manera que las unidades se encontró que 't' lo hizo. Esto es difícil de hacer porque la razón habitual por la que una unidad tiene 'c' y otro tiene 't' es que difieren en atributos relevantes para la respuesta. No puedo pensar en un empírico forma de demostrar lo que hay que mostrar. Puede ser posible corregir los factores de confusión en los estudios que utilizan secciones trans- versales observacionales. datos. Para calcular la corrección se requiere el conocimiento de los atributos relevantes para la respuesta de todos unidades y el conocimiento de cómo la respuesta de cada unidad depende de estos atributos. Resulta que: • Si no hay datos sobre cuáles son los atributos de las unidades que se sabe que son relevantes para la respuesta con 'c' y las unidades con 't', incluidos los atributos que explican por qué una unidad tiene 'c' y otra 't', o si la función que vincula la respuesta a todos los atributos relevantes para la respuesta es no conocida, debe juzgarse que existe con- fusión. 99 También se puede intentar corregir la confusión comparando un modelo de regresión para unidades con 'c' y otro para unidades con 't'. • El atractivo de este enfoque es la conveniencia. Se supone que las variables en el modelo ser los atributos relevantes para la respuesta; se supone que la ecuación del modelo es la función vinculación de atributos a la respuesta. Las desventajas de este enfoque son que el No se puede suponer que las variables del modelo de regresión implican todos los principales o incluso atri- butos conocidos relevantes para la respuesta y que la ecuación del modelo, cuando no se basa en conocimiento acumulado por la investigación, no puede asumirse como la mejor función que vincula atributos a la respuesta. Existe una distinción importante entre los estudios a nivel de población y a nivel de unidad. En los datos de estudios a nivel de población son 'totales' y 'promedios' que son agregados sobre conjuntos de muchas unidades (p. ej., países, estados, condados); en los estudios a nivel de unidad, los datos son para unidades individuales (por ejemplo, un conductor, una intersección, un segmento de carretera). Además de las dificultades que aquejan a todos regresiones en datos transversales de observación, los estudios a nivel de población están sujetos a una problema adicional: cuando la agregación es sobre unidades que difieren en atributos relevantes para la respuesta, el La respuesta 'total' o 'promedio' puede diferir, incluso ser opuesta, a las respuestas de individuos unidades.
  • 89.
    • Peltzman, Lave,sus comentaristas y Noland utilizaron datos agregados a nivel de población datos. En estos episodios históricos no se encuentra apoyo para la posibilidad de que tales datos y los métodos se pueden usar de manera confiable para respaldar las creencias causales. • Vogt, Bared, Hauer, Zegeer, Hadi y muchos otros llevaron a cabo regresiones en cruz datos de sección a nivel de unidad. A menudo hay un núcleo de congruencia entre varios hallazgos y también una diversidad sustancial. Es posible que la estructura causa-efecto subyacente de el fenómeno de ocurrencia de accidentes podría ser revelado a través de una regresión a nivel de unidad análisis de datos transversales observacionales. Para lograr este objetivo, las principales fuentes de la diversidad actualmente inexplicable necesita ser eliminada. La señal del éxito será si el futuro los estudios arrojarán resultados similares. Si bien uno puede esperar que a través de cuidadosos, creativos y investigación futura persistente esto podría lograrse, el historial dis- cutido y el Las dificultades conceptuales revisadas no me dan mucho terreno para el optimismo. • En la actualidad, la suposición incuestionable que se hace habitualmente de que las ecuaciones obtenidas por Las regresiones en datos transversales observacionales son máquinas matemáti- cas que pueden ser utilizado para calcular el efecto de las manipulaciones no es justificable. Todo esto no debe interpretarse en el sentido de que las regresiones sobre datos transversales observacionales no sirven de nada; sus resultados pueden estimular la investigación de conjetu- ras no examinadas hasta ahora y para generar hipótesis sobre posibles efectos no previstos. En general, en la investigación sobre seguridad vial, el enfoque econométrico cuando se aplica a datos transversales de observación no fue un éxito. Una gran cantidad de esfuerzo no produjo resultados convincentes. Esto debería conducir a un nuevo examen de la estrategia general de investigación. Está 100 cierto que los datos de la sección transversal de observación deberían ser una fuente importante de seguridad vial conocimiento. En la medida en que la tradición eco- nométrica resultó inútil, las tradiciones alternativas y los enfoques deben ser examinados en busca de inspiración. El enfoque econométrico consiste en arrojar todos datos disponibles en la tolva del software de regresión y espero que el software desenredar la compleja red causal. Al parecer, esto no es fácil de hacer. Por lo tanto, uno podría intentar el enfoque alternativo que limita las muchas fuentes de variación, como es la tradición de epidemiología observacional. Espero que las personas de la persuasión econométrica y los encantados por el la sofisticación matemática y la elegancia en las que se basa el análisis de regresión moderno criticar enérgica- mente las opiniones expresadas aquí. Espero que las carencias que hay se revelará en el debate que seguramente seguirá. También espero que el documento y el debate ayudar a dirigir la in- vestigación sobre seguridad vial en direcciones rentables.
  • 90.
    REFERENCES 1. Box GEP(1966) Use and abuse of regression. Technometrics 8 (4):625-629. 2. Bunge M. 1979. Causality and modern science. New York: Dover Publications. 3. Cirillo JA. (1968) Interstate system accident research: study II, Public Roads 1968; 35(3): 71-75. Public Roads 35 (3):71-75. 4. Cohen BL (1994) In defence of ecologic studies for testing a linear-no threshold theory. American Journal of Epidemiology 139 (8):765-768. 5. Coleman J and Stewart GR (1976) Investigation of accident data for railroad-highway grade crossings. TRR 611:60-67. 6. Crandall RW and Graham JD (1984) Automobile safety regulation and offsetting behaviour: Some new empirical estimates. The American Economic Review 74 (2):328- 331. 7. Davis GA (2000) Accident reduction factors and causal inference in traffic safety studies: a review. Accid.Anal.& Prev. 32:95-109. 8. Davis GA (2002) Is the claim that 'variance kills' an ecological fallacy? Accid.Anal.& Prev. 34:343-346. 9. Davis GA (2004) Possible aggregation biases in road safety research and a mechanism approach to crash modeling. Accid.Anal.& Prev. 36 (6):1119-1127. 10. De Finetti B. 1974. Theory of probability: A critical introductory treatment. London: Wiley. 11. Durkheim E. 1897. Le suicide. Paris: F. Alcan. 12. Farmer CM (2003) Reliability of police-reported information for determining crash and injury severity. Traffic Injury Prevention 4:38-44. 13. Fowles R and Loeb P.D. (1989) Speeding, coordination and the 55-mph limit: comment. The American Economic Review 79 (4):916-921. 14. Fridstrøm L and Ingebrigtsen S (1991) An aggregate accident model based on pooled, regional time-series data. Accid.Anal.& Prev. 23 (5):363-378. 15. Gaudry M, Lasarre S. 2000. Structural road accident models.Elsevier. 16. Greenland S and Robins JM (1986) Identifiability, exchangeability, and epidemiological confounding. International Journal of Epidemiology 15:413-419. 102 17. Greenland S and Robins JM (1994a) Accepting the limits of ecologic studies. American Journal of Epidemiology 139 (8):769-771.
  • 91.
    18. Greenland Sand Robins JM (1994b) Invited commentary: Ecologic studies-biases, misconceptions, and counterexamples. American Journal of Epidemiology 139 (8):747- 760. 19. Greenland S, Robins JM, and Pearl J (1999) Confounding and collapsibility in causal inference. Statistical Science 14 (1):29-46. 20. Hadi MA et al (1995a) Estimating safety effects of cross-section design for various highway types using negative binomial regression. TRR 1500:169-177. 21. Hadi, M. A., Wattleworth, J. A., Aruldhas, J., Chow, L-F., and Gan, C-T. Relationship of highway design standards to accidents, injuries and fatalities. 1995b. 22. Harvey AC (1990) The econometric analysis of time series. Phillip Allan. 23. Harwood, D. W., Council, F., Hauer, E., Hughes, W., and Vogt, A. Prediction of the expected safety performance of rural two-lane highways. 2000. McLean, VA. 24. Hauer, E. Re-estimation of models for two-lane rural road segments. 2001. www.roadsafetyresearch.com. Ref Type: Report 25. Hauer E (1971) Accidents, overtaking and speed control. Accid.Anal.& Prev. 3:1-13. 26. Hauer E (1991) Should STOP YIELD? Matters of method. ITE Journal 69 (9):25-32. 27. Hauer E, Council FM, and Mohamedshah YM (2004) Safety models for urban four-lane univided road sagments. TRR. 28. Hausman J, Hall BH, and Griliches Z (1984) Econometric models for count data with an application to the patents-R&D relationship. Econometrica 52 (4):909-938. 29. Hitz, J. S. Rail highway crossings resource allocation procedure-User's guide. Second edition. 1986. 30. Hogarth, R. M. The challenge of representative design in psychology and economics. 2004. Universidad Pompeu Fabra. Working Paper 758. Ref Type: Report 31. Holland PW (1986) Statistics and causal inference. Journal of the American Statistical Association 81 (396):945-960. 32. Joksch HC (1976) Critique of Sam Peltzman's study. Accid.Anal.& Prev. 8:129-137. 103 33. Kelsey JL, Thompson WD, Evans AS. 1986. Methods in observational epidemiology. New York: Oxford University Press. 34. Kennedy P. 1992. A guide to econometrics. Cambridge, Mass.: MIT Press.
  • 92.
    35. Lau LJ(1986) Functional forms in econometric model building. Handbook of Econometrics, vol. Griliches, Z. and Intriligator, M.D.North-Holland. 36. Lave, C and A. The 55 mph speed limit: variance kills, not speed. Department of Ecoomics, University of California, Irvine. 37. Lave, C and Elias, P. Did the 65 mph speed limit save lives? 2002. Washington, D.C. 38. Levy DT and Asch P (1989) Speeding, coordination and the 55-mph limit: Comment. The American Economic Review 79 (4):913. 39. MacAvoy.P.W. (1976) The regulation of accidents. Auto safety regulation: The cure of the problem, vol. Manne,H.G.; Miller,R.L.Thomas Horton and Daughters. 40. Malinas, G. and Bigelow, J. Simpson's paradox. 2004. Ref Type: Internet Communication 41. Mengert, P. Rail-highway crossing hazard prediction research results. 1980. 42. Miaou, S-P. The relationship between truck accidents and geometric design of road sections: Poisson versus Negative Binomial regression. 1994. 43. Mohamedshah YM and Kohls AR, "Accident rates using HSIS," Public Roads, 1994, 44- 47. 44. Nelson RR (1976) Comments on Peltzman's paper on automobile safety regulation. The regulation of accidents, vol. Manne,H.G.; Miller,R.L.Thomas Horton and Daughters. 45. Newton-Smith WH. 1981. The rationality of science. London and New York: Routledge & Kegan Paul. 46. Neyman J (1923) On the application of probability theory to agricultural experiments. Essay on Principles. Section 9. Statistical Science 5:463-472. 47. Ng, J. C. N. and Hauer, E. Accidents on rural two lane roads:differences between seven states. 1989. 48. Noland RB (2003) Traffic fatalities and injuries: the effect of changes in infrastructure and other trends. Accid.Anal.& Prev. 35:599-611. 104 49. Noland, R. B. and Karlaftis, M. G. Policy recommendations for accident models: Are the results specification-sensitive. Annual Meeting CD-ROM. 2004. Washington, D.C. TRB 2004 Annual Meeting. 50. Noland RB and Oh L. (2004) The effect of infrastructure and demographic change on traffic-related fatalities and crashes: a case study of Illinois county-level data. Accid.Anal.& Prev. 36:525-532.
  • 93.
    51. Park Y-Jand Saccomanno, F. F. Collision frequency analysis using tree-based stratification. Compendium of papers CD-ROM. 2005a. Washington, D.C. 84th Annual Meeting of the Transportation Research Board. 52. Park Y-J and Saccomanno, F. F. Evaluating factors affecting safety at highway-railway grade crossings. Compendium of papers CD-ROM. 2005b. Washington, D.C. 84th Annual Meeting of the Transportation Research Board. 53. Pearl J. 2000. Causality. Cambridge: Cambridge University Press. 54. Peltzman S (1977) A reply to Robertson. Journal of Economic Issues 11:672-678. 55. Peltzman S (1975) The effects of automobile safety regulation. The Journal of Political Economy 83 (4):677-726. 56. Peltzman S (1976) The effects of automobile safety regulation. Accid.Anal.& Prev. 8:139- 142. 57. Persaud, B. N., Retting, R., and lyon, C. Crash reduction following installation of centerline rumble strips on rural two-lane roads. 2003. Insurance Institute for Highway Safety. 58. Piantadosi S (1994) Invited commentary: Ecologic biases. American Journal of Epidemiology 139 (8):761-764. 59. Robertson LS (1977) A critical analysis of Peltzman's 'The Effects of Automobile Safety Regulation'. Journal of Economic Issues 11:587-600. 60. Rodriquez RJ (1990) Speed, speed dispersion and the highway fatality rate. Southern Economic Journal 57 (2):349-356. 61. Rosenbaum P.R. 1985. Observational studies. New York: Springer Verlag. 62. Rubin DB (1974) Estimating causal effects of treatments in randomized and nonrandomized studies. Journal of Educational Psychology 66 (5):688-701. 105 63. Rubin DB (1977) Assignment of treatment group on the basis of a covariate. Journal of Educational Statistics 2:1-26. 64. Rubin DB (1978) Bayesian inference for causal effects: the role of randomization. The annals of statistics 6 (1):34-58. 65. Rubin DB (1980) Discussion of "Randomization analysis of experimental data:The Fisher randomization test. BY D. Basu.". Journal of the American Statistical Association 75:591-593. 66. Rubin DB (1990) Formal modes of statistical inference for causal effects. Journal of
  • 94.
    Statistical Planning andInference 25:279-292. 67. Saccomanno, F. F and Lai, X. Model for evaluating counter-measures at highway-railway grage crossings. Compendium of papers CD-ROM. 2005. Washington, D.C. 84th Annual Meeting of the Transportation Research Board. 68. Selvin HC (1958) Durkheim's suicide and problems of empirical research. American Journal of Sociology 63:607-619. 69. Snyder D (1989) Speeding, coordination and the 55-mph limit: Comment. The American Economic Review 79 (4):922-925. 70. Sobel, R. S. and Nesbit, T. M. Automobile safety regulation and the incentive to drive recklessly:Evidence from NASCAR. 2003. Department of Economics, West Virginia University. 71. Solomon, D. Accidents on main rural highways related to speed, driver, and vehicle. 1964. 72. Surgeon General of the United States. Smoking and Health. 1964. US. Government Printing Office. 73. Tarko, A. P., Eranky, S., and Sinha K.S. Methodological considerations in the development and use of crash reduction factors. Preprint CD. 2004. 77th Annual Meeting of the Transporation Research Board. 74. Vogt A and Bared J (1998a) Accident models for two-lane rural segments and intersections. TRR 1635:18-29. 75. Vogt, A. and Bared, J. Accident models for two-lane rural segments and intersections. 1998b. McLean, VA. 76. Zegeer, C. V., Reinfurt, D., Hummer, J., Herf, L., and Hunter, W. Safety effects of crosssec- tion desing for two-lane roads. I. 1987. 106 77. Zegeer CV et al (198) Safety effects of cross-section desing for two-lane roads. TRR 1195:20-32.
  • 95.
    101 REFERENCIAS 1.Recuadro GEP (1966) Uso y abuso de la regresión. Tecnometría 8 (4):625-629. 2. Bunge M. 1979. Causalidad y ciencia moderna. Nueva York: Publicaciones de Dover. 3. Cirillo JA. (1968) Investigación de accidentes del sistema interestatal: estudio II, Public Roads 1968; 35(3): 71-75. Vía Pública 35 (3):71-75. 4. Cohen BL (1994) En defensa de los estudios ecológicos para probar una teoría lineal sin um- bral. Diario americano de epidemiología 139 (8): 765-768. 5. Coleman J y Stewart GR (1976) Investigación de datos de accidentes para ferrocarril-carretera pasos a nivel. TRR 611:60-67. 6. Crandall RW y Graham JD (1984) Regulación y compensación de la seguridad del automóvil comportamiento: algunas nuevas estimaciones empíricas. The American Economic Review 74 (2): 328- 331. 7. Davis GA (2000) Factores de reducción de accidentes e inferencia causal en estudios de se- guridad vial: una revisión. Acid.Anal.& Prev. 32:95-109. 8. Davis GA (2002) ¿Es la afirmación de que 'la variación mata' una falacia ecológica? Ácido.Anal.& Anterior 34:343-346. 9. Davis GA (2004) Posibles sesgos de agregación en la investigación de seguridad vial y un mecanismo enfoque del modelado de choques. Acid.Anal.& Prev. 36 (6):1119-1127. 10. De Finetti B. 1974. Teoría de la probabilidad: un tratamiento introductorio crítico. Londres: Wiley. 11. Durkheim E. 1897. Le suicide. París: F. Alcan. 12. Farmer CM (2003) Confiabilidad de la información reportada por la policía para determinar accidentes y gravedad de la lesión. Prevención de Lesiones de Tránsito 4:38-44. 13. Fowles R y Loeb PD (1989) Exceso de velocidad, coordinación y el límite de 55 mph: comen- tario. The American Economic Review 79 (4): 916-921. 14. Fridstrøm L e Ingebrigtsen S (1991) Un modelo agregado de accidentes basado en datos agrupados, datos de series temporales regionales. Acid.Anal.& Prev. 23 (5):363-378. 15. Gaudry M, Lasarre S. 2000. Modelos estructurales de accidentes viales. Elsevier. 16. Greenland S y Robins JM (1986) Identificabilidad, intercambiabilidad y datos epidemiológicos confuso Revista Internacional de Epidemiología 15:413-419. 102 17. Greenland S y Robins JM (1994a) Aceptando los límites de los estudios ecológicos. Americano Revista de Epidemiología 139 (8): 769-771. 18. Greenland S y Robins JM (1994b) Comentario invitado: estudios ecológicos: sesgos, con- ceptos erróneos y contraejemplos. Revista americana de epidemiología 139 (8): 747- 760. 19. Greenland S, Robins JM y Pearl J (1999) Confusión y colapsabilidad en causas inferencia. Ciencia Estadística 14 (1):29-46. 20. Hadi MA et al (1995a) Estimación de los efectos de seguridad del diseño de sección trans- versal para varios tipos de carreteras usando regresión binomial negativa. TRR 1500: 169-177.
  • 96.
    21. Hadi, MA,Wattleworth, JA, Aruldhas, J., Chow, LF. y Gan, CT. Relación de normas de diseño de carreteras para accidentes, lesiones y muertes. 1995b. 22. Harvey AC (1990) El análisis econométrico de series de tiempo. Felipe Allan. 23. Harwood, DW, Council, F., Hauer, E., Hughes, W. y Vogt, A. Prediction of the Desempeño de seguridad esperado de las carreteras rurales de dos carriles. 2000. McLean, VA. 24. Hauer, E. Reestimación de modelos para segmentos de carreteras rurales de dos carriles. 2001. www.roadsafetyresearch.com . Tipo de referencia: Informe 25. Hauer E (1971) Accidentes, adelantamientos y control de veloci- dad. Acid.Anal.& Prev. 3:1-13. 26. Hauer E (1991) ¿Debería DEJAR DE RENDIR? Cuestiones de método. Revista ITE 69 (9): 25-32. 27. Hauer E, Council FM y Mohamedshah YM (2004) Safety models for urban four-lane segmen- tos de carretera univididos. TRR . 28. Hausman J, Hall BH y Griliches Z (1984) Modelos econométricos para datos de conteo con un aplicación a la relación patentes-I+D. Econométrica 52 (4):909-938. 29. Hitz, JS Procedimiento de asignación de recursos de cruces de autopistas ferroviarias: guía del usuario. Segundo edición. 1986. 30. Hogarth, RM El desafío del diseño representativo en psicología y economía. 2004. Universidad Pompeu Fabra. Documento de Trabajo 758. Tipo de referencia: Informe 31. Holland PW (1986) Estadística e inferencia causal. Diario de la Estadística Americana Asociación 81 (396):945-960. 32. Joksch HC (1976) Crítica del estudio de Sam Peltzman. Acid.Anal.& Prev. 8:129-137. 103 33. Kelsey JL, Thompson WD, Evans AS. 1986. Métodos en epidemiología observacional. Nueva York: Oxford University Press. 34. Kennedy P. 1992. Una guía de econometría. Cambridge, Mass.: MIT Press. 35. Lau LJ (1986) Formas funcionales en la construcción de modelos econométricos. manual de Econometría, vol. Griliches, Z. e Intriligator, MD North-Holland. 36. Lave, C y A. El límite de velocidad de 55 mph: la variación mata, no la velocidad. Departa- mento de Economía, Universidad de California, Irvine. 37. Lave, C y Elias, P. ¿Salvó vidas el límite de velocidad de 65 mph? 2002. Washington, DC 38. Levy DT y Asch P (1989) Exceso de velocidad, coordinación y el límite de 55 mph: Comentario. los Revisión económica estadounidense 79 (4): 913. 39. MacAvoy.PW (1976) La regulación de los accidentes. Regulación de seguridad automotriz: La cura de el problema, vol. Manne, HG; Miller, RL Thomas Horton e hijas. 40. Malinas, G. y Bigelow, J. La paradoja de Simpson. 2004. Tipo de referencia: comunicación por Internet 41. Mengert, P. Resultados de la investigación de predicción de peligros de cruce de carreteras y trenes. 1980. 42. Miaou, ESP. La relación entre los accidentes de camiones y el diseño geométrico de la ca- rretera. secciones: Poisson versus regresión binomial negativa. 1994.
  • 97.
    43. Mohamedshah YMy Kohls AR, "Tasas de accidentes usando HSIS", Public Roads , 1994, 44- 47. 44. Nelson RR (1976) Comentarios sobre el artículo de Peltzman sobre la regulación de la segu- ridad del automóvil. los reglamento de accidentes, vol. Manne, HG; Miller, RL Thomas Horton e hijas. 45. Newton-Smith WH. 1981. La racionalidad de la ciencia. Londres y Nueva York: Routledge y Kegan Paul. 46. Neyman J (1923) Sobre la aplicación de la teoría de la probabilidad a los experimentos agrí- colas. Ensayo sobre los principios. Sección 9. Ciencia Estadística 5:463-472. 47. Ng, JCN y Hauer, E. Accidentes en caminos rurales de dos carriles: diferencias entre siete estados 1989. 48. Noland RB (2003) Muertes y lesiones por accidentes de tránsito: el efecto de los cambios en la infraestructura y otras tendencias. Acid.Anal.& Prev. 35:599-611. 104 49. Noland, RB y Karlaftis, MG Recomendaciones de políticas para modelos de accidentes: ¿Están los resultados sensibles a la especificación. CD-ROM de la Reunión Anual. 2004. Wa- shington, D.C. TRB Reunión Anual 2004. 50. Noland RB y Oh L. (2004) El efecto de la infraestructura y el cambio demográfico en Muertes y choques relacionados con el tráfico: un estudio de caso de datos a nivel de condado de Illinois. Acid.Anal.& Prev. 36:525-532. 51. Park YJ and Saccomanno, FF Análisis de frecuencia de colisión utilizando estratificación. Compendio de trabajos CD-ROM. 2005a. Washington, DC 84.º anual Reunión de la Junta de Investigación del Transporte. 52. Park YJ and Saccomanno, FF Evaluación de los factores que afectan la seguridad en la autopista-ferrocarril pasos a nivel. Compendio de trabajos CD-ROM. 2005b. Washington, D.C. 84 Reunión Anual de la Junta de Investigación de Transporte. 53. Pearl J. 2000. Causalidad. Cambridge: Prensa de la Universidad de Cambridge. 54. Peltzman S (1977) Una respuesta a Robertson. Revista de Asuntos Económicos 11:672-678. 55. Peltzman S (1975) Los efectos de la regulación de la seguridad del automóvil. El diario de política Economía 83 (4):677-726. 56. Peltzman S (1976) Los efectos de la regulación de la seguridad del automóvil. Acid.Anal.& Prev. 8:139- 142. 57. Persaud, BN, Retting, R. y lyon, C. Reducción de accidentes después de la instalación de franjas sonoras centrales en caminos rurales de dos carriles. 2003. Instituto de Seguros de Ca- rreteras La seguridad. 58. Piantadosi S (1994) Comentario invitado: Sesgos ecológicos. revista americana de Epide- miología 139 (8):761-764. 59. Robertson LS (1977) Un análisis crítico de 'The Effects of Automobile Safety' de Peltzman Regulación'. Revista de Asuntos Económicos 11:587-600. 60. Rodríguez RJ (1990) Velocidad, dispersión de la velocidad y tasa de fatalidad en las carrete- ras. Meridional Revista Económica 57 (2): 349-356. 61. Rosenbaum PR 1985. Estudios observacionales. Nueva York: Springer Verlag.
  • 98.
    62. Rubin DB(1974) Estimación de los efectos causales de los tratamientos en estudios aleato- rizados y estudios no aleatorizados. Revista de Psicología Educativa 66 (5): 688-701. 105 63. Rubin DB (1977) Assignment of treatment group on the basis of a covariate. Journal of Educational Statistics 2:1-26. 64. Rubin DB (1978) Bayesian inference for causal effects: the role of randomization. The annals of statistics 6 (1):34-58. 65. Rubin DB (1980) Discussion of "Randomization analysis of experimental data:The Fisher randomization test. BY D. Basu.". Journal of the American Statistical Association 75:591-593. 66. Rubin DB (1990) Formal modes of statistical inference for causal effects. Journal of Statistical Planning and Inference 25:279-292. 67. Saccomanno, F. F and Lai, X. Model for evaluating counter-measures at highway-railway grage crossings. Compendium of papers CD-ROM. 2005. Washington, D.C. 84th Annual Meeting of the Transportation Research Board. 68. Selvin HC (1958) Durkheim's suicide and problems of empirical research. American Journal of Sociology 63:607-619. 69. Snyder D (1989) Speeding, coordination and the 55-mph limit: Comment. The American Economic Review 79 (4):922-925. 70. Sobel, R. S. and Nesbit, T. M. Automobile safety regulation and the incentive to drive recklessly:Evidence from NASCAR. 2003. Department of Economics, West Virginia University. 71. Solomon, D. Accidents on main rural highways related to speed, driver, and vehicle. 1964. 72. Surgeon General of the United States. Smoking and Health. 1964. US. Government Printing Office. 73. Tarko, A. P., Eranky, S., and Sinha K.S. Methodological considerations in the development and use of crash reduction factors. Preprint CD. 2004. 77th Annual Meeting of the Transporation Research Board. 74. Vogt A and Bared J (1998a) Accident models for two-lane rural segments and intersections. TRR 1635:18-29. 75. Vogt, A. and Bared, J. Accident models for two-lane rural segments and intersections. 1998b. McLean, VA. 76. Zegeer, C. V., Reinfurt, D., Hummer, J., Herf, L., and Hunter, W. Safety effects of crosssection desing for two-lane roads. I. 1987. 106 77. Zegeer CV et al (198) Safety effects of cross-section desing for two-lane roads. TRR
  • 99.