SlideShare una empresa de Scribd logo
1 de 21
La evolución de la cooperaciónRobert Axelrod, 1984 Presentación para Microeconomía 2 Maestría en Economía Universidad ORT Uruguay 2011
El Torneo Axelrod convoca a varios conocedores de teoría de juegos de diversas áreas del conocimiento Cada uno debe presentar una estrategia para participar en un torneo computarizado del dilema del prisionero iterativo. Cada estrategia se enfrentará contra todas las demás estrategias, contra si misma y contra una estrategia llamada “azar” Cada enfrentamiento consiste de 200 jugadas Se presentan 14 participantes de 5 disciplinas diferentes El objetivo es maximizar las ganancias totales, no los “mano a mano” ganados
El Juego Condiciones Generales: T > R > P > S R > (T+S)/2
Resultados
TIT FOR TAT Fue la estrategia ganadora de la primera ronda Consiste en comenzar cooperando y a partir de la segunda jugada, hacer lo mismo que hizo el oponente en la jugada anterior Observaciónes:  Es imposible ganar una partida individual con esta estrategia. El maximo puntaje que puede obtener en una ronda es R*n (600 en el caso de este torneo), que es el resultado de la mutua cooperación en todas las jugadas
Análisis de los resultados El autor se pregunta: Hay alguna característica de las estrategias que tenga correlación con los resultados? Las reglas “decentes” quedaron en los primeros 8 lugares y las reglas “no decentes” obtuvieron las últimas colocaciones Definición: Decimos que una regla es decente si nunca es la primera en engañar Si el final del juego es conocido, podemos incluir dentro de las reglas decentes a las reglas que no son las primeras en engañar antes de las últimas jugadas La diferencia fue tan grande, que las reglas decentes puntuaron entre 472 y 504 mientras que la regla no decente que obtuvo mayor puntaje obtuvo 401
Análisis de los resultados Observaciones: Las reglas decentes prosperaron porque había un número suficientemente grande de ellas Dentro de las reglas decentes, las 2 que mejor puntuaron fueron las más indulgentes Ex-post, se pueden encontrar reglas que mejoren el resultado de TIT FOR TAT (Downing - 542, TIT FOR 2 TATS - 532, PROSPECTIVA - 520)
Segunda Ronda Para poder obtener mejores conclusiones, Axelrod organizó un segundo torneo. Se presentaron 62 participantes. Se dieron a conocer previamente los resultados del primer torneo, así como las principales conclusiones. Se modificó el problema del horizonte conocido de la ronda anterior, ya que la duración del juego se determinaba probabilísticamente (p=0,00346 ; w=1-p)
Resultados Nuevamente ganó TIT FOR TAT De las 15 primeras, 14 eran decentes De las 15 últimas,  14 eran no decentes La correlación entre decencia y puntaje fue 0,58 Otras dos características exitosas fueron la “provocabilidad” y la indulgencia.
Robustez de TIT FOR TAT Se probó la estrategia en 6 torneos hipotéticos diferentes. Ganó 5 y quedó 2da en el restante Se utilizó también un enfoque evolutivo: Se repite el torneo indefinidamente En cada ronda, la proporción de participantes con cada estrategia depende del puntaje que haya obtenido dicha estrategia TIT FOR TAT es nuevamente la “ganadora” ya que es la que más crece
Proposiciones Teóricas Proposición 1: Si la tasa de descuento es lo suficientemente grande, no existe una estrategia óptima que sea independiente de las aplicadas por los demás jugadores
Proposiciones Teóricas Def:  Decimos que la estrategia A invade a la estrategia B si en un mundo donde todos juegan B y un solo individuo juega A, La estrategia A obtiene en promedio mejores resultados Def:  Una estrategia es colectivamente estable si no puede ser invadida por ninguna estrategia. Proposición 2: TIT FOR TAT es colectivamente estable sii w≥ max {(T-R)/(T-P) ; (T-R)/(R-I)}
Proposiciones Teóricas Dem: TIT FOR TAT juega de acuerdo a lo que el oponente haya jugado la jugada anterior (y asume en la primera jugada que el oponente cooperó en -1) Cualquier estrategia que juegue contra TFT, después de jugar C, lo mejor que puede hacer es jugar C o D; y lo mejor que puede hacer luego de jugar D es jugar C o D. De esta forma, quedan determinadas las 4 posibles estrategias óptimas contra TFT. Jugar repetidamente CC, CD, DC o DD CD está dominada por CC y CC a su vez obtiene los mismos resultados que TFT por lo tanto no puede invadirla. Si ni DD ni DC pueden invadir a TFT, entonces ninguna estrategia puede hacerlo.
Proposiciones Teóricas Dem: DD no invade a TFT sii V(DD|TFT) ≤ V(TFT|TFT) -> T+wP/(1-w) ≤ R/(1-w) -> w ≥ (T-R)/(T-P) DC no invade a TFT sii V(DC|TFT) ≤ V(TFT|TFT) ->(T+wI)/(1-w2) ≤ R/(1-w) -> w ≥ (T-R)/(R-I)
Proposiciones Teóricas Proposición 3: Si w es lo suficientemente grande, cualquier estrategia A que pueda ser la primera en cooperar puede ser colectivamente estable. Dem:  Si A coopera en la primera jugada: V(SD|A) ≥ T + wP/(1-w) V(A|A) ≤ R/(1-w) Si T + wP/(1-w)≥ R/(1-w) -> V(SD|A) ≥ V(A|A) (T-R)/(T-P) ≥ w -> V(SD|A) ≥ V(A|A)
Proposiciones Teóricas Proposición 4: Para que una estrategia decente sea colectivamente estable, es necesario que sea provocada por la primera defección del otro jugador. Dem: Si una estrategia decente no es provocada por una defección en la jugada n, puede ser invadida por una estrategia que coopere siempre y engañe en la jugada n
Proposiciones Teóricas Proposición 5: La estrategia SD es colectivamente estable siempre. Dem: V(X|SD)≤ P/(1-w) para toda X V(SD|SD) = P/(1-w) 	-> V(X|SD) ≤ V(SD|SD) para toda X
Proposiciones Teóricas Def: Una estrategia es maximalmente discriminante si puede cooperar alguna vez aunque el otro no haya cooperado nunca hasta entonces, si una vez que coopera, nunca vuelve a cooperar con SD pero coopera siempre con si misma Proposición 6: Las estrategias capaces de invadir a SD en clusters de mínimo valor de p son maximalmente discriminantes
Proposiciones Teóricas Dem: Para que un cluster de A logre invadir a SD debe ocurrir que pV(A|A) + (1-p)V(A|SD) > V(SD|SD) -> p > [V(SD|SD)-V(A|SD)]/[V(A|A)-V(A|SD)] p es mínimo cuando V(A|A) y V(A|SD) son máximos -> p es mínimo si A es maximalmentediscriminante
Proposiciones Teóricas Proposición 7: Si una estrategia decente es colectivamente estable, entonces no puede ser invadida por ningún cluster. Dem: Para que un cluster de A pueda invadir a una regla decente B, tiene que darse que pV(A|A) + (1-p)V(A|B) > V(B|B) Pero como B es decente, V(A|A)≤ V(B|B) para todo A -> Un cluster de A puede invadir a B sii V(A|B) > V(B|B) Pero eso equivale a que B no es colectivamente estable

Más contenido relacionado

Destacado

Destacado (7)

What Makes Great Infographics
What Makes Great InfographicsWhat Makes Great Infographics
What Makes Great Infographics
 
Masters of SlideShare
Masters of SlideShareMasters of SlideShare
Masters of SlideShare
 
STOP! VIEW THIS! 10-Step Checklist When Uploading to Slideshare
STOP! VIEW THIS! 10-Step Checklist When Uploading to SlideshareSTOP! VIEW THIS! 10-Step Checklist When Uploading to Slideshare
STOP! VIEW THIS! 10-Step Checklist When Uploading to Slideshare
 
You Suck At PowerPoint!
You Suck At PowerPoint!You Suck At PowerPoint!
You Suck At PowerPoint!
 
10 Ways to Win at SlideShare SEO & Presentation Optimization
10 Ways to Win at SlideShare SEO & Presentation Optimization10 Ways to Win at SlideShare SEO & Presentation Optimization
10 Ways to Win at SlideShare SEO & Presentation Optimization
 
How To Get More From SlideShare - Super-Simple Tips For Content Marketing
How To Get More From SlideShare - Super-Simple Tips For Content MarketingHow To Get More From SlideShare - Super-Simple Tips For Content Marketing
How To Get More From SlideShare - Super-Simple Tips For Content Marketing
 
How to Make Awesome SlideShares: Tips & Tricks
How to Make Awesome SlideShares: Tips & TricksHow to Make Awesome SlideShares: Tips & Tricks
How to Make Awesome SlideShares: Tips & Tricks
 

Último

PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdfPROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
EduardoJosVargasCama1
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Fernando Solis
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
jlorentemartos
 

Último (20)

TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPCTRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
 
Actividades para el 11 de Mayo día del himno.docx
Actividades para el 11 de Mayo día del himno.docxActividades para el 11 de Mayo día del himno.docx
Actividades para el 11 de Mayo día del himno.docx
 
Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdfPROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
PROPUESTA COMERCIAL SENA ETAPA 2 ACTIVIDAD 3.pdf
 
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN PARÍS. Por JAVIER SOL...
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN  PARÍS. Por JAVIER SOL...ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN  PARÍS. Por JAVIER SOL...
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN PARÍS. Por JAVIER SOL...
 
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLAACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
 
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
 
Louis Jean François Lagrenée. Erotismo y sensualidad. El erotismo en la Hist...
Louis Jean François Lagrenée.  Erotismo y sensualidad. El erotismo en la Hist...Louis Jean François Lagrenée.  Erotismo y sensualidad. El erotismo en la Hist...
Louis Jean François Lagrenée. Erotismo y sensualidad. El erotismo en la Hist...
 
Tema 11. Dinámica de la hidrosfera 2024
Tema 11.  Dinámica de la hidrosfera 2024Tema 11.  Dinámica de la hidrosfera 2024
Tema 11. Dinámica de la hidrosfera 2024
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
Usos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicasUsos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicas
 
Lecciones 06 Esc. Sabática. Los dos testigos
Lecciones 06 Esc. Sabática. Los dos testigosLecciones 06 Esc. Sabática. Los dos testigos
Lecciones 06 Esc. Sabática. Los dos testigos
 
Desarrollo y Aplicación de la Administración por Valores
Desarrollo y Aplicación de la Administración por ValoresDesarrollo y Aplicación de la Administración por Valores
Desarrollo y Aplicación de la Administración por Valores
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
PP_Comunicacion en Salud: Objetivación de signos y síntomas
PP_Comunicacion en Salud: Objetivación de signos y síntomasPP_Comunicacion en Salud: Objetivación de signos y síntomas
PP_Comunicacion en Salud: Objetivación de signos y síntomas
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
 

La evolución de la cooperación

  • 1. La evolución de la cooperaciónRobert Axelrod, 1984 Presentación para Microeconomía 2 Maestría en Economía Universidad ORT Uruguay 2011
  • 2. El Torneo Axelrod convoca a varios conocedores de teoría de juegos de diversas áreas del conocimiento Cada uno debe presentar una estrategia para participar en un torneo computarizado del dilema del prisionero iterativo. Cada estrategia se enfrentará contra todas las demás estrategias, contra si misma y contra una estrategia llamada “azar” Cada enfrentamiento consiste de 200 jugadas Se presentan 14 participantes de 5 disciplinas diferentes El objetivo es maximizar las ganancias totales, no los “mano a mano” ganados
  • 3. El Juego Condiciones Generales: T > R > P > S R > (T+S)/2
  • 5. TIT FOR TAT Fue la estrategia ganadora de la primera ronda Consiste en comenzar cooperando y a partir de la segunda jugada, hacer lo mismo que hizo el oponente en la jugada anterior Observaciónes: Es imposible ganar una partida individual con esta estrategia. El maximo puntaje que puede obtener en una ronda es R*n (600 en el caso de este torneo), que es el resultado de la mutua cooperación en todas las jugadas
  • 6. Análisis de los resultados El autor se pregunta: Hay alguna característica de las estrategias que tenga correlación con los resultados? Las reglas “decentes” quedaron en los primeros 8 lugares y las reglas “no decentes” obtuvieron las últimas colocaciones Definición: Decimos que una regla es decente si nunca es la primera en engañar Si el final del juego es conocido, podemos incluir dentro de las reglas decentes a las reglas que no son las primeras en engañar antes de las últimas jugadas La diferencia fue tan grande, que las reglas decentes puntuaron entre 472 y 504 mientras que la regla no decente que obtuvo mayor puntaje obtuvo 401
  • 7. Análisis de los resultados Observaciones: Las reglas decentes prosperaron porque había un número suficientemente grande de ellas Dentro de las reglas decentes, las 2 que mejor puntuaron fueron las más indulgentes Ex-post, se pueden encontrar reglas que mejoren el resultado de TIT FOR TAT (Downing - 542, TIT FOR 2 TATS - 532, PROSPECTIVA - 520)
  • 8. Segunda Ronda Para poder obtener mejores conclusiones, Axelrod organizó un segundo torneo. Se presentaron 62 participantes. Se dieron a conocer previamente los resultados del primer torneo, así como las principales conclusiones. Se modificó el problema del horizonte conocido de la ronda anterior, ya que la duración del juego se determinaba probabilísticamente (p=0,00346 ; w=1-p)
  • 9. Resultados Nuevamente ganó TIT FOR TAT De las 15 primeras, 14 eran decentes De las 15 últimas, 14 eran no decentes La correlación entre decencia y puntaje fue 0,58 Otras dos características exitosas fueron la “provocabilidad” y la indulgencia.
  • 10. Robustez de TIT FOR TAT Se probó la estrategia en 6 torneos hipotéticos diferentes. Ganó 5 y quedó 2da en el restante Se utilizó también un enfoque evolutivo: Se repite el torneo indefinidamente En cada ronda, la proporción de participantes con cada estrategia depende del puntaje que haya obtenido dicha estrategia TIT FOR TAT es nuevamente la “ganadora” ya que es la que más crece
  • 11.
  • 12. Proposiciones Teóricas Proposición 1: Si la tasa de descuento es lo suficientemente grande, no existe una estrategia óptima que sea independiente de las aplicadas por los demás jugadores
  • 13. Proposiciones Teóricas Def: Decimos que la estrategia A invade a la estrategia B si en un mundo donde todos juegan B y un solo individuo juega A, La estrategia A obtiene en promedio mejores resultados Def: Una estrategia es colectivamente estable si no puede ser invadida por ninguna estrategia. Proposición 2: TIT FOR TAT es colectivamente estable sii w≥ max {(T-R)/(T-P) ; (T-R)/(R-I)}
  • 14. Proposiciones Teóricas Dem: TIT FOR TAT juega de acuerdo a lo que el oponente haya jugado la jugada anterior (y asume en la primera jugada que el oponente cooperó en -1) Cualquier estrategia que juegue contra TFT, después de jugar C, lo mejor que puede hacer es jugar C o D; y lo mejor que puede hacer luego de jugar D es jugar C o D. De esta forma, quedan determinadas las 4 posibles estrategias óptimas contra TFT. Jugar repetidamente CC, CD, DC o DD CD está dominada por CC y CC a su vez obtiene los mismos resultados que TFT por lo tanto no puede invadirla. Si ni DD ni DC pueden invadir a TFT, entonces ninguna estrategia puede hacerlo.
  • 15. Proposiciones Teóricas Dem: DD no invade a TFT sii V(DD|TFT) ≤ V(TFT|TFT) -> T+wP/(1-w) ≤ R/(1-w) -> w ≥ (T-R)/(T-P) DC no invade a TFT sii V(DC|TFT) ≤ V(TFT|TFT) ->(T+wI)/(1-w2) ≤ R/(1-w) -> w ≥ (T-R)/(R-I)
  • 16. Proposiciones Teóricas Proposición 3: Si w es lo suficientemente grande, cualquier estrategia A que pueda ser la primera en cooperar puede ser colectivamente estable. Dem: Si A coopera en la primera jugada: V(SD|A) ≥ T + wP/(1-w) V(A|A) ≤ R/(1-w) Si T + wP/(1-w)≥ R/(1-w) -> V(SD|A) ≥ V(A|A) (T-R)/(T-P) ≥ w -> V(SD|A) ≥ V(A|A)
  • 17. Proposiciones Teóricas Proposición 4: Para que una estrategia decente sea colectivamente estable, es necesario que sea provocada por la primera defección del otro jugador. Dem: Si una estrategia decente no es provocada por una defección en la jugada n, puede ser invadida por una estrategia que coopere siempre y engañe en la jugada n
  • 18. Proposiciones Teóricas Proposición 5: La estrategia SD es colectivamente estable siempre. Dem: V(X|SD)≤ P/(1-w) para toda X V(SD|SD) = P/(1-w) -> V(X|SD) ≤ V(SD|SD) para toda X
  • 19. Proposiciones Teóricas Def: Una estrategia es maximalmente discriminante si puede cooperar alguna vez aunque el otro no haya cooperado nunca hasta entonces, si una vez que coopera, nunca vuelve a cooperar con SD pero coopera siempre con si misma Proposición 6: Las estrategias capaces de invadir a SD en clusters de mínimo valor de p son maximalmente discriminantes
  • 20. Proposiciones Teóricas Dem: Para que un cluster de A logre invadir a SD debe ocurrir que pV(A|A) + (1-p)V(A|SD) > V(SD|SD) -> p > [V(SD|SD)-V(A|SD)]/[V(A|A)-V(A|SD)] p es mínimo cuando V(A|A) y V(A|SD) son máximos -> p es mínimo si A es maximalmentediscriminante
  • 21. Proposiciones Teóricas Proposición 7: Si una estrategia decente es colectivamente estable, entonces no puede ser invadida por ningún cluster. Dem: Para que un cluster de A pueda invadir a una regla decente B, tiene que darse que pV(A|A) + (1-p)V(A|B) > V(B|B) Pero como B es decente, V(A|A)≤ V(B|B) para todo A -> Un cluster de A puede invadir a B sii V(A|B) > V(B|B) Pero eso equivale a que B no es colectivamente estable