Tema 5 Teoría de Juegos y Aprendizaje Colectivo PDF
Document Details
Uploaded by Deleted User
Tags
Related
- Decisiones Estratégicas: Economía Neoclásica PDF
- Teoría de Juegos: Estrategias y Toma de Decisiones (PDF)
- Cap 17-Oligopolio PDF
- ECONOMIA SESION 7 - Estructuras de mercado II - Monopsonio y oligopolio PDF
- Economía Tema 5 - Teoría de Juegos - 1º Bachillerato - 2024-2025 PDF
- Presentación Elementos Comunes (2024) PDF
Summary
Estos apuntes presentan una introducción a la Teoría de Juegos y al Aprendizaje Colectivo. Exploran conceptos como las interacciones sociales, el intercambio, la cooperación y la competencia. Se destacan diferentes tipos de interacción y se proporcionan ejemplos concretos que explican distintas situaciones.
Full Transcript
TEMA 5 TEORÍA DE JUEGOS Y APRENDIZAJE COLECTIVO Aviso: Estos apuntes son sólo una guía para seguir la clase. Están incompletos y pueden contener errores. No es un sustituto del libro de texto. Para estudiar este tema, se recomienda leer: Capítulo 5 de Thompson, W. E., y Thompson, M. L. (2019). Soci...
TEMA 5 TEORÍA DE JUEGOS Y APRENDIZAJE COLECTIVO Aviso: Estos apuntes son sólo una guía para seguir la clase. Están incompletos y pueden contener errores. No es un sustituto del libro de texto. Para estudiar este tema, se recomienda leer: Capítulo 5 de Thompson, W. E., y Thompson, M. L. (2019). Sociological Wisdom: Things are Not what They Seem. Rowman & Littlefield Publishers. Capítulo 2 de Osborne, M. J. (2004). An introduction to game theory. New York: Oxford University Press. Capítulo 6 de Easley, D. y Kleinberg, J. (2010). Networks, Crowds and Markets: Reasoning about a highly connected world. New York: Cambridge University Press. Hoffman, M., Yoeli, E., y Navarrete, C. D. (2016). Game theory and morality. En: The evolution of morality (pp. 289-316). Springer, Cham. http://doi.org/10.1007/9783-319-19671- 8_14 Capítulo 9 de Webb, J. N. (2007). Game theory: Decisions, Interaction and Evolution. London: Springer. INDICE 1. INTRODUCCIÓN 2. LAS INTERACCIONES SOCIALES 3. TEORÍA DE JUEGOS 3.1 EL EQUILIBRIO DE NASH 3.2 EL DILEMA DE LOS PRISIONEROS 3.3 EL JUEGO DEL HALCÓN Y LA PALOMA 3.4 JUEGOS DE COORDINACIÓN 3.5 E.N. EN ESTRATEGIAS PURAS 3.6 E.N. EN ESTRATEGIAS MIXTAS 4. APRENDIZAJE COLECTIVO 5. DINAMICAS EVOLUTIVAS 1. INTRODUCCION El estudio del comportamiento social se centra en la conducta de los individuos cuando ésta se ve influida por las interacciones sociales Existen múltiples teorías para explicar el comportamiento social – Cada una pone el énfasis en un aspecto de la vida social de los individuos La teoría de juegos es una herramienta matemática para modelar interacciones e incentivos 2. LAS INTERACCIONES SOCIALES interacción social proceso por el que dos o más personas actúan, se relacionan o ejercen influencia recíproca en una sociedad Los sociólogos identifican cinco patrones fundamentales: - Intercambio - Cooperación - Competencia - Conflicto - Coerción INTERCAMBIO interacción en la que una determinada conducta (o acción) se intercambia por algún tipo de recompensa La persona se esfuerza por recibir la recompensa, ya sea material o no Está basada en la reciprocidad: si haces algo por alguien, de alguna forma te lo debe Son relaciones que se suelen repetir en el tiempo, pero si el coste supera la recompensa, los individuos probablemente darán por terminada la relación COOPERACIÓN proceso social en el que los individuos (o grupos) trabajan de forma conjunta para alcanzar un objetivo común El objetivo común suele beneficiar a más de una persona Suele darse junto con otro tipo de interacciones (ej., competencia) COMPETENCIA interacción en la que dos o más personas (o grupos) compiten por un objetivo que sólo una puede alcanzar - Se compite en base a unas reglas o códigos de conducta que los individuos respetan - Es la base del sistema capitalista y de las sociedades occidentales - Suele motivar a las personas a conseguir su objetivo Pero también puede conllevar estrés psicológico, falta de cooperación social, desigualdad y conflicto. CONFLICTO interacción en la que dos o más personas (o grupos) compiten por alcanzar un objetivo a cualquier coste - Tiene pocas reglas o normas de conducta (o si existen, se ignoran) - Puede derivar de interacciones de competencia. A diferencia, se busca más la derrota del oponente que la recompensa – Las causas más habituales son: Acceso a recursos Control de poder y toma de decisiones políticas Defensa identitaria Defensa de estatus o posición social – No sólo tiene consecuencias negativas. Refuerza la cohesión y lealtad del grupo (centra la atención en factores externos) Promueve el cambio social ya que obliga a buscar soluciones COERCIÓN presión o amenaza que se ejerce sobre una persona o grupo para forzar una conducta o un cambio en su voluntad – Por ejemplo, la educación primaria y secundaria es obligatoria, por lo que todos los menores de 16 años deben estar escolarizados (quieran o no) – Se suele producir por: Expresiones de poder y autoridad Acciones cotidianas que se pueden dar en el día a día, tales como burlas, rumores, retirada de afecto… – Participa un individuo o grupo que domina (supraordinado) y una persona o grupo que es dominado (subordinado) Los patrones de interacción social no son ni mutuamente excluyentes ni distintivos – La línea entre algunos patrones es muy delgada. Por ejemplo: Competición y conflicto Coerción e intercambio... – También depende de las propias percepciones de cada individuo y de los estereotipos 3. TEORÍA DE JUEGOS La teoría de juegos es una herramienta para modelar las interacciones sociales Modela situaciones en las que: - múltiples “jugadores” (personas, estados, animales, personas) - llevan a cabo estrategias (competir por un objeto, sacrificarse para ayudar a otro, emparejarse…) y - reciben resultados (o pagos), ya sea en términos monetarios o no (utilidad) Los resultados dependen tanto de la estrategia que un jugador elige como de las estrategias de los otros jugadores Los juegos más sencillos son los de forma matricial con estrategias puras: Sólo tienen dos jugadores Cada jugador tiene un número finito de estrategias posibles Cada estrategia se elige antes de jugar 3.1 El equilibrio de Nash El equilibrio Nash es una especificación de estrategias para cada jugador de forma que ninguno se beneficiaría de cambiarla unilateralmente (manteniendo el resto constante) Es una situación estable, ya que nadie tiene incentivos a cambiar su comportamiento 3.2 El dilema de los prisioneros Supongamos una situación en la que dos individuos pueden cooperar o traicionar Los jugadores estarán mejor si ambos cooperan (r), que si ambos se traicionan (p) – Pero cada uno estará mejor tracionando si el otro no cambia su estrategia t>r>p>s 3.3 El juego del halcón y paloma Supongamos una situación en la que dos individuos se disputan un recurso que vale v – Cada individuo puede adoptar dos comportamientos: Pelear agresivamente por el recurso (halcón) Negociar pacíficamente (paloma) Si los dos se comportan como palomas, comparten el recurso y recibe cada uno la mitad del valor (v/2) Si uno de los individuos se comporta como un halcón y el otro como una paloma, el halcón e hace con todo el valor del recurso (v), y la paloma no recibe nada (0) Si los dos se comportan como halcones, se reparten finalmente el recurso, pero con un coste de lucha (v/2-c) Asumimos que el coste es lo suficientemente alto como para que no compense ser agresivo si el otro lo es c > v/2 > 0 3.4 Juego de coordinación Supongamos una situación en la que dos individuos deben decidir entre dos estrategias - Entre las dos opciones, cada individuo prefiere hacer siempre la misma que el otro (o una estrategia correspondiente) - Los dos individuos pueden preferir la misma acción coordinada o no En cualquier caso, individualmente están mejor haciendo lo mismo que no estándolo A > B, D > C, a > c, d > b En los juegos anteriores, los equilibrios Nash son: - Ejemplo de matriz de pagos: (Arr, Izq) - Dilema de los prisioneros: (Traicionar, Traicionar) - Halcón y Paloma: (Halcón, Paloma) y (Paloma, Halcón) - Coordinación: (Izquierda, Izquierda) y (Derecha, Derecha) 3.5 E.N EN ESTRATEGIAS PURAS Un juego en forma matricial con estrategias puras es un juego de dos jugadores con estrategias finitas especificado por: - Conjunto de estrategias de cada jugador - Función de utilidad sobre cada par de estrategias para cada jugador Por tanto, cada juego se puede definir como una tupla: < {Si}i=1,2, {Ui}i=1,2 > donde: {Si}i=1,2 es el conjunto finito de estrategias disponible para cada jugador ◦ si ϵ Si es una estrategia genérica disponible para el jugador i ◦ S= ∏i=1,2 Si es el conjunto de perfiles de estrategias, es decir, el conjunto de todos los pares de estrategias, una para cada jugador ◦ s = (s1, s2) ϵ S es un elemento genérico de S Nos referiremos a s como (si, s-i), donde s-i representa las estrategias de los jugadores que no son i. Ui es una función S ------> R que define las preferencias de i sobre todos los perfiles de estrategias – Si Ui(s) ≥ Ui(s’) , diremos que el jugador i prefiere s a s’ Observa que este tipo de juegos está completamente definido en la matriz de pagos - Resulta más cómodo escribir la matriz que la tupla Un perfil de estrategia s ϵ S es un equilibrio Nash puro si ∀ i y ∀si ϵ Si , Ui(si, s-i) ≥ Ui(si’,s-i) - Ningún jugador obtendría mayor utilidad desviándose unilateralmente (es decir, si el resto no se desvían) - Algunos juegos tienen múltiples equilibrios Nash puros y otros no tienen ninguno. 3.6 E.N EN ESTRATEGIAS MIXTAS Hasta ahora hemos considerado que los jugadores pueden elegir entre sus “estrategias disponibles” Consideraremos ahora otra estrategia El jugador puede elegir una distribución de probabilidad sobre sus estrategias puras Esta estrategia tendrá un pago esperado Una extensión en estrategias mixtas del juego en forma matricial < {Si}i=1,2, {Ui}i=1,2 > se define por la tupla: < {∆Si}i=1,2, {UEi}i=1,2 > donde: ∆Si es el conjunto de estrategias mixtas disponible para el jugador i Cada estrategia mixta está representada por αi(p(s1), p(s2)), donde p(si) es la probabilidad que da el jugador a la estrategia pura si UEi es el pago esperado de la estrategia mixta α ϵ ∆Si , calculado como una simple media ponderada de los pagos: – UEi (α)=∑(s∈S) Ui (s)αi (s) Una estrategia mixta α = (αi, α-i) es un equilibrio Nash en estrategias mixtas si ∀i y ∀αi ϵ ∆Si , UEi (αi, α-i) ≥ UEi(αi’, α-i) Para encontrar los equilibrios Nash en estrategias mixtas, utilizaremos la siguiente propiedad: - Si i juega una estrategia mixta en el equilibrio, i debe ser indiferente entre las estrategias puras que combina Si no fuera así, preferiría jugar una estrategia pura - Además, esa estrategia mixta será mejor que cualquier estrategia pura no incluida en la combinación Aplicándolo al juego de pares o nones Si p es la probabilidad de jugar Par: UE1( Par, p(Par) + (1-p) Impar ) = UE1( Impar, p(Par) + (1-p) Impar ) U1(Par, Par)*p + U1 (Par, Impar)*(1-p) = U1 (Impar, Par)*p + U1 (Impar, Impar)*(1-p) (1)*p + (0)*(1-p) = (0)*p + (1)*(1-p) p=1-p p=0,5 El equilibrio Nash en estrategias mixtas (αi , α-i ) será simétrico: αi = α-i = αi(p(Par), p(Impar)) = αi (0.5 , 0.5) 4. APRENDIZAJE COLECTIVO El aprendizaje colectivo se refiere a cómo aprenden colectivos tales como organizaciones, pueblos, países… – Consideraremos que tales colectivos aprenden cuando adoptan de forma generalizada ciertas creencias o preferencias La teoría de juegos se puede utilizar para explicar que las preferencias o creencias con mejores resultados se convertirán en las más frecuentes Dos visiones alternativas: – sesgo de éxito Las personas imitan el comportamiento de las personas de referencia en lugar de las fracasadas También es más frecuente que recibamos formación de las personas con éxito que de las fracasadas – aprendizaje por refuerzo Las preferencias o creencias con buenos resultados se mantienen de forma más persistente Incluso si no somos conscientes de por qué Si estas preferencias o creencias se mantienen en el tiempo es porque esta conducta es consistente con un equilibrio Nash Ejemplos de aprendizaje: Llamar a mamá Ir al baño Jugar a un videojuego Hacer un examen o un trabajo Ejemplo: En una tribu de Fiji… – La mayoría de mujeres embarazadas evitan algunos alimentos por superstici ón (mero, anguila, tiburón, tortuga de mar) La superstición es transmitida de generación en generación Estos alimentos son propensos a contener una toxina que puede resultar peligrosa para el embarazo Muchas mujeres evitan los alimentos por superstición y por el castigo social que supondría tomarlos El comportamiento “bueno” (con mejores resultados) se mantiene en el tiempo A pesar de que algunas mujeres no sean conscientes de la verdadera razón Ejemplo: El gusto por las especias y el picante – La distribución en el mundo de las preferencias por el uso de ciertos condimentos se puede explicar de forma similar (ajo, cebolla, guindilla, mostaza…) Algunos condimentos tienen propiedades que inhiben el crecimiento de bacterias en los alimentos Éstos se suelen utilizar más en las regiones con mayor temperatura, que es donde son más efectivos para inhibir bacterias Las personas los utilizamos porque nos gusta el sabor, no porque seamos conscientes de su capacidad antibacteriana Nos siguen gustando incluso después de la invención de la nevera Las preferencias por los condimentos son aprendidas, no evolucionadas 5. DINÁMICAS EVOLUTIVAS Las dinámicas evolutivas pretenden explicar cómo se difunden o mantienen estas preferencias (o creencias) Consideremos una población de N jugadores En cada periodo, cada jugador es emparejado aleatoriamente con otro – No puede elegir con quién interactuar Los jugadores no eligen estrategia, sino que cada uno juega siempre la misma (es su forma de ser) – Podemos interpretarlo como que los individuos: “Nacen” o “heredan” esa forma de ser de su madre Imitan las estrategias de otros Supongamos dos estrategias A y B – Las estrategias son las preferencias de cada individuo. Por ejemplo: Gustar o no gustar el picante Evitar o no evitar los alimentos prohibidos Habrá NA jugadores que juegan A y NB que juegan B - La proporción de jugadores tipo A será xA = NA /N - La proporción de jugadores tipo B será xB = NB / N El estado de la población será (xA, xB ), donde xA >= 0, xB >= 0 y xA + xB = 1 El pago esperado por cada jugador vendrá determinado por la proporción de cada estrategia en la población: fA (xA , xB ) = xA · UA (A, A) + xB · UA (A, B) El pago medio en la población será la media ponderada de ambos pagos: f(xA , xB ) = xA · fA (xA , xB ) + xB · fB (xA , xB ) La proporción de individuos que juegan A crecerá si: fA(xA, xB) > f(xA, xB) Es decir, la estrategia A ganará peso en la población si sus pagos son mejores que la media Dinámicas evolutivas Los estados estacionarios son: xA = 0 Sólo subsiste la estrategia B (la estrategia A se extingue) xA = 1 Sólo subsiste la estrategia A (la estrategia B se extingue) xA tal que fA(xA, xB) = fB(xA, xB) - xA , xB es un equilibrio Nash en estrategias mixtas Las dinámicas evolutivas nos permiten describir cómo las poblaciones llegan al equilibrio Nash (si llegan) Y a cuál de ellos llegan, si existen varios