miércoles, 6 de junio de 2012

El dilema del prisionero hecho espectáctulo

Un amigo me pasa el siguiente vídeo de un programa que solían echar en el canal británico ITV. El programa se llamaba "Golden Balls" y estaba basado en el dilema del prisionero. Básicamente hay £6500 en juego por las que dos concursantes luchan; cada concursante cuenta con dos bolas, una llamada Compartir (Split) y otra llamada Robar (Steal). Ambos concursantes eligen una bola y la muestran a la vez, y las elecciones posibles determinarán el reparto de dinero:
  • Si ambos escogen Compartir, cada uno se lleva £3250. 
  • Si uno escoge Compartir y otro Robar, el que Roba se lleva todo el dinero y el que Comparte se queda con nada. 
  • Si ambos escogen Robar ambos se van con nada. 
Un ejemplo de la dinámica la podemos ver en este vídeo (en inglés).




Al margen del atractivo televisivo que pueden tener las técnicas manipuladoras de ambos concursantes, el análisis del concurso desvela interesantes efectos colaterales. Pongamos que uno quiere asegurarse ganar lo máximo posible, este sería su razonamiento:
  • Caso 1, escojo Compartir. Si el otro escoge también Compartir me llevo £3250, si el otro escoge Robar me llevo £0. Por lo que en el caso medio me llevo £1625. 
  • Caso 2, escojo Robar. Si el otro escoge también Robar me llevo £0, si el otro escoge Compartir me llevo £6500. En el caso medio me llevo £3250.
Visto esto, parecería que la opción más inteligente es ir siempre hacia Robar. Sin embargo, en el análisis anterior hemos partido de dos asunciones: la elección del otro es una variable aleatoria uniformemente distribuida (es decir, ambas opciones tienen una probabilidad de ocurrir del 50%) y el experimento se hace una sola vez. ¿Qué pasaría si el experimento se hiciera en múltiples ocasiones? ¿Si en lugar de participar una sola vez participo un gran número de veces contra diferentes concursantes?

Cuando tenemos en cuenta múltiples ocurrencias hay una manera alternativa de calcular las ganancias: tanto más ganarán los concursantes según más pierda el organizador, lo que significa que la estrategia a seguir es aquella que haga que el organizador se desprenda de la mayor cantidad de dinero posible independientemente de a manos de quién vaya ese dinero; de esta forma:
  • Caso 1, escojo Compartir. Si el otro escoge también Compartir el premio se reparte, por lo que el organizador pierde £6500. Si el otro escoge Robar se quedará con el total, por lo que el organizador pierde también £6500. De media, el organizador pierde £6500. 
  • Caso 2, escojo Robar. Si el otro escoge Compartir me quedo con la totalidad del premio, por lo que el organizador pierde £6500. Si el otro escoge también Robar nos quedamos los dos sin nada, por lo que el organizador no pierde dinero. De media, el organizador pierde £3250. 
Viéndolo así parece evidente que el organizador maximiza sus pérdidas cuando los concursantes escogen Compartir, por lo que "la comunidad de concursantes" se maximiza sus beneficios cuando los concursantes deciden compartir en lugar de robar. Ahora bien, beneficiar al conjunto solo beneficia al individuo si las ganancias del conjunto son equitativamente repartidas, y aquí es donde entra en juego la naturaleza del dilema: ¿cuán beneficioso es para un individuo formar parte de un conjunto?

Me gusta este programa porque presenta a modo de entretenimiento televisivo una pregunta social y moral muy interesante. En sociedades bien construidas el individuo se beneficia de la ganancia del conjunto, ergo es de sentido común buscar el beneficio común y no el individual. Sin embargo, cuando uno rompe la relación entre individuo y sociedad y persigue el beneficio propio en aras del global, Robar se convierte en la mejor opción.

Cuán representativo.