Wimbledon y el arte de la gestión de riesgos

Cuando pensamos en el riesgo debemos hacerlo en dos dimensiones. Una dimensión es la frecuencia, la probabilidad de que un evento ocurra; la otra dimensión es la severidad, el impacto si ocurre.

Este fin de semana debería haber sido el fin de semana de las finales de Wimbledon. Tal vez Roger Federer habría ampliado su récord a nueve victorias en categoría masculina. O el torneo podría haber hecho lo que mejor sabe hacer y dar una sorpresa como la rotunda victoria de Simona Halep sobre Serena Williams el año pasado. Desgraciadamente, nunca lo sabremos. Por primera vez desde la Segunda Guerra Mundial, el All England Lawn Tennis Club tomó la decisión de cancelar el torneo.

No es que el club vaya a quedarse sin dinero. A diferencia de la mayoría de los otros grandes eventos planeados para el 2020, tenía un seguro contra la pandemia. Durante diecisiete años pagó una prima anual de alrededor de 1,5 millones de libras esterlinas por el seguro; se espera que el pago este año sea de alrededor de 114 millones de libras esterlinas.

La historia dice que el club contrató un seguro por el SARS. Pero eso subestimaría la experiencia del club con eventos extremos.

Cualquiera que haya estado en Wimbledon en los últimos diez años habrá visto esta placa en una pared de ladrillo fuera de la pista 18.

Fuente: Net Interest

Conmemora el partido de tenis más largo de la historia. En junio de 2010, el estadounidense John Isner, 23º cabeza de serie, se enfrentó al francés Nicolas Mahut en la primera ronda del individual masculino. Jugado durante tres días consecutivos, el partido duró 11 horas y 5 minutos para concluir, con Isner como ganador final después de 183 juegos. El récord anterior fue un partido en París que duró seis horas y media.

A diferencia de la pandemia, el evento no tuvo un impacto financiero negativo en el club. Pero no fue menos extremo. La probabilidad de que un partido dure 183 juegos o más es de 1 en mil millones. Con esas probabilidades, ocurrirá otra pandemia antes de que un partido vuelva a durar tanto. Y para probarlo, la misma pareja se enfrentó en Wimbledon al año siguiente, en sí mismo un evento poco probable, aunque no tan improbable, e Isner ganó en tres sets seguidos en poco más de 2 horas.

Una pandemia y un partido de tenis que dura más de 11 horas son eventos poco frecuentes. Cuando pensamos en el riesgo puede ser útil pensar en él en dos dimensiones. Una dimensión es la frecuencia, la probabilidad de que un evento ocurra; la otra dimensión es la severidad, el impacto si ocurre.

Isner vs Mahut fue un evento de baja frecuencia y baja severidad, lo suficientemente improbable como para merecer una placa, pero no un evento que tenga un impacto duradero. Una pandemia es un evento de baja frecuencia y alta severidad. Nadie duda de la gravedad de lo que estamos atravesando actualmente, aunque lo hayan subestimado en febrero.

A lo largo de los años han surgido varios modelos de gestión de riesgos para medir el riesgo en ambas dimensiones. Lo que típicamente confunde son las ocurrencias de baja frecuencia.

Un modelo que las instituciones financieras utilizan para medir el riesgo es el del Valor en Riesgo (VaR). Este modelo utiliza los datos históricos de los movimientos de los precios para estimar la peor pérdida en un intervalo de confianza determinado. Para ilustrarlo, eche un vistazo a Goldman Sachs. En el primer trimestre de este año, Goldman informó de un VaR promedio de 81 millones de dólares. Esto significa que 95 veces de cada 100, el nivel de confianza elegido, la empresa no debería perder más de 81 millones de dólares en un solo día de negociación. Resultó que Goldman perdió más de 81 millones de dólares dos veces en los 62 días que comprende el trimestre, lo que está dentro de sus límites de confianza.

El problema con el VaR es lo que sucede cuando el futuro no se parece mucho al pasado. Goldman toma muestras de cinco años de datos históricos, ponderados para dar prominencia a los datos más recientes. Eso está bien siempre y cuando el futuro refleje los últimos cinco años, pero, ¿qué pasa si no lo hace? La empresa reconoce la deficiencia. Reconoce que "el VaR es más eficaz para estimar la exposición al riesgo en mercados en los que no hay cambios fundamentales repentinos o cambios en las condiciones del mercado".

Lamentablemente, los cambios repentinos son una característica de los mercados. Un ex director financiero de Goldman Sachs dijo al Financial Times en 2007 que su empresa estaba "viendo cosas que eran movimientos de 25 desviaciones estándar, varios días seguidos". Un evento de 25 dígitos es realmente poco frecuente, más aún que un partido de tenis de 11 horas. Ninguno de nosotros debería tener la fortuna de ser testigo de uno. Sin embargo, el número de eventos multi-sigma que hemos visto desde entonces excede lo que los chinos desearían para su peor enemigo.

Como dice el amigo de backgammon de Howard Marks, Bruce Newberg: “Hay una gran diferencia entre la probabilidad y el resultado. Las cosas probables no suceden, y las improbables suceden, todo el tiempo.”

Para acomodar esto se utiliza otro modelo, la prueba de estrés. A diferencia de las medidas VaR, que tienen una probabilidad implícita porque se calculan con un nivel de confianza especificado, las pruebas de tensión simplemente modelan los resultados basados en escenarios predefinidos. Ignoran por completo el concepto de frecuencia y se centran por completo en la gravedad de un escenario concreto.

Aunque las pruebas de estrés han sido utilizadas desde hace mucho tiempo por los gestores de cartera y las mesas de negociación para gestionar el riesgo, pasaron a formar parte del arsenal de los reguladores en la última fase de la crisis financiera. Inicialmente se emplearon como una extensión de los ejercicios informales de "quema" que los analistas estaban realizando en los bancos en ese momento, para ver cómo las posiciones de capital de los bancos podían soportar graves pérdidas. En sus memorias, Stress Test, Tim Geithner, ex Secretario del Tesoro de EE.UU., dice:

“Primero describí el plan como un 'ejercicio de valoración'. Llegamos a llamarlo la prueba de estrés. El plan tenía como objetivo imponer transparencia a las instituciones financieras opacas y a sus activos opacos para reducir la incertidumbre que estaba impulsando el pánico. Ayudaría a los mercados a distinguir entre los bancos viables temporalmente ilíquidos y los bancos débiles que eran esencialmente insolventes. Luego ayudaría a estabilizar tanto a los fuertes como a los débiles movilizando una combinación de capital privado y público.”

Continúa diciendo que la prueba de esfuerzo terminaría teniendo muchas otras virtudes que no preveía en ese momento, que sería "el regalo que sigue dando" como herramienta de regulación.

Eso no es algo malo. Las pruebas de esfuerzo tienen muchos méritos. Siguen proporcionando a los inversores la transparencia sobre las instituciones financieras que Geithner pretendía. Forman la base de cuánto capital se requiere que tenga un banco. Y además proporcionan a los reguladores una visión consistente y horizontal del riesgo de todo el sistema.

Pero también tienen desventajas. Tres en particular se destacan, dos de los cuales tienen ecos en otros dominios donde se utilizan pruebas de estrés: la salud y la construcción.

Las pruebas de esfuerzo se han utilizado en la industria de la construcción durante muchos años. No querría conducir sobre un puente que no ha sido sometido a una prueba de estrés. Así que cuando el Puente del Milenio en Londres comenzó a oscilar de lado a lado momentos después de abrirse a los peatones en junio de 2000 causó cierta sorpresa.

El puente se cerró rápidamente mientras los ingenieros realizaban una investigación. Esto es lo que encontraron:

“La correlación de la casualidad de los pasos, combinada con la sincronización que ocurre naturalmente dentro de una multitud, puede causar que el puente comience a balancearse horizontalmente. Si el balanceo es perceptible, un efecto adicional puede comenzar a hacerse sentir. Se hace más cómodo para los peatones caminar en sincronización con el balanceo del puente. Los peatones encuentran que esto hace que su interacción con el puente sea más predecible y les ayuda a mantener su equilibrio lateral. Este comportamiento instintivo asegura que las fuerzas de la pisada se apliquen a una frecuencia de resonancia del puente y con una fase tal que aumente el movimiento del puente. A medida que aumenta la amplitud del movimiento, la fuerza lateral impartida por los individuos aumenta, así como el grado de correlación entre los individuos. La frecuencia de 'bloqueo' y la retroalimentación de fuerza positiva causaron los excesivos movimientos observados en el Puente del Milenio.”

En otras palabras, se desarrolla un bucle de retroalimentación. Las personas naturalmente caen al mismo paso que los demás; eso causa un poco de balanceo; las personas responden de una manera que las hace sentir más cómodas; el balanceo empeora. Para capturar ese bucle de retroalimentación, las pruebas de estrés tendrían que haber incorporado la respuesta de los peatones entre sí y luego su respuesta al puente.

Los efectos de segundo orden son algo difícil de capturar. Muchas personas predijeron el Brexit pero sólo un subconjunto de ellos predijo la respuesta del mercado; muchas personas predijeron la victoria de Trump pero igualmente sólo un subconjunto predijo la respuesta del mercado. La pandemia es un poco diferente, no mucha gente la predijo, pero si lo hubiera hecho, es muy poco probable que muchos de ellos hubieran predicho la respuesta del mercado.

Los gestores de cartera suelen estresar sus carteras de acuerdo con los escenarios históricos; si se hubieran utilizado los escenarios de la victoria de Trump o de la pandemia antes de que ocurrieran, no habrían parecido creíbles. ("Sí, sí, estamos modelando un cierre completo de la economía mundial con un desempleo que aumenta hasta el 15% y un cráter del PIB del 30%, por lo que vamos a pronosticar, ¿qué, una caída del 5% en los mercados de valores?")

Un segundo inconveniente, extraído de la medicina, es que la prueba de esfuerzo puede estar sondeando en el lugar equivocado.

Los médicos realizan pruebas de esfuerzo cardíaco haciendo que los pacientes corran en cintas de correr y monitoreando su pulso y presión sanguínea. Las pruebas de esfuerzo son capaces de detectar las arterias que se estrechan gravemente como resultado de la acumulación de colesterol; éstas son las que causan los síntomas. Sin embargo, no necesariamente causan ataques cardíacos, que a menudo son el resultado de obstrucciones menores que se rompen y forman coágulos. Los síntomas no se sentirán hasta que se forme el coágulo de sangre y el músculo cardíaco se vea privado de oxígeno, por lo que las personas que sufren ataques cardíacos a menudo no tienen síntomas de advertencia y pueden someterse a una perfecta prueba de esfuerzo días antes de desplomarse.

En julio de 2016, el Banco Popular pasó una prueba de estrés realizada por la Autoridad Bancaria Europea. En doce meses había quebrado. La prueba de estrés examinó la solvencia en un escenario adverso para la economía general; lo que hizo caer al Popular fue la liquidez en un escenario adverso para el banco en particular.

El tercer inconveniente es que el sistema puede estar manipulado. Aquí es donde las pruebas de estrés financiero difieren de las pruebas de estrés cardíaco o de ingeniería. Ni el músculo cardíaco ni las vigas de acero saben que están siendo sometidos a una prueba de estrés; la gente lo sabe. Como dijo Richard Feynman, "imagina lo difícil que sería la física si los electrones tuvieran sentimientos".

Hay algunas evidencias de que las pruebas de estrés reglamentarias se están manipulando cada vez más. Los analistas han encontrado que a medida que las pruebas de estrés en los EE.UU. han evolucionado, los resultados se han vuelto más predecibles. Otros han demostrado que en Europa se explota sistemáticamente la flexibilidad que existe en el diseño y el uso de los modelos propios de los bancos para reducir al mínimo las pérdidas previstas. Y la revista Risk informó el año pasado sobre un memorándum filtrado en el que un banco estadounidense se dirigió a un banco europeo para intercambiar activos de riesgo como un ejercicio de maquillaje antes de su próxima prueba de estrés.

Un fenómeno similar se ha observado durante mucho tiempo en las mesas de trading. Si se mide el riesgo de los tipos de interés, los operadores optimizarán en función de la pendiente de la curva de rendimiento; si se mide el riesgo de la curva de rendimiento, optimizarán en función de la curvatura de la curva de rendimiento. En cada iteración, se va acrecentando la complejidad y, a medida que ésta se va acrecentando, se abren más grietas para manipularlo.

Al igual que el problema del Puente del Milenio, este inconveniente también pone de relieve un mecanismo de retroalimentación. Pero este es diferente; la retroalimentación aquí está diseñada específicamente no para encajar en un modelo sino para frustrarlo. Esta es la razón por la que ningún modelo de gestión de riesgos puede cubrir todos los riesgos. Una vez que se especifica un modelo, la gente tratará de encontrar una manera de sortearlo.

Esto da lugar a una paradoja. Tal vez sea un corolario de la Ley de Goodhart. La gestión abierta de los riesgos tiende a añadir complejidad a un sistema; y la complejidad aumenta el riesgo endógeno dentro del sistema. De hecho, el concepto de riesgo está plagado de paradojas. La Enciclopedia de Filosofía de Stanford afirma: "Cuando hay un riesgo, debe haber algo que es desconocido o tiene un resultado desconocido. Por lo tanto, el conocimiento sobre el riesgo es el conocimiento sobre la falta de conocimiento. Esta combinación de conocimiento y falta de conocimiento contribuye a complicar los temas de riesgo desde un punto de vista epistemológico".

La mejor salida es no centrarse en una sola métrica. Desafortunadamente los reguladores bancarios han caído en la trampa de centrarse en una, la prueba de estrés. Esto se puso de manifiesto este año cuando los reguladores de EE.UU. no quisieron distraerse de su ciclo anual de prueba de estrés por una prueba de estrés de la vida real. Así que en lugar de volver a hacer el "ejercicio de valoración" de 2009, lo han esquivado.

Otra salida es no pensarlo demasiado, como esta historia sobre Bobby Steinberg, ex jefe del departamento de arbitraje de riesgos de Bear Stearns y Ace Greenberg, que dirigía la empresa:

“El departamento de arbitraje estaba durante mucho tiempo largo de una acción involucrada en una fusión, y el departamento estaba al límite de la posición de la firma. Steinberg pensó que era increíblemente atractivo, y fue a Ace para pedirle permiso para exceder el límite. Ace escuchó muy atentamente, y cuando Steinberg terminó, levantó la vista y dijo: 'Bobby, eso suena realmente genial, suena como una historia increíble, pero tengo sólo una pregunta para ti. ¿Crees que tenemos límites de posición por aquí para evitar que la gente compre acciones que no les gustan?”

No habrá sorpresas en Wimbledon este año. Pero nuestra mayor exposición a eventos poco frecuentes sigue sin disminuir. La semana que viene los bancos de EE.UU. comenzarán a publicar sus resultados y veremos cómo les va hasta ahora en esta prueba de estrés de la vida real. Modelar resultados específicos es difícil, pero cosas simples como los límites de posición y un bajo apalancamiento proporcionan resistencia para defenderse del riesgo.

Fuente / Autor: Net Interest / Marc Rubinstein

https://netinterest.substack.com/p/wimbledon-and-the-art-of-risk-management?mc_cid=c57449ff10&mc_eid=bb4271e82a

Imagen: flowz

Contáctanos