sexta-feira, 22 de maio de 2020

La función exponencial y el nCovid19, parte 4.

Un aforismo, atribuido a Stalin, reza así: " Un Muerto es una desgracia, un millón de muertos es una estadística". Podemos entender que quiere decir fácilmente. Nuestro cerebro humano puede empatizar con la desgracia individual o de pocos números, podemos imaginarnos claramente a una persona sufriendo, o a dos, o a cinco, pero no a diez mil. Nuestra percepción empática se vuelve borrosa, no estamos naturalmente preparados para lidiar con esos números.
Aunese a esto que la Estadística, como disciplina, tiene una fama de frialdad y utilitarismo, especialmente al servicio de los poderosos ( del Estado, de ahí su nombre) y pues nos hace ver que la sentencia dice que básicamente muchísimos muertos no logran generar la misma empatía ( y resistencia ) que unos pocos.

Yo creo que es justo la Estadística la que nos puede salvar: tal vez nuestro cerebro no cuenta naturalmente con mecanismos de comprensión de los grandes números, pero puede ser entrenado. La Estadística es un gran programa de entrenamiento. Cuenta con excelentes herramientas que nos ayudan a aprehender esos números en nuestra conciencia; si interiorizamos, tanto analíticamente como empáticamente, su significado. Media, mediana, desviación estándar, moda, cuantil, etcétera, significan grupos de fenómenos concretos, personas, situaciones, actos heroicos y desgracias.

Un millón de muertos es una estadística. También es un millón de desgracias. Y también es una desgracia de otra categoría, ya que significa un fenómeno avasallador detrás de cada una de las muertes.

Quiero que al leer esto tengas presente que cada uno de los puntos en esta gráfica representa una cantidad grande de personas que murieron por este virus. Debemos tratar estos datos con respeto, aunque nuestros análisis no sean profesionales o profundos. Te encomiendo a sentir que quiere decir una expresión engañosamente descriptiva como "periodo duplicación del número de muertos".

Comencemos pues, el análisis gráfico. Una vez más, empecemos por una simple inspección visual general de los datos. Todos los datos provienen de la Wikipedia en sus artículos en ingles sobre la epidemia en cada país.


Aquí están los datos que quiero comparar en escala convencional. Esto es el número de muertos por nCovid19 confirmados oficialmente por EUA, México, Italia y Rusia. Escogí dos casos muy escandalosos pero diferentes: el caso de Italia, que fue el primer país donde la mortandad llegó decenas de miles, y el de Estados Unidos, que básicamente ya rebasó en muertos estadounidenses a la Guerra de Vietnam. Los dos muestran comportamiento muy disimilar, como vemos por las curvas. Rusia está aquí porque se parece en comportamiento mucho a México... y no sabemos porqué.

Se que el número reportado de muertos es controversial, pero podemos tomar eso en cuenta. Se estima que México esta contando sólo una tercera parte de sus muertos por esta enfermedad. Hay países que usan criterios muy rigurosos, y sólo reportan aquellos casos que tuvieron prueba positiva antes de morir, confirmado, y que murieron en tratamiento intensivo. Hay países donde muchos quedan como "neumonía atípica". Hay países que son menos rigurosos y permiten que los familiares no los reporten como nCovid19, pues esto evita que los familiares se puedan acercar a su Ser Querido en sus últimos momentos de vida, e incluso en sus primeras horas de muerto. México es una ensalada de todos estos casos. Aun así, se estima México podría tener "solamente" tres veces más de muertos por coronavirus. Digo solamente porque en realidad este factor es pequeño: no indicaría una clara malignidad en el manejo de los datos, sino un escasez en el muestreo manejable, si se quiere manejar, por supuesto. Es difícil pensar que tenemos diez veces más muertos, habría fenómenos visibles en las calles cotidianamente: abarrotamiento de casas funerarias por ejemplo. Esto se empezó a ver apenas hace unos dias, sin embargo el New York Times estaba acusando  a México de un mal manejo de muertos oficiales desde hace tiempo. Debemos de entender muy bien cual es la diferencia entre muertos confirmados y muertos totales. Nadie sabe el número de muertos totales aún. Los muertos confirmados nos dan un estimador. Lo único que podemos estar seguro es que todos los países tienen más muertos que los reportados. Nadie está "inflando" los números de muertos. En todo caso está ocurriendo lo contrario. Acaban de cachar a dos estados gringos (Georgia y Florida) manipulando sus datos para que parezca que tienen la situación bajo control y se les permita reabrir el comercio e industria. Hijos de tigre, pintitos.

Retomemos la gráfica: podemos ver que EUA y México tienen comportamientos que emulan los números de contagios totales que mostré en los artículetes anteriores. Esto es esperado: el número de muertos debe ser aproximadamente proporcional al número de casos, y por lo tanto la curva debe ser aproximadamente una sombra pequeña de la curva de casos confirmados. Esto mientras no ocurra un agravante, como que colapse el sistema sanitario. En ese caso el número de muertos iría aumentando en tasas continuamente crecientes y no  a la esperada por la tasa de mortandad. O también podría ser que cada vez encontráramos mejores tratamientos. En ese caso la curva también dejaría de seguir la curva de contagios confirmados y se haría cada vez más pequeña. Pero ninguna de las dos cosas parece estar pasando en EUA y México. EUA muestra los dos comportamientos lineales unidos por un codo, y México está con su crecimiento lento.  También estas curvas deben de mostrar un retraso de unos días en su comportamiento cualitativo respecto a las anteriores. Los enfermos tardan en morir. Los más rápidos, entre su detección y su fallecimiento, un par de días. Otros, un par de semanas. La curva debe estar desplazada a la derecha mas o menos por el promedio de ese efecto. 

La curva de Italia después del periodo de crecimiento rápido, muestra un comportamiento aun menor que el lineal. Cada vez que tratamos de ajustar una recta para ver que tan empinado están los puntos, los siguientes puntos quedan por debajo. Esto quiere decir que cada vez es menos empinada, y por lo tanto esta creciendo a una tasa menor que la lineal. Esto es una excelente señal. A esto si le podemos llamar "aplanar la curva": empieza a parecer justamente una recta plana. El caso de EUA es grave: incluso habiendose terminado el crecimiento exponencial, no se ve que despúes de ello la curva se aplane: continua estando en el ritmo de sus últimos momentos de crecimiento exponencial. Las curvas de Rusia y México son tan pequeñas que no se aprecia bien el tipo de crecimiento, pero a ojo de buen cubero parecen ser exponenciales que andan en un ritmo muy bajo, o que empezaron después. Para confirmarlo vayamos al plano semilogarítmico.



Helo ahí. Esta vez coloqué las lineas horizontales en una doble secuencia. Primero, 2,4,6,8 y 10 (no se porqué falta la etiqueta del 10 y sus potencias). Luego multipliqué esta secuencia por diez y puse en esos los siguientes renglones, y continué de esa forma. Los renglones están separados equidistantemente por múltiplos, pero aquellos que difieren en un valor que se suma se van acumulando. Por ejemplo, 6, 60, y 600, 6000 y 60000 están separados por la misma distancia entre ellos. La distancia que hay entre 6 y 8 es la misma que entre 60 y 80 y la misma que hay entre 600 y 800. El papel logarítmico que se vendía antes en las papelerías se veía así. Ayuda a visualizar las cantidades cuando uno se acostumbra a su interpretación. 

Mencioné arriba que el número real de fallecidos podía ser unas tres veces superior al confirmado. Esto no cambiará mucho el análisis mostrado. Esto es porque un factor constante sólo desplaza la curva en el plano logarítmico hacia arriba o hacia abajo. Eso se puede ver en las rectas horizontales que marqué. Multiplicar todo por diez sube la gráfica al siguiente bloque de renglones. Pero lo empinado de los puntos sigue siendo el mismo. Una vez más, insisto, eso no quiere decir que no sea grave que estén muertos tres, cuatro o 10 veces más personas que las reportadas. Es un hecho que hay más muertos que los reportados. Pero esto no cambia la tasa de duplicación, si el muestreo es consistente. Y dado que es muy difícil "cucharear" una curva exponencial de forma creíble, asumo que los datos reportados forman un submuestreo honesto, pero un submuestreo de cualquier forma. Para convencencernos de ello hagamos una gráfica mostrando los muertos confirmados de México, una versión multiplicada por tres y una por diez. Dejemos los datos de EUA como referencia. 

En el peor estimado posible la curva casí alcanza la oficial de EUA, y es más empinada ahora de lo que está está en este momento. Eso es un estimado gravemente pesimista, pero no fuera de la realidad del todo. Aun así, podemos estar seguros de algo: si la curva de México está más empinada que la de EUA y no se corrige, más pronto que después la rebasará, no importando que tan abajo comience. Ahora bien, regresemos al gráfico de datos oficiales de cuatro paises, pero agregemosle esta vez las lineas de ajuste a los invervalos que dan la aparienca de rectas ( ¡en el papel semilog! ):



Aquí están las "curvas" ( en el sentido general son curvas ) que representan funciones exponenciales. A cada una la acompañe de un número que indica el periodo de duplicación en días. Un número menor implica mayor velocidad en la acumulación de muertos, y es por lo tanto un indicador de algo muy malo. El peor caso es el de Italia, que durante el final de febrero y la primera mitad de marzo duplicó cada dos y medio días su cantidad de fallecidos. Eso fue lo que escandalizó al mundo. Sin embargo y después de un periodo de aproximadamente un mes de "doblarle el codo" a la curva, podemos ver que la gráfica empieza a parecer plana. Helo ahí, el habladísimo "aplanamiento de la curva". Tienen razón para salir a celebrar con un espresso, aunque el riesgo del rebote sigue siendo real. El caso de EUA se ve similar, pero su codo aun sigue mámás empinado. Su crecimiento es lineal ( y se ve como una recta en papel convencional) pero muy empinado aun. Su periodo de crecimiento exponencial parece haber durado lo mismo que en Italia, y ligeramente menos empinado, pero comenzó a duplicar un número más grande de muertos inicialmente: 60 en lugar de 10. Esa fue la famosa reacción tardía de EUA: durante la segunda mitad de marzo no hubo ninguna muestra de ralentización del fenómeno. 


México y Rusia parecen sólo haber cambiado una exponencial terrorífica por una ligeramente menos terrorífica. Si bien es cierto que aparentemente tuvimos siempre un ritmo de crecimiento más lento, 3.3 días no es tan diferente de 2.7. Aunque tener una tasa de duplicación de 9.4 días en el caso de México ya suena a un aliviane, no hay un "codo" en la curva claro como en EUA o Italia. Si se mantiene el rítmo así, podemos tener para finales de Mayo 12'000 muertos confirmados, para finales de Junio 96'000, y eso ya es otra categoría de desgracia. ¿Ha funcionado la estrategia de México? No lo sabemos certeramente. Claramente desde que inició la campaña de "Quedate en Casa" y "Susana Distancia", los periodos de duplicación aumentaron. Pero no parece haber detenídose el crecimiento exponencial. ¿No mencioné que esta curva está atrasada con respecto a los contagios? 
Así es. En el próximo artículete compararemos muertos y casos confirmados y veremos donde estamos.

Aclaración:


Hay rectas ( que representan funciones exponenciales, recuérdese) ajustadas a intervalos de puntos. También aquí hay una diferencia con los ajustes que hice en los artículos anteriores y me gustaría explicarla. Hay principalmente dos formas de ajustar una exponencial ( o cualquier otra función ) a una serie de datos. Una es tomar en cuenta los errores absolutos de los datos, y otra es tomarlos relativos. A la primera forma se le conoce como aditiva, y a la segunda multiplicativa. Pongamos un ejemplo. Supongamos que tenemos dos datos, digamos, 10 muertos en un lunes, y otro dato son 100 muertos el domingo. Si la curva de la función pasa a 1 muerto del primer día y a un muerto del segundo día, y usamos el criterio aditivo, contamos esos dos errores al ajustar la curva por igual. Si usáramos el criterio multiplicativo, el error del primer punto y del segundo serían diferentes. El primero sería un error de 0.1 del total, ( el 10%), mientras que el segundo sería del 0.01 ( el 1%). Entonces para ajustar la curva tomamos en cuenta esos errores relativos y tratamos de minimizar esa cantidad sumada. Esto tiene el efecto de que "a ojo" la curva así ajustada se ve mejor en el papel semilog, mientras que en el papel normal parece desviarse mucho de los datos pequeños. El otro criterio se ve mejor en el papel normal, pero peor en el semilog. 

¿Porqué preferíriamos ver la función mejor en el papel "alterado"? A fin de cuentas la realidad indica que los muertos son muertos, ¿no? Está raro ajustar la curva al "logarítmo de los muertos", ¿no? Cada muerto cuenta igual, ¿no? Algo así fue lo que me pasó cuando hice los ajustes anteriores. También probé los otros, y para el caso de México no cambiaba mucho la tasa de duplicación (que era lo que me importaba) así que ya no cambié de criterio. Sin embargo en este tipo de ejercicio es mejor usar el ajuste multiplicativo. Es una de esas cosas donde la estadística nos ayuda a abrazar conceptos que nuestra intuición cotidiana puede confundir. No se trata de minimizar el muerto extra porque ya hay cien, y darle más importancia a los que ocurren cuando hay pocos casos. Se trata de darle la misma importancia al ritmo de crecimiento a lo largo de todo el ajuste. Dado que ese es el número que más nos preocupa, tenemos que ver una esperanza ( aunque sea duro de ver ) en el hecho de que si tienes veinte casos fatales nuevos cuando tienes 20'000 acumulados, vas mucho mejor que si tienes 10 casos fatales cuando tienes 1000 acumulados. 

 PD:


Por cierto, llamarle aplanarse la curva  a esto empieza a hacer parecer a Hugo Lopez Gatell como una rutina de Monty Python, y no es lo mejor para la situación del país. No somos una sociedad que confie en sus autoridades. Más les vale hacer su trabajo de forma más cuidadosa. Los que votamos por ellos también tenemos que mantenerlos bajo el ojo crítico.


Nenhum comentário:

Postar um comentário