terça-feira, 5 de maio de 2020

La Función exponencial y el nCovid19, parte 2

Bueno, estamos a 5 de mayo del 2020, y las declaraciones del día de Hugo Lopez Gatell están tan disparadas como las del Peje hace unos días... o tal vez cuentan con otros datos. La famosa curva de contagios no se ha aplanado. Sigue siendo una curva exponencial, y básicamente sigue siendo la misma de hace un mes. Esto no es tan grave, como veremos a continuación.
Déjenme mostrarles unas gráficas simples. Para seguir este artículete, recomiendo comenzar por la primera parte para aquellos que no estén familiarizados con la curva exponencial y la representación semilogarítmica. También vale la pena echarle un ojito para tener presente como se ve una curva exponencial.

Estoy usando los datos disponibles en la Wikipedia, actualizados diariamente y que parecen provenir directamente de la Secretaria de Salud. Recordemos que son los números de casos confirmados, no casos totales. Comencemos por hacer una gráfica simple de los casos confirmados totales por día, aprovechando para hacer algunas marcas interesantes temporales.

Bueno, las marcas no quedaron tan bonitas, porque estoy escribiendo contra reloj, pero eso no es lo que salta a la vista, ¿o si?. Vean la curva. A todas luces es una curva exponencial. Las marcas temporales están ahí para ver si podemos apreciar "a ojímetro" algún cambio en el comportamiento. Eventos detonantes, como la marcha del Día de la Mujer o el Vive Latino no parecen haber tenido particular trascendencia alguna. La marca de 100 casos y de 5 Muertos sirven para ayudar a la estadística: antes de eso se considera que los casos (¡confirmados!) son tan pocos, que pueden desviar la curva mucho, aunque en el caso de México esto no parece hacer mucha diferencia. Si vemos el día que se declaró la emergencia sanitaria (el 30 de marzo) tal vez haya un ligero reducimiento en el crecimiento de la curva, pero no es muy claro y podría ser puro ruido estadístico. 

Bien, hagamos el truco visual confirmador que expliqué anteriormente: grafiquemos esto mismo en papel "semilog", cambiando el eje y de forma que en lugar de pasos constantes, signifique que se multiplica por un factor en cada renglon hacia arriba. La gráfica presenta la siguiente apariencia.
 Muy bien, puede que no se vea muy recta, pero no tiene que ser recta por todos lados. Así nomas podemos ver mas o menos dos partes donde una recta ajusta "bastante bien". Del 11 de marzo hasta el cierre de la Universidad de Nuevo León (2020-03-17), hay una recta bastante empinada. Cara renglón remarcado implica multiplicar por diez. Podemos ver que paso de
11 casos a 118, efectivamente creció brutalmente en esos días (cada cuadrito es aproximadamente 1.8 veces más hacia arriba). Durante esos días el periodo de duplicación era menos de dos días.  El otro periodo donde hay una buena recta es a partir de la declaración de la Emergencia Sanitaria, el 30 de marzo, hasta la fecha. Pero es una recta mucho menos empinada. Así así nomas "adivinándole", podemos estimar que el periodo de duplicación es como una semana, le toma 7 puntitos tener el doble de casos a la gráfica. Por ejemplo, el 9 de abril teníamos 3441, el 16 de abril son 6297, aprox el doble, el 23 de abril son 11'633, el 1 de marzo 20'739. 

Muy bien, podemos hacer (¡ gracias a R !) un ajuste formal de una curva exponencial a los datos, y calcular de forma más precisa el periodo de duplicación promedio. Yo decidí hacer tres ajustes: uno tomando todos los datos, incluyendo los primeros casos confirmados, y también a partir de los 100 casos y de los 5 muertos, que es lo que recomienda la OMS para disminuir el ruido estadístico. A continuación muestro las gráfica con los ajustes en escala normal.


Y ahí andamos, pues. El ajuste exponencial no es perfecto, pero le pega bastante bien al comportamiento cualitativo. Los periodos de duplicación no parecen ser muy afectados por los primeros datos, y los tres ajustes nos dan periodos de aproximadamente nueve días. Pero es claramente más acelerado si usamoslos primeros datos, y más lento si los ignoramos. Si comparamos con la semana del cierre de la UNNL, donde era de aproximadamente cada dos días, la cosa no pinta tan terrible. ¿Será que de eso estaba hablando Lopéz Gatell? 

Mi problema con eso es que están tergiversando el sentido de "aplanar la curva". Es cierto que tenemos una tasa de contagios relativamente baja, y un periodo de duplicación largo, y puede que si tenga que ver con que se comenzaron a aplicar medidas de distanciamiento social muy a tiempo, o que sea sólo suerte o una combinación de ambas. Pero eso no es aplanar la curva. Aplanar la curva quiere decir que deje de ser exponencial. Mientras se mantenga creciendo exponencialmente, el número de contagiados nuevos diarios aumenta día con día. Eventualmente, por lento que sea, tendremos 20'000 contagiados nuevos en un día. Y como EUA demostró, eso no se puede sostener, aunque se vuelva lineal el crecimiento a partir de ese  momento. La meta es frenar la exponencial antes de llegar a números diarios insostenibles.

Decir que ya se aplanó la curva es esencialmente erróneo. No esta el cuero pa' correas. No se debe jugar con los términos técnicos en cuestiones de vida o muerte. Y no se deben de dar falsas esperanzas, como tampoco falsos pánicos. 


PD: Hablé de R en un paréntesis. R es un lenguaje de programación "de matemáticos estadísticos para matemáticos estadísticos". Es gratuito y libre (abierto). Contiene una inmensa gama de utilidades que facilitan estos análisis, y tiene una estética clásica en su sintaxis y resultados. Lo recomiendo ampliamente.

Nenhum comentário:

Postar um comentário