La curva de Lorenz de una distribucion da una idea de la desigualdad entre nodos ricos y nodos pobres, representando la tipica frase «el xxx% de la poblacion posee el yyy% de la riqueza», que hemos usado en las tablas de los posts anteriores. A partir de ella se puede considerar el índice de Gini, que viene a ser el area entre esta curva y la diagonal.
Una cosa curiosa de una distribucion exponencial, digamos para riqueza media \(k_m\),
\(p(k)= {1 \over k_m} e^{- {k\over k_m}} \)
es que la curva de Lorenz tiene en si misma cierta invarianza de escala, pues es independiente del parametro que gobierna la exponencial. Esto me pilló de sorpresa el otro dia y lo he calculado lo menos cinco o seis veces; de hecho es un ejercicio muy majo y rápido para poner en los problemas de integrales del bachillerato. De todas formas el resultado esta directamente en la wikipedia; el porcentaje R de riqueza poseido por el porcentaje P mas pobre de la poblacion es:
\(R(P)=P + (1 – P) \ln (1-P)\)
Y, claro, esto significa que el coeficiente de Gini es tambien independiente de la riqueza media de la exponencial; es siempre igual a 0.5.
A nosotros nos interesa más bien el porcentaje Y de riqueza poseido por el porcentaje X mas rico de la población, dado que estamos estudiando sobre todo la parte extrema de la distribucion. Obviamente Y=1-R y X=1-P, asi que
\(Y(X) = 1-R(1-X) = X (1 – \ln X)\)
Que es el resultado al que -todavia misteriosamente- parecen converger los dos primeros experimentos de los posts anteriores. Fijaos que esta función es la integral del logaritmo, usease que se da el caso de que la «densidad porcentual» de riqueza es
\(Y'(X) = – \ln X\)
Lo que me lleva a la confusión de llamar de cuando en cuando «distribución logaritmica» a la exponencial, pero es una nomenclatura de la que me estoy corrigiendo (no ocurre lo mismo con el llamar «porcentajes» al tanto por uno, que es lo que he estado haciendo en todo este post, y no tiene visos de cambiar, porque ademas de sonarme muy pedante no esta el simbolo directamente en el teclado)
En general, es curioso esto de pensar en distribuciones de riqueza con la exponencial; es como si la probabilidad de tener un dinero en el rango (el «bin» o cesto) Xn fuera de algun modo proporcional directamente a la probabilidad de tener un dinero en el bin anterior Xn-1. Y los estadisticos tienen un montón de distribuciones alternativas para encajar empiricamente los casos extremos, tirando de Gamma o de Weilbull.
Deja una respuesta