¿Muchos datos comienzan con 1 | Café y teoremas

De los 179 municipios de la Comunidad de Madrid, más o menos un tercio (54 exactamente) tiene la propiedad que su número de habitantes comienza con 1. Este es un ejemplo de la Ley de Benford, que establece que en muchos conjuntos de datos digitales reales, alrededor del 30% de los datos tienen un 1 como primer dígito.

La ley se remonta a 1880, cuando el astrónomo estadounidense Simon newcomb notó un fenómeno curioso al manejar un libro de tablas de logaritmos: las primeras páginas, es decir las que correspondían a números cuyo primer dígito es 1, estaban mucho más gastadas que las otras . El avistamiento de Newcomb fue relativamente olvidado hasta Frank Benford, ingeniero y físico estadounidense, el redescubrió en 1938, probándolo en 20 conjuntos de datos de diversos orígenes, como el número de habitantes de 3259 ciudades en los Estados Unidos, la masa molecular de 1800 sustancias o las cifras que aparecen en 308 artículos de Resumen del lector. Entonces, la “ley del primer dígito” de Newcomb se conoció como “ley de Benford”.

Sin embargo, no todos los conjuntos de datos siguen la ley de Benford. Por ejemplo, los números de zapatos claramente no cumplen con las normas ni se aplican a los datos de los procesos asociados con el azar, como los números asignados a la lotería de Navidad. Así que no se preocupe si el décimo que compró no comienza con 1: la probabilidad de que aparezca su número sigue siendo muy baja, pero independiente del primer dígito.

Aunque no nos facilita ganarnos la lotería, la ley de Benford aparece en una amplia variedad de contextos: números de calles, cotizaciones bursátiles, tramos de ríos, zonas rurales, etc. Pensándolo un poco, es fácil ver que estos datos tienden a comenzar con más frecuencia con uno solo: por ejemplo, si se consideran los números de puertas de todas las calles de España, muchas calles son “pequeñas”. “- tienen entre 10 y 20 números – y es relativamente raro que una calle” larga “- con más de 100 números – tenga más de 200 números.

La ley de Benford aparece en contextos muy diversos: números de calles, cotizaciones, tramos de ríos, superficies terrestres …

Como regla, la ley de Benford está llena de datos que representan cantidades sin límites fijos (longitudes, poblaciones, etc.); además, la aproximación de la ley es tanto mayor cuanto mayores son los órdenes de magnitud cubiertos por los datos. En este sentido, la ley de Benford es un pariente de la distribución normal, o campana de Gauss, que aparece de forma natural en todo tipo de fenómenos estadísticos.

READ  Vacuna coronavirus: Viróloga Margarita del Val, pesimista sobre la efectividad de las vacunas: "Todavía no veo la luz, no me convencen para nada"

Precisamente, la ley de Benford está formulada en términos de logaritmos (en base 10): decimos que un conjunto de números satisface la ley de Benford si la probabilidad de que un miembro del conjunto comience con el número c es el logaritmo de (c +1) – logaritmo de c. Él logaritmo de un número positivo N, que denotamos por log (N), es el exponente al que debemos elevar 10 para que el resultado sea N. Por lo tanto, el logaritmo de 1000 es 3 (10 ^ 3 = 1000), el de 10 es 1 (10 ^ 1 = 10) y el de 1 es 0 (10 ^ 0 = 1). Todo número real positivo tiene un logaritmo, que a menudo es un número irracional, por ejemplo, log (2) = 0.3011 …

Además, los logaritmos tienen la importante propiedad de “transformar productos en sumas”: log (a * b) = log (a) + log (b). Por lo tanto, si multiplicamos un número por una potencia de 10, la parte decimal de su logaritmo no cambia. Por ejemplo: log (2.37) = 0.3747 … y log (237) = log (100 * 2.37) = log (100) + log (2.37) = 2 + 0.3747 … Entonces , todos los números de la forma log (2.37 * 10 ^ n), para cada entero n, tienen log (2.37) como parte decimal.

Además, dado que la función logaritmo aumenta, es decir, si un número es menor que otro, el logaritmo del primero es menor que el del segundo, entonces podemos asegurarnos de que un número comience con el dígito c exactamente cuando la parte decimal de su logaritmo está entre log (c) y log (c + 1). Por lo tanto, la probabilidad de que un número comience con c es la misma que la probabilidad de que la parte decimal de su logaritmo esté entre log (c) y log (c + 1), es decir, es en el intervalo (log (c), log (c + 1)), cuya longitud es log (c + 1) – log (c).

READ  Luna azul y lluvia de meteoritos

Entonces, en un conjunto que satisface la ley de Benford, la probabilidad de que un elemento comience con 1 es log (2) – log (1) = 0.3011 … Asimismo, la probabilidad de que un número comenzar con 8 es muy pequeño, especialmente log (9) – log (8) = 0.0511 … Es decir, el 30% de los números comenzará con 1, pero solo el 5% comenzará con 8.

Además de ser un fenómeno curioso y muy común, la ley de Benford también tiene aplicaciones en la vida real. Por ejemplo, si sabemos que las toneladas de CO2 liberadas a la atmósfera por empresas en España cumplen con la ley de Benford, y el 15% de los datos de emisiones que proporciona la empresa Toxic & Co empieza por 8, entonces tendríamos motivos para sospechar que esta empresa está proporcionando información falsa. Por supuesto, eso no sería una prueba definitiva, pero indicaría que vale la pena considerar el caso.

Javier Aramayona Es investigador titular del Consejo Superior de Investigaciones Científicas del Instituto de Ciencias Matemáticas (ICMAT)

Ágata A. Timón G. Longoria es responsable de la comunicación y divulgación de ICMAT

Café y teoremas es una sección dedicada a las matemáticas y el entorno en el que se crea, coordinada por el Instituto de Ciencias Matemáticas (ICMAT), en la que investigadores y miembros del centro describen los últimos avances en esta disciplina, comparten puntos de encuentro entre la matemática y otras expresiones sociales y culturales y recordar a quienes marcaron su desarrollo y supieron transformar el café en teoremas. El nombre evoca la definición del matemático húngaro Alfred Rényi: “Un matemático es una máquina que convierte el café en teoremas”.

READ  En imágenes: las mejores fotos de la Tierra de la NASA en 2020

Montaje y coordinación: Ágata A. Timón García-Longoria (ICMAT)

Puedes seguir LA MATERIA dentro Facebook, Gorjeo, Instagram o suscríbete aquí a nuestro Boletin informativo

More from Tiburcio Pasillas

Airbus ofrece una nueva forma de volar y una revisión de los aviones | Internacional | información

El objetivo de las aerolíneas y los fabricantes sería reducir los costos...
Read More

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *