">

La misteriosa ley de Zipf – 23/11/2021 – Marcelo Viana / Brasil

Alrededor de 1935, el lingüista estadounidense George Zipf observó que al enumerar las palabras en orden descendente de su uso en diferentes contextos, la frecuencia de la primera palabra en la lista era (aproximadamente) 2 veces mayor que la de la segunda palabra, 3 veces mayor que esa. del tercero, y así sucesivamente.

Por ejemplo, las tres palabras más utilizadas en inglés son el artículo «el», la preposición «de» y la conjunción «y», donde «el» aparece 1,92 veces más que «de» y 2,42 veces más que «y».

De hecho, este peculiar comportamiento ya había sido señalado antes, por el taquígrafo francés Jean-Baptist Issop (1868-1950) y por el físico alemán Felix Auerbach, y tampoco es privilegio de la lengua inglesa: es válido para todos los idiomas conocidos, incluidos los artificiales, como el esperanto.

Además, no se limita al dominio de la lingüística: el mismo tipo de distribución ocurre en listas de datos de diferentes fuentes. Una de las situaciones más estudiadas, ya señalada por Auerbach en 1913, se refiere al tamaño de las ciudades.

Por ejemplo, cuando enumeramos las ciudades brasileñas en orden descendente de su población, observamos que la más grande (São Paulo) es 1,92 veces más grande que la segunda (Río de Janeiro) y 2,42 veces más grande que la tercera (Brasilia).

El primer intento de explicar matemáticamente este fenómeno se debió al propio Zipf y es muy curioso. Supuso que tanto el hablante como el oyente querían poner el menor esfuerzo posible en la comunicación, y utilizó argumentos estadísticos para concluir que esto conduciría al tipo de distribución de frecuencia prescrito por la ley. Pero no está claro cómo esta idea podría extenderse a otras instancias de la ley de Zipf fuera de la lingüística.

Se han propuesto otras posibles explicaciones científicas a lo largo de los años, pero la validez de la ley de Zipf sigue siendo un misterio. En parte, esto se debe al hecho de que, a diferencia de la mayoría de los enunciados matemáticos, esta ley solo es aproximadamente correcta: las frecuencias de palabras en el idioma, las poblaciones de las ciudades y otros datos similares tienen un comportamiento complejo, que la ley de Zipf refleja solo de manera aproximada.

ENLACE ACTUAL: ¿Te gustó este texto? El suscriptor puede lanzar cinco accesos gratuitos de cualquier enlace por día. Simplemente haga clic en la F azul a continuación.

Noticia de Brasil
Fuente: uol.com.br

Salir de la versión móvil