Por Agustín
Planteamiento
Siempre que nos planteamos un análisis criptográfico echamos en falta una relación fiable de las frecuencias de las letras en castellano -suponiendo que éste sea el idioma del mensaje cifrado-. Se trata de un problema complejo porque, como se explica en Wikipedia, hay textos de muy diversa índole, lo que produce sesgos significativos en los resultados. También en ese enlace nos ofrecen dos estadísticas, una basada en un trabajo de Fletcher Pratt, y otra en el Quijote. En ninguna de ellas se computa la frecuencia del “espacio” o separador de palabras, ni de los signos de puntuación. Por otra parte no parece que El Quijote pueda ser considerado un texto estándar en la actualidad.
Por ello he elegido un texto más moderno, de indudable calidad literaria y de longitud suficiente: “La Regenta”, de Leopoldo Alas (Clarín), para construir una lista de frecuencias, con el siguiente planteamiento...

