En promedio, ¿cuántas letras crees que tiene una palabra del idioma español? Este es un dato curioso de lengua que quizás nunca te preguntaste. Yo sí, y más de una vez, porque en la corrección de textos los trabajos se cotizan por cantidad de palabras o cantidad de letras (caracteres con espacios, para ser más precisos).

Quienes nos dedicamos a los libros sabemos lo que pasa al trabajar sobre un texto repleto de palabras largas: más letras significan más horas frente a la pantalla, y ese tiempo debe cobrarse como corresponde. Por eso lo ideal es calcular los precios basándonos en caracteres con espacios, no en palabras.

Cantidad de letras por palabra en español

Más allá de ese dato del mundillo literario, la cantidad promedio de letras de una palabra en español se mantiene curiosamente estable entre autores diversos, entre épocas y estilos distintos, en textos escritos para públicos muy diferentes: en promedio, una palabra en nuestro idioma tiene 5 letras. Veamos algunos ejemplos.

En el momento en que escribo este texto, para el libro 10 curiosidades de la lengua española, con la obra todavía en borrador, el promedio de letras por palabra es de 4,95: apenas 1 % de diferencia con respecto al promedio general. La tendencia es tan estable que, incluso en el Quijote, un libro escrito hace más de cuatrocientos años, el promedio de letras por palabra es 4,48[1]. O sea que las palabras que usó Cervantes en su obra tienen solo «media letra menos» que las que estás leyendo ahora.

Cuántas letras tiene una palabra en español

¿Cinco letras por palabra te parecen muchas o pocas? ¿Esperabas un número similar? ¿Qué hubieras imaginado antes de conocer este dato?

Promedio de letras por palabra en español

Promedio de letras por palabra en castellano

Te confieso que, antes de realizar el cálculo, yo hubiera esperado que las palabras de Cervantes fueran más largas que las mías, solo porque es un autor antiguo, del Barroco, un arte famoso por las formas recargadas. Pero no, resulta ser que un texto moderno como este artículo, con lenguaje llano y sin ninguna ambición artística, usa más letras por palabra que la mejor novela de todos los tiempos (¡en eso no admito discusión!).

La cantidad de letras por palabra varía entre idiomas y la diferencia puede ser bastante significativa. Veamos un ejemplo. El alemán es un idioma que muchos hispanohablantes consideramos demasiado complejo, ¿sabes a qué se debe? Pues una buena razón es, precisamente, que tiene palabras más largas que las nuestras.

Cantidad de letras por palabra en alemán

Promediando varias fuentes consultadas, el alemán tiene alrededor de 6 letras por palabra, un 20 % más que el español. Esto se debe a que la lengua alemana tiene una manera especial de formar sustantivos mediante composición: una palabra «se pega» detrás de otra, y después se agrega otra, y después otra más…, sin que exista una cantidad límite (en teoría). Veamos cómo funciona esto en un caso concreto.

Kraftfahrzeughaftpflichtversicherung[2] significa seguro de responsabilidad civil para vehículos de motor. Analicemos la composición de esta palabra. Kraft quiere decir fuerza o potencia. Fahr equivale a conducir o desplazarse en vehículo. Zeug se traduce como artefacto u objeto. Haft quiere decir responsabilidad legal. Pflicht significa obligación o deber. Versicherung significa seguro o contrato asegurador. Así, mediante la suma de todas esas palabras distintas se crea una nueva con significado muy preciso: seguro de responsabilidad civil para vehículos de motor. ¡Qué lío! Mejor sigamos con nuestro amado español.

Cómo hacer estadísticas de un texto

Una creencia muy extendida entre las personas es que lengua y matemática son asuntos separados. La mayoría de los hablantes presupone que el lenguaje humano no se puede medir y, en cierto sentido, no están muy equivocados: las palabras no se pueden pesar en gramos ni tampoco se miden en kilómetros por hora, para poner dos ejemplos absurdos.

Pero… ¿qué tal si te dijera que se pueden hacer mediciones exactas sobre cualquier texto para obtener estadísticas muy reveladoras?

Análisis cuantitativo de textos

El cálculo que hicimos comparando el Quijote con este blog es un ejemplo de cómo podemos liberarnos de un prejuicio lingüístico sin fundamentos usando la matemática. Creer que una novela del Barroco tiene más letras por palabra que un texto moderno resultó ser una suposición falsa, y descubrimos la verdad haciendo una medición concreta y precisa, un cálculo matemático: cantidad total de letras dividida por cantidad de palabras es igual a cantidad promedio de letras por palabra.

Existen muchas maneras de medir textos y ahora te voy a revelar mis favoritas, las que uso todos los días para aumentar la productividad al escribir o al corregir.

#1. Contar palabras en Word

Esta es la opción básica y está disponible en la mayoría de los procesadores de textos, además del mencionado. Contar palabras es muy útil cuando te piden que escribas cierta cantidad de texto para el colegio, la universidad o el trabajo. No es necesario contar las palabras una por una, ni siquiera tienes que salir del documento. En Word, ve al menú «Revisar» y haz clic en «Contar palabras». Verás una tabla con número de páginas, de palabras, de caracteres con y sin espacios, de párrafos y de líneas. Esta es la medición más común de todas y su finalidad práctica es ayudarte a controlar la extensión del texto.

#2. Buscar (y reemplazar) en Word

Esta es otra herramienta muy útil y precisa. Mira este ejemplo de la vida real: hace muchos años escribo para un cliente español y resulta que este buen hombre no quiere que emplee adverbios terminados en -mente, ni tampoco quiere ver la palabra muy en los textos que me compra. Por eso, cuando escribo para él, lo hago pensando todo el tiempo en esa instrucción y ya casi no se me escapan esas «palabras prohibidas». Aun así, antes de entregar el documento final, hago un control de calidad obligatorio para buscar cuántas veces aparecen muy y –mente en el texto. El único resultado aceptable es 0. Rara vez encuentro una de esas palabras, pero, cuando hallo una, la puedo borrar o cambiar por otra en segundos sin tener que volver a leer todo el documento.

El mismo cliente parece tener un problema con la conjunción pero: no quiere que la use demasiado. Mi solución es parecida a la del caso anterior: busco pero en el documento y me aseguro de que no aparezca más de una vez cada dos páginas. Entonces, si escribí seis páginas y descubro cuatro peros, reemplazo uno de ellos por algún sinónimo, y santo remedio.

Lo mismo puedes hacer con cualquier palabra. Imagina que escribes sobre literatura. En ese caso es muy probable que uses la palabra libro con frecuencia y puede que se repita en la misma oración o en oraciones contiguas. La solución a este desagradable problema es buscar la palabra libro y reemplazarla por obra la mitad de las veces. Un pequeño detalle como ese puede hacer una gran diferencia en la calidad del texto.

#3. Usar TextSTAT

Te invito a entrar en las «ligas mayores» del análisis estadístico de textos. Te revelaré una herramienta asombrosa para que analices tu propia escritura con precisión matemática y descubras la información que se oculta en lo que tú mismo escribes.

TextSTAT es un programa disponible para Windows, Mac OS y Linux. TextSTAT es absolutamente gratis y, si eres programador, puedes crear tu propia versión porque es de código abierto.

Pero… ¿qué hace TextSTAT? El programa tiene muchas funciones sumamente útiles. Por ejemplo, te muestra una lista de todas las palabras distintas usadas en el texto y te dice cuántas veces se emplea cada una. Esto es muy interesante para saber de qué temas habla un escrito sin dejarnos confundir por los adornos de la retórica. Por ejemplo, si analizamos un tratado internacional titulado Un llamado a la paz mundial, pero el texto no menciona ni una sola vez las palabras libertad y democracia y, en cambio, dice quince veces los términos sanciones y bombardeos, ahí hay gato encerrado y las estadísticas textuales nos ayudan a descubrirlo. TextSTAT te permite buscar palabras aisladas (usa la función «Frecuencia de palabras») o en contexto (emplea el comando «Concordancia»). ¡Anímate a experimentar con esta poderosa herramienta!

El español en números

El español en números es tan interesante como el español en letras, si me permites el jueguito de palabras. Analizar cuantitativamente la lengua que hablamos arroja resultados inesperados y asombrosos.

Puedes usar las herramientas que acabo de compartir contigo para hacer tu propio análisis y mostrarme las conclusiones a las que llegaste dejando un comentario abajo.

La matemática secreta del español

Nuestro idioma está repleto de combinaciones y recovecos fascinantes para el ojo bien entrenado. El estudio cuantitativo de una novela, un cuento o un corpus de poemas puede retroalimentar resultados cualitativos muy enriquecedores, si se lo hace con seriedad.

Otras cifras interesantes del español

Ahora que ya vimos cómo es posible medir las palabras y las letras con precisión matemática, veamos algunos datos curiosos que arrojan estas mediciones.

#1. ¿Cuál es la letra más usada en español?

Es la e, seguida de cerca por la a.

#2. Frecuencia de aparición de letras en español

Las vocales en general ocupan casi la mitad de los textos en nuestro idioma (45 %). Entre las consonantes, las más frecuentes son la s, la r, la n, la d, la l y la c (37 % del total de las letras empleadas). La k, la w y la x son las menos frecuentes de todas. ¿Te habías puesto a pensar en esto alguna vez?

#3. ¿Cuántos hablantes de español hay en el mundo?

Existen unos seiscientos millones de hablantes de español, si contamos los nativos hispanoparlantes y las personas que aprendieron nuestro idioma como segunda lengua en la escuela, en la universidad, en otras instituciones educativas o por su propia cuenta.

#4. ¿En cuántos países se habla oficialmente español?

El español es la lengua oficial de 21 países. De ellos, 19 están en América (Argentina, Bolivia, Chile, Colombia, Costa Rica, Cuba, Ecuador, El Salvador, Guatemala, Honduras, México, Nicaragua, Panamá, Paraguay, Perú, República Dominicana, Uruguay, Venezuela, Puerto Rico), uno en Europa (España) y uno en África (Guinea Ecuatorial).

#5. ¿Hay países hispanoparlantes en Asia?

Ya no… Filipinas fue el único país asiático donde el español se reconocía como lengua oficial hasta 1973, cuando esto dejó de ser así por motivos políticos.

#6. ¿Cuál es el país con más hispanohablantes?

México es el país con más hablantes de español en todo el mundo (unos ciento treinta millones) y se estima que en los próximos años Estados Unidos ocupará el segundo lugar, que ahora es de Colombia, con alrededor de cincuenta millones de hablantes.

#7. ¿Cuántas palabras usamos los hablantes de español?

Según la Universidad Nebrija, los hispanohablantes usamos entre 1000 y 1500 palabras cotidianamente, apenas un 5 % de las que conocemos (unas 30 000).

Y tú ¿sabías que la lengua española se puede medir y cuantificar con tanta precisión? ¿Qué te parecieron estos datos numéricos sobre nuestro idioma?

¡Déjame un comentario aquí abajo y cuéntame tu opinión sobre este interesante asunto!

[1] Cálculo basado en la versión de la obra en texto plano publicada por la Universidad de Santiago de Compostela.

[2] También se admite Kraftfahrzeug-Haftpflichtversicherung.

Leave a comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *