Introdución

Para quen non o saiba, o wordle é un simple xogo de adiviñar palabras de 5 letras. É fácil ver porque se fixo tan famoso xa que é moi accesible e permíteche compartir os teus intentos cos teus amigos de maneira moi simple. Como debe ser, este xogo xa foi adaptado ao galego da man de Abraham Martinez Gracia. Pero hai algunha palabra ou combinación delas que sexa a mellor para garantir o teu éxito e superar a todos os teus colegas? Ben, parece que non fun o único que o pensou, pero vamos facer esta análise para a nosa versión en galego. A modo de disclaimer direi que non sei exactamente que lista de palabras usa o wordle, eu vou usar a que empreguei para facer typer-gal, así que é posible que falten as últimas palabras que engadira a RAG.

Ao choio

Partindo da lista de todas as palabras posibles, debemos seleccionar aquelas con 5 letras, xa que son as que emprega o wordle. En todo este proceso debemos eliminar palabras “espurias” que están incluídas no dicionario e que realmente son prefixos (i.e. vaso-) ou expresións (a fin, a man, etc.). É necesario ter coidado tamén con nomes propios e outras palabras que teñan letras en maiúscula. A mellor forma de evitar problemas é pasalo todo a maiúscula ou minúsculas. Finalmente, tamén se deben ter en conta os acentos e a ñ, que poden dar problemas máis adiante.

Desta forma obtemos que (cando menos nesa versión do dicionario) hai un total de 3351 palabras de 5 letras.

As letras

Xa coa lista definitiva de palabras podemos adentrarnos no análise, letra a letra. A forma máis fácil de ver que letras son as máis comúns e representativas deste conxunto de palabras é mediante un mapa de calor. Con esta figura poderemos ver claramente que letras son as que máis se repiten, pero tamén as súas posicións nas palabras en si.

Heatmap das palabras de 5 letras en galego

Se agrupamos as letras poderemos ver que as máis comúns son as vogais, con 4 delas no top-5 das letras máis repetidas. Desta forma, vendo o top-10 mostrado abaixo podemos empezar a pensar que palabras teñen a maior cantidade desas letras como unha boa forma de eliminar moitas posibilidades en poucos intentos.

Top-10 das letras máis comúns

Puntuando…

Con estes datos podemos obter varias métricas sobre que opcións sería mellor empregar á hora de adiviñar a palabra do dia no wordle, ou canto menos nos primeiros intentos cando vas a cegas.

A forma máis fácil de medir a utilidade dunha palabras é ver cantas outras pode descartar. Para isto simplemente debemos buscar as letras máis comúns e tentar agrupalas nunha mesma palabra. Para obter un número representativo deste poder discriminativo debemos sumar as posibilidades de que unha das súas letras apareza en calquera palabra (número de aparicións/total palabras). Cabe destacar que esta métrica é máis útil se evitamos que unha mesma letra se repita máis dunha vez, xa que así poderemos eliminar o maior número de variables do noso cadro do wordle. Así, nomearemos esta métrica como presente_sin_rep e presente_rep na táboa final.

Outra cousa a medir é a posibilidade de que unha letra apareza exactamente no lugar no que se escribe. Como se puido ver antes no mapa de calor, a pesar de que a letra “A” é moi común o máis habitual é atopala na quinta posición. Desta forma esta medida sería algo equivalente á posibilidade de acertar un cadro verde no wordle, así que lle chamaremos verde.

De maneira similar, tamén pode ser importante ter en conta as posibilidades de que unha letra non apareza no lugar no que se predixo pero si en calquera outro da palabra. Isto seria equivalente a un bloque amarelo, polo que así lle chamaremos.

Como quedaría logo a cousa? A palabra con maior poder discriminativo, é dicir, que pode eliminar máis letras frecuentes é eiroa que é un sinónimo de anguía. Se atendemos á posibilidade de acertar cadros verdes á primeira, a mellor palabra seria carto. Para acabar, se por algunha razón o que necesitas son cadrados amarelos a toda costa, a túa mellor aposta sería caroa, que é un sinónimo de caguña.

Puntuacións

Os resultados coas puntuacións para todas as palabras, pódense descargar aquí

Código