Resumo para impacientes
O mapa -> Mapa das escolas da emigración
O link rot
O concepto de “link rot”, que se podería traducir a algo como podremia de ligazóns ou comúnmente rotura de enlaces, ocorre cando un sitio ou recurso xa non se pode atopar en internet. Neste caso, o que vos vou contar si que se pode seguir visitando pero está nun estado inusuable. É común que moitas webs queden desatendidas ou desaparezan co tempo a medida que as persoas que as levaban ou mantiñan perden o interese. Algo que debería ser menos frecuente é que isto ocorra con sitios web creados/mantidos polas administracións. Neste caso estouvos a falar da web escolas da emigración. Actualmente, esta web está nun estado inusable, probablemente non pola culpa da administración senon polo cambio na API de google maps. Este cambio ocorreu xa no 2018 e fixo obrigatorio o uso dun método de pago de forma que, moitas webs coma esta, quedaron practicamente inutilizadas ao non estar ben configuradas. Neste caso, aínda que é posible ver máis ou menos as localizacións en canto lle tocas, rompe completamente.
Vendo o tempo que fai deste cambio e o feito de que agora a API é de pago, paréceme pouco probable que a administración se acorde xa deste proxecto. Cabe destacar que cada certo tempo ocorre un milagre como pasou con Galicia Nomeada que volveu recuperar o proxecto da toponimia cunha web mellor ca nunca. Visto todo isto, o que decidín facer é simple: un “remake”
Os datos
Por sorte os datos para este proxecto están dispoñibles na propia páxina. Dende o propio mapa pódense exportar ao formato .kmz, axeitado para o google earth. Isto fai que non sexan necesarios procedementos avanzados de “crawling”. Este tipo datos podemos, despois, convertelo a outros máis comúns. Eu usarei o geojson que está estandarizado e é compatible con python e folium (o que usarei máis adiante). Hai que dicir que se podería traballar cos datos orixinais xa que non deixan estar nun formato moi similar ao xml.
O mapa
Folium é unha libraría de python que permite, de forma bastante fácil, crear mapas a partir de múltiples tipos de datos (neste caso o geojson de antes). O máis relevante quizais é que soporta openstreetmap. Openstreetmap, en resumo, é como Google maps pero gratuíto e aberto o que o fai bastante atractivo para un proxecto deste estilo. Tan importante coma isto é que para usar os mapas non hai que pagar e calquera pode achegar o seu coñecemento a eles, en forma de topónimos por exemplo.
Con Folium podemos coller os datos exportados no geojson e introducilos no mapa directamente, isto daranos unha serie de marcadores detallando a localización de cada unha das escolas indianas. Para darlle un pouco máis de gracia ao asunto podemos engadir popups e tooltips para que engadan información adicional. Aí eu introducín o nome de cada escola, unha foto que moi convintemente viña embebida no propio geojson. Pero non todo ían ser cousa boas, as imaxes viñan incluídas en forma de ligazón. A páxina está configurada de tal forma que non permite peticións a través doutros lugares web, probablemente por razóns de seguridade. Desta forma para poñelo bonito a única opción que quedaba era facer “crawling” destas imaxes. Isto é, descargalas e almacenalas eu para que puideran ser servidas co resto da páxina web. Xa que os propios links estaban no json embebidos isto non foi difícil, descargar as imaxes a partir desas URLs e cambiar os vínculos para que apuntasen a este sitio web.
Adicionalmente, engadín un campo de información extra que é unha ligazón á paxina orixinal onde hai máis detalles. Este último campo construino “adviñando” o formato das ligazóns permanentes que crea o servizo. Desta forma pódese acceder aos detalles de cada escola na páxina orixinal, mantendo a utilidade e as visitas desta (non vaia ser que a liquiden por non ter tráfico) e evítase re-implementar todo de novo.
Finalmente, o mapa resultante, aínda que non é nada do outro mundo quedou bastante xeitoso e o que é mais importante, salvo cambio grave en openstreetmap debería ser estable.
Os bugs
Coma todo, tiña que ter bugs. O máis obvio foi atopar a Escola Rosalía de Castro na costa cerca de África. Isto debeuse a que nos datos desta escola a lonxitude e latitude estaban ambos a 0. Isto non é cousa da exportación así que o problema leva aí sen solucionar unhos anos. O máis interesante é que noutro lugar da páxina, nos detalles da escola en si, as coordenadas son correctas. Unha vez copiadas o problema quedou solucionado.
Máis interesante é o feito de que o xerador de ligazóns permanentes da páxina web non funciona ben. Se a escola ten no nome unha ñ non é capaz de crear o vínculo. Sorprendentemente con outros caracteres especiales si funciona, por exemplo, ignora as tiles. Debido a isto, é posible que neses casos o enlace de máis información que aparece no mapa non funcione ben.