#21 ¡Interesante pregunta! En general, es sorprendente la capacidad de cómputo que hoy en día tiene incluso un teléfono de bolsillo. Mi primer ordenador llegó a casa cuando yo comenzaba la EGB. Tenía 3,5 MHz de frecuencia de reloj. Te escribo ahora desde un portátil corriente que marca 2,3 GHz. En otras palabras, lo que en 2021 requiere un ciclo de reloj, hace treinta años necesitaba de 650. Y esta no es la mejor métrica si hablamos de capacidad de cómputo, pero sí una de las más visibles.
Quizá los contratos de la PLCSP son el conjunto de datos públicos más grande con el que he trabajado [1], y tampoco es para tanto. En un ordenador corriente pueden indexarse quizá en una noche, y el cuello de botella no es la máquina sino la red (utilizo un backend remoto).
Tampoco para procesar los datos de todo el Boletín Oficial del Registro Mecantil (BORME) me resultó necesario distribuir las tareas [2]. Y aunque supongo que para aplicar OCR sobre la totalidad de los documentos de la PLCSP sí va a lo será, hoy en día es viable y asequible con cualquiera de las plataformas que dan servicio en la nube.
[1]
[2]
#22 Aquí va una propuesta concreta que tendría un impacto notable: liberar los datos mercantiles. Lo he argumentado en [1] y lo he dicho muy fuerte en [2]. Incluso en formato chorrada en [3] .
[1] https://jaime.gomezobregon.com/ministra-libere-los-datos-mercantiles
[2] https://jaime.gomezobregon.com/discurso-premio-blasillo
[3] https://twitter.com/JaimeObregon/status/1429780051659304968
[2] https://jaime.gomezobregon.com/discurso-premio-blasillo
[3]