Hace 4 años | Por --491272-- a fomento.gob.es
Publicado hace 4 años por --491272-- a fomento.gob.es

El Ministerio de Fomento publica hoy en su página web (https://observatoriotransporte.fomento.gob.es/estudio-experimental) los resultados del estudio piloto y experimental denominado “Estudio de la Movilidad Interprovincial de Viajeros aplicando la Tecnología Big Data”, como un contenido relevante dentro de los disponibles en el Observatorio del Transporte y la Logística en España. Se trata de un proyecto desarrollado durante 2018 que emplea por primera vez esta tecnología para obtener los flujos de movilidad interprovincial a nivel nacional.

Comentarios

y

#4 Entiendo que es el análisis que se hace con los datos que se han recopilado, ¿no? Lo que no se que tiene eso de tecnológico, salvo la recopilación de datos, que tampoco entiendo que deba ser la leche con los medios de hoy en día, vamos, que tecnológico puede, pero nada del otro mundo.

Z

#8 ¿Te parecen poco tecnológicas las sentencias SQL supercomplejas, las optimizaciones de bases de datos, las transformaciones y demás? Deberias probarlo

p

#12 bigdata no implica "sentencias SQL supercomplejas" ni mucho menos. De hecho suelen ser más bien lo contrario, operaciones sobre un volumen de datos inmenso, que se distribuye entre los dostintos nodos de trabajo.

Tampoco implica "optimizaciones de bases de datos", de hecho la mayoria de veces se usan formatos planos (estilo csv) y metadatos para definir las columnas (usando Hive por ejemplo). Estos ficheros suelen estar organizados en directorios por fecha, a modo particionamiento. Lo importante es que todo se basa en un sistema de ficheros distribuido y redundante (HDFS en el caso de Hadoop, S3 en el caso de AWS,...).

Las transformaciones, muy complejas no suelen ser. Normalmente rellenar datos por defecto, traducir valores de un formato a otro. En los casos más complicados puedes tirar de herramiemtas mas complejas (ETL estilo Pentaho).

Decir hoy dia bigdata es demasiado generico. El ecosistema de Hadoop por ejemplo es inmenso, y abarca soluciones de machine learning (Spark),...

#12 Habría que ser muy necio para querer trabajar con grandes volúmenes de datos usando SQL... de hecho eso obligaría al uso de sentencias SQL supercomplejas, las optimizaciones de bases de datos, las transformaciones y demás... para nada!

Z

#21 habrá cambiado la cosa o habré visto a algún necio hacer eso. No es mi especialidad por eso hablo sin saber, sé que hace años me pidieron ayuda para unas SQL que usaban para hacer "big data" y la gente lo hacía así. Ahora por lo que veo ha evolucionado mucho

maloconocido

#22 si te cabe en una máquina no es Big data

p3riko

#8 que yo sepa, puede que me equivoque, Big data es una etiqueta para indicar la acción del tratamiento de grandes volúmenes de datos en crudo en poco tiempo. Para eso usan, por ejemplo, la tecnología que proporciona hadoop, que no es más que un almacén repartido en x nodos donde se puede almacenar información de forma masiva para su tratamiento (limpieza para quitar el grano de la paja) mediante algoritmos/programas en java,phyton, etc... Luego esos datos depurados se pueden sacar para su análisis con data science. Es decir, Big data no analiza datos, transforma información ininteligible en información válida. Para ello mínimo deben cumplir las 3 Vs para decir que es Big data: veracidad de la información, volumen de información y velocidad en el tratamiento de la información.

#4 #13 tampoco está mal dicho tecnología Big Data. Si tienes un volumen alto vas a tener que meterte en un cluster de Hadoop para transformarlos y analizarlos y por ahora no hay mucha alternativa (quizás H2O, pero también se está enfocando a ser usado en ese tipo de clusters). Que es cierto que luego tienes montón de cosas super específicas, pero todas se basan en el mismo enfoque Map Reduce aunque optimizado para una determinada tarea.

#8 sólo la recopilación de datos en tiempo real tiene una infraestructura y tecnología detrás de la leche. La limpieza, transformación, agregación y anonimización tampoco se quedtiene otro tanto. a atrás. El análisis, depende de cómo les hayan pasado los datos de desagregados puede ser fácil o tener bastante complicación.

#4 el gobierno actual usa el Big Data y el internet, y punto redondo... no dan para más.

Johnbo

#6 O para perpetuar las rutas ya existentes, por eso de que se usan las que mejor están y se mejoran las que más se usan.

lecheygalletas

Ahora ya saben donde poner nuevos peajes.

R

A Sevilla desde Madrid no va nadie por la carretera de Extremadura??? No me lo creo

Cantro

#2 El gráfico no indica por dónde van. Sólo si salen de Madrid a Sevilla, independientemente del recorrido que hayan hecho. Como mucho te puede pone alguna etapa intermedia o al menos es como lo interpreto yo.

O eso, o no se entiende que nadie vaya por la ruta de la plata entre Galicia y Andalucía lol

Gilbebo

Vaya, pensaba que esos datos los recogía el INE, previo aviso al público, desde hace solo unos días. Parece que alguien ya lo estaba haciendo este verano.

M

#10 igual es que no entiendes muy bien la diferencia...

C

#11 por que lo dejas a medias ?, cual es esa diferencia ?

C

#11 toc, toc, buenos días. Cual es la diferencia que yo tampoco lo se ?

cosmonauta

Habrá que mirarlo con atención, pero si la unidad es la provincia, no creo que tenga demasiado interés, ya que las provincias son divisiones artificiales. Por ejemplo, 2 pueblos cercanos separados por una provincia pueden tener grandes intercambios pero eso no demuestra que el global de la población se mueva habitualmente entre estas.

ferreret

Fallo mío

Heni

Muy interesante