264 meneos
2499 clics

Archivo yaml con toda la portada de Meneame desde el principio hasta 18/07/2016 [127MB]

Archivo yaml con toda la portada de Meneame desde el principio hasta 18/07/2016. Ocupa 127MB y esta pensado para hacer estadísticas sobre Meneame.
etiquetas: meneame, portada, yaml, estadisticas, datos
usuarios: 142   anónimos: 122   negativos: 8  
Comentarios destacados:                       
#27   #1 Desde cuando Gallir separó las aguas del Guadalquivir con un "rugir" de su Ferrari :troll:
#1   Desde el principio ... ¿De los tiempos? ¿Del fin? ¿De Housers?
votos: 13    karma: 128
#27   #1 Desde cuando Gallir separó las aguas del Guadalquivir con un "rugir" de su Ferrari :troll:
votos: 32    karma: 219
 *   Marco_Pagot Marco_Pagot
#38   #1 mira que sois picajosos...

{0x1f602}
votos: 3    karma: 33
#76   #1 Mierda, llego tarde. Espero que estén todas las fotos filtradas de Jeniffer Lawrence, ¿no? :troll: xD
votos: 0    karma: 11
#2   La idea era hacer estadísticas al estilo que se hizo con El País en www.meneame.net/story/editoriales-pais-1976-2016
Pero como finalmente no voy a tener tiempo lo dejo aquí por si alguien se anima ;)

Si queréis, dejar comentarios sobre que estadísticas os gustaría que sacara quien se decida a usar el yaml.
votos: 7    karma: 61
#4   #2 Número de noticias negativas sobre Podemos y Venezuela que han llegado a portada. Comparativa vs noticias negativas del PP y C's
votos: 25    karma: 191
#28   #4 Lo de comparar Podemos con C's puede ser peras con peras, pero con el PP que sentido tiene?
votos: 3    karma: 26
#57   #28 Confirmar el sesgo ideológico de mnm y como la portada es controlada por un grupo, nada más.
votos: 3    karma: 36
#58   #57 Que sesgo sería comparar portadas negativas del PP contra Podemos? Ni aun cogiendo el ABC ganarian los segundos, la realidad es la que es.
votos: 2    karma: 36
#59   #58 Se deben contar con los dedos de la mano las noticias negativas sobre UP, y no tengo en cuenta sensacionalismos o mentiras.
votos: 0    karma: 11
#60   #59 Joder, pero es que ni habiendo sesgo se pueden comparar millones de tramas de corrupción y años de "democracia" del PP con lo que pudiera sacarse de Podemos ni aun buscando la última coma como se les busca. Lo dicho, si buscas comprobar un sesgo quizás vale comparar Podemos VS Ciudadanos, pero comparar con el PP no permite llegar a ninguna conclusión (mas que sobre la miseria de este partido en concreto)
votos: 9    karma: 63
#61   #60 Pensándolo bien tienes razón ;)
votos: 3    karma: 32
#36   #4 directamente proporcional a los millones robados... :shit:
votos: 3    karma: 16
 *   KEPA_SAKOLEGI KEPA_SAKOLEGI
#70   #4 Creo que Podemos es un poco posterior a la creación de Menéame, el Pp no.

Pero como bien #36, ¿a cuantos millones robados toca por noticia negativa del Pp? El Pp no tiene noticias negativas suficientes.
votos: 2    karma: 4
#77   #70 perdón por negativo
votos: 1    karma: 20
#54   #4 Numero de noticias negativas sobre Haiti y Bangladesh que han llegado a portada. Comparativa vs noticias negativas de Venezuela y Cuba. Comparar a PP con Podemos... Ay que me dezorino.

Vendo Kleenex.
votos: 5    karma: 11
 *   Censor Censor
#68   #54 claro culturalmente históricamente y políticamente Haití y Bangladesh están al nivel de interés para la sociedad española de Venezuela y Cuba...
Para un comunista nazi tal vez.
votos: 3    karma: 21
 *   opositor opositor
#69   #68 Etnocentrismo a tope.
votos: 0    karma: 7
#86   #69 no como tu, que si se muere tu padre, que te importa lo mismo que si se muere el padre de un haitiano o de tu vecino.

Cuba y venezuela son referentes como alternativas politicas mundiales, haiti y bangladesh no.
Cuba y venezuela fueron españolas, haiti 200 años pero paso a ser francesa y os vinculos se perdieron y bangladesh no.
En cuba y en venezuela hablan español, en haiti y bangladesh no.
En cuba y venezuela han vivido y vivien muchos españoles y a la inversa, de haiti y bangladesh…   » ver todo el comentario
votos: 1    karma: 14
#87   #86 Y como tu en encefalograma plano de alumno de asprona te impide argumentar correctamente, recurres a las falacias y nombrar mi nick.

No he llamado etnocentrista a los medios. Te lo he llamado a ti.
votos: 1    karma: 6
#93   #87 es que no lo es.
Son paises mucho mas importantes no solo por afinidad cultural, tambien se habla mas de ellos en eeuu o en europa. Es como si me dices que deberían de salir en los medios en misma proporción Kazajistán que corea del norte, pues mira no.

Y me respondes ami, lo logico es que me lo estes diciendo ami.
Si yo te cito y digo borregismo a tope, que pensarias, que hablo de los medios o de ti?
Lo de meterme con tu nick tampoco te lo tomes a mal, creo que fibrolizas con cosas que…   » ver todo el comentario
votos: 1    karma: 14
#6   #2
Si ya has hecho el yaml, pasarlo por el R es bastante trivial.
votos: 0    karma: 7
#13   #6 ya, la idea era precisamente aprovechar para aprender R. Pero como he dicho, ahora no voy a tener tiempo de hacerlo como me gustaría +mi idea era analizar mucho más que los tags en el tiempo, por eso el yaml es tan tocho) y prefiero dejar aqui el yaml a arriesgarme a que se quede un directorio olvidado :-P

A ver si hay suerte y quien lo use detalla como lo hace y así me sirve de ejemplo practico.

#8 Si estas pensando en JSON o XML seria facil hacer una conversion directa con algun…   » ver todo el comentario
votos: 7    karma: 44
 *   cyttorak cyttorak
#23   #2 yo tengo hecho un scrapper y tengo un json igualito que tu yaml... estoy trabajando en con Rstudio, ggplot2 etc y he generado bastantes estadísticas. Me ha hecho mucha gracia justo encontrar esto ahora en portada :-)

Yo tengo en realidad también las publicadas en portada y las que no llegaron a portada, de hecho tengo un random forest que predice la probabilidad de que una noticia llegue a portada dados ciertos parámetros.
votos: 12    karma: 93
 *   jcarlosn jcarlosn
#24   #23 Guay, espero que cuando lo tengas acabado lo publiques por aquí. A poder ser con el código fuente :-)

Edit: Ostras, lo de calcular la probabilidad de que algo llegue a portada también quería intentar hacerlo pero aún no tenia claro como.
votos: 2    karma: 25
 *   cyttorak cyttorak
#26   #24 Claro, de hecho lo hacemos entre yo y mas gente y tenemos pensado hacer un buen artículo con ello y publicar en github todo.
votos: 5    karma: 51
#33   #21 Toma, comprimido con 7zip: www.filedropper.com/meneameyml
Se queda en 29MB

Pero visto lo dicho en #23 ya casi esta obsoleto :-P
votos: 6    karma: 48
#80   #33 Al menos este lo podemos bajar, el otro (todavía) no.
votos: 0    karma: 7
#49   #23 ¿Podrías dar más información? ¿O cómo me puedo poner en contacto contigo? Llevo trabajando en este tema bastante tiempo (desde otro punto de vista) y sería interesante saber qué hacéis o incluso colaborar :-)
votos: 0    karma: 10
#55   #49 claro, podemos hablar cuando quieras. Mi correo es jcarlos.norte@gmail.com :-)
votos: 0    karma: 9
#88   #55 Gracias, ya te he mandado un correo anoche :-)
votos: 0    karma: 10
#95   #94 Sobre lo de la privacidad: Deduzco que lo que has hecho es o ir leyendo los feed de meneame o scrapping del portal, en ambos casos la información que tiene tu base de datos es información ya publica. Lo único que quizá podría ser "sensible" son los nicks de aquellos usuarios que cuando almacenaste sus datos no habían eliminado aún su cuenta y ahora ya no la tienen, porque en ese caso meneame ya no muestra sus nick (en su lugar muestra su antiguo id) pero tu base de datos si. Si es…   » ver todo el comentario
votos: 1    karma: 25
 *   cyttorak cyttorak
#97   #95 Así es, tengo una serie de scripts que analizan cada noticia nueva y la monitorizan hasta 60 días (analizando comentarios y votos de las noticias y de los comentarios lógicamente).
Ciertamente la información es pública (y así consta en la licencia del sitio) pero no lo es la de los votos una vez el sistema no ofrece datos con más de 30 días de antigüedad.
Eliminar los nicks (usando un pseudónimo) es necesario pero no es suficiente para poder identificar la actividad de un usuario (busca el…   » ver todo el comentario
votos: 1    karma: 20
#100   #97 He buscando lo de IMDB y Netflix y he encontrado esto: archive.wired.com/politics/security/commentary/securitymatters/2007/12
Por lo que he entendido la idea muy simplificada sería esta:
Fulano ve en Netflix: Juego de Tronos, Mr Robot, Mad Men, House of Cards y Hannah Montana.
A Fulano le da vergüenza admitir que ve Hannah Montana pero las otras no, así que hace criticas en IMDB sobre las otras series.
Netflix publica su base de datos y donde pone &…   » ver todo el comentario
votos: 0    karma: 12
#101   #97 Acabo de recordar que en tu bbdd tambien hay votos y eso tambien desaparece de meneame, asi que me lo tengo que pensar otra vez...
Le dare mas vueltas.
Lo que he dicho en #100 encaja mas con mi yaml sumandole los comentarios.
votos: 0    karma: 12
 *   cyttorak cyttorak
#102   #100 Así es, el problema de Netflix con IMDB lo has descrito como fue... Netflix cambió los identificadores de usuario por pseudónimos y eso no fue suficiente porque con los datos de IMDB se pudo 'descubrir' quién era quién. Ésto es motivo suficiente para suponer que usar pseudónimos es necesario pero no suficiente a la hora de entregar datos privados para cualquier uso...
Lo que comentas luego está más relacionado con el concepto de 'differential privacy' donde la idea es no poder distinguir…   » ver todo el comentario
votos: 1    karma: 18
 *   John_Doe
#47   #2 Si quieres yo te paso la base de datos con los comentarios también y ya de puestos... los votos de las noticias y comentarios desde hace algo menos de un año ;) con un error bastante bajo en cuanto a votos que no tengo (suelen ser negativos) :-P
En su día pedí esta información al propio Menéame (antes y después del cambio de dueños incluso) pero siempre han pasado de mí... así que... me las tuve que agenciar :-P

Nota: estoy investigando con redes sociales y machaco Menéame al menos 10-12 veces al día para recoger datos (scripts hechos en Ruby por cierto).
votos: 2    karma: 24
 *   John_Doe
#67   #47 que rule que rule
votos: 2    karma: 18
#94   #67 ¿Me ayudas a montar una web para poder navegar por los datos?
Es algo que tengo pendiente de hacer, porque aunque es interesante poder tener todos los datos también lo es poder obtenerlos filtrados (por ejemplo, durante un perídoo de tiempo, con o sin votos, comentarios o votos de un determinado usuario... etc...).
También está el tema de la privacidad, justamente es en lo que estoy trabajando porque aunque cualquiera puede hacer lo que yo... deduzco que cualquier usuario también tiene derecho a que no se le identifique (y eso es algo que ahora mismo es posible si publicase la base de datos tal cual).
votos: 0    karma: 10
#96   #94 La verdad es que no se si lo haría de manera eficiente, me imagino que habría que diseñar una base de datos sobre los datos que se tienen, hacer un script y pasarlos(y que se puedan ir añadiendo nuevos semana a semana o lo que sea).
Sobre eso presentar los datos con alguna libreria para mostrar tablas www.editablegrid.net/en/
Pero no se, habias pensado en algo más?
Como querrias mostrar los datos?
La verdad es que el tema de los nicks que comentas le quita bastante juego al asunto.…   » ver todo el comentario
votos: 0    karma: 11
#3   Ejemplo de la información que contiene (muestro el primer y último item del fichero):

author: gallir
body: Pues sí, a las 5 de la mañana he acabado de subir los ficheros y la base de
datos para empezar a probar este servidor. Espero que los amigos se den cuenta.
comments: 5
id: 1
karma: 11
published: 1133928456
sent: 1133928253
story: www.meneame.net/story/esta-es-la-primer-noticia-meneada
sub: mnm
tags: primera noticia, menéame, hello world, primer meneo
title: Ésta es la primera…   » ver todo el comentario
votos: 11    karma: 94
#14   #3 por curiosidad... como es que a jorso se le escapó el cascarle negativo a la primera noticia?
votos: 26    karma: 196
#40   #14 Todavía no estaba en forma, pero mira la última:

www.meneame.net/story/edil-pp-albacete-autoconcede-subvenciones-financ

1.784 meneos y un solo negativo. ¿De quién podría ser?
votos: 5    karma: 35
#56   #40 lol
votos: 0    karma: 10
#41   #14 Jajaja. Pero jorso es una modernidad en Menéame xD
votos: 3    karma: 37
#42   #14 Era su primer día...
votos: 4    karma: 41
#17   #3 En la misma noticia también está el primer chiste de MNM, luego dirán algunos que antiguamente meneame estaba mejor y no había gente contando chistes chorras a todas horas en cada noticia. xD
votos: 8    karma: 70
#5   De los comentarios del Primer meneo hay unos cuantos que fueron baneados xD
votos: 5    karma: 51
 *   C0BRA C0BRA
#7   #5 la mayoria siguen registrados :-O
votos: 3    karma: 40
#9   #5 y unos cuantos comentarios en catalán. Hoy estarían cosidos a negativos.
votos: 7    karma: 38
#10   #9 es mallorquín
votos: 3    karma: 26
#11   #10 No me diguis... no ho sabia :-P
votos: 0    karma: 7
 *   beerbong beerbong
#37   #11 deu ni do
votos: 1    karma: 19
#35   #9 el problema no está en el catalán ni en los comentarios catalanes, está en que alguien conteste en catalán a un comentario en castellano. Si al que respondes no sabe catalán no tiene sentido. Y lo comento porque me ha pasado que me respondan en catálan y eso no es ni medio normal.
votos: 1    karma: 10
#72   #35 Pues eso no es nada, a mi una vez me respondieron con una frase en Inglés. Casi me da un síncope y me subía por las paredes, no podía soportarlo. Si me vuelve a suceder, yo creo no volveré a conectarme a Internet. ¿Puedes imaginártelo? Tremendo, apocalíptico...
votos: 3    karma: 15
#75   #72 capto la ironía pero no la suscribo. Existe una cosa llamada respeto, algo que se tiene cuando procuras responder a tu interlocutor en el mismo idioma con el que escribió el comentario.

¿A un turista que te pregunta en inglés le responderías en otro idioma aún pudiéndolo hacer en inglés? Normalmente no, pues en internet tampoco.
votos: 2    karma: 19
#90   #75 Si es lo que yo he dicho, la próxima vez que alguien me responda con una frase en inglés a uno de mis comentarios, aquí va a pasar algo gordo. ¡¿Pero como se atreven?!
votos: 0    karma: 11
#91   #90 sería una estupidez por parte del interlocutor, pero tu ironía empieza a ser ciertamente absurda. ¿Hasta dónde quieres llegar?
votos: 0    karma: 7
#92   #91 Quiero llegar a que deberías ignorar lo que no te interesa. Si una persona que responde en catalán a los demás es ignorada por todos, posiblemente dejará de hacerlo, o por otro lado, ya no será molesto porque estaría siendo ignorado.

Si alguien presta atención a esas respuestas en catalán, pues será asunto de ellos, y si se ignora, tampoco será molesto.
votos: 1    karma: 18
#8   Gracias, pero, no había otro formato?
votos: 0    karma: 8
#32   #8 Si, muchos y peores.
votos: 0    karma: 7
votos: 5    karma: 38
#15   Aqui la peña meneando sin leerse la noticia.
votos: 12    karma: 77
#16   #15 Como si eso fuese una novedad.
votos: 6    karma: 59
#18   #15 ¿qué noticia?
votos: 5    karma: 49
#29   #15 Absolutamente fino, ese sentido del humor.

Igual de aquí a unos meses alguien comenta habiéndose leído todo el archivo.
votos: 1    karma: 17
#39   #15 sin descargársela más bien :-D
votos: 1    karma: 17
#83   #15 son sus costumbres y hay que respetarlas :troll:
votos: 0    karma: 8
#19   yaml
Lo que aprende uno :shit:
votos: 3    karma: 29
#46   #19 yaml, yaml, que rico. :roll:
votos: 2    karma: 32
#20   Sería interesante ver cuando se puso el primer comentario del tipo "Menéame ya no es lo que era"
votos: 5    karma: 56
#25   #20 El 07/12/2005 04:05
votos: 6    karma: 61
#48   #20 El 19/3/2006, por ejemplo:

www.meneame.net/c/21160

Poco después...

www.meneame.net/c/70451 [Este justamente responde a un comentario que dice "esto (Menéame) empieza a oler ya con tanta política"]
www.meneame.net/c/76455
votos: 7    karma: 59
 *   --517017--
#21   ¿No sería útil comprimirlo?
votos: 1    karma: 9
#22   Más comprimido aún:

Podemos y en concreto :coletas: son seres de luz.


A ver quién lo supera.
votos: 1    karma: 8
 *   cuestionador cuestionador
#78   #22 :peineta:

Ah perdón, creía que era resumir los comentarios :troll:
votos: 0    karma: 7
#30   lo hizo utilizando recursos de la universidad? :troll: lo digo por el enlace de la uni
votos: 3    karma: 27
#31   Que buenos tiempos cuando esto era una web de noticias de Linux. :-)
votos: 3    karma: 32
#34   Que emoción....
votos: 0    karma: 7
#43   Podemos vs grafeno. Por fin podré
votos: 5    karma: 58
#79   #43 Gana Podemos:

$ grep Podemos meneame.yml | wc -l
1860
$ grep grafeno meneame.yml | wc -l
445
votos: 1    karma: 10
 *   Lb2A3qA Lb2A3qA
#85   #79 ¡gracias majo!
votos: 0    karma: 9
 *   muereelkin muereelkin
#44   Si abro el archivo...¿ Me pasará lo mismo que a los nazis de Indiana Jones en busca del arca perdida?.
votos: 1    karma: 18
#74   #44 Tú mismo, y no olvides que nunca debes buscar Google en Google.
votos: 1    karma: 16
#50   Yaml o miraré cuando pueda
votos: 4    karma: 30
#51   El mío pesa 129... :-S
votos: 1    karma: 17
#81   #51 A ver si te ha engordado por el camino...
133037013 bytes = 129919 KB = 127 MB
$ shasum meneame.yml
f4e7fc3da025c485a1c81d15eda121102da08c1a *meneame.yml
votos: 0    karma: 7
#84   #81 hehe :-) Era una broma hombre, aunque gracias por el shasum :-P
votos: 0    karma: 7
 *   median0 median0
#89   #84 Ya, lo había pensado... pero bueno, por si acaso :-)
votos: 0    karma: 7
votos: 0    karma: 10
 *   erronea erronea
#53   estaria interesante sacar estadisticas de la portada en estos ultimos años que alaben a Podemos y pongan a parir a sus rivales...

xD xD xD xD
votos: 0    karma: 6
#62   :professor: Aún recuerdo aquel día en que ésta fue la noticia más meneada de la historia de esta web:
www.meneame.net/story/lalalalalalalalalalalalalalalalalala/
Qué tiempos aquellos y cuánto han cambiado las cosas... {0x1f625}
votos: 1    karma: 19
#65   #62 Y volvería a ir a la portada :-D
votos: 0    karma: 9
#63   yo si el fichero no está en JSON paso
votos: 0    karma: 7
#64   Yameloheleíiiooooo!!
votos: 0    karma: 10
#66   ¿Y esto como se abre, miarma?
votos: 0    karma: 6
#82   #66 Con un gato:
$ cat meneame.yml

O puedes probar con el Bloc de Notas, a ver qué te dice :-D
votos: 0    karma: 7
 *   Lb2A3qA Lb2A3qA
#71   Un poco de risas con los datos y un generador de titulares y entradillas:

Canal 9 pagará 6 millones de euros en militarizar su uniforme
El 6 de diciembre. Todos los efectos del cromosoma Y. Otros genes asumen el puesto de Subdirector General de Personal y Pensiones Públicas a la que las gráficas no muestran problemas es el gas natural, 3, según ha informado hoy la entidad. Según consideró," el riesgo nuclear iraní está reforzado por sus políticas" [...]
----------
¿Viola…

  » ver todo el comentario
votos: 0    karma: 9
#73   Hace aproximadamente un año me hice un script que hacía esto mismo pero almacenando en un formato JSON :-D
votos: 0    karma: 8
#98   Me acabo de dar cuenta de que había un error en el script en la parte que contabilizaba el número de comentarios {0x1f625}
Subo aquí una nueva versión corregida del fichero yaml (comprimido con 7zip) www.filedropper.com/meneameyml_1 (29MB) De paso ahora incluye hasta el 21/07/2016
@Yonseca Lo mismo te interesa volver a pasar su conversión a sql/json
Nota: Otra modificación que he hecho es que no ponga el campo "tags" si no hay etiquetas (antes, en tal caso, ponía "tags: null" o algo así)
votos: 1    karma: 26
 *   cyttorak cyttorak
#99   #98 Iba a comentártelo en la nota que puse, pero no me cupo al final xD Pensé que ya lo sabías.

Gracias por el fichero, a ver qué puedo tocar para actualizarlos :-P
votos: 0    karma: 13
#103   #98 Acabo de pasarlo todo a JSON y SQL con los datos nuevos ;)
- JSON y SQLs aquí: drive.google.com/drive/u/0/folders/0B8uTfdl1QNyGREZ5SzkwbUY4b2M (los dos ficheros más recientes)
- Repo de github por si alguien le quiere echar un ojo: github.com/Yonseca/meneameData
votos: 0    karma: 13
«12
comentarios cerrados

menéame