Hace 10 años | Por NeoRazorX a neorazorx.com
Publicado hace 10 años por NeoRazorX a neorazorx.com

He creado este pequeño script para convertir a txt los PDFs de la contabilidad del PP. Este script crea un hilo por cada core de tu CPU, convierte el pdf a tif y lo procesa con tesseract, que saca el texto de las imágenes. Iré actualizando el post con las sugerencias de la gente.

Comentarios

M

#1 Gracias a toda la gente que se está preocupando en analizar y mejorar el acceso a los ordenadores con comandos ocultos. Gracias.

Jethrotul

#1 una cosa, esos pdf son de fiar?
Puede que sea una filtración controlada por parte del PP?

Jethrotul

#25 Merci por el link.
Pero igualmente yo tengo mis dudas. Es el procedimiento que deberían de hacer para aparentar que son ciertas esas cuentas. llámame conspiranoico pero es lo que pienso

saludos

robustiano

#28 Creo que los sobreestimas, no veo yo a esa panda de borderlines haciendo un montaje de ese calibre...

Paisos_Catalans

Toda ayuda para encontrar pruebas contra la Banda organizada PP a partir de su contabilidad filtrada, es bienvenida, gracias!

asensio

¿POR QUÉ TODA LA MIERDA sale en Julio y Agosto? Que "casualmente" la gente está de vacaciones (la que puede)... Bienvenidos a la nave del misterio...

D

#15 Hay 6m que estan de vacaciones permanentes.

D

Aquí ya hay una buena parte pasados a texto: http://pastebin.com/7pDfubLA

elpelodeannagabriel

El problema es que el OCR hace un gran trabajo, pero comete gran cantidad de fallos debido en muchos casos a la calidad de la fotocopia o a la dificultad del texto, por eso, lo mejor es analizar cada documento que procesa el OCR , como hace #3 , yo realice uno ( Las #CuentasDelPP ¿nos ayudas a analizarlas?/c77#c-77 ) la memoria del 2012 y afirmo que es un trabajo duro corregir todos los errores (y que abandone con el del 2011 ya por cansancio).
Por eso, aunque el script esta muy bien, hay que usarlo con cierta cautela.
Por cierto, si queréis ver los papeles sin tener que descargaros todo el torrent los he publicado online en http://elpp.chorizo.es/ para verlos online.

joffer

Justo por gente asi es por lo que se recorta y reforma la educación para q no aprenda a hacer script y la sanidad para q si aprende que se muera rápido.

D

Preveo que la contabilidad del PP va a acabar de Craptcha en breve.

D

#19 ¿Euros o pesetas?

http://espanol.answers.yahoo.com/question/index?qid=20111022161705AAgosUQ
Establo: 250€/mes (3000€/año)
Herrajes: 60€ cada mes y medio (480€/año)
Vacunas: 40€/año

Total: 3520€/año (584.000pts)

D

#0 muy boss!

thingoldedoriath

#31 WTF? Que mis envíos tienen más de spam? Pues no se de qué... Yo no escrito eso... Solo constato que desde el punto de vista de los niveles de "entropía" (que hasta donde yo se, miden la variedad de las fuentes) el usuario que envía esta noticia, hasta el momento, tiene el doble que tu (por cierto, y que yo ).

También habría que tener en cuenta el número de envíos realizados desde la fecha del registro, claro.

Simplemente me extrañaba que un usuario tan antiguo en MNM preguntase algo que está bastante claro en las normas de uso, con respecto al spam.

A mi en la portada tampoco me sobra nada (casi nunca) lo que pasa es que en días como hoy la actualidad marca demasiado y echo en falta un poco más de variedad temática (sobre todo si tenemos en cuenta a los usuarios que no viven en España...).

Discúlpame si mi comentario te ha resultado molesto.-

D

El pastebin de ppgoteras ha sido eliminado.

El pastebin de@anarion321_1 parece no estar disponible.

La web de anon your voice ha eliminado el contenido por recibir informaciones de que es ilegal.

Larga vida al TORRENT!!

http://thepiratebay.sx/torrent/8659683/Cables_contabilidad_PP_1990-2011

D

Parsear ls es lo peor que se puede hacer . Usando como argumento '*.pdf' sirve igualmente. Por lo demás, un script cojonudo.

O si no usad "xargs -p NUMERODEHILOSPORCPU "

D

¿No lo hay para Windows?

y

Estoy seguro que ese tal Anonymous jamás sacará las del PSOE por razones obvias.

ChanVader

Que está muy currao y tal, pero... ¿lo de subir algo de tu propio blog no debería ser considerado SPAM? Porque por mucho menos se han tirado temas aquí...

D

#20 Si es para atacar al PP, todo vale lol Si fuera sobre los EREs de Andalucía, seguro que lo tumbaban, y si fuera sobre algo de IU estaba descartada en tiempo record lol

thingoldedoriath

#20 Es muy común que los primeros enlaces que se envíen no estén "en sintonía" con la comunidad de usuarios de Menéame y reciban votos negativos. Un error típico suele ser enviar artículos de tu blog sin parar. Algunos usuarios lo consideran de mal gusto y lo votan como "spam". No tiene nada de malo enviar del propio blog; pero es mejor enviar sólo los artículos que consideres más interesantes y no abusar, procurando que la proporción de envíos de tu blog sea baja respecto al total de tus envíos. Recuerda: a los usuarios les molesta mucho que la gente sólo intente aprovecharse del sitio para su propio beneficio, en vez de compartir enlaces interesantes y conversar o debatir con los demás.

Fuente: http://meneame.wikispaces.com/Comenzando

Es cierto que muchos envíos se "tiran" por cualquier gilipollez y que otros lleguen a la portada isospechadamente; y que la cola de pendientes a veces resulte más variada que la portada (por ejemplo hoy mismo); pero no deja de ser curioso que un usuario con un nivel de "entropía del 25%" escriba lo que tu escribes sobre otro usuario con un nivel de "entropía del 56%".

Si no ponemos tiquismiquis con los votos de spam, tus envíos tienen más papeletas que los del usuario que ha hecho este. Eso sin tener en cuenta ni la antigüedad del usuario ni la utilidad del envío

Con cariño.-

ChanVader

#26 WTF? Que mis envíos tienen más de spam? Pues no se de qué...

En fin, que yo he visto cómo se itraba a un usuario recién llegado un post de su blog por ser de su blog.

Pero vamos, que no me sobra esta noticia en portada. Me sorprende que haya entrado, nada más

D

#31 "Que mis envíos tienen más de spam? Pues no se de qué..."

Spam de huevos con Spam.
Si solo enviases Spam con pan y Spam, a lo mejor el Spam con Spam huevos y Spam podría colar, pero el Spam con Spam Spam y huevos y Spam, pues como que Spam Spam Spam Spam Spam!

D

Una cosa de la que me estoy dando cuenta con tanta noticia es que hay mucha gente que el problema de todo esto es fundamentalmente del PP, o que piensan que dentro de que todos son malos, el PP es todavia mas malo. Lamentablemente todos son basura, el sistema esta podridisimo, lo que pasa es que el PP esta ahora en el gobierno y como es normal salen mas mierdas suyas.

D

Si se empleara el esfuerzo que ese está empleando contra el PP con otros partidos habria demasiada mierda que tapar.

D

#13 Ya hay mierda suficiente encima de la mesa. Como para un atracón.

jonolulu

#4 Si yo estoy a favor de la copia y mutación, pero también de la atribución. Pero que si dices que es todo tuyo, te creo, oye

s

#4 #5 podeis dejar de pelearos, utilizad ambos, compararemos resultados,quien sabe a lo mejor el bueno es la combinacion de ambos.

hay que compartir trabajar juntos es la unica manera de poner a estos ladrones en su sitio

fleaman

#10 Un script genial. Se agradece mucho tu aporte, buen trabajo.