Hace 5 años | Por Jakeukalane
Publicado hace 5 años por Jakeukalane

Comentarios

D

Gracias por el curro. También me había leído los dos anteriores.

No a tu nivel, pero le he dado muchas vueltas al asunto para crear un archivo y no he dado con ninguna solución.

Me gusta seguir las noticias (por ejemplo una guerra) para hacerme una imagen de lo que pasa. Mi solución ha sido un blog privado de Wordpress donde voy cortando y pegando los HTML y entrelazando lo que puedo dentro del blog. Muy rudimentario y poco útil si no se tiene tiempo, pero más o menos funciona como un bookmarks/archivador.

D

#2 Para local trabajo con Wget https://www.gnu.org/software/wget/wget.html

Tampoco es una solución que me satisfaga al 100%, pero es lo mejor que conozco. Si supiera programar me montaría una solución tal que fuera una especia de Índice en local que trabajara con Wget y opción de sincronización o guardado en servidor externo.
* * *
Será interesante saber si en el futuro se logra montar un sistema de archivado tan bueno como lo es una biblioteca hoy en día. Pensemos en todos los libros que se tuvieron que perder hasta que se empezó a archivar, y aún así se siguieron perdiendo obras hasta época muy moderna.

La preocupación de tus artículos y estimaciones como la de Branwen son acertadas, pero me recuerda a las pestes que echaba Platón de los libros porque creía que harían perder el conocimiento. Platón falló porque no predijo los cambios del futuro, puede que algún día se logre crear una "biblioteca" de Internet.

Jakeukalane

#3 yo me centro en esa parte del artículo pero realmente lo que está haciendo es un artículo como el mio para dar a conocer esos métodos de archivado y que con una sola Librería de Alejandría 2.0 no es suficiente.

También se menciona no se si ahí o en otro articulo que no he mencionado aun a wpull un comando como wget pero modificado para realizar archivos

Yo con wget "archivé"* una página (http://crpp0001.uqtr.ca:80/) con tropecientos niveles. Era una página personal asociada a una universidad. Es un ejemplo de lo bueno y lo malo del archivado personal/en general. También lo mencionaré en algún articulo futuro.
*no le puse que sacara niveles suficientes porque 25 GB ya era mucho. Además yo he ido borrando cosas de ese mismo directorio. Por ejemplo los vídeos.

Aquí hablo de ello: Wget, algunos ejemplos de lo que se puede hacer con esta herramienta/c22#c-22

Jakeukalane

#4 #3 Biblioteca de Alejandría*

thingoldedoriath

#1 Yo comencé un blog en 2005. En 2012 pasé todo el contenido a Wordpress porque Google empezó a tocarme las narices con su puritanismo censurador. Sigo pagando un pequeño dominio (por si en el futuro a los de Wordpress les entra ese mismo virus y se ponen a decirme sobre que debo escribir...).
El caso es que de los enlaces que adjunte a los artículos del primer blog, solo sobreviven los de Wikipedia... el resto están casi todos rotos.

D

#8 No sé el nivel de conocimientos que tienes, y no sé si te refieres a que los enlaces están rotos porque han desaparecido o porque no supiste pasarlos correctamente a WordPress. Si es lo segundo se puede "transbordar" el blog correctamente. Hay herramientas que te guardan el árbol de enlaces, o es algo que se puede hacer programando.

Por suerte yo me decidí bastante pronto por WordPress y ahí sigo. Tengo el blog privado que comenté arriba para seguir noticias y donde tengo anotaciones, lo hago pegando el HTML y modificando a mano los enlaces hacia dentro. En otro blog de textos me he preocupado de que todos los enlaces apunten al blog.

Tengo otro blog donde hay muchas fotos, y ese es un infierno. Las fotos desaparecen y me da mucha rabia. Las soluciones de pago tampoco son garantía. Me gustaría mucho instalarme mi propio CMS con mi propia base de datos y meterle mano al código.

A nivel personal la única solución viable es currárselo uno mismo, es decir, programar a medida lo que necesites, y aún así el CMS o su comunidad se pueden ir a pique en cualquier momento.

thingoldedoriath

#9 Los enlaces están rotos... apuntaban a sitios de almacenamiento de archivos que ya desaparecieron o que cambiaron el árbol (para pasar a ser de pago).
Tengo cosas en Drive, y tampoco es que me fíe mucho de que Google quiera mantener durante mucho tiempo las viejas cuentas de Googleapps.

De todas formas, no es que me preocupen los contenidos, todo lo que quería conservar o es mío o lo copié cuando se podía hacer (las imágenes cedidas por sus propietarios, para el blog) o cuando era más sencillo que ahora, y aparte tengo copias en discos duros. No había muchos blogs y mucha gente era generosa.
Lo que me molesta es tener que cambiar todos esos enlaces para que apunten a un lugar en el espacio tiempo que nadie cambie a su antojo.
Si en algún momento puedo tener fibra óptica, montaré mi propio servidor y lo pondré todo allí.

Jakeukalane

#10 yo subo cosas a un WordPress y las archivo. El problema de WordPress es la limitación de audio y vídeo. Antes utilizaba deviantart pero la compró Wix y han aleatorizado las urls.

También se pueden usar encapsulados en otros archivos pero no sé el proceso en Windows solo en Linux.

thingoldedoriath

#11 También se pueden usar encapsulados en otros archivos pero no sé el proceso en Windows solo en Linux.



Yo pasé de SCO y BSD a Slackware en 1994 (te escribo esto desde una versión más moderna ). Por el camino he tenido que trabajar con Red Hat, Solaris, Debian, FreeBSD (de hecho en uno de esos blogs hay post de 2005 dedicados a la compilación del kernel de FreeBSD ).

Nunca he usado Windows.

Jakeukalane

#12 ah, pues genial. Me refiero también a que seguramente no lo explique en el artículo. Archive.is por ejemplo no detecta cuando hay vídeos encapsulados dentro de imágenes y se pueden archivar sin problema. Ahora. ¿Conviene hacer eso?

p

Me quedo por aquí para leer al detalle.
Supongo que conocéis httrack, para descargar mucho contenido de web es lo mejor que conozco.
Yo ando con la idea de programarme un script que descargue automáticamente a local webs concretas de listados y poder tenerlo organizado automáticamente con tags.
Para mantener un poco organizado contenido web me hago tableros en trello, los favoritos de toda la vida se volvieron inservibles para mi cuando pasé de los 3000 favs, ahora vivo sin ellos por no encontrar una herramienta que me guste, algún di tendré que hacerme una aplicación para organizarlo.

Jakeukalane

#5 Sí. Analizaré Heitirix, Httrack, wget, WAIL y alguna más en otro artículo futuro. Voy de datos menos a más especialiados también porque con cada tema voy descubriendo cosas que no conocía del todo. Httrack lo he utilizado pero muy poco. Un saludo.

tinejo
Jakeukalane

#14 no tiene relación con este artículo.