Hace 12 años | Por Tanatos a blog.wikimedia.org
Publicado hace 12 años por Tanatos a blog.wikimedia.org

Hay más archivos completos en otros idiomas y versiones en el proyecto Kiwix, con distintas opciones de descarga – aunque la mejor es el tradicional torrent. Estas recopilaciones no contienen imágenes –incluso en miniaturas ocuparían más de 100 GB– pero sin duda el texto ya merece la pena, al menos si tienes un poco de Diógenes digital. El formato en que está el fichero es OpenZIM, pensado especialmente para archivar y leer wikis; hay versiones para OS X, Windows y Linux

Comentarios

D

#5 --> #4

palitroque

#6 Comprar esto también era una tontería, no?
Pillas la analogía?

j

#2 Mmmm no entiendo por qué es una idea tan absurda. Me lo explicas? En serio, sin acritud! A parte del problema que comenta #4, me parece una herramienta muy útil.

D

#7 ¿De verdad hace falta explicarlo? ¿Qué sentido tiene bajar un "snapshot" de un proyecto colaborativo tan vivo y cambiante como es la wikipedia? Como bien apunta #4 solo sirve para tener una copia obsoleta.

D

#8 es cierto que a cada segundo se queda obsoleta, pero yo creo q por 10 Gb de nada merece la pena tener una copia offline, aunque este un poco desactualizada. Si fueran 100 Gb... pero hoy 10 Gb no van a ningún sitio. Yo por lo menos me lo descargaré para tener en el portátil.

sangaroth

#5 Únicamente se me ocurre para entrenar algún tipo de algoritmo bayesiano, crear como comenta #12 alguna versión offline,...que ya es!

M

#8 Mejor una copia "obsoleta", con miles y miles de artículos que apenas vas a sufrir modificaciones, que nada. Hay miles de sitios donde el acceso a internet no es inmediato, o dispositivos como ebooks que podrían llevar una copia de esto para consultarlo en cualquier momento.

No me parece para nada una tontería. Y ademas, por 10Gb...

e

#8 Seguro que hace diez años, alguien como tú decía lo mismo de geocities. O hace un año, de megaupload. Aunque la nube sea la hostia en verso, y todos los sistemas son redundantes y todas esas cosas, alguien habrá que prefiera guardar esos 10GB que correr el mínimo riesgo.

didaquis

#8 ¿La posibilidad de llevar la mayor colección del saber a un colegio donde no tienen internet no te parece buena idea? ¿Tampoco para países del tercer mundo? ¿ni para reducir tráfico de red?

ﻞαʋιҽɾαẞ

#15 Veo que en #3 me ha faltado el tag o el imoticono

Don_Gato

#15 tranquilo que ahora la subo yo a megaupload

D

#7 Te lo explico: Megaupload.

D

#2 hay muchos pueblos, lugares, situaciones donde no cuentas con una conexión a internet.

Siempre he pensado que una solución como apunta #11 sería la ideal, tenerla offline y poder actualizarla cada x tiempo.

javierchiclana

#11 Gracias por la info. ¿Cuál es la diferencia entre "Kiwix" del meneo y el que usas "Wikitaxi"? Conozco a gente que colabora con campamentos de refugiados saharauis y seguro que les interesa.

Sheldon_Cooper

#25, en una hora y media te lo cuento (que el Kiwix no lo he probado y es lo que me falta para tener el torrent). De momento diria que el WikiTaxi está limitado por ser solo para windows, aunque puedo decir que funciona bastante bien en Wine. Eso si, no permite seleccionar texto para copiarlo, lo cual es una gran cagada en mi opinión. El Kiwix lo conocía de oídas pero no lo había probado porque de la que lo miré solo tenían copias bastante anticuadas de la wikipedia, pero como vaya bien y lo mantengan actualizado, probablemente no vuelva a usar WikiTaxi.

javierchiclana

#46 Gracias. Pues sí, ser monoplataforma y no poder seleccionar texto son grandes inconvenientes. Espero que Kiwix los solvente.

Sheldon_Cooper

#51, lo he probado un poco por encima con la wiki inglesa bajo Linux y diria que kiwix es bastante mejor en casi todo.

Puntos a favor de Kiwix:
WikiTaxi muestra un formato más simplificado, mientras que Kiwix lo muestra idéntico, o casi idéntico a la wikipedia original. Kiwix es mas rápido mostrando el artículo completo, que WikiTaxi se atraganta un poco al abrir un artículo largo. En WikiTaxi los enlaces externos no funcionan, mientras que en Kiwix te los abre con el navegador por defecto. El formato .zim es abierto, con lo que aunque ahora mismo no haya es probable que surjan más programas capaces de abrirlo, mientras el formato .taxi del WikiTaxi es cerrado. Kiwix soporta imágenes siempre que el dump usado las incluya, cosa que WikiTaxi no. Kiwix es multiplataforma, basado en Mozilla, mientras que WikiTaxi está hecho en delphi y es de código cerrado con lo que es solo para Windows (aunque funciona perfecto con Wine/Darwine). WikiTaxi tarda en mostrar fórmulas matemáticas en los artículos (de hecho es opcional y no lo hace por defecto), mientras que Kiwix diría que las pre-procesa como imágenes? aquí no estoy seguro. Kiwix permite seleccionar, copiar, e imprimir, mientras que WikiTaxi creo que solo imprimir.

Puntos a favor de WikiTaxi:
WikiTaxi requiere menos CPU y RAM, salvo para la conversión inicial. Aunque no ofrecen para descargar la wikipedia ya convertida ,puedes descargarte tu mismo un dump mas o menos actualizado (suelen llevar como mucho un mes o dos de retraso) y convertirlo. La conversión le lleva desde unos 30 minutos hasta unas 5 horas, según la wiki que sea. En Kiwix es algo mucho más complicado de hacer y suelen tardar más en colgar los dumps ya convertidos. WikiTaxi incluye el índice en el fichero ya convertido, lo cual lo engorda pero también hace que una vez convertido sea solo cosa de abrirlo y buscar, mientras que Kiwix tiene que indexarlo la primera vez que lo abres, y tiene que hacer esa operacion en cada PC o sistema operativo que uses (aunque eso sí, mientras lo hace ya puedes consultar las partes ya indizadas).


#55, no estoy totalmente seguro de eso porque aún no he bajado la wiki española, pero parece lógico entre el tamaño y los filenames. El fichero inglés se llama wikipedia_en_all_nopic_01_2012.zim y el español wikipedia_es_all_03_2012.zim sin lo de "nopic".

javierchiclana

#59 Muchas gracias. Gran comparativa, le pasaré los datos a mis amigos de la ONG.

D

Yo me lo descargaré como un seguro en caso de un apocalipsis. Esos 10GB tendrían un valor incalculable.

Edd

#19 Yo guardo colecciones enteras de libros de texto de física, química, matemáticas, etc,..., casi cualquier asignatura que he podido dar desde pequeño, así como de historia, electrónica, lengua, idiomas, comunicaciones y cualquier cosa que sea educativa...por si acaso.

o

En un torrent, luego es piratería, el p2p para lo único que sirve es para piratear cosas.

RubenC

#38 Te dejo que te documentes acerca de cómo se guarda la información, y ya verás que no implica ni peso, ni volumen.

I

#39 Pues hasta donde se, y he podido leer, el almacenamiento de información implica el uso del algún tipo de soporte físico, sea cual sea el mecanismo implicado (magnetización o lo que sea). No estoy diciendo que se guarde en cuentas de madera, ni en microsurcos en un disco de vinilo... pero se necesita algo físico, en definitiva.


Sigo optando por la humildad y la educación, al volver a pedirte, si eres tan amable (tú o cualquieria que pueda hacerlo), que me saques de mi error.

c

#43. Un lápiz usb del tamaño de tu dedo meñique, Ese peso y volumen necesita.

silosenovengo

#48 el dump de la wiki española ya convertido para kiwix incluye las imágenes

Ok, ¡gracias!

#34 El byte NO es una unidad de masa.

¿Seguro? http://www.vidainformatico.com/2009/07/discos-duros-antiguos.html

#39 Te dejo que te documentes acerca de cómo se guarda la información, y ya verás que no implica ni peso, ni volumen.

¿Conoces la expresión "it from bit"?

Te dejo que te documentes.

RubenC

#55 Y qué me pones? Una web que dice eso? En Internet si buscas encontrarás webs que hasta dicen que a JFK se lo llevaron los alienígenas, y que Hitler sigue vivo en la Luna.

Por lo demás, vete con el otro a ver cómo funcionan las cosas, anda. Y fin, que de verdad, mareáis.

silosenovengo

#56 Y qué me pones? Una web que dice eso?

No, uno de los mayores físicos del siglo XX que decían eso.

So necio.

D

#56 #34 Si tú sabes cómo funcionan las cosas, explícalo, por favor.

Es más, espero que en tu vida diaria no digas cosas como "Mi peso es de setenta kilogramos" porque el peso NO ES UNA UNIDAD DE MASA¹

#30 Desde mi punto de vista, aunque no soy lingüista (soy físico), está bien usado

Según la RAE:
Peso: 21. m. Mat. Valor asociado a un número de un conjunto con el que, según el criterio que corresponda, se expresa la importancia del mismo en el conjunto.

Yo bajo esa definición no veo ningún problema en la asociación "unidad de información (bit)" - "peso".

¹Es más, diría que es más incorrecto decir "Esa persona tiene un peso de setenta kilogramos" que "Ese archivo tiene un peso de siete bytes", pero eso ya es ponerse puntilloso, pedante y retorcido

D

Cuando en unos años la prohíban o la vayan a modificar hasta el extremo y se empiece a pensar en hacer copias para descargar este será un buen precedente, sirve al menos para ir preparándose o para si lo hacen de golpe como con MU.

D

500 GB para el pr0n y 10 para la Wikipedia, tampoco es para tanto.

AndyG

Hem, aparte del formato, no sé qué tiene esto de nuevo, la propia mediawiki ofrece los dumps de sus bases de datos en formatos 7zip y tar.bz2 para descargar desde el principio de los tiempos.

http://dumps.wikimedia.org/enwiki/20120403/

Hacia 2010 me bajé el dump en inglés para hacer una proyecto para el máster, menuda locura, millones y millones de palabras, sólo de pensarlo me agobio.

b

si tienes un poco de Diógenes digital... ahí me ha pillado. Bajando.

c

Siempre está bien tener copias de seguridad distribuida. Si mañana deciden cargarse la wikipedia por cualquier medio (pueden aprobar unas cuantas leyes y chapar sin previo aviso) podrá renacer fácilmente sin perder el trabajo de muchos años.

D

Creo que por ley deberíamos obligar a tener a todo el mundo una copia de la wikipedia. Imaginad si sobreviene el desastre tecnológico (el mineralismo va a llegar) lo que iba a ahorrarnos de tiempo...(bueno, eso asumiendo que aún queda un ordenador para leerla después, que igual es mucho asumir )

ViejaYeguaGris

Me voy este fin de semana al pueblo, a mi casa de veraneo, donde no tengo internet, sin embargo estoy haciendo un trabajo y necesito usar la wikipedia.

No es tan difícil buscar un uso práctico. Es una situación que a más de uno nos habrá pasado.

empe

Con este torrent y esta otra base de datos: http://playmatehunter.com/playboys-playmate-index#char_75 ¿quien necesita internet?

darccio

#32 Habría que ver la densidad de palabras y el número de cáracteres de los artículos en español comparados con los ingleses, pero algo me dice que tiene que ver con la longitud de las palabras y frases de cada idioma.

D

Esto es bastante antiguo ya.

robespain

Yo la tengo offline en el movil gracias a wikidroid. Es mi ebook favorito y para leer mientras viajas es lo mejor.

silosenovengo

Pregunta: ¿cómo es posible que ambas pesen lo mismo (10Gb), si la inglesa tiene casi 4 millones de artículos y la española todavía no llega a 1 millón?

¿Alguien sabe si está contenido el historial de ediciones de cada artículo o solamente es un snapshot de cada artículo? 10 Gb de solo texto (que se descomprimirá a 30Gb) me parece una barbaridad.

http://meta.wikimedia.org/wiki/List_of_Wikipedias

silosenovengo

#30 ¿Alguien sabe si está contenido el historial de ediciones de cada artículo o solamente es un snapshot de cada artículo? 10 Gb de solo texto (que se descomprimirá a 30Gb) me parece una barbaridad.

Me autorespondo: 30Gb de texto entre 4 millones de artículos = 8 Kb por artículo en la versión inglesa, lo cual parece razonable.

Lo que sigo sin comprender es cómo tanto la inglesa como la española pueden ocupar lo mismo. :-?

RubenC

#30 "Pregunta: ¿cómo es posible que ambas pesen lo mismo"

Mira que esto es algo que no soporto. El byte NO es una unidad de masa.

http://buscon.rae.es/draeI/SrvltConsulta?TIPO_BUS=3&LEMA=pesar

Y que se haya convertido en una costumbre para mucha gente (incluídos profesionales del sector) no lo convierte en válido. Sólo hace más sangrante el uso incorrecto de la expresión.

Sheldon_Cooper

#30, tienen para bajar en varios formatos, aunque el que se usa para wikitaxi y por lo que he mirado tambien para kiwix es el es(en.. lo que sea)wiki-(fecha)-pages-articles.tar.bz2, que creo que es un dump sql (no lo he extraido para ver el formato) de solo los artículos actualizados a fecha del dump, sin incluir historial ni páginas de discusión.

Y por lo que veo, al menos en los filenames, el dump de la wiki española ya convertido para kiwix incluye las imágenes, lo cual explicaría el tamaño (imagino que solo a tamaño pequeño tal como se ven en el artículo, y no la completa lógicamente). El dump que tenía yo hasta ahora para usarlo en WikiTaxi eran 1,8gb la española y unos 9 gb la inglesa (del 2-07-2011 y 20-06-2011 respectivamente), y la española no ha crecido tanto con lo que está claro de donde viene la diferencia.

w

#30 es posible que se deba a que el español tiene más redundancia que el inglés (el mismo texto en español es más largo que en inglés). Así, aunque tenga menos artículos, estos son más largos y ocupan más.

D

La prefiero Online y prefiero estar a la ultima en actualizaciones.

D

edit

RubenC

A insultar, te vas a otro lado. Sigue si te apetece, "nastardesman".

Segador

Yo ya tengo todo internet en un .rar, no necesito estas menudencias.

S

Lo mejor de todo es que los carcas hablan de que esto no es cultura. Eso sí, tener que pagar cientos de miles de pesetas por una enciclopedia (como las de antes, que yo nunca pude tener una) es lo mejor...

D

Bajada... ahora a imprirla

D

Pues no es ninguna tontería hacer una copia de seguridad de la Wikipedia, parece que muchos olvidaron la que lío Borja Perez de que vida mas triste. Meter un virus en youtube y cargarse todos los servidores, eso si, sin querer.



Ahora hablando en serio, hace unos años que existe este proyecto CDPEDIA http://python.org.ar/pyar/Proyectos/CDPedia

Es un proyecto de Python Argentina para acceder a la información de la Wikipedia en castellano aunque no tengas una conexión a Internet.

Toda la información incluída fue obtenida de Wikipedia durante Febrero del 2011, y es una foto del contenido on-line en un momento dado. Te sugerimos acceder a la información directamente en la Wikipedia Web si es que necesitás información actualizada de uno de los temas.

Importante: la CDPedia es Software Libre, te recomendamos (y te agradecemos) que copies estos discos y los regales a tus amigos, familia y conocidos. La información debe ser libre, así mejoramos la calidad de nuestra educación.

Puedes bajarte o el cd de 700 mg o el DVD de 4 gb... bueno, ya no son 10gb para los menos exigentes.

E

Yo ya me la estoy imprimiendo, aunque creo que voy a tener que bajar a comprar un paquete de folios.

neogeoweb

Importante noticia, sobre todo para los programadores, ya que se podrán hacer aplicaciones de escritorio sin necesidad de conexión a Internet. También abre la puerta para poder pequeñas aplicaciones para tablets que no tengan conexión de telefonía móvil y por tanto puedan funcionar sin necesidad de WIFI. Utilizándose esta para las actualizaciones. Me parece una idea fantástica y me reafirma en la mejora de este proyecto altruista que trata de llevar el conocimiento a todos. Si queréis leer alguna reflexión sobre wikipedia os dejo un link al post "La wikipedia se carga los trabajos del cole" http://adf.ly/6GPc1

musg0

¿Y luego se puede actualizar con rsync? Porque aunque con bittorrent debería poderse, normalmente los programas de Bittorrent no están preparados para actualizar fácilmente.

D

y seguro que algún gilipollas va y se lo descarga

ﻞαʋιҽɾαẞ

#2 Pues yo estaba en ello... Ahora corto.

D

#2 Hay muchos buenos motivos para bajar el archivo, es sólo que a ti no se te ha ocurrido ninguno

D

#2 Yo me la descargo porque hay artículos que hace años que son válidos, como por ejemplo el de "Idiotez"

http://es.wikipedia.org/wiki/Idiota