Los académicos que estudian la longevidad del conocimiento en línea dicen que 176 revistas digitales de acceso abierto han desaparecido de Internet en las últimas dos décadas. Los hallazgos están documentados en un artículo de investigación distribuido a través de ArXiv, "Open is not forever: un estudio de revistas de acceso abierto desaparecidas". Los autores Mikael Laakso (Hanken School of Economics-Helsinki), Lisa Matthias (Universidad Libre de Berlín) y Najko Jahn (U. de Gotinga) examinaron varios índices bibliográficos y… Traducción en #1.
#1:
Los académicos que estudian la longevidad del conocimiento en línea dicen que 176 revistas digitales de acceso abierto han desaparecido de Internet en las últimas dos décadas. Los hallazgos están documentados en un artículo de investigación distribuido a través de ArXiv, "Lo abierto no es para siempre: un estudio de revistas de acceso abierto desaparecidas" ( Open is not forever: a study of vanished open access journals).
Los diamantes son para siempre, los artículos académicos no tanto, parece.
Los autores Mikael Laakso de la Hanken School of Economics de Helsinki, Lisa Matthias de la Universidad Libre de Berlín y Najko Jahn de la Universidad de Gotinga examinaron varios índices bibliográficos y el Directorio de revistas de acceso abierto, e intentaron rastrear las publicaciones a través de Internet Archive Wayback Machine.
Las revistas de acceso abierto, como sugiere el término, se hacen accesibles a los usuarios de Internet sin cargo, en contraste con las revistas tradicionales basadas en suscripción. Existe un debate en curso entre los investigadores sobre si publicar en una revista de acceso abierto (AA) o en un título por suscripción. La decisión afecta la distribución del artículo, la velocidad de publicación, el costo de publicación, el prestigio profesional y otros factores.
El problema surgió el año pasado cuando la Universidad de California canceló su suscripción con el gigante de publicaciones científicas Elsevier por el precio que exigía para acceder a su colección de más de 2.000 revistas. El sistema de la UC quiere que Elsevier proporcione publicaciones de acceso abierto para los artículos escritos por la UC y que proporcione a los académicos de la UC acceso al contenido de la revista a un precio razonable. Las negaciones continúan.
El lento avance de la pérdida de información
Laakso, Matthias y Jahn señalan que, si bien las revistas de AA "no están desapareciendo en grandes cantidades", su desaparición afecta a ciertas disciplinas de manera desproporcionada. Las revistas asociadas con instituciones académicas o grupos académicos en América del Norte, y con la investigación en ciencias sociales y humanidades, representaron una porción mayor del contenido desaparecido que otras.
"Nuestros hallazgos sugieren que los enfoques actuales para la preservación digital tienen éxito en el archivo de contenido de revistas más grandes y editoriales establecidas, pero dejan atrás a los que están en mayor riesgo", afirman los autores en el artículo. "Por lo tanto, es posible que las iniciativas de preservación necesiten reevaluar su estrategia actual y desarrollar vías alternativas, idealmente en estrecha colaboración y consulta con revistas universitarias y de la sociedad, que sean más adecuadas para revistas más pequeñas que operan sin el apoyo de grandes editoriales profesionales".
En un correo electrónico enviado a The Register, Brewster Kahle, director y cofundador de Internet Archive, "Hemos encontrado casi lo mismo con las revistas de acceso abierto: a menudo no se atienden", y agregó que se alegra de que el tema se esté estudiando formalmente.
Kahle dijo que Internet Archive ha estado rastreando la web durante 25 años, pero comenzó a centrarse en publicaciones periódicas académicas en 2018. La Fundación Mellon, dijo, otorgó a Internet Archive una subvención en este sentido en 2019.
"Así que ahora estamos rastreando literatura la larga cola de revistas y también conjuntos de datos que están disponibles en la web", dijo. "Estamos preparados de manera significativa gracias a estas subvenciones y, francamente, a los descubrimientos que hemos hecho sobre la cantidad de apoyo que los recursos comunes necesitan "
Bryan Newbold de Internet Archive dijo que, según el análisis de Internet Archive, "el 18 por ciento de todos los artículos de acceso abierto desde 1945, más de tres millones, no son archivados independientemente por nosotros u otra organización de preservación, aparte de los propios editores".
Newbold dijo que Internet Archive ha estado en contacto con los autores del artículo y están trabajando para mejorar el rastreo de artículos. "Hay una función 'guardar paper ahora', así como una API para bots. Organizaciones como DOAJ, ISSN, registradores DOI (Crossref, Datacite, otros) son cruciales para esto", dijo.
Internet Archive tiene como objetivo aumentar sus esfuerzos asociándose con editoriales más grandes, como LOCKSS, Portico, JSTOR y repositorios institucionales.
Newbold dijo que sería útil tener el equivalente de youtube-dl, una herramienta para descargar videos de YouTube, para documentos de acceso abierto.
"Hay una gran cantidad de contenido en grandes plataformas y editores que tienen medidas anti-rastreo (¡incluso para contenido abierto "dorado" e "híbrido"!), así como una larga lista de editores pequeños que no utilizan mecanismos simples / comunes como OAI- PMH y la metaetiqueta HTML 'citation_pdf_url' para identificar el contenido de texto completo. Lamentablemente, el ecosistema OAI-PMH no es muy completo ni útil para el caso de uso de mirroring (duplicación)", dijo Newbold.
#3:
Llama la atención que quede aún tanto conocimiento en soporte de papel del siglo XX y que sin embargo, se haya perdido ya tanto conocimiento en formato web de los últimos 20 años (que no está almacenado en archive.org ni en ninguna web de preservación).
Al final, dentro de lo leonino que es el modelo de las revistas de suscripción hay que reconocer que se encargan de que el contenido siga siendo accesible.
Por otro lado, la gente se ha acostumbrado a que sean los rastreadores bots los que se ocupen de indexar y preservar su web cuando quizá debería ser al contrario. Archive.org ya ofrece la posibilidad de que saquen una "foto" (una indexación y guardado en un momento dado) de una web a petición del visitante, pero creo recordar que hace 10 años esa posibilidad no estaba.
También se me ocurre, que deberían ser los ministerios de cultura e instituciones tipo bibliotecas nacionales las que tuvieran implementado una especie de archive.org que automáticamente indexara y preservara las webs de sus respectivos dominios (*.es y *.esp en el caso de la Biblioteca Nacional de España, por ejemplo)
#2:
No solo son revistas las que desaparecen, tambien libros enteros y webs con contenidos muy similares a los de articulos o libros, y archive.org no lo tiene todo, aunque afortunadamente tiene bastante. El conocimiento nunca se ha preservado por completo: De los tiempos que era oral no ha quedado mucho, y de bastantes culturas que tuvieron escritura queda poca cosa. De todos modos de los que era el mundo de las revistas y los libros antiguos hace 50 años a ahora hemos avanzado de manera increible.
Estamos en un momento de almacenamiento barato, por lo que podemos guardar mucho, y poco a poco se tomara conciencia de salvar lo producido.
Los académicos que estudian la longevidad del conocimiento en línea dicen que 176 revistas digitales de acceso abierto han desaparecido de Internet en las últimas dos décadas. Los hallazgos están documentados en un artículo de investigación distribuido a través de ArXiv, "Lo abierto no es para siempre: un estudio de revistas de acceso abierto desaparecidas" ( Open is not forever: a study of vanished open access journals).
Los diamantes son para siempre, los artículos académicos no tanto, parece.
Los autores Mikael Laakso de la Hanken School of Economics de Helsinki, Lisa Matthias de la Universidad Libre de Berlín y Najko Jahn de la Universidad de Gotinga examinaron varios índices bibliográficos y el Directorio de revistas de acceso abierto, e intentaron rastrear las publicaciones a través de Internet Archive Wayback Machine.
Las revistas de acceso abierto, como sugiere el término, se hacen accesibles a los usuarios de Internet sin cargo, en contraste con las revistas tradicionales basadas en suscripción. Existe un debate en curso entre los investigadores sobre si publicar en una revista de acceso abierto (AA) o en un título por suscripción. La decisión afecta la distribución del artículo, la velocidad de publicación, el costo de publicación, el prestigio profesional y otros factores.
El problema surgió el año pasado cuando la Universidad de California canceló su suscripción con el gigante de publicaciones científicas Elsevier por el precio que exigía para acceder a su colección de más de 2.000 revistas. El sistema de la UC quiere que Elsevier proporcione publicaciones de acceso abierto para los artículos escritos por la UC y que proporcione a los académicos de la UC acceso al contenido de la revista a un precio razonable. Las negaciones continúan.
El lento avance de la pérdida de información
Laakso, Matthias y Jahn señalan que, si bien las revistas de AA "no están desapareciendo en grandes cantidades", su desaparición afecta a ciertas disciplinas de manera desproporcionada. Las revistas asociadas con instituciones académicas o grupos académicos en América del Norte, y con la investigación en ciencias sociales y humanidades, representaron una porción mayor del contenido desaparecido que otras.
"Nuestros hallazgos sugieren que los enfoques actuales para la preservación digital tienen éxito en el archivo de contenido de revistas más grandes y editoriales establecidas, pero dejan atrás a los que están en mayor riesgo", afirman los autores en el artículo. "Por lo tanto, es posible que las iniciativas de preservación necesiten reevaluar su estrategia actual y desarrollar vías alternativas, idealmente en estrecha colaboración y consulta con revistas universitarias y de la sociedad, que sean más adecuadas para revistas más pequeñas que operan sin el apoyo de grandes editoriales profesionales".
En un correo electrónico enviado a The Register, Brewster Kahle, director y cofundador de Internet Archive, "Hemos encontrado casi lo mismo con las revistas de acceso abierto: a menudo no se atienden", y agregó que se alegra de que el tema se esté estudiando formalmente.
Kahle dijo que Internet Archive ha estado rastreando la web durante 25 años, pero comenzó a centrarse en publicaciones periódicas académicas en 2018. La Fundación Mellon, dijo, otorgó a Internet Archive una subvención en este sentido en 2019.
"Así que ahora estamos rastreando literatura la larga cola de revistas y también conjuntos de datos que están disponibles en la web", dijo. "Estamos preparados de manera significativa gracias a estas subvenciones y, francamente, a los descubrimientos que hemos hecho sobre la cantidad de apoyo que los recursos comunes necesitan "
Bryan Newbold de Internet Archive dijo que, según el análisis de Internet Archive, "el 18 por ciento de todos los artículos de acceso abierto desde 1945, más de tres millones, no son archivados independientemente por nosotros u otra organización de preservación, aparte de los propios editores".
Newbold dijo que Internet Archive ha estado en contacto con los autores del artículo y están trabajando para mejorar el rastreo de artículos. "Hay una función 'guardar paper ahora', así como una API para bots. Organizaciones como DOAJ, ISSN, registradores DOI (Crossref, Datacite, otros) son cruciales para esto", dijo.
Internet Archive tiene como objetivo aumentar sus esfuerzos asociándose con editoriales más grandes, como LOCKSS, Portico, JSTOR y repositorios institucionales.
Newbold dijo que sería útil tener el equivalente de youtube-dl, una herramienta para descargar videos de YouTube, para documentos de acceso abierto.
"Hay una gran cantidad de contenido en grandes plataformas y editores que tienen medidas anti-rastreo (¡incluso para contenido abierto "dorado" e "híbrido"!), así como una larga lista de editores pequeños que no utilizan mecanismos simples / comunes como OAI- PMH y la metaetiqueta HTML 'citation_pdf_url' para identificar el contenido de texto completo. Lamentablemente, el ecosistema OAI-PMH no es muy completo ni útil para el caso de uso de mirroring (duplicación)", dijo Newbold.
Llama la atención que quede aún tanto conocimiento en soporte de papel del siglo XX y que sin embargo, se haya perdido ya tanto conocimiento en formato web de los últimos 20 años (que no está almacenado en archive.org ni en ninguna web de preservación).
Al final, dentro de lo leonino que es el modelo de las revistas de suscripción hay que reconocer que se encargan de que el contenido siga siendo accesible.
Por otro lado, la gente se ha acostumbrado a que sean los rastreadores bots los que se ocupen de indexar y preservar su web cuando quizá debería ser al contrario. Archive.org ya ofrece la posibilidad de que saquen una "foto" (una indexación y guardado en un momento dado) de una web a petición del visitante, pero creo recordar que hace 10 años esa posibilidad no estaba.
También se me ocurre, que deberían ser los ministerios de cultura e instituciones tipo bibliotecas nacionales las que tuvieran implementado una especie de archive.org que automáticamente indexara y preservara las webs de sus respectivos dominios (*.es y *.esp en el caso de la Biblioteca Nacional de España, por ejemplo)
#3 Sí. Por partes:
El servicio de archivado bajo demanda empezó en otoño de 2012 así que no han pasado 10 años.
Hay muchísima información perdida en internet y eso seguirá siendo así por mucho que IA declare que van a combatir. A ellos también se les pierde información almacenada.
Sí. La Biblioteca Nacional de España hace eso que dices con los dominios .es. El problema es que el tema del copyright (y temas privacidad también supongo, si navegas un rato en elfwood puedes sacar un montón de datos personales de gente que piensa que ya no existen, lo mismo pasará con webs españolas — elfwood era sueca —) hace que sólo se pueden consultar presencialmente.
Hay tropecientos servicios nacionales pero debido a eso es como si apenas existieran.
Igualmente siempre va a haber cosas inalcanzables a los archivadores web, por definición. Supuestamente, en 2100 no existirán ninguna o casi ninguna de las webs que existen ahora. Eso significa que también se puede llevar por delante a archivadores como WM, archive.is, conifer, perma.cc, igual que ya desaparecieron otros en el pasado.
Un saludo
Cc #5 así es, el buscador aún es muy malo. A mí me gusta más la búsqueda implementada en archive.is
#3 Originalmente, existian Del.icio.us que permitia hacer marcadores y era una forma de indexar. Ahora no se si queda algun marcador social.
Es una forma de clasificar informacion que se ha perdido.
Tambien habia directorios, buscadores que funcionaban con informacion que metian los usuarios y la indexaba. OZU o Kaixo creo que funcionaba asi.
Webs que han muerto:
Amigos del ciclismo.com
Geocities
Existe algo parecido a geocities? supongo que la gente usa Blogspot de esa forma.
#17 Yo sigo usando los feed rss, que antiguamente utilizaba con Rsss Reader y con Bloglines (actualmente uso inoreader, y no sé si queda algo más). Entre mi círculo de conocidos había una persona que se preocupaba de hacer versiones offline navegables de webs que nos gustaban y las metía en CD para distribuirnoslas y que no se perdieran. Muchas de esas webs ya sólo quedan hoy en estos cds porque el original desapareció por una rotura del servidor o aburrimiento del webmaster. Y eso era en los años 2000-2010. La desaparición de dominios desde el 2010 en adelante ha sido brutal. Al principio, el éxodo de las webs convencionales y portales hacia el formato blog, y después, esos blogs fueron abandonados y se convirtieron (convirtieron, no evolucionaron) en grupos de Facebook y Telegram, formato chat sin contenidos de valor y solo ruido. Que si mañana desaparecen de nuevo poco se perderá ya ...
#18 Lo malo de los CD-R es que creo que todos acaban perdiendio los datos al ser fotosensibles.
Es curioso esta deriva. ¿Es espontanea o es buscadas por algun interesado? A mi twitter siempre me ha parecido sin interes, pero ha triunfado. Puede ser interesante para mantener el interés y tener un compendio de relaciones que luego se pueden explotar.
Tal vez los usuarios estamos perdiendo la batalla respecto a las corporaciones.
#19 No creo que sea culpa de la herramienta. Cosas así como Twitter ya había hace 20 años, pero quizá no eran tan accesibles o apetitosas como ahora (había otras cosas como IRC). Curiosamente, a nadie le daba la vena de querer tener contenidos de valor en un canal de IRC y prefería usar foros,ftps o webs para tener accesible y ordenado el contenido de valor. Sin embargo, ahora hay mucha gente que piensa que un grupo de Telegram vale para eso. Yo pienso que la gente que monta grupos de Telegram es por sentirse protagonista, no por querer brindar un servicio a la escena o a la comunidad, y eso se nota.
Por tener métricas de referencia: ¿se sabe cuánto es el tiempo medio, moda y máximo que suele aguantar una web abierta? La mayoría de los grandes servicios de Internet no han llegado a los 15 años. Geocities era de los más longevos y ya no está, por ejemplo, o Hotmail, que se ha ido reconvirtiendo y transmutando en otras cosas, por lo que hoy tampoco existe ya. O Napster. O Terra. O Ole. O Altavista. Lycos ... Y si hablamos de sitios personales, raro es que sobrepasen los 10 años salvo lo que está hospedado en Wordpress o Blogger, que no muere porque lo mantiene el proveedor del hosting, aunque el sitio ya no tenga mantenimiento.
En realidad, los sitios de internet son sumamente efímeros. Si nos parecía que un CD de Princo duraba poco, resulta que la mayoría de sites duran menos aún.
No solo son revistas las que desaparecen, tambien libros enteros y webs con contenidos muy similares a los de articulos o libros, y archive.org no lo tiene todo, aunque afortunadamente tiene bastante. El conocimiento nunca se ha preservado por completo: De los tiempos que era oral no ha quedado mucho, y de bastantes culturas que tuvieron escritura queda poca cosa. De todos modos de los que era el mundo de las revistas y los libros antiguos hace 50 años a ahora hemos avanzado de manera increible.
Estamos en un momento de almacenamiento barato, por lo que podemos guardar mucho, y poco a poco se tomara conciencia de salvar lo producido.
#14 la cosa es quejarse. Ni que no tuvieras acceso al inglés. Está traducido con traducción automática con algunas correcciones por ejemplo al principio el traductor quería poner becas en vez de conocimiento y cosas así.
Yo no tengo obligación de dar ninguna traducción, pero aquí entra mucha gente que no sabe inglés. No le veo el problema realmente a la traducción, no me rechina en ningún momento. Creo que te quejas por quejarte, si no habrías puesto alguna alternativa. Que por cierto, "diarios" no es el término que se usa para hablar de las revistas científicas. Así que eres tú el equivocado.
#9 se llaman revistas igual. Que tu comprensión sea "de mierda" (sin acritud) no le hace nada al envío, que está en inglés. La traducción está para quien no sepa inglés y para aportar más información. Saludos.
Comentarios
Los académicos que estudian la longevidad del conocimiento en línea dicen que 176 revistas digitales de acceso abierto han desaparecido de Internet en las últimas dos décadas. Los hallazgos están documentados en un artículo de investigación distribuido a través de ArXiv, "Lo abierto no es para siempre: un estudio de revistas de acceso abierto desaparecidas" ( Open is not forever: a study of vanished open access journals).
Los diamantes son para siempre, los artículos académicos no tanto, parece.
Los autores Mikael Laakso de la Hanken School of Economics de Helsinki, Lisa Matthias de la Universidad Libre de Berlín y Najko Jahn de la Universidad de Gotinga examinaron varios índices bibliográficos y el Directorio de revistas de acceso abierto, e intentaron rastrear las publicaciones a través de Internet Archive Wayback Machine.
Las revistas de acceso abierto, como sugiere el término, se hacen accesibles a los usuarios de Internet sin cargo, en contraste con las revistas tradicionales basadas en suscripción. Existe un debate en curso entre los investigadores sobre si publicar en una revista de acceso abierto (AA) o en un título por suscripción. La decisión afecta la distribución del artículo, la velocidad de publicación, el costo de publicación, el prestigio profesional y otros factores.
El problema surgió el año pasado cuando la Universidad de California canceló su suscripción con el gigante de publicaciones científicas Elsevier por el precio que exigía para acceder a su colección de más de 2.000 revistas. El sistema de la UC quiere que Elsevier proporcione publicaciones de acceso abierto para los artículos escritos por la UC y que proporcione a los académicos de la UC acceso al contenido de la revista a un precio razonable. Las negaciones continúan.
Las restricciones y costos impuestos por editoriales académicas tradicionales como Elsevier llevaron a Alexandra Asanovna Elbakyan en 2011 a fundar Sci-Hub, un sitio web que comparte artículos de investigación sin costo y sin tener en cuenta la ley de derechos de autor de EE. UU.
----
Artículos relacionados sobre sci-hub en Menéame
Sci-hub. Quién es la Robin Hood de la ciencia que creó este sitio pirata.
Sci-Hub, el 'Pirate Bay' de la ciencia, acusado de espiar para Rusia y perseguido por las grandes editoriales académicas.
La investigadora que cuelga millones de "papers" online para compartir conocimiento (eng), etc.).
Relacionado con Internet Archive o Wayback Machine previamente en menéame
La Wayback Machine ya compara las páginas que mantiene en su archivo histórico (en beta).
Internet Archive cierra su biblioteca digital tras una demanda por piratería.
Cuatro potentes editoriales demandan a Internet Archive: argumentan que violan los derechos de autor a gran escala.
(Propios)
Lo efímero del hipervínculo I: Introducción y principales archivos web actuales.
Lo efímero del hipervínculo II: Memento Time Travel y más archivos web actuales.
Lo efímero del hipervínculo III: Archivos web pasados y enlaces cortos.
----
Las revistas de AA por diseño son más asequibles y accesibles que sus parientes basados en suscripción, pero su falta de un modelo de financiación hace que su supervivencia en curso sea más precaria.
El lento avance de la pérdida de información
Laakso, Matthias y Jahn señalan que, si bien las revistas de AA "no están desapareciendo en grandes cantidades", su desaparición afecta a ciertas disciplinas de manera desproporcionada. Las revistas asociadas con instituciones académicas o grupos académicos en América del Norte, y con la investigación en ciencias sociales y humanidades, representaron una porción mayor del contenido desaparecido que otras.
"Nuestros hallazgos sugieren que los enfoques actuales para la preservación digital tienen éxito en el archivo de contenido de revistas más grandes y editoriales establecidas, pero dejan atrás a los que están en mayor riesgo", afirman los autores en el artículo. "Por lo tanto, es posible que las iniciativas de preservación necesiten reevaluar su estrategia actual y desarrollar vías alternativas, idealmente en estrecha colaboración y consulta con revistas universitarias y de la sociedad, que sean más adecuadas para revistas más pequeñas que operan sin el apoyo de grandes editoriales profesionales".
En un correo electrónico enviado a The Register, Brewster Kahle, director y cofundador de Internet Archive, "Hemos encontrado casi lo mismo con las revistas de acceso abierto: a menudo no se atienden", y agregó que se alegra de que el tema se esté estudiando formalmente.
Kahle dijo que Internet Archive ha estado rastreando la web durante 25 años, pero comenzó a centrarse en publicaciones periódicas académicas en 2018. La Fundación Mellon, dijo, otorgó a Internet Archive una subvención en este sentido en 2019.
"Así que ahora estamos rastreando literatura la larga cola de revistas y también conjuntos de datos que están disponibles en la web", dijo. "Estamos preparados de manera significativa gracias a estas subvenciones y, francamente, a los descubrimientos que hemos hecho sobre la cantidad de apoyo que los recursos comunes necesitan "
Bryan Newbold de Internet Archive dijo que, según el análisis de Internet Archive, "el 18 por ciento de todos los artículos de acceso abierto desde 1945, más de tres millones, no son archivados independientemente por nosotros u otra organización de preservación, aparte de los propios editores".
Newbold dijo que Internet Archive ha estado en contacto con los autores del artículo y están trabajando para mejorar el rastreo de artículos. "Hay una función 'guardar paper ahora', así como una API para bots. Organizaciones como DOAJ, ISSN, registradores DOI (Crossref, Datacite, otros) son cruciales para esto", dijo.
Internet Archive tiene como objetivo aumentar sus esfuerzos asociándose con editoriales más grandes, como LOCKSS, Portico, JSTOR y repositorios institucionales.
Newbold dijo que sería útil tener el equivalente de youtube-dl, una herramienta para descargar videos de YouTube, para documentos de acceso abierto.
"Hay una gran cantidad de contenido en grandes plataformas y editores que tienen medidas anti-rastreo (¡incluso para contenido abierto "dorado" e "híbrido"!), así como una larga lista de editores pequeños que no utilizan mecanismos simples / comunes como OAI- PMH y la metaetiqueta HTML 'citation_pdf_url' para identificar el contenido de texto completo. Lamentablemente, el ecosistema OAI-PMH no es muy completo ni útil para el caso de uso de mirroring (duplicación)", dijo Newbold.
Llama la atención que quede aún tanto conocimiento en soporte de papel del siglo XX y que sin embargo, se haya perdido ya tanto conocimiento en formato web de los últimos 20 años (que no está almacenado en archive.org ni en ninguna web de preservación).
Al final, dentro de lo leonino que es el modelo de las revistas de suscripción hay que reconocer que se encargan de que el contenido siga siendo accesible.
Por otro lado, la gente se ha acostumbrado a que sean los rastreadores bots los que se ocupen de indexar y preservar su web cuando quizá debería ser al contrario. Archive.org ya ofrece la posibilidad de que saquen una "foto" (una indexación y guardado en un momento dado) de una web a petición del visitante, pero creo recordar que hace 10 años esa posibilidad no estaba.
También se me ocurre, que deberían ser los ministerios de cultura e instituciones tipo bibliotecas nacionales las que tuvieran implementado una especie de archive.org que automáticamente indexara y preservara las webs de sus respectivos dominios (*.es y *.esp en el caso de la Biblioteca Nacional de España, por ejemplo)
#3 Sí. Por partes:
El servicio de archivado bajo demanda empezó en otoño de 2012 así que no han pasado 10 años.
Hay muchísima información perdida en internet y eso seguirá siendo así por mucho que IA declare que van a combatir. A ellos también se les pierde información almacenada.
Sí. La Biblioteca Nacional de España hace eso que dices con los dominios .es. El problema es que el tema del copyright (y temas privacidad también supongo, si navegas un rato en elfwood puedes sacar un montón de datos personales de gente que piensa que ya no existen, lo mismo pasará con webs españolas — elfwood era sueca —) hace que sólo se pueden consultar presencialmente.
Hay tropecientos servicios nacionales pero debido a eso es como si apenas existieran.
Igualmente siempre va a haber cosas inalcanzables a los archivadores web, por definición. Supuestamente, en 2100 no existirán ninguna o casi ninguna de las webs que existen ahora. Eso significa que también se puede llevar por delante a archivadores como WM, archive.is, conifer, perma.cc, igual que ya desaparecieron otros en el pasado.
Un saludo
Cc #5 así es, el buscador aún es muy malo. A mí me gusta más la búsqueda implementada en archive.is
#3 Originalmente, existian Del.icio.us que permitia hacer marcadores y era una forma de indexar. Ahora no se si queda algun marcador social.
Es una forma de clasificar informacion que se ha perdido.
Tambien habia directorios, buscadores que funcionaban con informacion que metian los usuarios y la indexaba. OZU o Kaixo creo que funcionaba asi.
Webs que han muerto:
Amigos del ciclismo.com
Geocities
Existe algo parecido a geocities? supongo que la gente usa Blogspot de esa forma.
#17 Yo sigo usando los feed rss, que antiguamente utilizaba con Rsss Reader y con Bloglines (actualmente uso inoreader, y no sé si queda algo más). Entre mi círculo de conocidos había una persona que se preocupaba de hacer versiones offline navegables de webs que nos gustaban y las metía en CD para distribuirnoslas y que no se perdieran. Muchas de esas webs ya sólo quedan hoy en estos cds porque el original desapareció por una rotura del servidor o aburrimiento del webmaster. Y eso era en los años 2000-2010. La desaparición de dominios desde el 2010 en adelante ha sido brutal. Al principio, el éxodo de las webs convencionales y portales hacia el formato blog, y después, esos blogs fueron abandonados y se convirtieron (convirtieron, no evolucionaron) en grupos de Facebook y Telegram, formato chat sin contenidos de valor y solo ruido. Que si mañana desaparecen de nuevo poco se perderá ya ...
#18 Lo malo de los CD-R es que creo que todos acaban perdiendio los datos al ser fotosensibles.
Es curioso esta deriva. ¿Es espontanea o es buscadas por algun interesado? A mi twitter siempre me ha parecido sin interes, pero ha triunfado. Puede ser interesante para mantener el interés y tener un compendio de relaciones que luego se pueden explotar.
Tal vez los usuarios estamos perdiendo la batalla respecto a las corporaciones.
#19 No creo que sea culpa de la herramienta. Cosas así como Twitter ya había hace 20 años, pero quizá no eran tan accesibles o apetitosas como ahora (había otras cosas como IRC). Curiosamente, a nadie le daba la vena de querer tener contenidos de valor en un canal de IRC y prefería usar foros,ftps o webs para tener accesible y ordenado el contenido de valor. Sin embargo, ahora hay mucha gente que piensa que un grupo de Telegram vale para eso. Yo pienso que la gente que monta grupos de Telegram es por sentirse protagonista, no por querer brindar un servicio a la escena o a la comunidad, y eso se nota.
Por tener métricas de referencia: ¿se sabe cuánto es el tiempo medio, moda y máximo que suele aguantar una web abierta? La mayoría de los grandes servicios de Internet no han llegado a los 15 años. Geocities era de los más longevos y ya no está, por ejemplo, o Hotmail, que se ha ido reconvirtiendo y transmutando en otras cosas, por lo que hoy tampoco existe ya. O Napster. O Terra. O Ole. O Altavista. Lycos ... Y si hablamos de sitios personales, raro es que sobrepasen los 10 años salvo lo que está hospedado en Wordpress o Blogger, que no muere porque lo mantiene el proveedor del hosting, aunque el sitio ya no tenga mantenimiento.
En realidad, los sitios de internet son sumamente efímeros. Si nos parecía que un CD de Princo duraba poco, resulta que la mayoría de sites duran menos aún.
No solo son revistas las que desaparecen, tambien libros enteros y webs con contenidos muy similares a los de articulos o libros, y archive.org no lo tiene todo, aunque afortunadamente tiene bastante. El conocimiento nunca se ha preservado por completo: De los tiempos que era oral no ha quedado mucho, y de bastantes culturas que tuvieron escritura queda poca cosa. De todos modos de los que era el mundo de las revistas y los libros antiguos hace 50 años a ahora hemos avanzado de manera increible.
Estamos en un momento de almacenamiento barato, por lo que podemos guardar mucho, y poco a poco se tomara conciencia de salvar lo producido.
Ojo, que archive.org tampoco es la panacea. Tienen la información almacenada, pero como no te sepas la url original buscar algo es un infierno
#5 Pero ese problema (problemilla) es para el caso de webs. Guarda de todo, hasta software.
In memorandum a Aaron Schwartz!
#4 me parece que no se dice memorándum, pero bueno, todo sea por recordar a Aaron!
#4 "In Memoriam" es "en recuerdo de". Un memorandum es una circular
Pero sí, RIP Aaron!
Off topic: ¡Que bonita es la foto del robot!
Aquí el catálogo de stock del autor. Vasilyev Alexandr: https://www.shutterstock.com/es/g/idal/sets
#11 gracias.
(Telegram bot) Nexus Scientific Search | LibGen | Sci-Hub https://t.me/libgen_scihub_bot
#14 la cosa es quejarse. Ni que no tuvieras acceso al inglés. Está traducido con traducción automática con algunas correcciones por ejemplo al principio el traductor quería poner becas en vez de conocimiento y cosas así.
Yo no tengo obligación de dar ninguna traducción, pero aquí entra mucha gente que no sabe inglés. No le veo el problema realmente a la traducción, no me rechina en ningún momento. Creo que te quejas por quejarte, si no habrías puesto alguna alternativa. Que por cierto, "diarios" no es el término que se usa para hablar de las revistas científicas. Así que eres tú el equivocado.
Me parece que no se refieren a revistas tipo "Hola", sino especificamente a diarios de investigación científica.
Perdido en la traducción (de mierda).
#9 se llaman revistas igual. Que tu comprensión sea "de mierda" (sin acritud) no le hace nada al envío, que está en inglés. La traducción está para quien no sepa inglés y para aportar más información. Saludos.
#12 ¿Pero y a tí que te imp... ? Aaaah, vale, que eres tú el que ha perpetrado la traducción