460 meneos
11147 clics

Un vistazo al robots.txt de la SGAE

Enlace directo: www.sgae.es/robots.txt
etiquetas: robots, sgae
negativos: 7   usuarios: 239   anónimos: 221  
compartir:  twitter  facebook  tuenti  
  1. #1   Ni p...a idea de que va esto.
    93  votos: 15   link
    el 27-12-2012 16:31 UTC por isra_el isra_el
  2. #2   Al menos tienen asumido lo que son.

    #1 Son las búsquedas por la que no quieren aparecer en los navegadores.
    361  votos: 43   link
    el 27-12-2012 16:32 UTC por FornicioDelToro FornicioDelToro
  3. #14   #2 #12 #13 en realidad no.
    El archivo robots.txt lo que se encarga es de decirle a los bots que archivos del propio sitio web - en este caso sgae.es - no quiere que indexe. Por ejemplo Disallow:/?SGAE=LADRONES=MONOPOLIO significa: no indexes sgae.es/?SGAE=LADRONES=MONOPOLIO

    básicamente los de la SGAE no entendieron nada. En vez de arreglar su buscador para que no les hicieran cross scripting hicieron esta chapuza del robots.
    501  votos: 55   link
    el 27-12-2012 17:41 UTC por EGraf EGraf
  4. #9   Que levante la mano el que haya ido a ver lo que hay en los directorios "no tocar" xD
    217  votos: 24   link
    el 27-12-2012 17:01 UTC por mandelbr0t mandelbr0t
  5. #12   Esto ¿que es? ¿Hackeado o que han puesto ese archivo para que no salga la web de la SGAE al buscar eso? Es que de informática y estas cosas no sé nada.
    20  votos: 0   link
    el 27-12-2012 17:10 UTC por reemax reemax
  6. #6   Esos putos egoístas utilizan wordpress...

    ¿Habrán pagado por el CD de wordpress? :troll:
    Los autores de wordpress se mueren de hambre con tanta descarga :-(
    214  votos: 28   link
    el 27-12-2012 16:41 UTC por odio odio
  7. #34   #1 ¿Te han votado negativo por no saber leer un código? Cómo. Está. El. Patio.
    70  votos: 8   link
    el 27-12-2012 19:27 UTC por aluk aluk
  8. #36   #9 Oye Manolo, no olvides de poner

    Disallow:/documentos-muy-secretos/

    en el robots.txt, no vaya a ser que la gente se entere de que existe, y nos caiga una bronca...


    o_o

    #24 lo que tenga que estar oculto no estará accesible públicamente por lo que los robots de google no lo pueden ni ver así que da igual.

    No subestimes el poder de Google...

    1. Uno de la SGAE está mirando un documento ultrasecreto en su navegador, ubicado en www.sgae.es/documentos-muy-secretos/cuentas_en_suiza_de_teddy.pdf
    2. En un momento dado, se va a sus marcadores, y pincha en cualquier dirección que quiera consultar, por ejemplo: www.foroblanqueo.ky . Y resulta que ese servidor guarda los logs de los accesos web y genera automáticamente las estadísticas en un dirección de consulta "típica", por ejemplo, www.foroblanqueo.ky/stats o www.foroblanqueo.ky/aw-stats
    3. Google indexa esa dirección y, escaneando los datos, resulta que en las estadísticas sale que hubo una visita a www.foroblanqueo.ky que entró (HTTP_REFERER) desde la dirección www.sgae.es/documentos-muy-secretos/cuentas_en_suiza_de_teddy.pdf
    4. En su afán de dominar el mundo, Google indexa todos los enlaces que encuentra visitándolos y escaneando lo que contienen, incluyendo www.sgae.es/documentos-muy-secretos/cuentas_en_suiza_de_teddy.pdf que nadie debería de saber que existe
    5. Un día cualquiera no sabes qué hora es, y tecleas "teddy cuentas suiza" en el buscador de Google.
    6. Envías el enlace a meneame y se lía parda.

    :-D

    Algo así pasó con un proxy de una universidad española, que guardaba los datos de las direcciones visitadas públicamente y accesibles vía web.
    119  votos: 13   link
    el 27-12-2012 19:36 UTC por devotee devotee
comentarios cerrados

menéame