Un vistazo al robots.txt de la SGAE

  1. #12   Esto ¿que es? ¿Hackeado o que han puesto ese archivo para que no salga la web de la SGAE al buscar eso? Es que de informática y estas cosas no sé nada.
    votos: 0    karma: 20
  1. #13   #12 lo primero que comentas.
    votos: 1    karma: 14
    1. #14   #2 #12 #13 en realidad no.
      El archivo robots.txt lo que se encarga es de decirle a los bots que archivos del propio sitio web - en este caso sgae.es - no quiere que indexe. Por ejemplo Disallow:/?SGAE=LADRONES=MONOPOLIO significa: no indexes sgae.es/?SGAE=LADRONES=MONOPOLIO

      básicamente los de la SGAE no entendieron nada. En vez de arreglar su buscador para que no les hicieran cross scripting hicieron esta chapuza del robots.
      votos: 55    karma: 501
      1. #22   El fichero robots.txt sólo evita que el 'googlebot' y similares escaneen las páginas o directorios mencionados, pero no evita su indexación si alguien (incluído Google) ha visitado ya la página antes. Vamos, que lo que han hecho es una chapuza impresionante, como dice #14.

        Por ejemplo, el enlace que aparece en el robots.txt "a no indexar"

        www.sgae.es/?SGAE=LADRONES=MONOPOLIO

        Está indexado, porque hay otras páginas que hacen referencia a ésta (está explicado por google en el enlace de #15).
        votos: 4    karma: 34
         *   gaia26 gaia26
      2. #37   Pues no es por nada, pero con lo zote que soy yo, de letras, y sin zorra idea de estas cosas, y que haya sido capaz de darme cuenta de la chapuza que han hecho... #14 ¿a quién le pagan por hacer esa web?
        Ni en el todo a 100 lo harían peor.
        votos: 0    karma: 20
         *   reemax reemax
      3. #55   #14 Tenéis que daros cuenta compañeros. Que por mucho que la SGAE vaya de defensora de la Cultura, no tiene NPI de ella, y menos tecnológica. Así que no esperéis algo bien hecho por ellos.

        Salu2
        votos: 0    karma: 10
    2. #15   #1,#2,#12, el robots.txt es un fichero público con el que informar a los robots de internet lo que quieres o no quieres que indexen de tu página web. No han hackeado nada pues es de acceso público y además lo utilizan mal, como dice #14 (te adelantaste..)

      Para más información
      support.google.com/webmasters/bin/answer.py?hl=es&answer=156449
      votos: 9    karma: 84
       *   saraguato saraguato
      comentarios cerrados

      menéame