Un vistazo al robots.txt de la SGAE

#2   Al menos tienen asumido lo que son.

#1 Son las búsquedas por la que no quieren aparecer en los navegadores.
votos: 43    karma: 361
#4   #2 Aaah. Gracias por el dato.
votos: 5    karma: 58
#14   #2 #12 #13 en realidad no.
El archivo robots.txt lo que se encarga es de decirle a los bots que archivos del propio sitio web - en este caso sgae.es - no quiere que indexe. Por ejemplo Disallow:/?SGAE=LADRONES=MONOPOLIO significa: no indexes sgae.es/?SGAE=LADRONES=MONOPOLIO

básicamente los de la SGAE no entendieron nada. En vez de arreglar su buscador para que no les hicieran cross scripting hicieron esta chapuza del robots.
votos: 55    karma: 501
#15   #1,#2,#12, el robots.txt es un fichero público con el que informar a los robots de internet lo que quieres o no quieres que indexen de tu página web. No han hackeado nada pues es de acceso público y además lo utilizan mal, como dice #14 (te adelantaste..)

Para más información
support.google.com/webmasters/bin/answer.py?hl=es&answer=156449
votos: 9    karma: 84
 *   pero.kokoa pero.kokoa
#22   El fichero robots.txt sólo evita que el 'googlebot' y similares escaneen las páginas o directorios mencionados, pero no evita su indexación si alguien (incluído Google) ha visitado ya la página antes. Vamos, que lo que han hecho es una chapuza impresionante, como dice #14.

Por ejemplo, el enlace que aparece en el robots.txt "a no indexar"

www.sgae.es/?SGAE=LADRONES=MONOPOLIO

Está indexado, porque hay otras páginas que hacen referencia a ésta (está explicado por google en el enlace de #15).
votos: 4    karma: 34
 *   gaia26
#37   Pues no es por nada, pero con lo zote que soy yo, de letras, y sin zorra idea de estas cosas, y que haya sido capaz de darme cuenta de la chapuza que han hecho... #14 ¿a quién le pagan por hacer esa web?
Ni en el todo a 100 lo harían peor.
votos: 0    karma: 20
 *   reemax reemax
#55   #14 Tenéis que daros cuenta compañeros. Que por mucho que la SGAE vaya de defensora de la Cultura, no tiene NPI de ella, y menos tecnológica. Así que no esperéis algo bien hecho por ellos.

Salu2
votos: 0    karma: 10
#29   #2 Donde dije navegadores quise decir buscadores. Error tipográfico.
votos: 0    karma: 5

menéame