236 meneos

Digg estrena un sistema 'infalible' para evitar el envío de historias duplicadas

En sitios como Digg o Menéame es habitual encontrarse con que una misma noticia ha sido enviada repetidamente por varios usuarios en un breve espacio de tiempo. Es algo normal teniendo en cuenta que cada día se menean cientos de historias. Pero Digg ha estrenado un sistema ultra-avanzado que, según los ingenieros del portal, va a acabar con los artículos duplicados. Bueno, o no... En inglés: blog.digg.com/?p=866

negativos: 1   usuarios: 158   anónimos: 78  
compartir:  twitter  facebook  tuenti  
  1. #1   El sistema está todavía en periodo de pruebas y por el momento únicamente bloquea por defecto las URLs idénticas. <== Lo de las URLs idénticas lo tiene menéame, desde hace eones.
    517  votos: 44   link
    el 01-07-2009 15:16 UTC por miguelitor miguelitor
  2. #2   Entonces perderia la gracia de pelearnos por ¿relacionada o dupe?...
    55  votos: 4   link
    el 01-07-2009 15:17 UTC por jamaicano jamaicano
  3. #3   Aquí hay hordas de aguerridos buscadupes, eso basta para dejar en la sombra a la inteligencia artificial de Digg.
    684  votos: 63   link
    el 01-07-2009 15:18 UTC por --14179-- --14179--
  4. #4   #1 DIGG FAIL! MENÉAME WIN! :-D
    231  votos: 19   link
    el 01-07-2009 15:18 UTC por jm22381 jm22381
  5. #5   #3
    [chiste_malo]
    ¿Las hordas tienen inteligencia?
    [/chiste_malo]
    20  votos: 1   link
    el 01-07-2009 15:19 UTC por MarioQuartz MarioQuartz
  6. #6   esta noticia es duplicada!!!!!!!!!!!!
    37  votos: 2   link
    el 01-07-2009 15:20 UTC por grima grima
  7. #7   ¿Nadie lo va a decir?
    Pues lo digo yo:
    diggowned www.abadiadigital.com/imagenes/digg-duplicadas.png

    :-P
    267  votos: 23   link
    el 01-07-2009 15:25 UTC por miguelitor miguelitor
  8. #8   #1

    Ingenieros de Digg:

    Amo' a ver... creo que si uno esto aquí, junto por allá, adapto la junta de la culata...

    ¡Mirad! ¡He conseguido un sistema infalible para las dupes!

    consulta = "Select * from PAGINAS where URL=" + url;
    if(query(consulta)!=0){
    dupe = true;
    }
    266  votos: 24   link
    el 01-07-2009 15:26 UTC por Moussenger Moussenger
  9. #10   La verdad es que en Digg hay demasiados envios duplicados y lo que es peor, en portada.
    33  votos: 1   link
    el 01-07-2009 15:26 UTC por Kery Kery
  10. #11   #9 No se a que viene ese ataque personal.
    41  votos: 4   link
    el 01-07-2009 15:28 UTC por miguelitor miguelitor
  11. #12   El sistema está todavía en periodo de pruebas y por el momento únicamente bloquea por defecto las URLs idénticas

    Pues sí que es ultra-avanzado, sí.
    40  votos: 3   link
    el 01-07-2009 15:28 UTC por --127476-- --127476--
  12. #13   #11 es una broma, que poco sentido del humor!
    Carme pilla todas las duplicadas al vuelo, por eso lo digo. En fin.
    70  votos: 7   link
    el 01-07-2009 15:32 UTC por Danny Danny
  13. #15   #14 Verás, como con la tontería voten dupe... xD
    77  votos: 5   link
    el 01-07-2009 15:37 UTC por miguelitor miguelitor
  14. #16   Aquí tenemos un script muy efectivo llamado HAJO, y lleva funcionando desde hace lustros. Aunque el HAJO se repite mucho y deja siempre los mismos comentarios con regusto es muy eficaz

    Gracias HAJO (HAbladorcito JOrsovernet)
    149  votos: 10   link
    el 01-07-2009 15:37 UTC por kurioso kurioso
  15. #17   #14 Descartaayaakesdupeeeee!
    38  votos: 2   link
    el 01-07-2009 15:41 UTC por ludens76 ludens76
  16. #18   #16 Pensé que te habías vuelto hoygan y que ibas a poner:
    "HAJO y agua" xD xD
    53  votos: 3   link
    el 01-07-2009 15:41 UTC por miguelitor miguelitor
  17. #20   Votamos copia/plagio?
    49  votos: 3   link
    el 01-07-2009 15:54 UTC por Maki_ Maki_
  18. #22   ¿Como funciona el sistema?
    22  votos: 2   link
    el 01-07-2009 16:14 UTC por chulonsky chulonsky
  19. #23   Donde dije Diggo diggo Dieggo.
    21  votos: 1   link
    el 01-07-2009 16:14 UTC por edgard72 edgard72
  20. #24   Habís perdido un meneador xD
    31  votos: 2   link
    el 01-07-2009 16:18 UTC por filipo filipo
  21. #25   Detecta urls idénticas...y el resto de features donde se las dejaron? Pffff yo creo que "programan" leyéndose el svn de menéame, a mí no me jodas.
    28  votos: 1   link
    el 01-07-2009 16:42 UTC por Taikochu Taikochu
  22. #26   Aumenta el karma:

    * Votos positivos a tus noticias enviadas.
    * Votos positivos a noticias que han sido publicadas, siempre que el voto haya sido realizado antes de la publicación de la noticia.
    * Votos negativos a noticias que han sido descartadas, siempre que el voto haya sido realizado en los 15 minutos siguientes al envío de la noticia.
    * Votos positivos a tus comentarios.

    +

    Karmawhores

    =

    Sistema infalible antidupes ... :-D
    48  votos: 6   link
    el 01-07-2009 16:49 UTC por InTheAciD InTheAciD
  23. #27   Epdigg fail
    9  votos: 0   link
    el 01-07-2009 16:55 UTC por Cocoman Cocoman
  24. #28   Esto lo tiene menéame desde hace tiempo, lo dicen en los primeros comentarios y la noticia ha llegado a portada... ¿Algún sistema para evitar eso? Quizás sea mejor que lo de las duples :-P
    13  votos: 1   link
    el 01-07-2009 17:00 UTC por VicenteAlfonso VicenteAlfonso
  25. #29   Tienen mania por usar mayusculas jaja
    7  votos: 0   link
    el 01-07-2009 17:00 UTC por --125164-- --125164--
  26. #30   Pues tanto como infalible... recuerdo una vez que otro usuario y yo se la colamos al buscadupes de Menéame sin darnos cuenta:

    Él mandó meneame.net/story/orgullo-prejuicio-nada-persuasion con el url www.lanacion.com.ar/nota.asp?nota_id=1011137

    Y luego yo envié meneame.net/story/como-debe-no-debe-ser-atencion-call-center con dirección www.lanacion.com.ar/opinion/nota.asp?nota_id=1011137&origen=column

    Básicamente, al enviar la noticia con todos los metadatos, el buscador no la detectó como duplicada porque la dirección no era idéntica. Así que la infalibilidad es bastante discutible.
    19  votos: 0   link
    el 01-07-2009 17:37 UTC por Nirgal Nirgal
  27. #31   y que sería meneame sin sus discusiones sobre dupes
    27  votos: 2   link
    el 01-07-2009 17:43 UTC por flashinghurt flashinghurt
  28. #32   El sistema para evitar historias duplicadas es este: img523.imageshack.us/img523/9661/diggnewdupecheck.png

    Y el usuario es quien decide si enviarla finalmente o no.
    19  votos: 1   link
    el 01-07-2009 18:11 UTC por posavasos posavasos
  29. #33   Va va, que no puedo resistirme a decirlo:

    Esto es inDIGGnante
    20  votos: 1   link
    el 01-07-2009 18:25 UTC por Cocoman Cocoman
  30. #34   Parece que #22 es el unico comentario interesado por el tema que no ha hecho un chiste malo.

    En el Blog de digg explican en que consisten los nuevos mecanismos que estan desarrollando que NO se estan aplicando de momento.
    blog.digg.com/?p=866

    las nuevas soluciones corregiran casos en que se envia un link al mismo contenido pero con urls diferentes, mediante un algoritmo que compara la similitud entre contenidos.

    Y por otro lado intentan algo un poco mas complejo: detectar como duplicadas dos noticias que aunque no sean la misma traten sobre el mismo tema (esto parece mas complicado... ya veremos que tal funciona :-)
    33  votos: 3   link
    el 01-07-2009 19:03 UTC por hildor hildor
  31. #35   Es un problema muy grande. La base de datos de digg es monstruosa y analizar textos muy costoso.

    Evidentemente lo primero es buscar URL idénticas. Pero no es tan fácil, deben previamente ser canonicalizarlas de alguna manera para que sea efectivo. Y no es nada trivial, por ejemplo, ¿tenemos en cuenta subdominios o solo los de primer nivel? ¿quitamos las barras que sobran? provad esta URL:
    meneame.net////story/digg-estrena-sistema-infalible-para-evitar-envio-
    ¿Raro, no? ¿Quitamos el #ancla? En algunas páginas, como la wikipedia llevarían a la misma página. En otras, donde son parámetros para el javascript/ajax de la página resultarían distintas (ej: facebook).

    Y eso es solo el paso más fácil. Yo seguramente seguiría buscando envios similares a través de las etiquetas, y por último analizar el título de las más probables, que siendo optimistas serían pocas noticias. Vamos, casi imposible.

    Reirme de los programadores de digg, me parece mal. Seguramente sean muy buenos, y han invertido un montón de tiempo y esfuerzo en esto, y seguramente ayude a evitar las duplicadas. Como uno del gremio, me compadezco por ellos por el escarnio público y el asegurado mal rollo en la oficina.
    17  votos: 1   link
    el 01-07-2009 19:18 UTC por kolme kolme
  32. #36   Lo de sistema infalible...
    Menéame ya lo tiene y aún así se siguen subiendo las mismas noticias publicadas en otros medios...
    6  votos: 0   link
    el 01-07-2009 20:05 UTC por esperantisto esperantisto
  33. #37   infalible mis bolainas, ayer mismos envié una historia que era dupe :-P
    40  votos: 1   link
    el 01-07-2009 20:30 UTC por holiveira holiveira
  34. #38   Sistema infalible? Nisiquiera es un sistema, es una única regla, es como decir que construyeron una casa cuando apenas acotaron el perímetro.
    6  votos: 0   link
    el 02-07-2009 00:46 UTC por Arth Arth
  35. #39   Estamos rodeados de expertos, cualquiera programaría digg con los ojos cerrados, es increible :roll:
    26  votos: 1   link
    el 02-07-2009 07:17 UTC por chulonsky chulonsky
comentarios cerrados

menéame