Hace 14 años | Por jm22381 a abadiadigital.com
Publicado hace 14 años por jm22381 a abadiadigital.com

En sitios como Digg o Menéame es habitual encontrarse con que una misma noticia ha sido enviada repetidamente por varios usuarios en un breve espacio de tiempo. Es algo normal teniendo en cuenta que cada día se menean cientos de historias. Pero Digg ha estrenado un sistema ultra-avanzado que, según los ingenieros del portal, va a acabar con los artículos duplicados. Bueno, o no... En inglés: http://blog.digg.com/?p=866

Comentarios

jm22381

#1 DIGG FAIL! MENÉAME WIN!

kurioso

Aquí tenemos un script muy efectivo llamado HAJO, y lleva funcionando desde hace lustros. Aunque el HAJO se repite mucho y deja siempre los mismos comentarios con regusto es muy eficaz

Gracias HAJO (HAbladorcito JOrsovernet)

miguelitor

#14 Verás, como con la tontería voten dupe... lol

MrAmeba

#11 es una broma, que poco sentido del humor!
Carme pilla todas las duplicadas al vuelo, por eso lo digo. En fin.

jamaicano

Entonces perderia la gracia de pelearnos por ¿relacionada o dupe?...

miguelitor

#16 Pensé que te habías vuelto hoygan y que ibas a poner:
"HAJO y agua" lol lol

Maki_

Votamos copia/plagio?

D

#17.........NO, es relacionada...........

InTheAciD

Aumenta el karma:

* Votos positivos a tus noticias enviadas.
* Votos positivos a noticias que han sido publicadas, siempre que el voto haya sido realizado antes de la publicación de la noticia.
* Votos negativos a noticias que han sido descartadas, siempre que el voto haya sido realizado en los 15 minutos siguientes al envío de la noticia.
* Votos positivos a tus comentarios.

+

Karmawhores

=

Sistema infalible antidupes ...

miguelitor

#9 No se a que viene ese ataque personal.

D

El sistema está todavía en periodo de pruebas y por el momento únicamente bloquea por defecto las URLs idénticas

Pues sí que es ultra-avanzado, sí.

holiveira

infalible mis bolainas, ayer mismos envié una historia que era dupe

l

#14 Descartaayaakesdupeeeee!

grima

esta noticia es duplicada!!!!!!!!!!!!

D

La verdad es que en Digg hay demasiados envios duplicados y lo que es peor, en portada.

D

Parece que #22 es el unico comentario interesado por el tema que no ha hecho un chiste malo.

En el Blog de digg explican en que consisten los nuevos mecanismos que estan desarrollando que NO se estan aplicando de momento.
http://blog.digg.com/?p=866

las nuevas soluciones corregiran casos en que se envia un link al mismo contenido pero con urls diferentes, mediante un algoritmo que compara la similitud entre contenidos.

Y por otro lado intentan algo un poco mas complejo: detectar como duplicadas dos noticias que aunque no sean la misma traten sobre el mismo tema (esto parece mas complicado... ya veremos que tal funciona

filipo

Habís perdido un meneador lol

D

..........A LA BASTILLA!!!!!!!!!!!!!!!!!!!

Taikochu

Detecta urls idénticas...y el resto de features donde se las dejaron? Pffff yo creo que "programan" leyéndose el svn de menéame, a mí no me jodas.

flashinghurt

y que sería meneame sin sus discusiones sobre dupes

chulonsky

Estamos rodeados de expertos, cualquiera programaría digg con los ojos cerrados, es increible roll

chulonsky

¿Como funciona el sistema?

edgard72

Donde dije Diggo diggo Dieggo.

Cocoman

Va va, que no puedo resistirme a decirlo:

Esto es inDIGGnante

marioquartz

#3
[chiste_malo]
¿Las hordas tienen inteligencia?
[/chiste_malo]

Nirgal

Pues tanto como infalible... recuerdo una vez que otro usuario y yo se la colamos al buscadupes de Menéame sin darnos cuenta:

Él mandó Orgullo, prejuicio y nada de persuasión

Hace 16 años | Por dariogaona a lanacion.com.ar
con el url http://www.lanacion.com.ar/nota.asp?nota_id=1011137

Y luego yo envié Cómo debe y NO debe ser la atención en Call Center
Hace 16 años | Por Nirgal a lanacion.com.ar
con dirección http://www.lanacion.com.ar/opinion/nota.asp?nota_id=1011137&origen=columnistas&acumulado_id=608-11227

Básicamente, al enviar la noticia con todos los metadatos, el buscador no la detectó como duplicada porque la dirección no era idéntica. Así que la infalibilidad es bastante discutible.

posavasos

El sistema para evitar historias duplicadas es este:



Y el usuario es quien decide si enviarla finalmente o no.

kolme

Es un problema muy grande. La base de datos de digg es monstruosa y analizar textos muy costoso.

Evidentemente lo primero es buscar URL idénticas. Pero no es tan fácil, deben previamente ser canonicalizarlas de alguna manera para que sea efectivo. Y no es nada trivial, por ejemplo, ¿tenemos en cuenta subdominios o solo los de primer nivel? ¿quitamos las barras que sobran? provad esta URL:
http://meneame.net////story/digg-estrena-sistema-infalible-para-evitar-envio-historias
¿Raro, no? ¿Quitamos el #ancla? En algunas páginas, como la wikipedia llevarían a la misma página. En otras, donde son parámetros para el javascript/ajax de la página resultarían distintas (ej: facebook).

Y eso es solo el paso más fácil. Yo seguramente seguiría buscando envios similares a través de las etiquetas, y por último analizar el título de las más probables, que siendo optimistas serían pocas noticias. Vamos, casi imposible.

Reirme de los programadores de digg, me parece mal. Seguramente sean muy buenos, y han invertido un montón de tiempo y esfuerzo en esto, y seguramente ayude a evitar las duplicadas. Como uno del gremio, me compadezco por ellos por el escarnio público y el asegurado mal rollo en la oficina.

VicenteAlfonso

Esto lo tiene menéame desde hace tiempo, lo dicen en los primeros comentarios y la noticia ha llegado a portada... ¿Algún sistema para evitar eso? Quizás sea mejor que lo de las duples

Cocoman

Epdigg fail

D

Tienen mania por usar mayusculas jaja

esperantisto

Lo de sistema infalible...
Menéame ya lo tiene y aún así se siguen subiendo las mismas noticias publicadas en otros medios...

D

Sistema infalible? Nisiquiera es un sistema, es una única regla, es como decir que construyeron una casa cuando apenas acotaron el perímetro.

MrAmeba

si pusieran eso en meneame Carme se quedaría sin trabajo