2248
[c&p] En los últimos siete días, los datos acumulados en di66.net, han demostrado que el 46,6% de las noticias que llegan a la página principal de Digg provienen de solamente 50 sitios web. Los cambios recientes en las políticas y restricciones hechas por Digg para fomentar la diversidad de noticias en la primera página del sitio ha tenido dos resultados importantes. [Eng] Vía alt1040.com/2009/03/el-46-de-la-pagina-principal-de-digg-es-controlada
menéame
- Total de publicadas: 396
- Sitios diferentes: 242
Abajo los dos sql:
mysql> select count(*) from links where link_status='published' and link_date > date_sub(now(), interval 7 day);
+----------+
| count(*) |
+----------+
| 396 |
+----------+
1 row in set (0.00 sec)
mysql> select count(distinct link_blog) from links where link_status='published' and link_date > date_sub(now(), interval 7 day);
+---------------------------+
| count(distinct link_blog) |
+---------------------------+
| 242 |
+---------------------------+
1 row in set (0.00 sec)
Tened cuidado que igual os aparece una cabeza de caballo en vuestra cama
Es logico que empresas se interesen en publicitarse de manera gratuita en paginas con muchos visitantes...y si lo pueden hacer desde dentro mejor
www.elmundo.es:21
www.elpais.com:21
www.20minutos.es:10
ecodiario.eleconomista.es:10
www.publico.es: 9
www.lavanguardia.es: 9
www.abc.es: 7
www.elperiodico.com: 7
www.cadenaser.com: 7
www.europapress.es: 7
www.soitu.es: 6
www.youtube.com: 4
www.lavozdegalicia.es: 4
rayosycentellas.net: 3
www.rtve.es: 3
sp.rian.ru: 3
www.cotizalia.com: 3
www.dosmanzanas.com: 3
www.adn.es: 3
www.levante-emv.com: 3
www.maikelnai.es: 3
elsofista.blogspot.com: 3
aldea-irreductible.blogspot.com: 3
www.eleconomista.es: 2
www.facua.org/es: 2
www.univision.com: 2
www.gran-angular.net: 2
www.vertele.com: 2
www.eluniversal.com.mx: 2
www.larazon.es: 2
www.tendencias21.net: 2
arstechnica.com: 2
www.genbeta.com: 2
www.dailymail.co.uk: 2
www.elconfidencial.com: 2
www.cincodias.com: 2
www.antena3noticias.com: 2
blogs.20minutos.es/cronicaverde: 2
www.neoteo.com: 2
www.ecologistasenaccion.org: 2
paseandohistoria.blogspot.com: 2
www.diariocordoba.com: 2
www.libertaddigital.com: 2
www.boston.com/bigpicture: 2
www.heraldo.es: 2
bandaancha.eu: 2
www.infobae.com: 2
www.enriquedans.com: 2
www.cienciakanija.com: 1
elmilicianocnt-aitchiclana.blogspot.com: 1
blogs.publico.es/manel: 1
sdpnoticias.com: 1
www.pinknews.co.uk: 1
www.laopinioncoruna.es: 1
www.google.com: 1
desequilibros.blogspot.com: 1
nosolometro.blogspot.com: 1
www.canalsur.es: 1
www.webdesignerdepot.com: 1
www.cuatro.com: 1
www.360cities.net: 1
citius64.blogspot.com: 1
r0uzic.net: 1
www.laopinion.es: 1
www.extremadura24horas.com: 1
www.pinktentacle.com: 1
apurtu.org: 1
www.ojobuscador.com: 1
www.astronomybuff.com: 1
www.cabovolo.com: 1
www.delcastellano.com: 1
www.eldiarioexterior.com: 1
clitoris.lacoctelera.net: 1
blogs.publico.es/apuntesperipateticos: 1
actualidad.terra.es: 1
www.deminorias.com: 1
» ver todo el comentario
> Me salen 241 sitios.
Porque las consultas fueron hechas con horas de diferencia entre el #3 y el #8
> Y aquí, es al revés: el 50% de la portada es "controlada" por 46 webs
Deberías calcular propocionales a la cantidad de sitios y envíos de cada uno para tener una idea mejor. En di66.net/top-sites-7d-by-posts.html sólo salen los del top... no se cuántas más hay. Pero sí, demasiados periódicos, los primeros 8 son periódicos "tradicionales". Y eso que hay límite en el número de envíos de cada fuente (con muchos "rechazos" por exceso), sería mucho peor sin ese límite.
Aunque también es cierto que en la blogocosa no se encuentran noticias ni demasiadas cosas interesantes más allá del frikismo usual
www.elmundo.es 91
www.elpais.com 91
www.publico.es 46
ecodiario.eleconomista.es 46
www.europapress.es 43
www.lavanguardia.es 37
www.20minutos.es 33
www.cadenaser.com 30
www.youtube.com 25
www.lavozdegalicia.es 25
www.soitu.es 24
www.elperiodico.com 21
www.abc.es 21
www.levante-emv.com 17
www.elconfidencial.com 16
www.que.es 13
www.adn.es 13
www.dailymail.co.uk 13
www.elplural.com 12
www.rtve.es 12
www.libertaddigital.com 11
es.noticias.yahoo.com 11
www.eleconomista.es 9
www.larazon.es 9
www.univision.com 9
www.heraldo.es 9
www.diariosur.es 8
www.marca.com 8
www.expansion.com 8
rayosycentellas.net 7
www.elcorreogallego.es 7
news.bbc.co.uk 7
fogonazos.blogspot.com 7
www.vertele.com 7
www.as.com 6
bandaancha.eu 6
www.cotizalia.com 6
www.adslzone.net 6
www.eluniversal.com.mx 6
dividiendoentrecero.blogspot.com 5
aldea-irreductible.blogspot.com 5
porantonomasia.wordpress.com 5
www.cincodias.com 5
eltamiz.com/elcedazo 5
www.facua.org/es 5
www.lne.es 5
sp.rian.ru 5
actualidad.terra.es 5
kurioso.wordpress.com 5
www.internautas.org 4
www.elperiodicoextremadura.com 4
www.neoteo.com 4
www.diariodemallorca.es 4
www.oddee.com 4
www.dosmanzanas.com 4
www.google.com 4
www.porandalucialibre.es 4
www.boston.com/bigpicture 4
www.larepublica.es 4
francisthemulenews.wordpress.com 4
www.antena3noticias.com 4
blogs.publico.es/manel 4
www.hoy.es 4
www.tendencias21.net 4
www.laopinioncoruna.es 4
www.diariodesevilla.es 4
www.emol.com 4
mangasverdes.es 4
www.newscientist.com 4
desequilibros.blogspot.com 4
www.diarioinformacion.com 4
www.diariosigloxxi.com 4
torrentfreak.com 4
historiasconhistoria.es 3
www.gran-angular.net 3
www.flickr.com 3
www.hispanidad.com 3
www.xornal.com 3
http://w » ver todo el comentario
Curioso que el intervalo mensual, el 50% de portadas lo consiguen 25 medios, casi la mitad que antes. Estabilización de la "aletoriedad"
Los #N/A de la columna Pct1mes de la hoja 7dias imagino que serán los que se han cortado del comentario.
Pero los datos salen distintos, el 50% de portadas se consiguen con los primeros 68 sitios del total de 777.
Pero curiosamente, los primeros 50 sitios hacen ¡el 46% de portadas! Clavado
¿Tendrá algo que ver el código o simple casualidad?
es.wikipedia.org/wiki/Vilfredo_Pareto
Para quienes tengan cuenta de Google:
spreadsheets.google.com/ccc?key=pMWEBOE4GPWyRiWwjC64FRw
Como página web:
spreadsheets.google.com/pub?key=pMWEBOE4GPWyRiWwjC64FRw
No creo que afecte mucho, pero es posible que pueda afectar al listado de sitios más votados de la portada.
El código que lo hace: svn.meneame.net/index.cgi/branches/version3/www/libs/blog.php?view=mar (mira analyze_html() o find_base_url()).