2240
Si alguien trataba de imaginar la cantidad de datos que pasan por las manos de Google, seguramente no llegaría a suponer que la cifra asciende a nada menos que 20 PB. Este dato proviene de un informe publicado en ACM por parte de dos de los miembros de Google, que han realizado un estudio en el que han determinado la cantidad de información que se maneja diariamente, y que pasa a través de una media de 100.000 procesos denominados MapReduce y que se gestionan en sus clusters. www.niallkennedy.com/blog/2008/01/google-mapreduce-stats.html
menéame
Según la wikipedia:
"Un petabyte es una unidad de almacenamiento de información cuyo símbolo es el PB, y puede equivalerse a 250 bytes o a 1015 bytes.
El prefijo peta viene del griego πέντε, que significa cinco, pues equivale a 1000^5 o 10^15. Está basado en el modelo de tera, que viene del griego ‘monstruo’, pero que es similar (excepto una letra) a tetra-, que viene de la palabra griega para cuatro y así peta, que viene de penta-, pierde la tercera letra, n.
1 PB = 1015 byte = 1012 KB = 109 MB = 106 GB = 103 TB
1 PB = 1.000.000.000.000.000 byte = 1.000.000.000.000 KB = 1.000.000.000 MB = 1.000.000 GB = 1.000 TB
1 PB = Mil Billones byte = Un Billón KB = Mil Millones MB = Un Millón GB = Mil TB
A menudo se confunden los petabytes con los pebibytes (PiB), siendo estos en base 2, de manera que un PiB és equivalente a 250 bytes, o 1 125 899 906 842 624 bytes"
Luego como siempre, TheInquirer patinando en la información, porque nadie se lee el paper al que hacen referencia (el PDF, se necesita clave de acceso) y se basan en el copy&paste de otro blog. Pero yo sí me he leído:
"que han realizado un estudio en el que han determinado la cantidad de información que se maneja diariamente"
Falso, el artículo mencionado es un paper describiendo el diseño y funcionamiento del MapReduce.
La cantidad de datos que procesan es sólo información adicional anecdótica y sólo aparece en el resumen del paper:
"past four years, and an average of one hundred thousand MapReduce jobs are executed on
Google’s clusters every day, processing a total of more than twenty petabytes of data per day."
Luego ese tema ni se vuelve a tocar y se centran el MapReduce, donde muestran una tabla (copiada por www.niallkennedy.com/blog/2008/01/google-mapreduce-stats.html) que indican lo que procesan con el mapreduce por mes (403.000 terabytes en set 2007, lo que da un poco menos de 20 petas diarios).
He modificado el contenido poniendo el enlace a la fuente original. Y si, lo reconozco. Tengo de empezar a cambiar de fuentes...
Es mas facil decir que un petabyte son 1024 terabytes.