Publicado hace 14 años por CortoCircuito a ciencia-explicada.blogspot.com

C&P: "Según comunica Michael Rubin, en Google han realizado una comparación de eficiencia de distintos sistemas de ficheros, como xfs, ext4 y jfs. Finalmente se van a decantar por actualizar sus sistemas, actualmente en ext2, a ext4." Relacionada: Ext4: lo que traerá Linux 2.6.28
Hace 15 años | Por Kartoffel a diegocg.blogspot.com
Publicado hace 15 años por Kartoffel
a diegocg.blogspot.com

"Ext4 es la evolución del sistema de archivos más utilizado en el mundo Linux, Ext3. En muchos sentidos Ext4 es una mejora más profunda de Ext3 que la que Ext3 fue de Ext2. Ext3 consistió básicamente en añadir journaling, pero Ext4 modifica ciertas estructuras críticas del sistema de archivos, como las destinadas a almacenar los datos de los archivos. El resultado es un sistema de archivos con un mejor diseño, mayor rendimiento y fiabilidad." Repasa las principales mejoras que ofrece y cómo comenzar a usar ext4 (es posible migrar desde ext3)

Comentarios

antxon.urrutia

#15 Un buen sistema de producción usa lo que tenga que usar, puede ser viejo o nuevo, la cosa es que resulte.

Google cambia de servidores y aplicara parches cada 4 días, no creo que sea el entorno más estable del mundo. Además, el problema con ese tipo de software muchas veces no se adapta a las tecnologías actuales. He visto empresas llorando por estos temas. Típico caso de Oracle que corre y tiene soporte solo sobre X y Z versiones del sistema y el hardware que tienen no funciona sobre eso ni queriendo.

Si utilizaban Ext2 en vez de Ext3 entiendo que no les interesaba para nada el jounaling (come recursos). Hace tiempo se publicaron unos benchmark con ext2, ext3, ext4 y ext4-nojournal y ext4-nojournal era más rápido que ext2.

http://kerneltrap.org/mailarchive/linux-ext4/2009/1/7/4632414

De todas maneras, una empresa que tiene un millón de servidores (por decir un numero) no creo que tenga todo montado de la misma manera, ya que no es lo mismo el crawler, el servidor imap de Gmail, etc...

Fingolfin

#6 De hecho, se retrasó la publicación bastante tiempo (más de un año) para asegurarse de que fuera estable, según el propio mantenedor. El simple hecho de usar barriers por defecto lo hace bastante más fiable que Ext3 como opción por defecto para instalaciones nuevas(gente de Red Hat afirma haber comprobado que existe una relación directa entre tener barriers desactivadas y aumento de casos de corrupción)

#5 A Google no le sirve de mucho la gestión de espacio y correción de errores de ZFS (ya lo hacen ellos mismos en GFS), de hecho teniendo en cuenta que los sistemas de archivo basados en técnicas COW sufren más fragmentación (en el email enlazado se quejan especificamente de la latencia causada por cosas así) puede que no les convenga.

D

Donde se ponga FAT32...

deigote

#3 Los sistemas de archivos en cluster, o mejor dicho, al menos el GoogleFS que comentas, es virtual. Y que, que yo sepa, Google seguirá usando este último. Lo que cambia es el sistema de ficheros fisico, por decirlo así, sobre el que corre GFS, que ahora cambiará de ext2 a ext4.

s

#6 Pero si hace unos meses solo se recomendaba para sistemas dómesticos ( no de alto rendimiento), y que seguían utilizando ext2 no me negarás que ahora Google decida usarlo para sus servidores es muy inesperado. Por eso se ve que han contratado a su desarrollador:

"Después de realizar pruebas de rendimiento y confiabilidad, Google decidió dar el paso de migrar a ext4 y debido a lo crítico que es el almacenamiento para esta compañía, no es raro que hayan contratado a la autoridad sobre el tema."

s

Un buen sistema de producción utiliza software antiguo, muy probado y estable. Lo esperado es, que se hubieran pasado a ext3 o cualquier otro más viejo ahora que lleva varios años de existencia.

Cidwel

#19 ...que se quite una iso pirata

The_Hoff

#10 por no mencionar que ZFS no es compatible ni en licencia ni en implementación contra el VFS de linux. Y que tiene carencias graves con la gestión de los pools.

Lo de ZFS y linux es como lo de alonso y ferrari

o

Diego http://diegocg.blogspot.com/ poniendo a parir a Google por no usar BTRFS en 3, 2, 1...

¡Vamos Diego, tu puedes!

The_Hoff

Me gustaría ver los resultados de sus benchmarks, que igual están en el enlace 1 pero parece que está caído. Aún así, me llaman la atención varias cosas:

1. Que no se decanten por un sistema de archivos en cluster (ocfs, gfs...)
2. Que sigan usando ext2, y que incluyan en el benchmark el jfs, adelantado incluso por ext3.
3. Que en ninguna parte del artículo se mencione btrfs. El principal desarrollador de ext4 manifestó que este (ext4) es la última evolución de un sistema de ficheros desfasado, y que los sistemas como btrfs son la evolución lógica. (http://arstechnica.com/open-source/news/2009/04/linux-collaboration-summit-the-kernel-panel.ars). Aunque aún no es del todo estable, si han estado desde los tiempos de ext2 esperando, no les va a pasar nada por esperar un poco más.

Sus razones tendrán.

antxon.urrutia

#4 en 2.6.33 se usa el driver de ext4 para ext2 y 3 [ CONFIG_EXT4_USE_FOR_EXT23 ]

a

Hace dos años hice tests (bonnie++) durante varias semanas de los diferentes fs que se recomendaban entonces. El resultado de número de ficheros pequeños por segundo en acceso aleatorio fue:

JFS: 153
Ext2: 142
Reiser3: 107
Ext3: 90
XFS: 73

Para todos los casos se probaron diferentes combinaciones, journal interno o externo, tamaño de bloque, etcetc según se recomendaba para mejorar el rendimiento del fs concreto.

Como se ve, si sólo se tuviera en cuenta esto para elegir un filesystem, JFS no tiene rival. Sin embargo para uso con BD grandes, o servicio de disco por ejemplo, seguramente no será el mejor. Como dice #1 y como han hecho los de Google, lo mejor es probar el fs para la aplicación concreta que le vas a dar.

D

Menos mal, me temía lo peor

P

Yo lo tengo en Ext4 y me va bien, la diferencia es poca en su uso normal, se nota más en archivos muy grandes.

D

#3

3. Que en ninguna parte del artículo se mencione btrfs. El principal desarrollador de ext4 manifestó que este (ext4) es la última evolución de un sistema de ficheros desfasado, y que los sistemas como btrfs son la evolución lógica. (arstechnica.com/open-source/news/2009/04/linux-collaboration-summit-ths). Aunque aún no es del todo estable, si han estado desde los tiempos de ext2 esperando, no les va a pasar nada por esperar un poco más.

Esperar a una solución perfecta suena maravilloso, mejor que pasen directamente a Hurd, ext4 supone mejoras aquí y ahora, y la actualización dentro de la familia ext es más que sencilla
With recent versions of ext4 (2.6.29 and later), you can mount any ext2 or ext3 filesystem as ext4 without any changes. You must use tune2fs to enable the new ext4 features:

Mientras btrfs no está listo y no es compatible con ext2
Btrfs is under heavy development, and is not suitable for any uses other than benchmarking and review. The Btrfs disk format is not yet finalized, but it will only be changed if a critical bug is found and no workarounds are possible.
http://ext4.wiki.kernel.org/index.php/Frequently_Asked_Questions#Can_I_mount_existing_Ext3_as_Ext4.3F_And_vice_versa.3F_Similarly_from_Ext2_to_Ext4_and_its_reverse.3F

s

Nunca pensé que Google pudiera utilizar Ext4 teniendo en cuenta lo nuevo y poco probado que está. (no estamos hablando de sistemas domésticos precisamente)

r

#3 Creo que no termino de entender tu comentario. ¿Dónde pone que ext3 mejore a jfs en benchmarking? ¿Te refieres a mi enlace #1 o a otra web?

Respecto a la decisión, creo que viene influenciada en gran medida por la facilidad de portar ext2 a ext3, y ext3 a ext4, manteniendo los datos (creo que incluso es posible teniendo montado el sistema de ficheros, pero de esto no estoy seguro).

r

Me estáis poniendo cachondo...

#9 No tenía ni idea de que jfs estaba semi-abandonado ojalá lo hubiera sabido hace 3 meses.

D

Sin backup ni nada?

The_Hoff

#8 tu enlace de #1 es una web de coña, no me refería a eso.

jfs está casi abandonado, y no es lógico en mi opinión, tener en cuenta en un benchmark un sistema de archivos que no va a ser mantenido por mucho tiempo, para una tarea de producción.

Aparte, en mi experiencia, ext3 se comporta mejor que jfs al menos en cuanto a integridad. Para mí, eso es lo primero, y si un sistema de archivos falla en eso, ya puede ser la hostia en bicicleta, que no lo tendré en cuenta.

The_Hoff

#3 btrfs ya tiene casi terminado su formato[1] (sólo cambiaría en caso de fallos), y existe compatibilidad (mediante conversión rápida) con ext3, y por tanto con ext2[2].

[1] http://btrfs.wiki.kernel.org/index.php/Main_Page
[2] http://btrfs.wiki.kernel.org/index.php/Conversion_from_Ext3

ronko

Esperemos que no le pase lo que le pasó a Bilo: http://www.tiraecol.net/modules/comic/comic.php?content_id=60 .

The_Hoff

#30 no. No me refiero a Google FS, me refiero a GFS2 (global filesystem). No tiene nada que ver con google.

http://en.wikipedia.org/wiki/Global_File_System

arieloq

Deberían haberse decantado por ZFS por mucho superior a los demás...

D

vah yo ya lo hice hace tiempo lol

gejobj

#19 yo diría más, volvamos a la FAT16 y a sus 2 GB máximo para las particiones!!

f

Muy arriesgado por su parte. Hasta que Debian no lo ponga por defecto en su instalación yo ni tocarlo...

D

Tengamos en cuenta que ext4 es compatible con ext2 y ext3 hasta niveles exagerados.

#5 Pero ZFS no es libre.

#20 Información de btrfs en ese blog, aquí. http://diegocg.blogspot.com/2009/09/btrfs.html

y un buen artículo aquí. http://lwn.net/Articles/342892/