Sistemas de archivos distribuidos: ¿Ceph o GlusterFS son más adecuados para aplicaciones de medios enriquecidos (transmisión de video, edición de posproducción, etc.)?

(Desarrollador GlusterFS aquí)

Depende mucho del tipo de aplicaciones de medios enriquecidos a las que se refiera, porque pueden tener perfiles de rendimiento muy diferentes. De los dos que menciona, la transmisión de video tiende a exigir un ancho de banda agregado muy alto y ha habido muchas implementaciones a gran escala utilizando GlusterFS. Por otro lado, la edición de posproducción tiende a exigir una latencia más baja y Ceph podría servirle mejor. Además, tenga en cuenta que el uso de Ceph de MacOS o Windows niega una de sus principales ventajas de rendimiento de poder cargarse en el kernel de Linux; de hecho, reexportar un sistema de archivos Ceph a través de NFS podría ser más problemático e incurrir en un mayor impacto de rendimiento que el servidor NFS incorporado de GlusterFS.

Al final, todo lo que puedo decir es que depende. El rendimiento de ida y vuelta entre ellos es demasiado complicado para predecir una respuesta basada en algo menos que una caracterización completa y detallada de la carga de trabajo, por lo que probablemente se reduzca a otras características como la extensibilidad, el soporte, etc.

Estamos muy satisfechos con el precio / rendimiento de Isilon, y el soporte conjunto de CIFS y NFS es excelente. Usamos esto para servir aproximadamente 1.5 PB de archivos de video simultáneamente en un clúster de cómputo basado en Linux para visión artificial y cerca de 50 analistas con estaciones de trabajo de Windows para anotación humana.

Parece que consumirías tanto en Windows como en Mac con CIFS, por lo que el soporte NFS no es tan crítico, pero diré que la noción de Isilon de soporte multiprotocolo es la mejor.

Hemos realizado algunas pruebas de GlusterFS para scratch puro de Linux, y es bastante eficiente, robusto y rentable, pero para consumir a través de CIFS estás viendo Samba y eventualmente odiarás tu vida.