Distributed_FileSystem

Facebook Twitter

Gestion des snapshots dans MooseFs. En regardant les statistiques de visite sur ce blog et notamment les mots clés qui permettent d’y aboutir, la question de la gestion des snapshots dans MooseFS revient fréquemment.

Gestion des snapshots dans MooseFs

Voici donc un (tout) petit article sur le sujet. Définition A l’instar de la virtualisation, un snapshot permet de figer l’état ‘E’ d’un objet (ici fichier, répertoire ou arborescence) à un instant ‘T’. Ceph: un système de fichier distribué à surveiller. A l’instar de MooseFS , Ceph est un système de fichier distribué.

Ceph: un système de fichier distribué à surveiller

Son architecture matériel & logiciel repose sur: un groupe de serveurs de stockage (appelés OSDs), un ensemble de serveurs de métadonnée (MDS) et quelques services de monitoring qui ont pour vocation de gérer la cohérence de l’ensemble en fonction de l’états des différents noeuds. L’architecture logique, quant à elle, se compose de deux couches: la première est une couche d’abstraction intitulé RADOS qui fournit un espace de stockage distribué, évolutif (scalable) et à tolérance de panne. La seconde, Ceph lui même, utilise les services de la précédente pour stocker les fichiers et fournit un jeu de commande compatible POSIX pour y accéder.

Il existe différentes méthodes pour intéragir avec Ceph: Clustered, replicated Storage with GlusterFS - Tutorials / Howtos - Sysconfig's Wiki. In an environment where high availability is crucial, you won't be able to work without cross-machine replication in the long run.

Clustered, replicated Storage with GlusterFS - Tutorials / Howtos - Sysconfig's Wiki

While normal RAIDs, backups, and networked file systems are reasonable ways to protect yourself from data loss and allow to access the same data from multiple hosts, they still leave you with a single point of failure, the storage itself. There are plenty of rather expensive solutions out there, which come with two machines and multiple NICs in one box, accessing the same RAID array (for example NetApp®). But for most environments this is overkill, or just not affordable. Clustered Filesystem with DRBD and OCFS2 on CentOS 5.5 - Tutorials / Howtos - Sysconfig's Wiki. Months ago I've published Clustered Filesystem with DRBD and GFS2 on CentOS 5.4 in this wiki.

Clustered Filesystem with DRBD and OCFS2 on CentOS 5.5 - Tutorials / Howtos - Sysconfig's Wiki

Now I would like to give another option – OCFS2, which is a clustered filesystem developed by Oracle. OCFS initially was focused on use with Oracle's databases, but with OFCS2 it's a general-pupose cluster filesystem. It's available as open source, and Oracle does a quite good job publishing packages and modules for each and every kernel version (so you don't need to re-compile it over and over again when you update your kernel).

That at least holds true for RHEL and derivates. Tahoe-lafs.